×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: hadoop 共 83 个结果.
Hadoop常用命令
一、查看分区数据 (一)查看哪些分区有数据 hadoop fs -du hdfs路径 (二)查看数据文件大小(单位:K/M/G,hdfs会有多个备份的数据文件,cos默认没有备份) hadoop fs -du -h hdfs路径 二、查看路径 h...
wylc123
1年前
992
0
Centos 7安装配置Hadoop 2.7.7
1. 下载安装包 华为镜像下载 2. 解压 cd /usr/local/softs tar -zxvf hadoop-2.7.7.tar.gz 3. 修改host映射 vi /etc/hosts 192.168.209.129 node1 4. ...
wylc123
1年前
1334
0
HBase 写吞吐场景资源消耗量化分析及优化
一。 概述 HBase 是一个基于 Google BigTable 论文设计的高可靠性、高性能、可伸缩的分布式存储系统。 网上关于 HBase 的文章很多,官方文档介绍的也比较详细,本篇文章不介绍 HBase 基本的细节。 本文从 HBase 写链路开始分析,然后针对少量随机读和海量随机写入场景入手 ....
star2017
1年前
2956
0
分享6家公司的大数据岗位的面试经验
作者: 锋云帮主 本人住在有人间天堂之称的城市,6年多开发经验,最近2年主要在做大数据相关的开发,最近考虑换工作,基本也只考虑大数据相关岗位。目前新工作已经找好,但想分享一下最近面试的失败一些经历(成功的那些就不讲了),吐槽吐槽,跟广大吃瓜群众分享一下过程中的经历心得,我的语文体育老师教的,还请大家莫怪。 公司:国内知名电信运营商,其下面的大数据研究院,面两…
star2017
1年前
2127
0
从Hadoop到Spark和Flink,大数据处理框架十年激荡发展史
本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
star2017
1年前
7687
0
从HadoopSummit2016看大数据行业与Hadoop的发展
目前在美国,无论行业是IT,金融相关(包括银行保险),电信,制造业,还是餐饮,百货零售都已经广泛的用上了Hadoop。
star2017
1年前
7296
0
技术|Hadoop面试,有它就够了
本文介绍了google推广的一个编程模型MapReduce,以及下一代mapreduce框架,简称MRv2。从各个方面对比了传统的MR框架和新一代的区别,以及它们的优缺点。一起来看看吧~
star2017
1年前
3108
0
如何入行大数据拿高薪?大神来支招!
你想象中的做大数据到底是做什么?
star2017
1年前
10742
0
快手万亿级别 Kafka 集群应用实践与技术演进之路
赵健博 [图片] Kafka 系统在快手有着很广泛的应用,随着其业务的高速发展, Kafka 集群的规模也成指数增长,目前快手 Kafka 集群日消息处理总量达数万亿级别,峰值超过 1 亿 /s。与此同时,快手也面临了很多新问题与技术挑战。本文整理自快手高级架构师、大数据架构团队负责人赵健博在 QC ....
star2017
1年前
7762
0
每日生产万亿消息数据入库,腾讯如何突破大数据分析架构瓶颈
作者: 彭渊 2018 年 11 月 20 日 [图片] 背景介绍 对于腾讯庞大的大数据分析业务,几千台的 Hadoop 集群,近百 P 级的存储总量,每日产生万亿的消息数据入库,需要针对几十亿 IMEI 手机设备去重,并关联数千亿的历史全表,进行曝光、点击、PV、UV、日活、新增、留存等统计指标分 ....
star2017
1年前
3227
0
海量日志实时收集系统架构设计与 go 语言实现
日志收集系统应该说是到达一定规模的公司的标配了,一个能满足业务需求、运维成本低、稳定的日志收集系统对于运维的同学和日志使用方的同学都是非常 nice 的。然而这时理想中的日志收集系统,现实往往不是这样的...本篇的主要内容是:首先吐槽一下公司以前的日志收集和上传;介绍新的实时日志收集系统架构;用 g ....
star2017
1年前
2535
0
大数据凉了?No,流式计算浪潮才刚刚开始!
大数据凉了?No,流式计算浪潮才刚刚开始! 原创: AI 前线小组 译 AI 前线 1 周前 [图片] 策划编辑 | Natalie 翻译 |巴真 编辑 |Debra **AI 前线导读:**本文重点讨论了大数据系统发展的历史轨迹,行文轻松活泼,内容通俗易懂,是一篇茶余饭后用来作为大数据谈资的不严肃 ....
star2017
1年前
2822
0
苏宁 11.11 :苏宁大数据离线任务开发调度平台实践
桑强 2018 年 11 月 5 日 [图片] 目录 背景 2 设计目标 2 2.1 用户交互的产品功能 2 2.2 后台调度功能 3 2.3 任务执行器功能 4 2.4 任务运维功能 5 2.5 平台对外功能 6 平台价值 7 平台建设 7 4.1 用户功能实现说明 8 4.2 调度周期设计说明 ....
star2017
1年前
7878
0
回顾·云上 HBase 冷热分离实践
[图片] 本文根据阿里云技术专家郭泽晖在中国 HBase 技术社区第 3 届 MeetUp 杭州站中分享的《云上 HBase 冷热分离实践》编辑整理而成。 [图片] 今天分享的内容分为两个方面,首先会介绍下冷数据的经典场景,以及如果使用开源的 HBase 应该如何实现,最后介绍下 HBase 在云端 ....
star2017
1年前
2272
0
一条数据的 HBase 之旅,简明 HBase 入门教程 -Write 全流程
如果将上篇内容理解为一个冗长的'铺垫',那么,从本文开始,'剧情'才开始正式展开。本文基于所给出的样例数据,介绍了将数据从 Client 写到 RegionServer 的全流程。 本文整体思路: 1. 前文内容回顾 2. 示例数据 3. HBase 可选接口介绍 4. 表服务接口介绍 5. 介绍几 ....
star2017
1年前
2364
0
【有赞】数据资产,赞之治理
作者:见风 团队:有赞大数据团队 一、背景介绍 大数据概念的提出已十年有余,这期间风靡全球,与其相关的理论、技术和实践遍地开花,整个领域都在飞速发展。野蛮生长之下,“数据治理”的呼声水涨船高。工信部 19 年提出:将加强数据治理,扎实推进国家大数据发展战略,将数据治理重要性上升到新的高度。在各行业畅 ....
star2017
1年前
7985
0
一条数据的 HBase 之旅,简明 HBase 入门教程 -Flush 与 Compaction
Flush 与 Compaction 其实属于 Write 流程的继续,所以本文应该称之为'Write 后传'。在 2.0 版本中,最主要的变化就是新增了 In-memory Flush/Compaction,而 DateTieredCompaction 并不算 2.0 新加入的特性,2.0 版本在 ....
star2017
1年前
2268
0
基于 Flink 的严选实时数仓实践
[图片] 分享嘉宾:杨雄 网易严选 资深研发工程师 内容来源:DataFun Talk《基于 Flink 的严选实时数仓实践》 出品社区:DataFun [图片] 今天分享的内容主要分为四个部分,首先会介绍下严选实时数仓的背景、产生的一些问题。然后是针对这些背景和问题对实时数仓的整体设计和具体的实施 ....
star2017
1年前
3981
0
【干货】Spark 之性能优化
1、诊断Spark 程序内存的消耗 A、Spark 程序中内存都花费在哪里? Ø每个 Java 对象,都有一个对象头,会占用 16 个字节,主要是包括了一些对象的元信息,比如指向它的类的指针。如果一个对象本身很小,比如就包括了一个 int 类型的 field,那么它的对象头实际上占用的内存比对象自己 ....
star2017
1年前
2571
0
Spark 性能调优总结
使用正确的 transformations 操作 虽然开发者达到某一目标,可以通过不同的 transformations 操作,但是有时候不同的姿势,性能差异非常明显。优化姿势的总体目标是尽可能少的产生 shuffle, 和待被 shuffled data。因为 shffule 过程存在写盘和节点间 ....
star2017
1年前
8786
0
1
2
3
4
5
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到