×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: hadoop 共 83 个结果.
达观数据分析平台架构和Hive实践
Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。 近十年来,随着Hadoo…
star2017
1年前
2490
0
HBase 写吞吐场景资源消耗量化分析及优化
一。 概述 HBase 是一个基于 Google BigTable 论文设计的高可靠性、高性能、可伸缩的分布式存储系统。 网上关于 HBase 的文章很多,官方文档介绍的也比较详细,本篇文章不介绍 HBase 基本的细节。 本文从 HBase 写链路开始分析,然后针对少量随机读和海量随机写入场景入手 ....
star2017
1年前
2893
0
SparkSQL 大数据实战:shuffle hash join、broadcast hash join 以及 sort merge join 三种 join 大揭秘
[图片] 易小云: Join 操作是数据库和大数据计算中的高级特性,大多数场景都需要进行复杂的 Join 操作,本文从原理层面介绍了 SparkSQL 支持的常见 Join 算法及其适用场景。 本文 2383 字 建议阅读时长 6 分钟 Join 背景介绍 Join 是数据库查询永远绕不开的话题,传 ....
star2017
1年前
2587
0
Spark 性能调优总结
使用正确的 transformations 操作 虽然开发者达到某一目标,可以通过不同的 transformations 操作,但是有时候不同的姿势,性能差异非常明显。优化姿势的总体目标是尽可能少的产生 shuffle, 和待被 shuffled data。因为 shffule 过程存在写盘和节点间 ....
star2017
1年前
8631
0
【干货】Spark 之性能优化
1、诊断Spark 程序内存的消耗 A、Spark 程序中内存都花费在哪里? Ø每个 Java 对象,都有一个对象头,会占用 16 个字节,主要是包括了一些对象的元信息,比如指向它的类的指针。如果一个对象本身很小,比如就包括了一个 int 类型的 field,那么它的对象头实际上占用的内存比对象自己 ....
star2017
1年前
2506
0
基于 Flink 的严选实时数仓实践
[图片] 分享嘉宾:杨雄 网易严选 资深研发工程师 内容来源:DataFun Talk《基于 Flink 的严选实时数仓实践》 出品社区:DataFun [图片] 今天分享的内容主要分为四个部分,首先会介绍下严选实时数仓的背景、产生的一些问题。然后是针对这些背景和问题对实时数仓的整体设计和具体的实施 ....
star2017
1年前
3907
0
一条数据的 HBase 之旅,简明 HBase 入门教程 -Flush 与 Compaction
Flush 与 Compaction 其实属于 Write 流程的继续,所以本文应该称之为'Write 后传'。在 2.0 版本中,最主要的变化就是新增了 In-memory Flush/Compaction,而 DateTieredCompaction 并不算 2.0 新加入的特性,2.0 版本在 ....
star2017
1年前
2215
0
【有赞】数据资产,赞之治理
作者:见风 团队:有赞大数据团队 一、背景介绍 大数据概念的提出已十年有余,这期间风靡全球,与其相关的理论、技术和实践遍地开花,整个领域都在飞速发展。野蛮生长之下,“数据治理”的呼声水涨船高。工信部 19 年提出:将加强数据治理,扎实推进国家大数据发展战略,将数据治理重要性上升到新的高度。在各行业畅 ....
star2017
1年前
7891
0
一条数据的 HBase 之旅,简明 HBase 入门教程 -Write 全流程
如果将上篇内容理解为一个冗长的'铺垫',那么,从本文开始,'剧情'才开始正式展开。本文基于所给出的样例数据,介绍了将数据从 Client 写到 RegionServer 的全流程。 本文整体思路: 1. 前文内容回顾 2. 示例数据 3. HBase 可选接口介绍 4. 表服务接口介绍 5. 介绍几 ....
star2017
1年前
2302
0
回顾·云上 HBase 冷热分离实践
[图片] 本文根据阿里云技术专家郭泽晖在中国 HBase 技术社区第 3 届 MeetUp 杭州站中分享的《云上 HBase 冷热分离实践》编辑整理而成。 [图片] 今天分享的内容分为两个方面,首先会介绍下冷数据的经典场景,以及如果使用开源的 HBase 应该如何实现,最后介绍下 HBase 在云端 ....
star2017
1年前
2238
0
苏宁 11.11 :苏宁大数据离线任务开发调度平台实践
桑强 2018 年 11 月 5 日 [图片] 目录 背景 2 设计目标 2 2.1 用户交互的产品功能 2 2.2 后台调度功能 3 2.3 任务执行器功能 4 2.4 任务运维功能 5 2.5 平台对外功能 6 平台价值 7 平台建设 7 4.1 用户功能实现说明 8 4.2 调度周期设计说明 ....
star2017
1年前
7687
0
大数据凉了?No,流式计算浪潮才刚刚开始!
大数据凉了?No,流式计算浪潮才刚刚开始! 原创: AI 前线小组 译 AI 前线 1 周前 [图片] 策划编辑 | Natalie 翻译 |巴真 编辑 |Debra **AI 前线导读:**本文重点讨论了大数据系统发展的历史轨迹,行文轻松活泼,内容通俗易懂,是一篇茶余饭后用来作为大数据谈资的不严肃 ....
star2017
1年前
2771
0
海量日志实时收集系统架构设计与 go 语言实现
日志收集系统应该说是到达一定规模的公司的标配了,一个能满足业务需求、运维成本低、稳定的日志收集系统对于运维的同学和日志使用方的同学都是非常 nice 的。然而这时理想中的日志收集系统,现实往往不是这样的...本篇的主要内容是:首先吐槽一下公司以前的日志收集和上传;介绍新的实时日志收集系统架构;用 g ....
star2017
1年前
2486
0
每日生产万亿消息数据入库,腾讯如何突破大数据分析架构瓶颈
作者: 彭渊 2018 年 11 月 20 日 [图片] 背景介绍 对于腾讯庞大的大数据分析业务,几千台的 Hadoop 集群,近百 P 级的存储总量,每日产生万亿的消息数据入库,需要针对几十亿 IMEI 手机设备去重,并关联数千亿的历史全表,进行曝光、点击、PV、UV、日活、新增、留存等统计指标分 ....
star2017
1年前
3158
0
快手万亿级别 Kafka 集群应用实践与技术演进之路
赵健博 [图片] Kafka 系统在快手有着很广泛的应用,随着其业务的高速发展, Kafka 集群的规模也成指数增长,目前快手 Kafka 集群日消息处理总量达数万亿级别,峰值超过 1 亿 /s。与此同时,快手也面临了很多新问题与技术挑战。本文整理自快手高级架构师、大数据架构团队负责人赵健博在 QC ....
star2017
1年前
7530
0
如何入行大数据拿高薪?大神来支招!
你想象中的做大数据到底是做什么?
star2017
1年前
10580
0
技术|Hadoop面试,有它就够了
本文介绍了google推广的一个编程模型MapReduce,以及下一代mapreduce框架,简称MRv2。从各个方面对比了传统的MR框架和新一代的区别,以及它们的优缺点。一起来看看吧~
star2017
1年前
3034
0
从HadoopSummit2016看大数据行业与Hadoop的发展
目前在美国,无论行业是IT,金融相关(包括银行保险),电信,制造业,还是餐饮,百货零售都已经广泛的用上了Hadoop。
star2017
1年前
7198
0
从Hadoop到Spark和Flink,大数据处理框架十年激荡发展史
本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
star2017
1年前
7602
0
分享6家公司的大数据岗位的面试经验
作者: 锋云帮主 本人住在有人间天堂之称的城市,6年多开发经验,最近2年主要在做大数据相关的开发,最近考虑换工作,基本也只考虑大数据相关岗位。目前新工作已经找好,但想分享一下最近面试的失败一些经历(成功的那些就不讲了),吐槽吐槽,跟广大吃瓜群众分享一下过程中的经历心得,我的语文体育老师教的,还请大家莫怪。 公司:国内知名电信运营商,其下面的大数据研究院,面两…
star2017
1年前
2073
0
1
2
3
4
5
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到