×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据 共 539 个结果.
怎样向有大量数据的表中添加索引
create table t_sys_test_temp like t_sys_test; alter table t_sys_test_temp add index age_index(age); INSERT into t_sys_test_...
wylc123
1年前
1775
0
ES在十几亿的数量级下如何提升查询效率?-转载
一、ES写入数据 (选择协调节点—>根据文件进行路由转发给对应的节点—>节点的主分片处理请求—>数据同步到副本分片—>返回响应) 客户端选择一个 node 发送请求过去,这个 node 就是 coordinating ...
洛辰
1年前
8314
0
消息中间件—RocketMQ 消息消费(三)(消息消费重试)
摘要:如果 Consumer 端消费消息失败,那么 RocketMQ 是如何对失败的异常情况进行处理? 前面两篇 RocketMQ 消息消费(一)/(二)篇,主要从 Push/Pull 两种消费模式的简要流程、长轮询机制和 Consumer 端负载均衡这几点内容出发,介绍了 RocketMQ 消息消 ....
star2017
1年前
6830
0
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
作者:Stefan Kojouharov 译者:郝毅 2018 年 11 月 27 日 话题:AI 语言 & 开发大数据深度学习 2018 年 11 月 27 日 话题:AI 语言 & 开发大数据深度学习机器学习 [图片] 本文是根据 Stefan Kojouharov 发表在 Me ....
star2017
1年前
13723
0
消息中间件—RocketMQ 消息存储(一)
文章摘要:MQ 分布式消息队列大致流程在于消息的一发一收一存,本篇将为大家主要介绍下 RocketMQ 存储部分的架构 消息存储是 MQ 消息队列中最为复杂和最为重要的一部分,所以小编也就放在 RocketMQ 系列篇幅中最后一部分来进行阐述和介绍。本文先从目前几种比较常用的 MQ 消息队列存储方式 ....
star2017
1年前
6826
0
流式数据处理在百度数据工厂的应用与实践
本文整理自百度李俊卿在 QCon 上的演讲:《流式数据处理在百度数据工厂的应用与实践》。 百度数据工厂最原先用 Hive 引擎,进行离线批量数据分析和 PB 级别的查询,处理一些核心报表数据。但是在我们推广过程中发现,用户其实还是有复杂分析、实时处理、数据挖掘的请求,我们在 Spark1.0 推出的 ....
star2017
1年前
7078
0
【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 B 站的应用
分享嘉宾: 张杨,B 站资深开发工程师 整理出品: AICUG 人工智能社区 https://img.6aiq.com/bilibili_flink.mp4 导读 : 整个机器学习的过程,从数据上报,到特征计算,到模型训练,再到线上部署,最终效果评估,整个流程非常冗长,在 b 站,多个团队都会搭建自 ....
star2017
1年前
10649
0
Flink 在有赞实时计算的实践
转载自: 有赞技术团队博客 一、前言 这篇主要由五个部分来组成: 首先是有赞的实时平台架构。 其次是在调研阶段我们为什么选择了 Flink。在这个部分,主要是 Flink 与 Spark 的 structured streaming 的一些对比和选择 Flink 的原因。 第三个就是比较重点的内容, ....
star2017
1年前
7310
0
Walrus- 一个轻量级 olap 查询框架
Walrus Introduction walrus是一个轻量级 olap 查询框架。它支持多源异构数据源(hdfs,mysql,clickhouse,kylin,druid...),采用 apache spark 作为聚合计算引擎,在雪花模型上通过 JSON 提供 ETL 建模和 ad hoc 数 ....
star2017
1年前
7840
0
【有赞】数据资产,赞之治理
作者:见风 团队:有赞大数据团队 一、背景介绍 大数据概念的提出已十年有余,这期间风靡全球,与其相关的理论、技术和实践遍地开花,整个领域都在飞速发展。野蛮生长之下,“数据治理”的呼声水涨船高。工信部 19 年提出:将加强数据治理,扎实推进国家大数据发展战略,将数据治理重要性上升到新的高度。在各行业畅 ....
star2017
1年前
7471
0
贝壳找房 | 复杂订阅条件下,如何实时准确的向用户推送新上房源?
卫海波@贝壳找房 贝壳产品技术 贝壳找房 APP 给用户提供了海量房源的搜索查询功能,但是网站存量房源并不能完全满足用户的找房需求,用户希望可以及时获取新上房源的实时提醒。目前贝壳找房 APP 提供的房源新上实时推送有两个维度:基于关注小区的房源新上和基于搜索订阅条件的房源新上。 基于关注小区的房源 ....
star2017
1年前
8198
0
如何快速入门大数据
小白如何快速了解大数据产品及应用?
star2017
1年前
7857
0
浅谈蘑菇街大数据标签平台
起始 标签平台作为数据平台建设的一部分,尤其是在互联网电商平台中,有着重要的作用。本人在公司接手并且重构了整个标签平台的核心逻辑。对标签平台有一定的了解。写这篇文章的契机是几个数仓的哥们,问到了这方面的问题,正好我也可以总结一下。 本文从技术角度,通过以下几个方面来阐述标签平台的建设历程 什么是特征 ....
star2017
1年前
6973
0
58 技术 | 金融数仓体系建设
文章作者:胡明昊 58 金融 内容来源:58 技术 导语: 本文讲述了金融数据仓库从无到有的整体设计思路,以及对数据建模、质量控制、元数据管理及开发规范各方面的经验思考,希望对大家在数仓建设工作方面有所帮助。 背景 自 2018 年以来,随着业务体系的不断丰富与发展,数据分析与应用需求越来越丰富,对 ....
star2017
1年前
7268
0
Scala 下划线 (_) 用法汇总
导包时的通配符 import java.util._ 类似 Java 的 import java.util.* Scala 类中成员变量初始化 class Foo{ //String类型的默认值为null 不适合局部变量 var s: String = _ } 类型通配符 Java 的泛型系统有一个 ....
star2017
1年前
8075
0
腾讯实时计算平台优化实践
[图片] 分享:杜立 腾讯高级工程师 整理:戴季国 校对:苗文婷 来源:Flink 中文社区 摘要: 本文由腾讯高级工程师杜立分享,主要介绍腾讯实时计算平台针对 Flink SQL 所做的优化,内容包括: Flink SQL 现状 窗口功能的扩展 回撤流的优化 未来的规划 01 背景及现状 1. 三 ....
star2017
1年前
7346
0
Spark 性能调优总结
使用正确的 transformations 操作 虽然开发者达到某一目标,可以通过不同的 transformations 操作,但是有时候不同的姿势,性能差异非常明显。优化姿势的总体目标是尽可能少的产生 shuffle, 和待被 shuffled data。因为 shffule 过程存在写盘和节点间 ....
star2017
1年前
8044
0
Spark 宽依赖 窄依赖 Job Stage Executor Task 总结
[图片] 宽依赖与窄依赖 窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency). 窄依赖是指父 RDD 的每个分区只被子 RDD 的一个分区所使用,子 RDD 分区通常对应常数个父 RDD 分区(O(1),与数据规模无关 ....
star2017
1年前
7137
0
阿里巴巴为什么选择 Apache Flink?Flink——下一代大数据处理系统
[图片] 阿里妹导读:伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎 Apache Flink(以下简称 Flink)。本文将结合 ....
star2017
1年前
7192
0
【干货】Kafka 数据可靠性深度解读
我们先看一组评论再进入正文,我只想说厮大牛逼! [图片] 作者:朱忠华 原文:https://blog.csdn.net/u013256816/article/details/71091774 1 概述 Kakfa 起初是由 LinkedIn 公司开发的一个分布式的消息系统,后成为 Apache 的 ....
star2017
1年前
6041
0
1
2
3
4
...
27
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
中文版onlyoffice/documentserver镜像制作
6.
史上最全的“大数据”学习资源(上)
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
MongoDB报错:InvalidMongoDbApiUsageException之重复的字段条件
2.
mysql 8.0.34升级8.4.2升级完成后连接不上 Plugin 'mysql_native_password' is not loaded
3.
mysql 8二级等保设置
4.
mysql通过.idb文件恢复数据
5.
idea本地模式调试spark代码
6.
ubuntu更换阿里云或清华镜像源
最新评论
签到
?
签到
签到
签到,学习
签到