×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据 共 539 个结果.
爱奇艺大数据生态的实时数仓建设
作者: 爱奇艺技术产品团队 数据作为互联网时代的基础生产资料,在各大公司企业拥有举足轻重的地位。数据的价值在互联网公司的体现,大致而言可以分成三类: 发掘数据中的信息来指导决策,如产品运营、用户增长相关的 BI 报表 依托数据优化用户体验和变现效率,如信息分发场景下的个性化推荐、效果广告等 基于数据 ....
star2017
1年前
7261
0
如何快速入门大数据
小白如何快速了解大数据产品及应用?
star2017
1年前
8588
0
工作中组内遇到的 elasticsearch 使用上的踩坑总结
嵌套索引的坑 场景: 一个 spu doc 下有多个内嵌的 csu,csu 内有上下架状态,前台操作某 csu 上下架,在商城界面看起来未生效。 坑 1: MySQL binlog 消息监控组件 dbus 通知服务端 B 多台机器消息变更时,未考虑 spu 下 csu 消息的消费顺序性,导致同一 s ....
star2017
1年前
7245
0
【干货】Kafka 数据可靠性深度解读
我们先看一组评论再进入正文,我只想说厮大牛逼! [图片] 作者:朱忠华 原文:https://blog.csdn.net/u013256816/article/details/71091774 1 概述 Kakfa 起初是由 LinkedIn 公司开发的一个分布式的消息系统,后成为 Apache 的 ....
star2017
1年前
6603
0
阿里巴巴为什么选择 Apache Flink?Flink——下一代大数据处理系统
[图片] 阿里妹导读:伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎 Apache Flink(以下简称 Flink)。本文将结合 ....
star2017
1年前
7828
0
Spark 宽依赖 窄依赖 Job Stage Executor Task 总结
[图片] 宽依赖与窄依赖 窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency). 窄依赖是指父 RDD 的每个分区只被子 RDD 的一个分区所使用,子 RDD 分区通常对应常数个父 RDD 分区(O(1),与数据规模无关 ....
star2017
1年前
7739
0
Spark 性能调优总结
使用正确的 transformations 操作 虽然开发者达到某一目标,可以通过不同的 transformations 操作,但是有时候不同的姿势,性能差异非常明显。优化姿势的总体目标是尽可能少的产生 shuffle, 和待被 shuffled data。因为 shffule 过程存在写盘和节点间 ....
star2017
1年前
8788
0
腾讯实时计算平台优化实践
[图片] 分享:杜立 腾讯高级工程师 整理:戴季国 校对:苗文婷 来源:Flink 中文社区 摘要: 本文由腾讯高级工程师杜立分享,主要介绍腾讯实时计算平台针对 Flink SQL 所做的优化,内容包括: Flink SQL 现状 窗口功能的扩展 回撤流的优化 未来的规划 01 背景及现状 1. 三 ....
star2017
1年前
8076
0
Scala 下划线 (_) 用法汇总
导包时的通配符 import java.util._ 类似 Java 的 import java.util.* Scala 类中成员变量初始化 class Foo{ //String类型的默认值为null 不适合局部变量 var s: String = _ } 类型通配符 Java 的泛型系统有一个 ....
star2017
1年前
8727
0
58 技术 | 金融数仓体系建设
文章作者:胡明昊 58 金融 内容来源:58 技术 导语: 本文讲述了金融数据仓库从无到有的整体设计思路,以及对数据建模、质量控制、元数据管理及开发规范各方面的经验思考,希望对大家在数仓建设工作方面有所帮助。 背景 自 2018 年以来,随着业务体系的不断丰富与发展,数据分析与应用需求越来越丰富,对 ....
star2017
1年前
7945
0
浅谈蘑菇街大数据标签平台
起始 标签平台作为数据平台建设的一部分,尤其是在互联网电商平台中,有着重要的作用。本人在公司接手并且重构了整个标签平台的核心逻辑。对标签平台有一定的了解。写这篇文章的契机是几个数仓的哥们,问到了这方面的问题,正好我也可以总结一下。 本文从技术角度,通过以下几个方面来阐述标签平台的建设历程 什么是特征 ....
star2017
1年前
7561
0
消息中间件—RocketMQ 消息消费(二)(push 模式实现)
摘要:在 RocketMQ 中,消息消费都是基于 Pull 消息方式,那么 Push 模式中又是如何实现 Consumer 端准实时消费的呢? 在上一篇—“消息中间件—RocketMQ 消息消费(一)”中,已经简要地介绍了下 RocketMQ 中“Pull 和 Push 两种消费方式的简要流程”以及 ....
star2017
1年前
7265
0
贝壳找房 | 复杂订阅条件下,如何实时准确的向用户推送新上房源?
卫海波@贝壳找房 贝壳产品技术 贝壳找房 APP 给用户提供了海量房源的搜索查询功能,但是网站存量房源并不能完全满足用户的找房需求,用户希望可以及时获取新上房源的实时提醒。目前贝壳找房 APP 提供的房源新上实时推送有两个维度:基于关注小区的房源新上和基于搜索订阅条件的房源新上。 基于关注小区的房源 ....
star2017
1年前
8759
0
【有赞】数据资产,赞之治理
作者:见风 团队:有赞大数据团队 一、背景介绍 大数据概念的提出已十年有余,这期间风靡全球,与其相关的理论、技术和实践遍地开花,整个领域都在飞速发展。野蛮生长之下,“数据治理”的呼声水涨船高。工信部 19 年提出:将加强数据治理,扎实推进国家大数据发展战略,将数据治理重要性上升到新的高度。在各行业畅 ....
star2017
1年前
7986
0
Walrus- 一个轻量级 olap 查询框架
Walrus Introduction walrus是一个轻量级 olap 查询框架。它支持多源异构数据源(hdfs,mysql,clickhouse,kylin,druid...),采用 apache spark 作为聚合计算引擎,在雪花模型上通过 JSON 提供 ETL 建模和 ad hoc 数 ....
star2017
1年前
8398
0
Flink 在有赞实时计算的实践
转载自: 有赞技术团队博客 一、前言 这篇主要由五个部分来组成: 首先是有赞的实时平台架构。 其次是在调研阶段我们为什么选择了 Flink。在这个部分,主要是 Flink 与 Spark 的 structured streaming 的一些对比和选择 Flink 的原因。 第三个就是比较重点的内容, ....
star2017
1年前
7915
0
【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 B 站的应用
分享嘉宾: 张杨,B 站资深开发工程师 整理出品: AICUG 人工智能社区 https://img.6aiq.com/bilibili_flink.mp4 导读 : 整个机器学习的过程,从数据上报,到特征计算,到模型训练,再到线上部署,最终效果评估,整个流程非常冗长,在 b 站,多个团队都会搭建自 ....
star2017
1年前
11387
0
流式数据处理在百度数据工厂的应用与实践
本文整理自百度李俊卿在 QCon 上的演讲:《流式数据处理在百度数据工厂的应用与实践》。 百度数据工厂最原先用 Hive 引擎,进行离线批量数据分析和 PB 级别的查询,处理一些核心报表数据。但是在我们推广过程中发现,用户其实还是有复杂分析、实时处理、数据挖掘的请求,我们在 Spark1.0 推出的 ....
star2017
1年前
7788
0
消息中间件—RocketMQ 消息存储(一)
文章摘要:MQ 分布式消息队列大致流程在于消息的一发一收一存,本篇将为大家主要介绍下 RocketMQ 存储部分的架构 消息存储是 MQ 消息队列中最为复杂和最为重要的一部分,所以小编也就放在 RocketMQ 系列篇幅中最后一部分来进行阐述和介绍。本文先从目前几种比较常用的 MQ 消息队列存储方式 ....
star2017
1年前
7523
0
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
作者:Stefan Kojouharov 译者:郝毅 2018 年 11 月 27 日 话题:AI 语言 & 开发大数据深度学习 2018 年 11 月 27 日 话题:AI 语言 & 开发大数据深度学习机器学习 [图片] 本文是根据 Stefan Kojouharov 发表在 Me ....
star2017
1年前
14762
0
1
2
3
4
...
27
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到