×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
知乎 Flink 数据集成平台建设实践
[图片] 分享嘉宾:孙晓光 知乎 技术平台负责人 内容来源:Flink 中文社区 摘要: 本文由知乎技术平台负责人孙晓光分享,主要介绍知乎 Flink 数据集成平台建设实践。内容如下: 业务场景 历史设计 全面转向 Flink 后的设计 未来 Flink 应用场景的规划 01 业务场景 很高兴和大家 ....
star2017
博客
1年前
3097
0
浅谈 UC 国际信息流推荐
分享嘉宾:杰雄 阿里巴巴 编辑整理:Hoh Xil 内容来源:大鱼技术沙龙 出品社区:DataFun 导读: 本次分享的主题是浅谈 UC 国际信息流推荐。会跟大家探讨下发链路中常见的一些问题,主要包括两个场景: 列表页排序,包括:目标确定、多目标任务以及混排组合优化。 内容冷启问题,如果不做内容理解 ....
star2017
博客
1年前
9173
0
冗余数据一致性,到底如何保证?
一,为什么要冗余数据 互联网数据量很大的业务场景,往往数据库需要进行水平切分来降低单库数据量。 水平切分会有一个 patition key,通过 patition key 的查询能够直接定位到库,但是非 patition key 上的查询可能就需要扫描多个库了。 此时常见的架构设计方案,是使用数据冗 ....
star2017
博客
1年前
3351
0
Walrus- 一个轻量级 olap 查询框架
Walrus Introduction walrus是一个轻量级 olap 查询框架。它支持多源异构数据源(hdfs,mysql,clickhouse,kylin,druid...),采用 apache spark 作为聚合计算引擎,在雪花模型上通过 JSON 提供 ETL 建模和 ad hoc 数 ....
star2017
博客
1年前
9450
0
一条数据的 HBase 之旅,简明 HBase 入门教程 - 开篇
一些常见的 HBase 新手问题 什么样的数据适合用 HBase 来存储? 既然 HBase 也是一个数据库,能否用它将现有系统中昂贵的 Oracle 替换掉? 存放于 HBase 中的数据记录,为何不直接存放于 HDFS 之上? 能否直接使用 HBase 来存储文件数据? Region(HBase ....
star2017
博客
1年前
625
0
互联网智能广告系统简易流程与架构
很多朋友估计没有做过这一块,争取最简洁的语言描述清楚。 一、业务简述 [图片] 从业务上看 整个智能广告系统,主要分为: 1)业务端:广告主的广告后台 2)展现端:用户实际访问的页面 业务端,广告主主要有两类行为: 1)广告设置行为:例如设置投放计划,设置地域,类别,关键字,竞价等 2)效果查看行为 ....
star2017
博客
1年前
9683
0
字节跳动全链路压测 (Rhino) 的实践
[图片] 1. 背景 随着公司业务的不断扩张,用户流量在不断提升,研发体系的规模和复杂性也随之增加。线上服务的稳定性也越来越重要,服务性能问题,以及容量问题也越发明显。 因此有必要搭建一个有效压测系统,提供安全、高效、真实的线上全链路压测服务,为线上服务保驾护航。 关于全链路压测的建设,业界已经有了 ....
star2017
博客
1年前
2932
0
推荐系统 pipeline 的构建过程和总体架构描述。
作者:Parul Pandey 编译:ronghuaiyang 推荐系统 pipeline 的构建过程和总体架构描述。 [图片] 选择太少不好,但是选择太多也不是什么好事 你听说过著名的果酱实验吗?2000 年,哥伦比亚大学和斯坦福大学的心理学家 Sheena Iyengar 和 Mark Lepp ....
star2017
博客
1年前
9332
0
Java GC 调优怎么做?
[图片] 作者 | 杨晓峰 出处 | 极客时间《Java 核心技术 36 讲》专栏 我发现,目前不少外部资料对 G1 的介绍大多还停留在 JDK 7 或更早期的实现,很多结论已经存在较大偏差,甚至一些过去的 GC 选项已经不再推荐使用。所以,今天我会选取新版 JDK 中的默认 G1 GC 作为重点进 ....
star2017
博客
1年前
532
0
58 信息安全—营销反作弊业务的算法实践
导读: 本文介绍当前 58 营销反作弊业务算法建设的一些实践内容,主要聚焦于各类算法在体系中的应用设计以及相关算法在体系中的实践应用。 背景 58 每年会借助 58 同城、58 同镇等平台,投入数以亿计的成本,来进行各式各样的营销活动,以此达到平台各业务线的拉新、促活、促销等目的。然而现实中存在一些 ....
star2017
博客
1年前
10792
0
阿里深度召回模型实践
[图片] 文章作者:韩宇、张跃伟 阿里巴巴 内容来源:阿里云开发者 导读: 召回结果的好坏对整个推荐结果有着至关重要的影响,最近的一系列实践和研究表明,基于行为序列的深度学习推荐模型搭配高性能的近似检索算法可以实现既准又快的召回性能;与此同时,用户在天猫精灵上还可以进行实时指令操控,利用丰富的反馈信 ....
star2017
博客
1年前
4536
0
AIQ - 人工智能 | 人工智能军备竞赛:一文尽览全球主要国家 AI 战略
人工智能的迅速发展将深刻改变人类社会和世界的面貌,为了抓住 AI 发展的战略机遇,越来越多的国家和组织已争相开始制定国家层面的发展规划。近日,来自加拿大先进技术研究院(CIFAR)的政策研究员 Tim Dutton 对颁布了 AI 战略的一些国家进行了总结。本文在发布之后引起了 Yann LeCun ....
star2017
博客
1年前
10806
0
推荐系统应该如何保障推荐的多样性?
作者:周开拓 第四范式 来源:周开拓@知乎问答 首先,推荐系统的多样性并不应该是一个推荐系统追求的终极目标。 多样性,是手段,不是目标! 多样性,是手段,不是目标! 多样性,是手段,不是目标! 重要的事情重复三遍,为什么不能作为目标呢?因为: 1. 多样性很难量化。3 个体育新闻 +7 个小姐姐和 ....
star2017
博客
1年前
9429
0
回顾·云上 HBase 冷热分离实践
[图片] 本文根据阿里云技术专家郭泽晖在中国 HBase 技术社区第 3 届 MeetUp 杭州站中分享的《云上 HBase 冷热分离实践》编辑整理而成。 [图片] 今天分享的内容分为两个方面,首先会介绍下冷数据的经典场景,以及如果使用开源的 HBase 应该如何实现,最后介绍下 HBase 在云端 ....
star2017
博客
1年前
2476
0
基于内容的推荐算法
作者丨 gongyouliu 欢迎关注他的公众号 gongyouliu 作者在上篇文章《推荐系统产品与算法概述》中对推荐算法做了比较全面的概述,本篇开始我们来详细讲解各类推荐算法。这篇文章我们主要关注的是基于内容的推荐算法,它也是非常通用的一类推荐算法,在工业界有大量的应用案例。 本文会从什么是基于 ....
star2017
博客
1年前
6939
0
一条数据的 HBase 之旅,简明 HBase 入门教程 -Write 全流程
如果将上篇内容理解为一个冗长的'铺垫',那么,从本文开始,'剧情'才开始正式展开。本文基于所给出的样例数据,介绍了将数据从 Client 写到 RegionServer 的全流程。 本文整体思路: 1. 前文内容回顾 2. 示例数据 3. HBase 可选接口介绍 4. 表服务接口介绍 5. 介绍几 ....
star2017
博客
1年前
2587
0
苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用
胡正林 2018 年 11 月 5 日 话题:架构大数据 [图片] 背景说明 苏宁易购商品评价系统主要提供商品维度评价数量聚合、评价列表展示功能,并为其他业务系统提供商品评价数据支撑服务。功能涉及对亿级数据的数量聚合、排序、多维度查询等复杂的业务场景,关系型数据库的索引为 B-Tree 结构,适合数 ....
star2017
博客
1年前
6750
0
真正的高手都是悄无声息的摆渡人
[图片] 作者:莜麦面 来源:商界洞见(ID:biz998) 我知道我不是他的明天,我唯一可以做的,就是把他送到彼岸。——张嘉佳《摆渡人》 01 我的研究生导师是一个和蔼可亲、清心寡欲的教授。也许是因为他的导师是国际经济法方向的权威,治学严谨,他身上便传袭了西南联大大师的风范。 他有一个儿子,当时在 ....
star2017
博客
1年前
5318
0
美团智能问答技术探索与实践
[图片] 分享嘉宾:美团 江会星 博士 编辑整理:韩佳 出品平台:DataFunTalk 导读: 本文主要介绍在美团业务中智能问答技术的相关落地与实践。通常问答系统需要提前构建好问答对知识库,这种方式对高频问题能处理的很好,但难以解决开放性问题。在日常生活服务中,如'去哪玩'、'住哪家酒店'等,在行 ....
star2017
博客
1年前
9648
0
语义分割江湖的那些事儿——从旷视说起
今天的主题是 Face++ Detection 组近两年持续在做的 Semantic Segmentation 相关工作,代表性成果主要有 1)GCN (CVPR2017)、2)DFN (CVPR2018)、3)BiSeNet (ECCV2018)。我们先来看一段演示 Demo: [视频] CVPR ....
star2017
博客
1年前
10910
0
1
...
437
438
439
...
472
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
SpringBoot2实践系列(六):集成监控模块Actuator详解
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到