×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
BERT 在美团搜索核心排序的探索和实践
美团点评技术团队 引言 美团搜索是美团 App 上最大的连接人和服务的入口,覆盖了团购、外卖、电影、酒店、买菜等各种生活服务。随着用户量快速增长,越来越多的用户在不同场景下都会通过搜索来获取自己想要的服务。理解用户 Query,将用户最想要的结果排在靠前的位置,是搜索引擎最核心的两大步骤。但是,用户 ....
star2017
博客
1年前
3367
0
机器学习数学基础:常见分布与假设检验
作者:吴忠强,Datawhale 优秀学习者,东北大学 所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。 这次是学习概率统计的第三篇文章, 基于前两篇文章进行展开。在第一篇文章的概率论基础学习了离散型 ....
star2017
博客
1年前
7332
0
阿里巴巴搜索引擎平台 Ha3 揭秘
云栖君导读: Ha3 是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。 Ha3 的架构 [图片] 在线 Ha3 是搜索体系中的在线部分,在其系统内部,包含 Qrs(Query result searcher)和 Searcher 两种基本的角色。 Qr ....
star2017
博客
1年前
3858
0
如何构建用户画像—打用户行为标签
本文转载自 机器学习与人工智能 公众号 用户画像中用户行为标签是很重要的一块内容,这篇详细讲讲如何打行为标签。 数据仓库 用户画像的应用流程从原始的数据输入到模型应用可分为 5 块(图 1),包括将操作型环境数据经 ETL 后集中存储在数据仓库,之后经过对数据的建模、挖掘、分析建立用户画像模型,最终 ....
star2017
博客
1年前
9009
0
十年技术老兵总结的自我修炼之路
[图片] 赵健博,快手大数据架构团队的负责人 工作十年,跳槽三次,四份工作 毕业后加入百度 我是在北京邮电大学就读的本科,毕业后被保送到了中国科学院计算技术研究所,硕士期间主要从事的是计算机系统结构与操作系统的相关研究。上学时对 Linux Kernel 非常痴迷,也做些有意思的小项目,研究生毕业后 ....
star2017
博客
1年前
5400
0
工作中组内遇到的 elasticsearch 使用上的踩坑总结
嵌套索引的坑 场景: 一个 spu doc 下有多个内嵌的 csu,csu 内有上下架状态,前台操作某 csu 上下架,在商城界面看起来未生效。 坑 1: MySQL binlog 消息监控组件 dbus 通知服务端 B 多台机器消息变更时,未考虑 spu 下 csu 消息的消费顺序性,导致同一 s ....
star2017
博客
1年前
7258
0
「干货」YouTube 基于深度神经网络推荐系统剖析
[图片] 文章作者:王科 某司资深算法工程师 内容来源:《YouTube 基于深度神经网络推荐系统剖析》 出品社区:DataFun YouTube 的推荐系统是近年来业内的佼楚之作。其经典之处不仅仅在于基于深度学习的解决方案,也有很多不属于纯技术范畴的设计抉择。 YouTube 转用深度学习做推荐系 ....
star2017
博客
1年前
9592
0
【美团】LruCache 在美团 DSP 系统中的应用演进
背景 DSP 系统是互联网广告需求方平台,用于承接媒体流量,投放广告。业务特点是并发度高,平均响应低(百毫秒)。 为了能够有效提高 DSP 系统的性能,美团平台引入了一种带有清退机制的缓存结构 LruCache(Least Recently Used Cache),在目前的 DSP 系统中,使用 L ....
star2017
博客
1年前
7601
0
神马搜索技术演进之路
前言 国内搜索引擎大事记 1998 年,Google 发布;2000 年,百度发布;2004 年,搜狗发布;2006 年,搜搜发布;2010 年,Google 退出中国;2012 年,360 搜索发布;2013 年,神马发布,搜搜并入搜狗,百度收购 91;2017 年,微信推出搜一搜。 神马搜索简介 ....
star2017
博客
1年前
9861
0
腾讯 | 从零开始了解推荐系统全貌
作者:yijiapan,腾讯 WXG 数据分析师 有幸参与了几个业务推荐系统搭建的全流程,本文将从实际经验出发,为大家解构如何从从零搭建推荐系统,希望跟大家能够相互交流,如有错误之处烦请指正。 一、推荐算法的理解 如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可 ....
star2017
博客
1年前
4685
0
干货 | 内容型产品 Feed 流的生成、效果评估及优化
本篇文章属于超级干货方法论,不论是产品、运营还是数据分析从业者,只要是内容型产品形态,便都会需要接触到 Feed 流,且整个工作几乎都围绕着内容优化这一主题。本篇我将讲述自己对这方面方法论的理解总结,相信读完本篇文章会对你有所帮助。 一、Feed 流是什么? Feed 流是将若干消息源组合在一起,帮 ....
star2017
博客
1年前
4683
0
TensorFlow 中最大的 30 个机器学习数据集
作者:Limarc Ambalina 编译:ronghuaiyang 导读: 包括图像,视频,音频,文本,非常的全。 [图片] 由谷歌 Brain 的研究人员创建的 TensorFlow 是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。Tenso ....
star2017
博客
1年前
2283
0
Elasticsearch 遇上 BERT:使用 Elasticsearch 和 BERT 构建搜索引擎
作者:Hironsan 编译:ronghuaiyang 导读: 强强联合,看看是否能有 1+1>2 的效果。 在这篇文章中,我们使用一个预先训练好的 BERT 模型和 Elasticsearch 来构建一个搜索引擎。Elasticsearch 最近发布了带有矢量字段的文本相似性搜索。另一方面,你可以 ....
star2017
博客
1年前
1915
0
推荐系统遇上深度学习 (十四)--《DRN:A Deep Reinforcement Learning Framework for News Recommendation》
之前学习了强化学习的一些内容以及推荐系统的一些内容,二者能否联系起来呢!今天阅读了一篇论文,题目叫《DRN: A Deep Reinforcement Learning Framework for News Recommendation》。该论文便是深度强化学习和推荐系统的一个结合,也算是提供了一个 ....
star2017
博客
1年前
10048
0
万物皆 Embedding,从经典的 word2vec 到深度学习基本操作 item2vec
这里是 王喆的机器学习笔记 的第四篇文章,之前我们一起讨论了阿里的 DIN,YouTube 的深度学习推荐系统,本来今天想再分享另一篇科技巨头的业界前沿文章,Airbnb 的 Embedding 方法 但因为文章中涉及 word2vec 的技术细节,为了保证一些初学者的知识是自洽的,我还是想在此之前 ....
star2017
博客
1年前
7633
0
码农晋升为技术管理者后,痛并快乐着的纠结内心
[图片] 有一个非常有趣的现象:据说大部分的技术管理者,在其从程序员转为管理岗位的时候,都是在领导或公司的要求下,被动的推到管理岗位上的,并非是自己当初有强烈意愿、主动去选择管理岗的。这种被动的比例还不低,高达 80% 以上。 这个现象从我自己身边的同事中也可以感受到,最近两年我接触到的四五位新晋的 ....
star2017
博客
1年前
5058
0
滴滴出行基于 RocketMQ 构建企业级消息队列服务的实践
作者: 江海挺 2018-11-20 [图片] 本文整理自滴滴出行消息队列负责人 江海挺 在 Apache RocketMQ 开发者沙龙北京站的分享。 滴滴出行的消息技术选型 历史 初期,公司内部没有专门的团队维护消息队列服务,所以消息队列使用方式较多,主要以 Kafka 为主,有业务直连的,也有通 ....
star2017
博客
1年前
1631
0
【下】YouTube 深度学习推荐系统的十大工程问题
转载自 王喆的机器学习笔记 因为这篇文章主要介绍了 YouTube 深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下 Deep Neural Networks for YouTube Recommendations 中介绍的 YouTube 深度学习 ....
star2017
博客
1年前
9068
0
番外篇:Lucene 索引流程与倒排索引实现
前两篇文章主要围绕 Lucene 的底层索引文件结构方面介绍了倒排索引原理: http://www.6aiq.com/article/1564413040138 http://www.6aiq.com/article/1564413209435 在 Lucene 中,写数据的基本单元称之为 Docu ....
star2017
博客
1年前
3531
0
滴滴技术 | 数据挖掘技术在轨迹数据上的应用实践
[图片] 桔妹导读: 每天滴滴都会为上千万人提供出行服务,在这一过程中积累了海量轨迹数据。这些轨迹数据来自于公共服务,本文介绍如何利用这些数据回馈大众,改善出行体验。 一 背景 首先简要介绍一下什么是数据挖掘。数据挖掘(Data Mining)是指从大量数据中发现特定信息和模式的过程,也有很多人将这 ....
star2017
博客
1年前
3726
0
1
...
460
461
462
...
471
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到