×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
BERT 在美团搜索核心排序的探索和实践
美团点评技术团队 引言 美团搜索是美团 App 上最大的连接人和服务的入口,覆盖了团购、外卖、电影、酒店、买菜等各种生活服务。随着用户量快速增长,越来越多的用户在不同场景下都会通过搜索来获取自己想要的服务。理解用户 Query,将用户最想要的结果排在靠前的位置,是搜索引擎最核心的两大步骤。但是,用户 ....
star2017
博客
1年前
3424
0
机器学习数学基础:常见分布与假设检验
作者:吴忠强,Datawhale 优秀学习者,东北大学 所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。 这次是学习概率统计的第三篇文章, 基于前两篇文章进行展开。在第一篇文章的概率论基础学习了离散型 ....
star2017
博客
1年前
7526
0
阿里巴巴搜索引擎平台 Ha3 揭秘
云栖君导读: Ha3 是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。 Ha3 的架构 [图片] 在线 Ha3 是搜索体系中的在线部分,在其系统内部,包含 Qrs(Query result searcher)和 Searcher 两种基本的角色。 Qr ....
star2017
博客
1年前
3931
0
如何构建用户画像—打用户行为标签
本文转载自 机器学习与人工智能 公众号 用户画像中用户行为标签是很重要的一块内容,这篇详细讲讲如何打行为标签。 数据仓库 用户画像的应用流程从原始的数据输入到模型应用可分为 5 块(图 1),包括将操作型环境数据经 ETL 后集中存储在数据仓库,之后经过对数据的建模、挖掘、分析建立用户画像模型,最终 ....
star2017
博客
1年前
9315
0
十年技术老兵总结的自我修炼之路
[图片] 赵健博,快手大数据架构团队的负责人 工作十年,跳槽三次,四份工作 毕业后加入百度 我是在北京邮电大学就读的本科,毕业后被保送到了中国科学院计算技术研究所,硕士期间主要从事的是计算机系统结构与操作系统的相关研究。上学时对 Linux Kernel 非常痴迷,也做些有意思的小项目,研究生毕业后 ....
star2017
博客
1年前
5572
0
工作中组内遇到的 elasticsearch 使用上的踩坑总结
嵌套索引的坑 场景: 一个 spu doc 下有多个内嵌的 csu,csu 内有上下架状态,前台操作某 csu 上下架,在商城界面看起来未生效。 坑 1: MySQL binlog 消息监控组件 dbus 通知服务端 B 多台机器消息变更时,未考虑 spu 下 csu 消息的消费顺序性,导致同一 s ....
star2017
博客
1年前
7560
0
「干货」YouTube 基于深度神经网络推荐系统剖析
[图片] 文章作者:王科 某司资深算法工程师 内容来源:《YouTube 基于深度神经网络推荐系统剖析》 出品社区:DataFun YouTube 的推荐系统是近年来业内的佼楚之作。其经典之处不仅仅在于基于深度学习的解决方案,也有很多不属于纯技术范畴的设计抉择。 YouTube 转用深度学习做推荐系 ....
star2017
博客
1年前
9992
0
【美团】LruCache 在美团 DSP 系统中的应用演进
背景 DSP 系统是互联网广告需求方平台,用于承接媒体流量,投放广告。业务特点是并发度高,平均响应低(百毫秒)。 为了能够有效提高 DSP 系统的性能,美团平台引入了一种带有清退机制的缓存结构 LruCache(Least Recently Used Cache),在目前的 DSP 系统中,使用 L ....
star2017
博客
1年前
7788
0
神马搜索技术演进之路
前言 国内搜索引擎大事记 1998 年,Google 发布;2000 年,百度发布;2004 年,搜狗发布;2006 年,搜搜发布;2010 年,Google 退出中国;2012 年,360 搜索发布;2013 年,神马发布,搜搜并入搜狗,百度收购 91;2017 年,微信推出搜一搜。 神马搜索简介 ....
star2017
博客
1年前
10328
0
腾讯 | 从零开始了解推荐系统全貌
作者:yijiapan,腾讯 WXG 数据分析师 有幸参与了几个业务推荐系统搭建的全流程,本文将从实际经验出发,为大家解构如何从从零搭建推荐系统,希望跟大家能够相互交流,如有错误之处烦请指正。 一、推荐算法的理解 如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可 ....
star2017
博客
1年前
4795
0
干货 | 内容型产品 Feed 流的生成、效果评估及优化
本篇文章属于超级干货方法论,不论是产品、运营还是数据分析从业者,只要是内容型产品形态,便都会需要接触到 Feed 流,且整个工作几乎都围绕着内容优化这一主题。本篇我将讲述自己对这方面方法论的理解总结,相信读完本篇文章会对你有所帮助。 一、Feed 流是什么? Feed 流是将若干消息源组合在一起,帮 ....
star2017
博客
1年前
4813
0
TensorFlow 中最大的 30 个机器学习数据集
作者:Limarc Ambalina 编译:ronghuaiyang 导读: 包括图像,视频,音频,文本,非常的全。 [图片] 由谷歌 Brain 的研究人员创建的 TensorFlow 是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。Tenso ....
star2017
博客
1年前
2324
0
Elasticsearch 遇上 BERT:使用 Elasticsearch 和 BERT 构建搜索引擎
作者:Hironsan 编译:ronghuaiyang 导读: 强强联合,看看是否能有 1+1>2 的效果。 在这篇文章中,我们使用一个预先训练好的 BERT 模型和 Elasticsearch 来构建一个搜索引擎。Elasticsearch 最近发布了带有矢量字段的文本相似性搜索。另一方面,你可以 ....
star2017
博客
1年前
1943
0
推荐系统遇上深度学习 (十四)--《DRN:A Deep Reinforcement Learning Framework for News Recommendation》
之前学习了强化学习的一些内容以及推荐系统的一些内容,二者能否联系起来呢!今天阅读了一篇论文,题目叫《DRN: A Deep Reinforcement Learning Framework for News Recommendation》。该论文便是深度强化学习和推荐系统的一个结合,也算是提供了一个 ....
star2017
博客
1年前
10388
0
万物皆 Embedding,从经典的 word2vec 到深度学习基本操作 item2vec
这里是 王喆的机器学习笔记 的第四篇文章,之前我们一起讨论了阿里的 DIN,YouTube 的深度学习推荐系统,本来今天想再分享另一篇科技巨头的业界前沿文章,Airbnb 的 Embedding 方法 但因为文章中涉及 word2vec 的技术细节,为了保证一些初学者的知识是自洽的,我还是想在此之前 ....
star2017
博客
1年前
7875
0
码农晋升为技术管理者后,痛并快乐着的纠结内心
[图片] 有一个非常有趣的现象:据说大部分的技术管理者,在其从程序员转为管理岗位的时候,都是在领导或公司的要求下,被动的推到管理岗位上的,并非是自己当初有强烈意愿、主动去选择管理岗的。这种被动的比例还不低,高达 80% 以上。 这个现象从我自己身边的同事中也可以感受到,最近两年我接触到的四五位新晋的 ....
star2017
博客
1年前
5192
0
滴滴出行基于 RocketMQ 构建企业级消息队列服务的实践
作者: 江海挺 2018-11-20 [图片] 本文整理自滴滴出行消息队列负责人 江海挺 在 Apache RocketMQ 开发者沙龙北京站的分享。 滴滴出行的消息技术选型 历史 初期,公司内部没有专门的团队维护消息队列服务,所以消息队列使用方式较多,主要以 Kafka 为主,有业务直连的,也有通 ....
star2017
博客
1年前
1663
0
【下】YouTube 深度学习推荐系统的十大工程问题
转载自 王喆的机器学习笔记 因为这篇文章主要介绍了 YouTube 深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下 Deep Neural Networks for YouTube Recommendations 中介绍的 YouTube 深度学习 ....
star2017
博客
1年前
9424
0
番外篇:Lucene 索引流程与倒排索引实现
前两篇文章主要围绕 Lucene 的底层索引文件结构方面介绍了倒排索引原理: http://www.6aiq.com/article/1564413040138 http://www.6aiq.com/article/1564413209435 在 Lucene 中,写数据的基本单元称之为 Docu ....
star2017
博客
1年前
3621
0
滴滴技术 | 数据挖掘技术在轨迹数据上的应用实践
[图片] 桔妹导读: 每天滴滴都会为上千万人提供出行服务,在这一过程中积累了海量轨迹数据。这些轨迹数据来自于公共服务,本文介绍如何利用这些数据回馈大众,改善出行体验。 一 背景 首先简要介绍一下什么是数据挖掘。数据挖掘(Data Mining)是指从大量数据中发现特定信息和模式的过程,也有很多人将这 ....
star2017
博客
1年前
3840
0
1
...
460
461
462
...
471
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
史上最全的“大数据”学习资源(上)
5.
onlyoffice 20并发限制处理,up to 20 maximum
6.
SpringBoot2实践系列(六):集成监控模块Actuator详解
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
paddlenlp实现关系抽取
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到