×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
万物皆 Embedding,从经典的 word2vec 到深度学习基本操作 item2vec
这里是 王喆的机器学习笔记 的第四篇文章,之前我们一起讨论了阿里的 DIN,YouTube 的深度学习推荐系统,本来今天想再分享另一篇科技巨头的业界前沿文章,Airbnb 的 Embedding 方法 但因为文章中涉及 word2vec 的技术细节,为了保证一些初学者的知识是自洽的,我还是想在此之前 ....
star2017
博客
1年前
8621
0
码农晋升为技术管理者后,痛并快乐着的纠结内心
[图片] 有一个非常有趣的现象:据说大部分的技术管理者,在其从程序员转为管理岗位的时候,都是在领导或公司的要求下,被动的推到管理岗位上的,并非是自己当初有强烈意愿、主动去选择管理岗的。这种被动的比例还不低,高达 80% 以上。 这个现象从我自己身边的同事中也可以感受到,最近两年我接触到的四五位新晋的 ....
star2017
博客
1年前
5644
0
滴滴出行基于 RocketMQ 构建企业级消息队列服务的实践
作者: 江海挺 2018-11-20 [图片] 本文整理自滴滴出行消息队列负责人 江海挺 在 Apache RocketMQ 开发者沙龙北京站的分享。 滴滴出行的消息技术选型 历史 初期,公司内部没有专门的团队维护消息队列服务,所以消息队列使用方式较多,主要以 Kafka 为主,有业务直连的,也有通 ....
star2017
博客
1年前
1781
0
【下】YouTube 深度学习推荐系统的十大工程问题
转载自 王喆的机器学习笔记 因为这篇文章主要介绍了 YouTube 深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下 Deep Neural Networks for YouTube Recommendations 中介绍的 YouTube 深度学习 ....
star2017
博客
1年前
10488
0
番外篇:Lucene 索引流程与倒排索引实现
前两篇文章主要围绕 Lucene 的底层索引文件结构方面介绍了倒排索引原理: http://www.6aiq.com/article/1564413040138 http://www.6aiq.com/article/1564413209435 在 Lucene 中,写数据的基本单元称之为 Docu ....
star2017
博客
1年前
3870
0
滴滴技术 | 数据挖掘技术在轨迹数据上的应用实践
[图片] 桔妹导读: 每天滴滴都会为上千万人提供出行服务,在这一过程中积累了海量轨迹数据。这些轨迹数据来自于公共服务,本文介绍如何利用这些数据回馈大众,改善出行体验。 一 背景 首先简要介绍一下什么是数据挖掘。数据挖掘(Data Mining)是指从大量数据中发现特定信息和模式的过程,也有很多人将这 ....
star2017
博客
1年前
4225
0
用 TensorFlow Extended 实现可扩展、快速且高效的 BERT 部署
文 / 由特邀作者 SAP Concur Labs 的高级机器学习工程师 Hannes Hapke 发布。由 Robert Crowe 代表 TFX 团队编辑。 [图片] Transformer 模型(尤其是 BERT 模型)为 NLP 带来巨大的变革,并且在情感分析、实体提取和问答问题等任务的处理 ....
star2017
博客
1年前
2629
0
微信「看一看」 推荐排序技术揭秘
本文转载自:微信 AI,作者 xiafengxia 在微信 AI 背后,技术究竟如何让一切发生?微信 AI 公众号推出技术专题系列“微信看一看背后的技术架构详解”,干货满满,敬请关注。以下为专题的第一篇《微信看一看推荐排序》。 第二篇:详文解读微信「看一看」多模型内容策略与召回 一、背景 微信公众平 ....
star2017
博客
1年前
9695
0
[详解] 一文读懂 BERT 模型
作者: Microstrong 本文概览: [图片] 1. Autoregressive 语言模型与 Autoencoder 语言模型 1.1 语言模型概念介绍 Autoregressive 语言模型:指的是依据前面(或后面)出现的单词来预测当前时刻的单词,代表有 ELMo, GPT 等。 Auto ....
star2017
博客
1年前
9983
0
个性化推荐技术
[图片] 文章作者:姚凯飞 Club Factory 推荐算法负责人 内容来源:作者授权发布 出品社区:DataFun 注:欢迎转载,转载请注明出处。 在这个时代背景下,信息爆炸与长尾问题普遍发生,而解决方案之一是个性化推荐技术,那具体什么是个性化推荐,怎么去实现这一过程呢?这一章读者朋友需要做到的 ....
star2017
博客
1年前
12210
0
推荐系统遇上深度学习 (十五)-- 强化学习在京东推荐中的探索
原文地址: https://www.jianshu.com/p/b9113332e33e 强化学习在各个公司的推荐系统中已经有过探索,包括阿里、京东等。之前在美团做过的一个引导语推荐项目,背后也是基于强化学习算法。本文,我们先来看一下强化学习是如何在京东推荐中进行探索的。 本文来自于 paper:《 ....
star2017
博客
1年前
9712
0
ES 查询性能调优实践,亿级数据查询毫秒级返回
1、概述 本文简要描述 ES 查询性能的优化过程。忽略很多细节,其实整个过程并不顺利,因为并没有一个明确的指引,教你怎么做就能让性能大幅提升。很多时候不同业务有不同的场景,还是需要自己摸索一番。比如用 filter 过滤取代 query 查询,明明官方文档说 filter 速度更快。但应用到我们业务 ....
star2017
博客
1年前
4095
0
回顾·CTR 预估系统实践
本文根据 OPPO 黄树东老师在 OPPO&DataFun Talk 算法架构系列活动“AI 在 OPPO 业务场景下的应用实践”所分享的《OPPO CTR 预估系统实践》编辑整理而成,在未改变原意的基础上稍做修改。 [图片] CTR 预估系统在商业变现领域有一个非常大的应用,也是非常核心的 ....
star2017
博客
1年前
8923
0
【贝壳网】两种简单有效的标签选择方法
[图片] 不论是通过搜索还是推荐,用户看到了很多我们用各种逻辑和理由展示给他的物品,他只从中消费了一部分物品。那么问题来了,到底是那些特性吸引了用户消费呢? 一种简单粗暴的办法是直接把用户产生过行为的物品标签累积在一起。但是这里要说的是另一种思路。 我们把用户对物品的行为,消费或者没有消费看成是一个 ....
star2017
博客
1年前
11165
0
电商推荐那点事
文章作者:姚凯飞 Club Factory 编辑整理:Hoh Xil 内容来源:作者授权发布 出品社区:DataFun ▌本次分享内容大纲: 推荐概述 好的推荐产品 几大挑战(用户、物品、系统、冷启动...) 模块与架构 召回及排序 ▌推荐概述**:** [图片] [图片] [图片] [图片] [图 ....
star2017
博客
1年前
11166
0
几十亿数据查询 3 秒返回,ES 性能优化实战!
公司的数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于有时间整理一些完善的文档,在此分享以供所需的朋友。 在此篇幅中偏重于 ES 的优化,关于 HBase,Hadoop 的设计优化有很多文章可以参考,不再赘述。 需求说明 项目背景: 在一业务系统中,部分表每天的数据量过亿,已按天分表,但业务 ....
star2017
博客
1年前
1345
0
沟通的重要工具——乔哈里视窗
写在前面 今年最大的成长之一就是对沟通的理解和认知,包括沟通的意义,如何更好的去沟通,毕竟因为沟通踩了不少坑。但就在最近从樊登的一个演讲中,听到了“沟通视窗”的模型,感觉特别惊艳,它将沟通这个抽象高维的事情映射到更多人可以理解的二维上去讨论,不同场景不同个体的沟通都可以套用的框架。为我们如何做好沟通 ....
star2017
博客
1年前
6090
0
基于内容的图像检索技术综述 传统经典方法
SIGAI 特约作者 manyi 视觉算法工程师 今天我们来介绍一下图片检索技术,图片检索就是拿一张待识别图片,去从海量的图片库中找到和待识别图片最相近的图片。这种操作在以前依靠图片名搜图的时代是难以想象的,直到出现了 CBIR(Content-based image retrieval)技术,依靠 ....
star2017
博客
1年前
10634
0
阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景
[图片] AI 前线导读: 11 月 28 日,阿里巴巴旗下大数据营销平台阿里妈妈宣布开源深度学习框架 XDL。这是阿里巴巴首次公开的深度学习框架,也是业界首个面向高维稀疏数据场景的深度学习开源框架,突破了现有深度学习开源框架大都面向图像、语音等低维稠密数据而设计的现状。 更多干货内容请关注微信公众 ....
star2017
博客
1年前
7902
0
Maven将JavaFX项目打包为exe(集成JRE)
Maven将JavaFX项目打包为exe(集成JRE) 最近用 JavaFx 写了个小工具,最终完成时需要打包成 exe 可执行文件并且集成 JRE 环境,在网上找了很多方法大多使用 exe4J 或一大堆 Maven 插件进行打包。...
wylc123
博客
1年前
946
0
1
...
461
462
463
...
472
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
SpringBoot2实践系列(六):集成监控模块Actuator详解
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到