×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
深入浅出词嵌入技术
本文概览: [图片] 本文又名《Distributed Representation: From Static Embedding to Contextualized Embedding》 [图片] 1. Classical Representation: One-hot Encoding 独热编码 ....
star2017
博客
1年前
8848
0
腾讯微信 | 看一看实时相关推荐,满足你对同主题文章的“意犹未尽”
作者: 微信 AI 团队 谢若冰等 导语 在推荐系统中,用户在一个时间段经常会关注同一个主题。当用户读完一篇文章时,他往往会想要继续阅读和这篇文章相关的拓展文章。然而,传统的推荐系统 feed 流难以提供这种深度的拓展阅读(相关阅读)功能。这是由于考虑到推荐系统多样性和兴趣试探的要求,主推荐流中的文 ....
star2017
博客
1年前
4577
0
贝壳找房【语言模型系列】实践篇:ALBERT 在房产领域的实践
贝壳找房【语言模型系列】原理篇一:从 one-hot 到 Word2vec 贝壳找房【语言模型系列】原理篇二:从 ELMo 到 ALBERT 随着预训练模型在各大榜单的不断屠榜,学术界和工业界对于预训练模型的研究也愈加狂热。预训练语言模型一般基于海量语料,消耗大量的硬件资源以及时间成本,利用无监督的 ....
star2017
博客
1年前
10111
0
Lucene 源码系列——BooleanQuery 介绍
阅读原文: https://www.amazingkoala.com.cn/Lucene/Search/2018/1211/25.html BooleanQuery 常用来对实现多个 Query 子类对象的进行组合,这些 Query 子类对象会组成一个 Cluase 实现组合查询。每一个 Query ....
star2017
博客
1年前
1465
0
阿里巴巴为什么选择 Apache Flink?Flink——下一代大数据处理系统
[图片] 阿里妹导读:伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎 Apache Flink(以下简称 Flink)。本文将结合 ....
star2017
博客
1年前
8808
0
深度学习之表示学习(理论结合实践的思考)
作者:美丽联合集团 算法工程师 琦琦 ,公众号关注:诗品算法 阅读原文:https://zhuanlan.zhihu.com/p/234224652 本文经作者授权转载,转载请联系原作者 第一篇: 蘑菇街首页推荐视频流——增量学习与 wide&deepFM 实践(工程 + 算法) 楔子 你们 ....
star2017
博客
1年前
4095
0
贝壳找房—【图数据库系列】Dgraph 简介篇
系列文章: https://www.6aiq.com/article/1586913224622 在上一篇文章中我们已经对当前流行的几款图数据库做过简单的分析,并介绍了我们为什么使用 Dgraph。从本篇内容开始,我们将开启 Dgraph 之旅,探索这个图数据库方向的新贵。 注:本章内容基于 Dgr ....
star2017
博客
1年前
1826
0
一文总结词向量的计算、评估与优化
作者:芙蕖,Datawhale 优秀学习者,东北石油大学 为了处理语言,需要将文本信息用向量的形式表达。词向量(Word Vector)或称为词嵌入(Word Embedding)就是将词语向量化。常见的生成词向量的神经网络模型有 NNLM 模型,C&W 模型,CBOW 模型和 Skip-g ....
star2017
博客
1年前
8870
0
干货 | 查询耗时降低 2/3,携程度假搜索引擎架构优化
[图片] 作者简介 少伟,负责度假起价、搜索的研发工作,资深技术控。 锦涛,负责度假搜索及相关子系统的建设,对搜索引擎、NLP 等有浓厚兴趣。 背景介绍 携程度假搜索引擎(以下简称为引擎):携程度假搜索引擎是一个专注在旅游行业的垂直搜索引擎,用来查找符合从出发地到目的地的相关旅游产品(跟团、自由行、 ....
star2017
博客
1年前
3688
0
SparkSQL 大数据实战:shuffle hash join、broadcast hash join 以及 sort merge join 三种 join 大揭秘
[图片] 易小云: Join 操作是数据库和大数据计算中的高级特性,大多数场景都需要进行复杂的 Join 操作,本文从原理层面介绍了 SparkSQL 支持的常见 Join 算法及其适用场景。 本文 2383 字 建议阅读时长 6 分钟 Join 背景介绍 Join 是数据库查询永远绕不开的话题,传 ....
star2017
博客
1年前
2857
0
vivo 技术 | 分布式搜索引擎 Elasticsearch 的架构分析
一、写在前面 ES(Elasticsearch 下文统一称为 ES)越来越多的企业在业务场景是使用 ES 存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES 作为传统关系型数据库的补充,提供了关系型数据库不具备的一些能力。 ES 最先进入大众视野的是其能够实现全文搜 ....
star2017
博客
1年前
1715
0
超强整理,非科班硕士的算法面经 (阿里 腾讯 字节 美团)
[图片] 写在前面 结束秋招已经很长一段时间了,如今也已经入职一段时间了,应大佬邀请整理一下面经,回馈一下有志于从事算法工作的学弟学妹们,毕竟自己也是曾经站在巨人的肩膀上,得到一些帮助,受益匪浅。 笔者背景,C9 硕,非科班,互联网领域公司投递的岗位主要是“机器学习”(数据挖掘、搜索广告推荐方向,偶 ....
star2017
博客
1年前
6779
0
中文 NLP 用什么?中文自然语言处理的完整机器处理流程
[图片] 虽然同为人类自然语言,但是由于英文和中文其语言自身的特点,导致中文和英文分词是有差别的。 很多读者在后台留言,提到了结巴分词,并要求我们出一些关于中文自然语言处理的内容。所以本禅师就找到了这方面很有研究的宿永杰。 宿永杰现就职于某知名互联网公司担任数据挖掘工程师,CSDN 博客专家,PC ....
star2017
博客
1年前
11307
0
Lucene 源码系列——IntBlockPool 类
原文地址: https://www.amazingkoala.com.cn/Lucene/gongjulei/2018/1209/24.html IntBlockPool 类 在索引阶段,使用 IntBlockPool 来存储 term(域值)的信息,在 MemoryIndex 中,使用此类对 te ....
star2017
博客
1年前
1458
0
建了一个机器学习微信群
建了一个机器学习群 欢迎大家进来讨论 [图片]
star2017
博客
1年前
9825
0
要提升微信看一看推荐混排的长期收益?试试深度强化学习
第一篇:微信「看一看」 推荐排序技术揭秘 第二篇:详文解读微信「看一看」多模型内容策略与召回 微信 '看一看' 内容理解与推荐 导语 相比于传统的监督学习方法,强化学习能够最大化长期收益,正是推荐系统更加需要的。做好当下做好固然重要,但放眼未来才能看得更远。 本文主要是在看一看算法推荐算法过程中的实 ....
star2017
博客
1年前
610
0
贝壳找房—【图数据库系列】Dgraph 原理篇
系列文章: https://www.6aiq.com/article/1586914360530 https://www.6aiq.com/article/1586913224622 通过上一篇的 Dgraph 简介 ,相信大家已经了解了 Dgraph 的一些基本概念和用法,本篇文章继续介绍 Dgr ....
star2017
博客
1年前
8257
0
【综述】基于知识图谱的推荐系统综述
基于知识图谱的推荐系统综述 [图片] 作者信息 Elesdspline 目前从事 NLP 与知识图谱相关工作。 导语 本文是 2020 年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐,而且对推荐也是具有可解释性的,有迹可循。 本文汇总了近些年来知 ....
star2017
博客
1年前
5992
0
MRR vs MAP vs NDCG:具有排序意义的度量指标的可视化解释及使用场景分析
作者:Moussa Taifi, Ph.D 编译:ronghuaiyang 导读 3 种指标,各有优缺点,各有适用场景,分析给你看。 [图片] 机器学习度量之旅 在不适当的度量指标上报告小的改进是一个众所周知的机器学习陷阱。理解机器学习(ML)指标的优缺点有助于为 ML 从业者建立个人信誉。这样做是 ....
star2017
博客
1年前
7011
0
一文解说 Scala Trait 所有用法
Trait 基础 在 Scala 中,Trait 是一种特殊概念。首先,Trait 可以被作为接口来使用,此时 Trait 与 Java 的接口非常类似。同时在 Trait 可以定义抽象方法,其与抽象类中的抽象方法一样,不给出方法的具体实现。 _注意:_类使用 extends 继承 Trait,与 ....
star2017
博客
1年前
2131
0
1
...
456
457
458
...
472
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
SpringBoot2实践系列(六):集成监控模块Actuator详解
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到