×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
贝壳找房—【图数据库系列】Dgraph 简介篇
系列文章: https://www.6aiq.com/article/1586913224622 在上一篇文章中我们已经对当前流行的几款图数据库做过简单的分析,并介绍了我们为什么使用 Dgraph。从本篇内容开始,我们将开启 Dgraph 之旅,探索这个图数据库方向的新贵。 注:本章内容基于 Dgr ....
star2017
博客
1年前
1685
0
一文总结词向量的计算、评估与优化
作者:芙蕖,Datawhale 优秀学习者,东北石油大学 为了处理语言,需要将文本信息用向量的形式表达。词向量(Word Vector)或称为词嵌入(Word Embedding)就是将词语向量化。常见的生成词向量的神经网络模型有 NNLM 模型,C&W 模型,CBOW 模型和 Skip-g ....
star2017
博客
1年前
7944
0
干货 | 查询耗时降低 2/3,携程度假搜索引擎架构优化
[图片] 作者简介 少伟,负责度假起价、搜索的研发工作,资深技术控。 锦涛,负责度假搜索及相关子系统的建设,对搜索引擎、NLP 等有浓厚兴趣。 背景介绍 携程度假搜索引擎(以下简称为引擎):携程度假搜索引擎是一个专注在旅游行业的垂直搜索引擎,用来查找符合从出发地到目的地的相关旅游产品(跟团、自由行、 ....
star2017
博客
1年前
3429
0
SparkSQL 大数据实战:shuffle hash join、broadcast hash join 以及 sort merge join 三种 join 大揭秘
[图片] 易小云: Join 操作是数据库和大数据计算中的高级特性,大多数场景都需要进行复杂的 Join 操作,本文从原理层面介绍了 SparkSQL 支持的常见 Join 算法及其适用场景。 本文 2383 字 建议阅读时长 6 分钟 Join 背景介绍 Join 是数据库查询永远绕不开的话题,传 ....
star2017
博客
1年前
2681
0
vivo 技术 | 分布式搜索引擎 Elasticsearch 的架构分析
一、写在前面 ES(Elasticsearch 下文统一称为 ES)越来越多的企业在业务场景是使用 ES 存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES 作为传统关系型数据库的补充,提供了关系型数据库不具备的一些能力。 ES 最先进入大众视野的是其能够实现全文搜 ....
star2017
博客
1年前
1615
0
超强整理,非科班硕士的算法面经 (阿里 腾讯 字节 美团)
[图片] 写在前面 结束秋招已经很长一段时间了,如今也已经入职一段时间了,应大佬邀请整理一下面经,回馈一下有志于从事算法工作的学弟学妹们,毕竟自己也是曾经站在巨人的肩膀上,得到一些帮助,受益匪浅。 笔者背景,C9 硕,非科班,互联网领域公司投递的岗位主要是“机器学习”(数据挖掘、搜索广告推荐方向,偶 ....
star2017
博客
1年前
6222
0
中文 NLP 用什么?中文自然语言处理的完整机器处理流程
[图片] 虽然同为人类自然语言,但是由于英文和中文其语言自身的特点,导致中文和英文分词是有差别的。 很多读者在后台留言,提到了结巴分词,并要求我们出一些关于中文自然语言处理的内容。所以本禅师就找到了这方面很有研究的宿永杰。 宿永杰现就职于某知名互联网公司担任数据挖掘工程师,CSDN 博客专家,PC ....
star2017
博客
1年前
10367
0
Lucene 源码系列——IntBlockPool 类
原文地址: https://www.amazingkoala.com.cn/Lucene/gongjulei/2018/1209/24.html IntBlockPool 类 在索引阶段,使用 IntBlockPool 来存储 term(域值)的信息,在 MemoryIndex 中,使用此类对 te ....
star2017
博客
1年前
1378
0
建了一个机器学习微信群
建了一个机器学习群 欢迎大家进来讨论 [图片]
star2017
博客
1年前
9004
0
要提升微信看一看推荐混排的长期收益?试试深度强化学习
第一篇:微信「看一看」 推荐排序技术揭秘 第二篇:详文解读微信「看一看」多模型内容策略与召回 微信 '看一看' 内容理解与推荐 导语 相比于传统的监督学习方法,强化学习能够最大化长期收益,正是推荐系统更加需要的。做好当下做好固然重要,但放眼未来才能看得更远。 本文主要是在看一看算法推荐算法过程中的实 ....
star2017
博客
1年前
580
0
贝壳找房—【图数据库系列】Dgraph 原理篇
系列文章: https://www.6aiq.com/article/1586914360530 https://www.6aiq.com/article/1586913224622 通过上一篇的 Dgraph 简介 ,相信大家已经了解了 Dgraph 的一些基本概念和用法,本篇文章继续介绍 Dgr ....
star2017
博客
1年前
7614
0
【综述】基于知识图谱的推荐系统综述
基于知识图谱的推荐系统综述 [图片] 作者信息 Elesdspline 目前从事 NLP 与知识图谱相关工作。 导语 本文是 2020 年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐,而且对推荐也是具有可解释性的,有迹可循。 本文汇总了近些年来知 ....
star2017
博客
1年前
5526
0
MRR vs MAP vs NDCG:具有排序意义的度量指标的可视化解释及使用场景分析
作者:Moussa Taifi, Ph.D 编译:ronghuaiyang 导读 3 种指标,各有优缺点,各有适用场景,分析给你看。 [图片] 机器学习度量之旅 在不适当的度量指标上报告小的改进是一个众所周知的机器学习陷阱。理解机器学习(ML)指标的优缺点有助于为 ML 从业者建立个人信誉。这样做是 ....
star2017
博客
1年前
6403
0
一文解说 Scala Trait 所有用法
Trait 基础 在 Scala 中,Trait 是一种特殊概念。首先,Trait 可以被作为接口来使用,此时 Trait 与 Java 的接口非常类似。同时在 Trait 可以定义抽象方法,其与抽象类中的抽象方法一样,不给出方法的具体实现。 _注意:_类使用 extends 继承 Trait,与 ....
star2017
博客
1年前
2030
0
陌陌直播如何做到推荐系统的从 0 到 1
作者: 李波 本文根据李波老师 DTCC 大会分享内容整理而成,将首先介绍陌陌直播业务和推荐系统的整体架构,然后对用户及主播的多角度 Embedding 表征学习、多预估目标的 Rank 策略研发进行重点介绍,希望能够给对陌陌直播产品以及推荐策略分发算法感兴趣的同学起到抛砖引玉的效果。 陌陌成立于 ....
star2017
博客
1年前
3894
0
基于强化学习的 Contextual Bandits 算法在推荐场景中的应用
[图片] 文章作者:杨梦月、张露露 导读: 本文是对滴滴 AI Labs 和中科院大学联合提出的 WWW 2020 Research Track 的 Oral 长文 'Hierarchical Adaptive Contextual Bandits for Resource Constraint b ....
star2017
博客
1年前
4276
0
应用于实时视频通信的深度学习算法研究
众所周知,深度学习在实时视频通信端到端系统里有很多的应用,比如说我们用它做超分辨率,能取得比较好的效果;我们用它做图像恢复,也能取得比较好的效果。如果说提及挑战的话,在支持移动端的应用里,我们必须考虑复杂性的限制,必须要以一个小的模型,能够在移动平台上实时运行,而且功耗、CPU 占比都得到合适的限制 ....
star2017
博客
1年前
10769
0
Lucene 源码系列——去重编码 (dedupAndEncode)
原文: [链接] 去重编码是 Lucene 中对 int 类型数据的一种压缩存储方式,在 FacetsConfig 类中用到此方法来处理 int 类型数据。其优点在于,存储一个原本需要固定 4 个字节空间大小的 int 类型的数据,最好的情况下只要 1 个字节,最差的情况下需要 5 个字节。 处理过 ....
star2017
博客
1年前
1299
0
基于 TensorFlow Serving 的深度学习在线预估
转载自: 美团点评技术团队博客 一、前言 随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用。而在广告 CTR 预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、 ....
star2017
博客
1年前
9823
0
AIQ | Spark 及 Spark Streaming 核心原理及实践
Spark 已经成为广告、报表以及推荐系统等大数据计算场景中首选系统,因效率高,易用以及通用性越来越得到大家的青睐,我自己最近半年在接触 spark 以及 spark streaming 之后,对 spark 技术的使用有一些自己的经验积累以及心得体会,在此分享给大家。本文依次从 spark 生态, ....
star2017
博客
1年前
1516
0
1
...
456
457
458
...
471
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
史上最全的“大数据”学习资源(上)
5.
onlyoffice 20并发限制处理,up to 20 maximum
6.
SpringBoot2实践系列(六):集成监控模块Actuator详解
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
paddlenlp实现关系抽取
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到