×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
丁香园基于 Milvus 的向量召回应用
丁香园大数据 NLP 丁香园大数据 背景 随着 BERT,GNN 等模型在 NLP 领域的发展,DNN 类模型的语义提取能力又得到进一步提升,我们对文本语义向量也有了更高的期待,期望语义向量或其他模型特征向量可以在召回段发挥更大作用;约 2019 年初,我们就尝试在推荐业务中引入基于 Faiss 的 ....
star2017
博客
1年前
6037
0
【必读!!】人工智能社区公告!!
[图片] 欢迎加入 AIQ,与 22000+ 人工智能算法爱好者共同书写中国人工智能新篇章。在这里会分享人工智能在企业落地上的一些实践、AI 智能领域的资讯、知识及教育培训、会议活动;鼓励技术写作和问答互助。大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。 ChangeLogs ....
star2017
博客
1年前
435
0
携程 | 用户画像在携程商旅的实践
作者简介 大卫,携程资深算法工程师,关注计算广告和推荐系统。 发表于: 2020 年 7 月 16 日 一、用户画像 用户画像这一概念最早源于交互设计领域,由交互设计之父 Alan Cooper 提出。其指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型。具体而言,在互联网用户分析 ....
star2017
博客
1年前
2178
0
特斯拉宣布降薪!开源节流,疫情之下如何提升企业管理效能
[图片] 4 月 7 日,特斯拉给员工的一封内部信显示,4 月 13 日起,特斯拉将采取削减开销措施,所有线上办公和职位级别较为关键的员工都将根据薪资水平的不同进行降薪。其中,在美国地区,副总裁以上级别工资削减 30%,总监以上级别工资削减 20%,其它所有员工工资削减 10%。不能线上工作或不被视 ....
star2017
博客
1年前
3090
0
人工智能入门书单推荐,学习 AI 的请收藏好(附 PDF 下载)
人工智能相关岗位中,涉及到的内容包含:算法、深度学习、机器学习、自然语言处理、数据结构、Tensorflow、Python 、数据挖掘、搜索开发、神经网络、视觉度量、图像识别、语音识别、推荐系统、系统算法、图像算法、数据分析、概率编程、计算机数学、数据仓库、建模等关键词,基本涵盖了现阶段人工智能细分 ....
star2017
博客
1年前
6432
0
知识图谱 |298 万条三元组生成方法 (一)
作者: 谓之小一 本篇文章接《Python 爬虫 |Get 豆瓣电影与书籍详细信息》,学习如何利用爬取的数据,构建知识图谱所需的三元组。主要内容包括如何从 JSON 类型的数据,转换成 RDF 数据,并最终存储到 Jena 之中,然后利用 SPARQL 进行查询。数据链接: https://pan. ....
star2017
博客
1年前
9853
0
面试了 8 家公司,社招机器学习面试题
面试了 8 家公司,他们问了我这些机器学习题目…… 翻译 | 王柯凝 出品 | AI 科技大本营(公众号 ID:rgznai100) 【导读】今年年初以来,作者一直在印度找数据科学、机器学习以及深度学习领域的工作。在找工作的这三十四天里,他面试了 8 到 10 家公司,其中也包括初创公司、基于服务的 ....
star2017
博客
1年前
6087
0
汽车之家电商平台秒杀系统架构实现
作者: 方利 前言 秒杀作为一种营销工具,利用限时限量,先到先得的用户心理,刺激购买或制造机会吸引用户关注,不仅能短时间带动商品的销量提升,还可以聚集大量的人气,是各大平台的运营人员和商家在活动期间最常用的营销工具。 汽车之家电商平台厂商旗舰店业务主要服务于各大汽车主机厂商,主机厂商的车型以及优惠政 ....
star2017
博客
1年前
335
0
万字长文 | 详解优酷视频质量评价体系
分享嘉宾 |李静博士,阿里巴巴文娱集团资深算法专家,阿里巴巴大文娱摩酷实验室视频体验与质量团队负责人 整理出品 |AICUG 人工智能社区 导读:随着近年来用户在社交媒体/短视频分享平台的重度参与,视频多媒体内容的消费主导从原来的 OGC 向 UPGC 转变。因此 UPGC 图像/视频的质量评价成为 ....
star2017
博客
1年前
260
0
ES 在十几亿的数量级下如何提升查询效率?
一、ES 写入数据 (选择协调节点—> 根据文件进行路由转发给对应的节点—> 节点的主分片处理请求—> 数据同步到副本分片—> 返回响应) 客户端选择一个 node 发送请求过去,这个 node 就是 coordinating node(协调节点)。 coordinating ....
star2017
博客
1年前
1076
0
Elasticsearch 高级调优方法论之——根治慢查询!
1、引言 Elasticsearch 是非常灵活且功能丰富的搜索引擎,它提供了许多不同查询数据的方法。在实战业务场景中,经常会出现远远低于预期查询速度的慢查询。作为分布式系统的 Elasticsearch,可能有各种影响查询性能的因素,包括外部因素,如负载均衡设置,网络延迟(带宽,NIC 卡/驱动程 ....
star2017
博客
1年前
1154
0
滴滴 ElasticSearch 千万级 TPS 写入性能翻倍技术剖析
[图片] 桔妹导读: 滴滴 Elasticsearch 平台承接了公司内部所有使用 Elasticsearch 的业务,包括核心搜索、RDS 从库、日志检索、安全数据分析、指标数据分析等等。平台规模达到了 3000+ 节点,5PB 的数据存储,超过万亿条数据。平台写入的峰值写入 TPS 达到了 20 ....
star2017
博客
1年前
821
0
基于内容和上下文的音乐推荐
[图片] 文章作者:弗朗西斯科·里奇 等 内容来源:《推荐系统:技术、评估及高效算法》& DataFunTalk 导读: 随着在线音乐商城及流媒体音乐服务的出现,数字音乐分发已经使得音乐触手可及。然而,面对突然出现的海量可收听内容,听众很容易面临信息过载的问题。因此,本次分享的主题音乐推荐系 ....
star2017
博客
1年前
4461
0
自然语言理解(NLU)难在哪儿?
文章作者:刘知远 清华大学 副教授 内容来源:NLP 日知录@知乎专栏 [图片] 导读: 在微博和知乎上关注自然语言处理(NLP)技术的朋友,应该都对#NLP 太难了#、#自然语言理解太难了#两个话题标签不陌生,其下汇集了各种不仅难煞计算机、甚至让人也发懵的费解句子或歧义引起的笑话。然而,这些例子只 ....
star2017
博客
1年前
2690
0
Lucene 源码系列——索引文件的生成(九)之 dim&&dii(Lucene 8.4.0)
上一篇文章中,我们介绍了在索引(index)阶段,Lucene 收集了跟点数据相关的信息,这些信息在 flush 阶段会被读取,用于生成索引文件。dim&&.dii,从本文开始介绍索引文件。dim&&.dii 生成的详细过程,如图 1 所示,另外阅读本文中需要前置知识 ....
star2017
博客
1年前
984
0
支持频繁更新、即席查询:ClickHouse 在爱奇艺视频生产的应用
作者: 爱奇艺后台研发部 众所周知,爱奇艺拥有海量视频,在视频生产过程中产生的上千 QPS 的实时数据、T 级别的数据存储。要支持这样的数据进行即席查询和多个大表的 JOIN,是爱奇艺视频生产团队大数据应用的难点。 具体来说有以下几点: 1)实时性的要求,需要实时的解决方案。 2)生产数据更新频繁, ....
star2017
博客
1年前
8045
0
AIQ - 架构 | 京东推荐系统架构揭秘:大数据时代下的智能化改造
在电商领域,推荐的价值在于挖掘用户潜在购买需求,缩短用户到商品的距离,提升用户的购物体验。 [图片] 京东推荐的演进史是绚丽多彩的。京东的推荐起步于 2012 年,当时的推荐产品甚至是基于规则匹配做的。整个推荐产品线组合就像一个个松散的原始部落一样,部落与部落之前没有任何工程、算法的交集。2013 ....
star2017
博客
1年前
11213
0
AIQ| 出轨大数据新出炉,暴露一个惊人真相
-01- 曾经有很多女孩在后台问我:桌子,我将来到底是选择嫁给爱情,还是嫁给金钱? 我回答她们:姑娘,你真的多虑了。 100% 的女孩都想嫁给爱情,但是最终只有极小一部分嫁给了爱情,极小一部分嫁给了金钱。 还有极大部分呢?她们嫁给了隐忍和妥协。 你可能说我腹黑,但我说的就是赤裸裸的现实,不是吗? 这 ....
star2017
博客
1年前
4448
0
停班不停工,远程办公助力击穿疫情下企业困局
2020 年的开局太不寻常,一场新冠疫情闹得大家都过不好年,这个春节假期对于我们来说可能是史上最长春节。除了待在家里不能出门外,对我们生活并没有其他的影响。但疫情对各大企业的影响可不是那么简单了。 因疫情原因,很多企业都延长了假期,同时也组织团队成员们开启了远程办公的模式。没办法,日子还是要过的,开 ....
star2017
博客
1年前
2833
0
Lucene 源码系列——索引文件的生成(十)之 dim&&dii(Lucene 8.4.0)
本文承接索引文件的生成(九),继续介绍剩余的内容,下面先给出生成索引文件。dim&&.dii 的流程图: 图 1: [图片] 在上一篇文章中,我们介绍了流程点 执行处理前的初始化的工作,在这个流程中涉及到的一些信息贯穿整个流程,请务必先行阅读,例如一些变量名如果没有展开说明,说明 ....
star2017
博客
1年前
902
0
1
...
398
399
400
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到