×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
浅谈搜索系统中 Query 理解和分析
作者: OPPO 算法工程师,搜索方向;北京科技大学本硕,统计学毕业,在学期间曾经发表 6 篇论文,其中 4 篇 SCI。CS 的陋室号主 搜索是一个系统,大小不好说,但肯定是五脏俱全,我做的比较多的就是 query 理解和分析,这次给大家重点讨论一下这块内容。 久违的懒人目录: query 理解的 ....
star2017
博客
1年前
2794
0
AIQ - Solr 与 ES(ElasticSearch)的对比
搜索引擎选择: Elasticsearch 与 Solr 搜索引擎选型调研文档 Elasticsearch 简介 Elasticsearch 是一个实时的分布式搜索和分析引擎。 它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 El ....
star2017
博客
1年前
1680
0
网易严选 | DDD 在严选供应链复杂业务系统的落地实践
复杂业务系统长期迭代,难免会逐渐腐化,如何治理腐化,并设计出能够延缓腐化,保持长期高效能的方案是一个开发同学难免要遇到的问题,本文旨在介绍一套基于 DDD 的落地实施方案,提供另外一种解决问题的思路。 系统背景 Teddy 出入库系统,是进销存概念里的进和销,核心能力是仓库货物的出库和入库的流转,在 ....
star2017
博客
1年前
539
0
聊聊 Linux IO 栈
写在前面 在开始正式的讨论前,我先抛出几个问题: 谈到磁盘时,常说的 HDD 磁盘和 SSD 磁盘最大的区别是什么?这些差异会影响我们的系统设计吗? 单线程写文件有点慢,那多开几个线程一起写是不是可以加速呢? write(2) 函数成功返回了,数据就已经成功写入磁盘了吗?此时设备断电会有影响吗?会丢 ....
star2017
博客
1年前
1556
0
58 同城 | 基于 Flink 构建实时数仓实践
导读 随着公司用户增长业务快速发展,陆续孵化出 部落、同镇、C 端会员、游戏等非常多的业务板块。与此同时产品及运营对实时数据需求逐渐增多,帮助他们更快的做出决策,更好的进行产品迭代,实时数仓的建设变得越发重要起来。本文主要介绍用户增长业务基于 Flink 构建实时数仓的实践之路。 实时数仓 1.0 ....
star2017
博客
1年前
2131
0
阿里巴巴复杂搜索系统的可靠性优化之路
[图片] 背景 搜索引擎是电商平台成交链路的核心环节,搜索引擎的高可用直接影响成交效率。闲鱼搜索引擎作为闲鱼关键系统,复杂度和系统体量都非常高,再加上闲鱼所有导购场景都依靠搜索赋能,搜索服务的稳定可靠成为了闲鱼大部分业务场景可用能力的衡量标准;如何保障搜索服务的稳定和高可用成为了极大的挑战。 闲鱼搜 ....
star2017
博客
1年前
9711
0
不到 10 个提升逼格的 Redis 命令
keys 我把这个命令放在第一位,是因为笔者曾经做过的项目,以及一些朋友的项目,都因为使用 keys 这个命令,导致出现性能毛刺。这个命令的时间复杂度是 O(N),而且 Redis 又是单线程执行,在执行 keys 时即使是时间复杂度只有 O(1)例如 SET 或者 GET 这种简单命令也会堵塞,从 ....
star2017
博客
1年前
2446
0
风控建模流程:以京东群体感知项目为例
导读:本次分享将以群体风险感知为例,从需求挖掘、数据挖掘、建模再到最终的模型部署应用,详细介绍全流程的风控建模方案。下面将从这几个方面出发,详细的讲解具体流程中的概念,同时会给出每个流程中的目标、实现方法、交付物,让同学们在具体实践的时候有目标,有方法。 ▌业务需求挖掘 [图片] 任何项目的起源,都 ....
star2017
博客
1年前
3319
0
详解 Transformer (Attention Is All You Need)
前言 注意力(Attention)机制[2]由 Bengio 团队与 2014 年提出并在近年广泛的应用在深度学习中的各个领域,例如在计算机视觉方向用于捕捉图像上的感受野,或者 NLP 中用于定位关键 token 或者特征。谷歌团队近期提出的用于生成词向量的 BERT[3]算法在 NLP 的 11 ....
star2017
博客
1年前
9940
0
敏捷实践经验分享,企业如何在敏捷开发中实施 DoD
一、什么是 DoD? 当你有两个或更多的人参与同一个事情的时候,我们的“团队”就产生了,这时我们最重要的事情,就是要设定和统一团队的期望值,在本文中,这就是**“完成标准”**。 一个迭代做完后,团队要进行验收,来决定本个迭代是否完成。但每个团队对于是否完成无法达成统一,有的认为编码完成,就表示任务 ....
star2017
博客
1年前
2957
0
字节跳动混沌工程实践总结
本文选自“字节跳动基础架构实践”系列文章。 “字节跳动基础架构实践”系列文章是由字节跳动基础架构部门各技术团队及专家倾力打造的技术干货内容,和大家分享团队在基础架构发展和演进过程中的实践经验与教训,与各位技术同学一起交流成长。 混沌工程是通过故障注入的方式帮助系统寻找薄弱点,从而提高系统的稳定性。随 ....
star2017
博客
1年前
247
0
AIQ| 深醒首席科学家张钹院士:深度学习优势与短板,中国 AI 机遇和挑战
前言 在首届世界智能大会上,深醒科技首席科学家、中国科学院院士张钹发表了题为《基于大数据的人工智能》演讲,分享了中美人工智能差异、深度学习成功的三大法宝、隐患与短板以及中国如何实现人工智能基础研究赶超欧美等话题的见解。 张钹院士简介 [图片] 清华大学计算机系教授,中国科学院院士,深醒科技首席科学家 ....
star2017
博客
1年前
10457
0
多目标排序模型在腾讯 QQ 看点推荐系统中的应用实践
作者:zhongzhao,腾讯 PCG 应用研究员 在推荐系统中,最常用的排序模型是以用户点击为目标的 CTR 预估模型,它没有考虑用户点击后的消费深度,也没有考虑用户的多种互动行为带来的生态方面的收益。为了取得 CTR 以外的更多收益,QQ 看点团队在深度学习框架下,对推荐系统中的多目标建模做了一 ....
star2017
博客
1年前
9536
0
拼多多创始人黄峥:我的人生经历和创业理念
本文来源丨浙大校友创业研究 内容来源丨北大纵横,杭州浙江大学校友会 黄峥 拼多多创始人 [图片] 2002 年本科毕业于浙江大学竺可桢学院,2004 年获得美国威斯康星大学麦迪逊分校计算机硕士学位,随后加入美国谷歌。2006 年回国,参与谷歌中国办公室的创立。2007 年从谷歌离职创业,先后创立电商 ....
star2017
博客
1年前
4214
0
Lucene 6 数值索引以及空间索引方案
要解决的问题 范围查询 在一个二维平面上,有很多点,给定一个矩形,怎么快速的将落在矩形中的点找出来? 这个问题还可以推广到任意维度,一维就是区间查询,三维就是在长方体内部。 近邻查询 离我最近的餐馆有哪些? 这个问题可以抽象成二维空间中,要找出距离某个点最近的点的集合。 一维的场景 这个场景非常简单 ....
star2017
博客
1年前
7571
0
AIQ - 基础 | 深度学习之基础知识详解
转载自 datayx 公众号 过拟合,欠拟合 过拟合(overfitting):学习能力过强,以至于把训练样本所包含的不太一般的特性都学到了。 欠拟合(underfitting):学习能太差,训练样本的一般性质尚未学好。 下面是直观解释: [图片] 《机器学习》--周志华 下面在那一个具体的例子: ....
star2017
博客
1年前
10385
0
爱奇艺大数据生态的实时数仓建设
作者: 爱奇艺技术产品团队 数据作为互联网时代的基础生产资料,在各大公司企业拥有举足轻重的地位。数据的价值在互联网公司的体现,大致而言可以分成三类: 发掘数据中的信息来指导决策,如产品运营、用户增长相关的 BI 报表 依托数据优化用户体验和变现效率,如信息分发场景下的个性化推荐、效果广告等 基于数据 ....
star2017
博客
1年前
8582
0
A/B 测试中我们都会犯的十个常见错误
作者:Romain AYRES 本文由 AI 公园授权转载,转载请联系出处 编译:ronghuaiyang 导读 这篇博客文章的目的不是告诉你在运行 A/B 测试时应该做什么,而是告诉你不应该做什么。 “没有数据,你只是一个有观点的人。” 这个著名的_W. Edwards Deming_引用说明了 ....
star2017
博客
1年前
7795
0
【杉枫】推荐引擎异步架构设计
作者: 探索互联网 如果一味追求实时设计,对于线上并发量大的业务来说,瓶颈点是很多的,一个是 IO 消耗时间、一个是存储消耗时间、一个是计算消耗时间。实际情况并不是一个方面的问题,而是三个方面交织在一起。 [图片] IO 消耗时间,包含数据读取,读取数据量大,量大 IO 就会消耗时间长。做了很多优化 ....
star2017
博客
1年前
10096
0
为什么已有 Elasticsearch,我们还要重造实时分析引擎 AresDB?
Uber 工程博客 2019 年 2 月 24 日 [图片] 作者 | Jian Shen, Ze Wang, David Wang, Jeremy Shi, and Steven Chen AresDB 在 Uber 被广泛使用,为我们的实时数据分析仪表盘提供支持,使我们能够针对业务的各个方面大规 ....
star2017
博客
1年前
3435
0
1
...
401
402
403
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到