×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 搜索引擎 共 35 个结果.
搜索引擎中的 Web 数据挖掘
[图片] 分享嘉宾:沐沐老师 前百度资深研发 编辑整理:赵丽 内容来源:2019 DataFun Live 11 出品社区:DataFun 导读: 今天为大家分享的是搜索引擎中的 Web 数据挖掘。首先介绍下搜索引擎。实际上,我们每天都会使用的搜索引擎,我们会输入关键词 query 和需求,搜索引擎 ....
star2017
1年前
9084
0
郭嘉梁:阿里云 Elasticsearch 日志场景最佳实践及引擎内核优化
分享嘉宾:郭嘉梁 阿里巴巴 技术专家 以下文章来源于Apache Spark技术交流社区 ,作者郭嘉梁@阿里巴巴 出品平台:DataFunTalk 导读: 全文将围绕以下四点展开: 阿里云Elasticsearch日志场景最佳实践 阿里云Elasticsearch引擎内核优化 阿里云Elastics ....
star2017
1年前
985
0
腾讯 | 大幅降低存储成本,Elasticsearch 可搜索快照是如何办到的?
作者: 腾讯 高斌龙 导语 | Elasticsearch 7.10 版本最近发布,该版本有一个重磅特性:Searchable snapshots (可搜索快照功能),可以大幅度地降低存储成本。那么 Searchable snapshots 的使用方式和实现效果是怎样的呢,下面就让我们来一探究竟吧! ....
star2017
1年前
1503
0
58 同城 | 搜索引擎实时索引实现和重构
作者:卢克 58 同城高级架构师 导读:倒排索引是搜索引擎的核心技术,主要于解决海量数据下的快速检索问题。同数据库技术中索引原理一样,在搜索引擎中创建了倒排索引后,查询性能非常好,但是数据的快速/大量更新却是个棘手的问题。在实际应用中,往往优先保证检索性能而牺牲了更新的时效性。 本文主要介绍了我们是 ....
star2017
1年前
963
0
搜索引擎背后的经典数据结构和算法
原文: 码海 喜欢请关注文末公众号 前言 我们每天都在用 Google, 百度这些搜索引擎,那大家有没想过搜索引擎是如何实现的呢,看似简单的搜索其实技术细节非常复杂,说搜索引擎是 IT 皇冠上的明珠也不为过,今天我们来就来简单过一下搜索引擎的原理,看看它是如何工作的,当然搜索引擎博大精深,一篇文章不 ....
star2017
1年前
905
0
新一代海量数据搜索引擎 TurboSearch 来了!
本文作者:sololzluo,腾讯 AI Lab 开发工程师 一。 TurboSearch 简介 AI Lab 多年一直在搜索领域进行深耕和积累,继搜搜网页搜索之后,陆续服务于微信搜一搜(公众号文章、朋友圈、视频)、应用宝搜索、地图搜索、音乐搜索、视频搜索、手 Q、QQ 群等精品垂直搜索业务,以及云 ....
star2017
1年前
2635
0
第四范式 | 如何构建一个好的电商搜索引擎?
[图片] 分享嘉宾:邢少敏 第四范式 架构师 编辑整理:刘员京 出品平台:DataFunTalk 导读: 机器学习算法的不断进步,搜索引擎巧妙的人机交互设计,分布式系统的革新让搜索引擎在不知不觉中成为人们生活中不可或缺的一部分。同时,随着人们新需求的不断涌现,搜索引擎也没有停下变革的步伐。本文主要分 ....
star2017
1年前
2405
0
微信搜索引擎中索引的分布式演进
一、引言 提起分布式,不少人能很清晰的阐述 paxos、CAP 等理论,但我们在遇到一个具体的分布式问题时,很少有人能知道如何做出一个“好”的设计。对于当前的很多分布式数据系统,包括开源的 HBase、Elasticsearch 等,我们一般只知其然,很少能够知其所以然。因为几乎所有的分布式数据系统 ....
star2017
1年前
2736
0
百度搜索稳定性问题分析的故事(上)
[图片] 导读: 百度搜索系统是百度历史最悠久、规模最大并且对其的使用已经植根在大家日常生活中的系统。坊间有一种有趣的做法:很多人通过打开百度搜索来验证自己的网络是不是通畅的。这种做法说明百度搜索系统在大家心目中是“稳定”的代表,且事实确是如此。百度搜索系统为什么具有如此高的可用性?背后使用了哪些技 ....
star2017
1年前
2450
0
【干货】搜索引擎技术资料整理
这篇博客意图是收集市面上质量不错的搜索引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(infoQ、Stackoverflow、GitHub 等)、专业技术网站(我爱自然语言处理等)、国内外知名互联网公司技术博客(阿里中间件团队博客、美团技术博客等)、知 ....
star2017
1年前
8424
0
有赞搜索引擎从 0 到 1 技术解析
[图片] 分享嘉宾:毛夏君老师 内容来源:DataFun AI Talk《搜索引擎从 0 到 1》 出品社区:DataFun [图片] 今天主要分享的是一些搜索工程方面的意见,首先介绍下一个完整的搜索引擎是由哪几部分组成的,然后是搜索内部文件的读和写,最后是搜索系统中主要的核心要点分析以及对应的案例 ....
star2017
1年前
7755
0
阿里巴巴搜索引擎平台 Ha3 揭秘
云栖君导读: Ha3 是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。 Ha3 的架构 [图片] 在线 Ha3 是搜索体系中的在线部分,在其系统内部,包含 Qrs(Query result searcher)和 Searcher 两种基本的角色。 Qr ....
star2017
1年前
3780
0
360 搜索的百亿级网页搜索引擎架构实现
360 搜索技术团队 目前 360 搜索每日抓取的网页数量高达十亿,已经收录的网页基本上是万亿级别的网页集合,实际可检索的网页是在一个百亿级别的网页集合里。 目前 360 搜索的单日流量是亿级 pv。我们目前的在线、离线机群有几万台服务器来维护这么大量级的计算。 主要内容 我今天的分享的主要会侧重于 ....
star2017
1年前
3444
0
搜索引擎倒排索引的设计与实践
[图片] 搜索引擎如何工作? 信息检索已经发展的非常成熟了,应该所有人都不陌生。我有幸这几年接触过并且实际做过一些搜索引擎开发的工作,特此总结并分享给大家。实际上,一个成熟的搜索引擎是想当复杂的,比如百度的,就分 nginx,vui,us,as,bs,da.....等等这些模块,当然这些简写的字母大 ....
star2017
1年前
5815
0
苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用
胡正林 2018 年 11 月 5 日 话题:架构大数据 [图片] 背景说明 苏宁易购商品评价系统主要提供商品维度评价数量聚合、评价列表展示功能,并为其他业务系统提供商品评价数据支撑服务。功能涉及对亿级数据的数量聚合、排序、多维度查询等复杂的业务场景,关系型数据库的索引为 B-Tree 结构,适合数 ....
star2017
1年前
5665
0
回顾·搜索引擎算法体系简介——排序和意图篇
本文根据刘老师在 DataFun Talk 算法架构系列活动“人工智能典型场景算法应用解析”中所分享的《搜索引擎算法体系介绍——排序和意图篇》编辑整理而成,在未改变中心思想的基础上稍做修改。 请在WiFi环境下服用,土豪随意~~ [图片]刘老师主要讲解的是关于搜索引擎方向的一些算法应用,由于这个体系 ....
star2017
1年前
7890
0
实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程
Twitter 的实时搜索引擎起步于一家被收购的小公司,随着流量的增长、功能的增加和服务对象的扩张,搜索引擎不断面临着新的挑战,设计经历了多次变化。本演讲将介绍该实时搜索引擎进化历程中的挑战和决策。 王天, Twitter Senior Staff Engineer, 2003 年清华计算机系本科毕 ....
star2017
1年前
6835
0
搜索引擎新架构:与 SQL 不得不说的故事
[图片] 阿里巴巴搜索引擎平台 Ha3 揭秘 10 年 +,阿里沉淀出怎样的搜索引擎? 阿里巴巴搜索引擎 HA3 架构 1.HA3 架构分为在线和离线两部分 在线是一个传统的 2 层服务架构,分别叫做 QRS 和 search。QRS 负责接受用户请求,做一些简单处理之后把请求发给下面的 searc ....
star2017
1年前
2960
0
深入浅出搜索架构引擎、方案与细节(上)
一、缘起 《100 亿数据 1 万属性数据架构设计》文章发布后,不少朋友对 58 同城自研搜索引擎 E-search 比较感兴趣,故专门撰文体系化的聊聊搜索引擎,从宏观到细节,希望把逻辑关系讲清楚,内容比较多,分上下两期。 主要内容如下,本篇(上)会重点介绍前三章: (1)全网搜索引擎架构与流程 ( ....
star2017
1年前
6134
0
干货 | 查询耗时降低 2/3,携程度假搜索引擎架构优化
[图片] 作者简介 少伟,负责度假起价、搜索的研发工作,资深技术控。 锦涛,负责度假搜索及相关子系统的建设,对搜索引擎、NLP 等有浓厚兴趣。 背景介绍 携程度假搜索引擎(以下简称为引擎):携程度假搜索引擎是一个专注在旅游行业的垂直搜索引擎,用来查找符合从出发地到目的地的相关旅游产品(跟团、自由行、 ....
star2017
1年前
3276
0
1
2
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到