×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 搜索引擎 共 35 个结果.
HeySiri,帮我把这个boss打一下:基于音频的游戏代理探索
在第二遍检测中,该方法通过语音增强对语音信号进行去噪。该方法进一步评估了RedDots 2016挑战数据库中的数据以验证性能。结果证明了rVAD相比传统方法具有竞争力。 我们都需要更好、更有效的AI算法。更精确的VAD方法有助于AI社区实现性能更好的语音通信系统。谈话语音识别,语音编码,说话人识别,回声消除,音频会议,免提电话等应用均可从中获益。 这一研究还…
star2017
1年前
11155
0
58 同城 | 搜索引擎实时索引实现和重构
作者:卢克 58 同城高级架构师 导读:倒排索引是搜索引擎的核心技术,主要于解决海量数据下的快速检索问题。同数据库技术中索引原理一样,在搜索引擎中创建了倒排索引后,查询性能非常好,但是数据的快速/大量更新却是个棘手的问题。在实际应用中,往往优先保证检索性能而牺牲了更新的时效性。 本文主要介绍了我们是 ....
star2017
1年前
1000
0
腾讯 | 大幅降低存储成本,Elasticsearch 可搜索快照是如何办到的?
作者: 腾讯 高斌龙 导语 | Elasticsearch 7.10 版本最近发布,该版本有一个重磅特性:Searchable snapshots (可搜索快照功能),可以大幅度地降低存储成本。那么 Searchable snapshots 的使用方式和实现效果是怎样的呢,下面就让我们来一探究竟吧! ....
star2017
1年前
1553
0
腾讯技术 | 新一代搜索引擎项目 ZeroSearch 设计探索
本文作者:kaelhua,腾讯 WXG 后台开发工程师 背景 写这篇文章很大的原因在于不论是内网还是外网,分享内存检索引擎设计的资料都非常稀少,且存量的资料大多侧重于功能性的介绍。 另一方面,在磁盘检索引擎方面,由于开源搜索引擎 ES 的盛行,对于其使用的索引库 lucence 的分析资料反而较为丰 ....
star2017
1年前
1489
0
10 年 +,阿里沉淀出怎样的搜索引擎?
简介: 阿里妹导读:搜索引擎是阿里的 10 年 + 沉淀,具有很高的技术/业务/商业价值。1688 很多场景都借助了搜索中台的能力,基于此,以 1688 主搜为例介绍搜索全链路知识点,希望对你有所借鉴,有所启发。 一、整体架构 搜索引擎分为数据源聚合(俗称 dump)、全量/增量/实时索引构建及在线 ....
star2017
1年前
3278
0
58 同城 | 搜索引擎中相似字符串查找那些事儿
来源: 58 技术 丁斌 导读 本文主要介绍如何基于 Levenshtein 和 Damerau Levenshtein 自动机技术高效地解决在搜索引擎系统中相似字符串快速查找问题的技术原理和操作实践。文中创造性地提出一种 Damerau Levenshtein 自动机的有效构建算法,并创造性地给出 ....
star2017
1年前
838
0
vivo | 深度解析 Lucene 轻量级全文索引实现原理
作者:vivo 互联网服务器团队-Qian Yulun 一、Lucene 简介 1.1 Lucene 是什么? Lucene 是 Apache 基金会 jakarta 项目组的一个子项目; Lucene 是一个开放源码的全文检索引擎工具包,提供了完整的查询引擎和索引引擎,部分语种文本分析引擎; Lu ....
star2017
1年前
1296
0
深度学习经验指南
简单和复杂的技巧,帮助你提升深度学习的模型准确率
star2017
1年前
7154
0
探索推荐系统(附R语言实战案例)
在生活中我们怎样给别人推荐呢?
star2017
1年前
3723
0
搜索引擎背后的经典数据结构和算法
原文: 码海 喜欢请关注文末公众号 前言 我们每天都在用 Google, 百度这些搜索引擎,那大家有没想过搜索引擎是如何实现的呢,看似简单的搜索其实技术细节非常复杂,说搜索引擎是 IT 皇冠上的明珠也不为过,今天我们来就来简单过一下搜索引擎的原理,看看它是如何工作的,当然搜索引擎博大精深,一篇文章不 ....
star2017
1年前
936
0
用户的敏感数据可以轻松被恢复,怎么破?
敏感的资料和数据每天会以不同形式收集。
star2017
1年前
8499
0
有赞搜索引擎实践(算法篇)
1. 搜索算法总体架构 在上篇文章(工程篇)中, 我们介绍了有赞搜索引擎的基本框架. 搜索引擎主要3个部件构成. 第一, hadoop集群, 用于生成大规模搜索和实时索引; 第二, ElasticSearch集群, 提供分布式搜索方案; 第三, 高级搜索集群, 用于提供商业搜索的特殊功能. 商业电商搜索由于搜索的特殊性, 独立的ElasticSearch集群…
star2017
1年前
2209
0
有赞搜索引擎实践(工程篇)
随着互联网数据规模的爆炸式增长, 如何从海量的历史, 实时数据中快速获取有用的信息, 变得越来越有挑战性. 一个中等的电商平台, 每天都要产生百万条原始数据, 上亿条用户行为数据. 一般来说, 电商数据一般有3种主要类型的数据系统: 关系型数据库, 大多数互联网公司会选用mysql作为关数据库的主选, 用于存储商品, 用户信息等数据. 关系型数据库对于事务性…
star2017
1年前
3860
0
运营指南|如何判断一个关键词是否竞争激烈?
当我们用搜索引擎搜索资料时,选择关键词的关键性是毋庸置疑的。正确分析和处理关键词,是提高搜索结果满意度的必然前提。
star2017
1年前
6152
0
运营数据分析:谈一谈万恶的KPI
KPI 的核心是量化,而在互联网运营过程中,残酷的说一句,基本上能够量化的东西,大部分都可以用并不有利于目标的方式刷出来。
star2017
1年前
6599
0
深入搜索引擎之 Elasticsearch 必知必会(一):开发视角
腾讯音乐技术团队 yueqqzhang 稿 两句话了解它是什么 搜索引擎。提供了数据存储、数据处理、数据查询、聚合统计的能力。 创始人说:“不要求你必须是一个数据科学家才能把它用好” 前言 Elasticsearch 是一个很有意思的产品,不同岗位的人,对它的关注维度区别比较大 主要可以分三个层面 ....
star2017
1年前
1905
0
郭人通:向量数据库及 Embedding 流水线
[图片] 分享嘉宾:郭人通博士 Zilliz 合伙人&研发总监 编辑整理:梁胜文 中科院计算所 出品平台:DataFunTalk 导读: 随着移动设备与应用的繁荣发展,非结构化数据例如图像、视频、音频等呈现爆炸式增长。针对海量的非结构化数据进行分析与检索成为企业关注的焦点。相比于结构化数据, ....
star2017
1年前
767
0
郭嘉梁:阿里云 Elasticsearch 日志场景最佳实践及引擎内核优化
分享嘉宾:郭嘉梁 阿里巴巴 技术专家 以下文章来源于Apache Spark技术交流社区 ,作者郭嘉梁@阿里巴巴 出品平台:DataFunTalk 导读: 全文将围绕以下四点展开: 阿里云Elasticsearch日志场景最佳实践 阿里云Elasticsearch引擎内核优化 阿里云Elastics ....
star2017
1年前
1041
0
360 搜索的百亿级网页搜索引擎架构实现
360 搜索技术团队 目前 360 搜索每日抓取的网页数量高达十亿,已经收录的网页基本上是万亿级别的网页集合,实际可检索的网页是在一个百亿级别的网页集合里。 目前 360 搜索的单日流量是亿级 pv。我们目前的在线、离线机群有几万台服务器来维护这么大量级的计算。 主要内容 我今天的分享的主要会侧重于 ....
star2017
1年前
3502
0
vivo 技术 | 分布式搜索引擎 Elasticsearch 的架构分析
一、写在前面 ES(Elasticsearch 下文统一称为 ES)越来越多的企业在业务场景是使用 ES 存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES 作为传统关系型数据库的补充,提供了关系型数据库不具备的一些能力。 ES 最先进入大众视野的是其能够实现全文搜 ....
star2017
1年前
1571
0
1
2
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到