×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: lucene 共 57 个结果.
Lucene 解析 - 基本概念
前言 Apache Lucene 是一个开源的高性能、可扩展的信息检索引擎,提供了强大的数据检索能力。Lucene 已经发展了很多年,其功能越来越强大,架构也越来越精细。它目前不仅仅能支持全文索引,也能够提供多种其他类型的索引方式,来满足不同类型的查询需求。 基于 Lucene 的开源项目有很多,最 ....
star2017
1年前
3196
0
构造 IndexWriter 对象(八)
构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本 ....
star2017
1年前
1060
0
Word delimiter graph token filter(word_delimiter_graph 词元过滤器)
本文禁止转载 word_delimiter_graph 使用非字母字符切分 tokens,并可以根据规则执行一些可选的 token 正则化。默认情况下,word_delimiter_graph 会使用以下规则: 使用非字母字符作为切分点。 比如 Super-Duper → Super, Duper ....
star2017
1年前
2168
0
番外篇:Lucene 索引流程与倒排索引实现
前两篇文章主要围绕 Lucene 的底层索引文件结构方面介绍了倒排索引原理: http://www.6aiq.com/article/1564413040138 http://www.6aiq.com/article/1564413209435 在 Lucene 中,写数据的基本单元称之为 Docu ....
star2017
1年前
3525
0
深入 Lucene 搜索引擎原理
之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP 等。文章有点长,多多指点~~ 一、搜索引擎引题 搜索引擎是什么? 这里有个概念需要提一下。信息检索 (Information R ....
star2017
1年前
1104
0
构造 IndexWriter 对象(七)
构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWriter 对象(六),继续介绍调用 IndexWriter ....
star2017
1年前
1227
0
构造 IndexWriter 对象(六)
系列文章: https://www.6aiq.com/article/1586279369002 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWri ....
star2017
1年前
1060
0
构造 IndexWriter 对象(五)
系列文章: https://www.6aiq.com/article/1586277643798 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWriter 对象(四),继续介绍调用 Inde ....
star2017
1年前
1284
0
构造 IndexWriter 对象(四)
系列文章: https://www.6aiq.com/article/1586277004353 https://www.6aiq.com/article/1586276430450 https://www.6aiq.com/article/1586275234347 本文承接构造 IndexWri ....
star2017
1年前
1146
0
构造 IndexWriter 对象(三)
查看原文 系列文章: https://www.6aiq.com/article/1586276430450 https://www.6aiq.com/article/1586275234347 构造一个 IndexWriter 对象的流程总体分为下面三个部分: 设置索引目录 Directory 设置 ....
star2017
1年前
986
0
构造 IndexWriter 对象(二)
查看来源 系列文章: 构造 IndexWriter 对象(一) 构造一个 IndexWriter 对象的流程总体分为下面三个部分: 设置索引目录 Directory 设置 IndexWriter 的配置信息 IndexWriterConfig 调用 IndexWriter 的构造函数 在文章构造 ....
star2017
1年前
984
0
构造 IndexWriter 对象(一)
来源: https://www.amazingkoala.com.cn/Lucene/Index/2019/1111/106.html 该系列文章将会介绍构造一个 IndexWriter 对象的流程,该流程总体分为下面三个部分: 设置索引目录 Directory 设置 IndexWriter 的配置 ....
star2017
1年前
977
0
Lucene 源码系列——索引文件的生成(五)之 tim&&tip
在前面的四篇文章中,我们介绍了生成索引文件.tim、.tip、.doc、.pos、.pay 中.doc、.pos、.pay 这三个索引文件的内容,接着我们继续图 1 中剩余的内容,即流程点 生成索引文件.tim、.tip。 生成索引文件。tim、.tip、.doc、.pos、.pay 的流程图 图 ....
star2017
1年前
1087
0
Lucene 源码系列——索引文件的生成(四)之跳表 SkipList
在文章索引文件的生成(三)中我们介绍了在 Lucene 中生成跳表 SkipList 的流程,通过流程图的方法介绍了源码中的实现方式,而对于读取 SkipList 的内容,决定直接以例子的方式来介绍其读取过程,下文中出现的名词如果没有作出介绍,请先阅读文章索引文件的生成(三)。 例子 直接给出一 ....
star2017
1年前
1061
0
Lucene 源码系列——索引文件的生成(三)之跳表 SkipList
在文章索引文件的生成(一)中我们说到,在生成索引文件.doc、.pos、.pay 的过程中,当处理了 128 篇文档后会生成一个 PackedBlock,并将这个 PackedBlock 的信息写入到跳表 skipList 中,使得在读取阶段能根据文档号快速跳转到目标 PackedBlock,提高查 ....
star2017
1年前
1049
0
Lucene 源码系列——索引文件的生成(二)之 doc&&pay&&pos
生成索引文件。tim、.tip、.doc、.pos、.pay 的流程图 图 1: [图片] 我们继续介绍流程点 生成索引文件.doc、.pos、.pay。 生成索引文件.doc、.pos、.pay 的流程图 图 2: [图片] 记录位置信息 position、payload、偏移信息 offse ....
star2017
1年前
1086
0
Lucene 源码系列——倒排表
原文:https://www.amazingkoala.com.cn/Lucene/Index/2019/0222/36.html 本篇文章介绍如何生成倒排表,通过一个简单的例子来讲解倒排表的底层存储结构。文章中不会给出详细的源码介绍,只有一些必要的对象,感兴趣的朋友可以看我的 GitHub,对构建 ....
star2017
1年前
1171
0
1
2
3
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到