×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: lucene 共 57 个结果.
Lucene 解析 - 基本概念
前言 Apache Lucene 是一个开源的高性能、可扩展的信息检索引擎,提供了强大的数据检索能力。Lucene 已经发展了很多年,其功能越来越强大,架构也越来越精细。它目前不仅仅能支持全文索引,也能够提供多种其他类型的索引方式,来满足不同类型的查询需求。 基于 Lucene 的开源项目有很多,最 ....
star2017
1年前
3125
0
构造 IndexWriter 对象(八)
构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本 ....
star2017
1年前
1022
0
Word delimiter graph token filter(word_delimiter_graph 词元过滤器)
本文禁止转载 word_delimiter_graph 使用非字母字符切分 tokens,并可以根据规则执行一些可选的 token 正则化。默认情况下,word_delimiter_graph 会使用以下规则: 使用非字母字符作为切分点。 比如 Super-Duper → Super, Duper ....
star2017
1年前
2113
0
番外篇:Lucene 索引流程与倒排索引实现
前两篇文章主要围绕 Lucene 的底层索引文件结构方面介绍了倒排索引原理: http://www.6aiq.com/article/1564413040138 http://www.6aiq.com/article/1564413209435 在 Lucene 中,写数据的基本单元称之为 Docu ....
star2017
1年前
3452
0
深入 Lucene 搜索引擎原理
之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP 等。文章有点长,多多指点~~ 一、搜索引擎引题 搜索引擎是什么? 这里有个概念需要提一下。信息检索 (Information R ....
star2017
1年前
1076
0
构造 IndexWriter 对象(七)
构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWriter 对象(六),继续介绍调用 IndexWriter ....
star2017
1年前
1191
0
构造 IndexWriter 对象(六)
系列文章: https://www.6aiq.com/article/1586279369002 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWri ....
star2017
1年前
1019
0
构造 IndexWriter 对象(五)
系列文章: https://www.6aiq.com/article/1586277643798 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本文承接构造 IndexWriter 对象(四),继续介绍调用 Inde ....
star2017
1年前
1255
0
构造 IndexWriter 对象(四)
系列文章: https://www.6aiq.com/article/1586277004353 https://www.6aiq.com/article/1586276430450 https://www.6aiq.com/article/1586275234347 本文承接构造 IndexWri ....
star2017
1年前
1116
0
构造 IndexWriter 对象(三)
查看原文 系列文章: https://www.6aiq.com/article/1586276430450 https://www.6aiq.com/article/1586275234347 构造一个 IndexWriter 对象的流程总体分为下面三个部分: 设置索引目录 Directory 设置 ....
star2017
1年前
970
0
构造 IndexWriter 对象(二)
查看来源 系列文章: 构造 IndexWriter 对象(一) 构造一个 IndexWriter 对象的流程总体分为下面三个部分: 设置索引目录 Directory 设置 IndexWriter 的配置信息 IndexWriterConfig 调用 IndexWriter 的构造函数 在文章构造 ....
star2017
1年前
965
0
构造 IndexWriter 对象(一)
来源: https://www.amazingkoala.com.cn/Lucene/Index/2019/1111/106.html 该系列文章将会介绍构造一个 IndexWriter 对象的流程,该流程总体分为下面三个部分: 设置索引目录 Directory 设置 IndexWriter 的配置 ....
star2017
1年前
958
0
Lucene 源码系列——索引文件的生成(五)之 tim&&tip
在前面的四篇文章中,我们介绍了生成索引文件.tim、.tip、.doc、.pos、.pay 中.doc、.pos、.pay 这三个索引文件的内容,接着我们继续图 1 中剩余的内容,即流程点 生成索引文件.tim、.tip。 生成索引文件。tim、.tip、.doc、.pos、.pay 的流程图 图 ....
star2017
1年前
1065
0
Lucene 源码系列——索引文件的生成(四)之跳表 SkipList
在文章索引文件的生成(三)中我们介绍了在 Lucene 中生成跳表 SkipList 的流程,通过流程图的方法介绍了源码中的实现方式,而对于读取 SkipList 的内容,决定直接以例子的方式来介绍其读取过程,下文中出现的名词如果没有作出介绍,请先阅读文章索引文件的生成(三)。 例子 直接给出一 ....
star2017
1年前
1039
0
Lucene 源码系列——索引文件的生成(三)之跳表 SkipList
在文章索引文件的生成(一)中我们说到,在生成索引文件.doc、.pos、.pay 的过程中,当处理了 128 篇文档后会生成一个 PackedBlock,并将这个 PackedBlock 的信息写入到跳表 skipList 中,使得在读取阶段能根据文档号快速跳转到目标 PackedBlock,提高查 ....
star2017
1年前
1025
0
Lucene 源码系列——索引文件的生成(二)之 doc&&pay&&pos
生成索引文件。tim、.tip、.doc、.pos、.pay 的流程图 图 1: [图片] 我们继续介绍流程点 生成索引文件.doc、.pos、.pay。 生成索引文件.doc、.pos、.pay 的流程图 图 2: [图片] 记录位置信息 position、payload、偏移信息 offse ....
star2017
1年前
1065
0
Lucene 源码系列——倒排表
原文:https://www.amazingkoala.com.cn/Lucene/Index/2019/0222/36.html 本篇文章介绍如何生成倒排表,通过一个简单的例子来讲解倒排表的底层存储结构。文章中不会给出详细的源码介绍,只有一些必要的对象,感兴趣的朋友可以看我的 GitHub,对构建 ....
star2017
1年前
1138
0
1
2
3
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到