欢迎来到Xugang的小屋
-
ReaderPool(一)(Lucene 8.7.0)
ReaderPool类对于理解Lucene的一些机制起到了极其关键的作用,这些机制至少包含段的合并、作用(apply)删除信息、NRT(near real-time)、flush/commit与merge的并发过程中的删除信息的处理等等,所以有必... -
索引文件的合并(三)之fdx&&fdt&&fdm(Lucene 8.7.0)
本文承接文章索引文件的合并(二)之fdx&&fdt&&fdm,继续介绍剩余的内容,下面先给出索引文件fdx&&fdt&&fdm的合并流程图。 索引文件fdx&&fd... -
索引文件的合并(二)之fdx&&fdt&&fdm(Lucene 8.7.0)
本文承接文章索引文件的合并(一)之fdx&&fdt&&fdm,继续介绍剩余的内容,下面先给出索引文件fdx&&fdt&&fdm的合并流程图。 索引文件fdx&&fd... -
索引文件的合并(一)之fdx&&fdt&&fdm(Lucene 8.7.0)
从本篇文章开始介绍索引文件合并的过程,其中合并策略、合并调度在之前的文章中已经介绍,没有阅读过这些文章并不会影响对本篇文章的理解。 由于本篇文章是索引文件的合并的开篇文章,故我们先给出各类索引文件合并的先后顺序,如下所示: 图1: 图1... -
BinaryDocValues(Lucene 8.7.0)
在文章BinaryDocValues中我们介绍了Lucene 7.5.0版本的数据结构,并且在文章索引文件的生成(二十一)之dvm&&dvd中介绍了Lucene 8.4.0中其数据结构的生成。阅读本文前建议先看下上述的两篇文章,因... -
索引文件之tvd&&tvx&&tvm(Lucene 8.7.0)
在索引(Indexing)阶段,当某个域被设置为需要记录词向量(term vector)信息后,那么随后在flush阶段,该域对应的词向量将被写入到索引文件.tvd&&tvx&&tvm三个文件中。 图1: 图... -
索引文件的读取(十五)之fdx&&fdt&&fdm(Lucene 8.4.0)
本文承接文章索引文件的读取(十四)之fdx&&fdt&&fdm,继续介绍剩余的内容。为了更好的理解下文中的内容,建议先阅读文章DirectMonotonicWriter&&Reader。下面先给出读... -
Changes(Lucene 8.7.0)
2020年11月3号,Lucene发布了最新的版本8.7.0,本篇文章将会对Change Log中几个变更展开介绍下。 LUCENE-9510 该issue的原文如下: 1Indexing with an index sort is now... -
索引文件的读取(十四)之fdx&&fdt&&fdm(Lucene 8.4.0)
在前几篇索引文件的读取的系列文章中,我们介绍索引文件tim&&tip的读取时机点时说到,在生成StandardDirectoryReader对象期间,会生成SegmentReader对象,该对象中的StoredFieldsRead... -
DirectMonotonicWriter&&Reader(Lucene 7.5.0)
DirectMonotonicWriter&&Reader DirectMonotonicWriter类用来存储单调递增的整数序列(monotonically-increasing sequences of integers),...