欢迎来到Xugang的小屋
-
LRUQueryCache(Lucene 7.5.0)
LRUQueryCache用来对一个Query查询的结果进行缓存,缓存的内容仅仅是文档号集,由于不会缓存文档的打分(Score),所以只有不需要打分的收集器(Collector)才可以使用LRUQueryCache,比如说TotalHitCou... -
索引文件之tvx&&tvd(Lucene 7.5.0)
当设置了TermVector的域生成了倒排表以后,将文档的词向量信息写到.tvx(vector_index)跟.tvd(vector_data)文件中。 数据结构 .tvd 图1: PackedIntsVersion PackedIntsVe... -
倒排表(中)(Lucene 7.5.0)
本篇文章介绍使用了词向量(TermVector)后的域生成的倒排表,在索引阶段,索引选项(indexOptions)不为NONE的域会生成一种倒排表(上),这种倒排表的特点是所有文档的所有域名的倒排表都会写在同一张中,后续会读取倒排表来生成.doc、... -
索引文件之liv(Lucene 7.5.0)
索引文件.liv只有在一个segment中包含被删除的文档时才会生成,它记录了当前段中没有被删除的文档号。这里不会讨论一个segment是如何获得被删除的文档号,在后面的文章中,介绍IndexWriter.flush()时会详细介绍,本篇文章只介绍那... -
索引文件之dim&&dii(Lucene 7.5.0)
从Lucene6.0开始出现点数据(Point Value)的概念,通过将多维度的点数据生成KD-tree结构,来实现快速的单维度的范围查询(比如 IntPoint.newRangeQuery)以及N dimesional shape inter... -
Bkd-Tree(Lucene 7.5.0)
Bkd-Tree作为一种基于K-D-B-tree的索引结构,用来对多维度的点数据(multi-dimensional point data)集进行索引。Bkd-Tree跟K-D-B-tree的理论部分在本篇文章中不详细介绍,对应的两篇论文在附件中,感...