欢迎来到Xugang的小屋
-
TOP
前导
简单说明 如果你喜欢我的文章,可以下载每篇文章结尾的附件,附件中的MD文件,强烈推荐使用Typora阅读。 博客中所有关于Lucene文章的代码大家可以在我的GitHub中找到,地址:https://github.com/luxugang/Luc... -
段的多线程查询(二)(Lucene 10.0.0)
众所周知Lucene的索引数据由一个或多个段组成,并且通过下列方式定义一个IndexSearcher后就可以实现段的多线程查询: 1234public IndexSearcher(IndexReaderContext context, Executo... -
DocValuesSkipper(Lucene 10.0.0)
从Lucene 10.0.0开始,新增了DocValuesSkipper功能,用来提高正排索引DocValues类型范围查询(SortedNumericDocValuesRangeQuery、SortedSetDocValuesRangeQuery)... -
Count(Lucene 9.11.0)
概述 在OLAP系统,尤其在大数据分析和决策支持系统中,获取某个查询对应的命中数量(也称为查询结果的计数),即count是一个非常重要的指标。本篇文章将介绍Lucene中count功能的实现原理,以及该功能的部分演进历程。 Lucene提供了Ind... -
QueryCache(Lucene 9.11.0)
QueryCache是一个用于缓存查询结果的组件,旨在提高重复查询的性能。它通过在段级别缓存查询结果,避免了重复计算,从而减少查询响应时间和系统资源消耗。 数据结构 在介绍QueryCache的缓存逻辑之前,我们有必要先介绍下几个关键的数据结构。 ... -
Block-Max-Maxscore(Lucene 9.10.0)
Lucene中基于论文:Optimizing Top-k Document Retrieval Strategies for Block-Max Indexes 实现了Block-Max-Maxscore (BMM) 算法,用来优化关键字之间只有OR... -
HNSW图的构建(Faiss 1.8.0)
本篇介绍下Faiss中如何基于HNSW图存储向量,同样基于论文:Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small W... -
Vector Quantization(一)(Lucene 9.10.0)
本篇文章介绍下截止到9.10.0版本,Lucene中向量量化(Vector Quantization)技术相关的内容。 Lucene中为什么要引入VQ Lucene中使用HNSW (Hierarchical Navigable Small Worl... -
Constructing an HNSW Graph(Lucene 9.8.0)
Lucene has implemented the HNSW (Hierarchical Navigable Small World) logic based on the paper ‘Efficient and robust approxima...