欢迎来到Xugang的小屋
-
TOP
前导
简单说明 博客中的Lucene版本是7.5.0,如果是其他版本的会在文章标题体现。 如果你喜欢我的文章,可以下载每篇文章结尾的附件,附件中的MD文件,强烈推荐使用Typora阅读。 博客中所有关于Lucene文章的代码大家可以在我的GitHub中... -
Count(Lucene 9.11.0)
概述 在OLAP系统,尤其在大数据分析和决策支持系统中,获取某个查询对应的命中数量(也称为查询结果的计数),即count是一个非常重要的指标。本篇文章将介绍Lucene中count功能的实现原理,以及该功能的部分演进历程。 Lucene提供了Ind... -
QueryCache(Lucene 9.11.0)
QueryCache是一个用于缓存查询结果的组件,旨在提高重复查询的性能。它通过在段级别缓存查询结果,避免了重复计算,从而减少查询响应时间和系统资源消耗。 数据结构 在介绍QueryCache的缓存逻辑之前,我们有必要先介绍下几个关键的数据结构。 ... -
Block-Max-Maxscore(Lucene 9.10.0)
Lucene中基于论文:Optimizing Top-k Document Retrieval Strategies for Block-Max Indexes 实现了Block-Max-Maxscore (BMM) 算法,用来优化关键字之间只有OR... -
HNSW图的构建(Faiss 1.8.0)
本篇介绍下Faiss中如何基于HNSW图存储向量,同样基于论文:Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small W... -
Vector Quantization(一)(Lucene 9.10.0)
本篇文章介绍下截止到9.10.0版本,Lucene中向量量化(Vector Quantization)技术相关的内容。 Lucene中为什么要引入VQ Lucene中使用HNSW (Hierarchical Navigable Small Worl... -
Constructing an HNSW Graph(Lucene 9.8.0)
Lucene has implemented the HNSW (Hierarchical Navigable Small World) logic based on the paper ‘Efficient and robust approxima... -
HNSW图的构建(Lucene 9.8.0)
Lucene基于论文Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs [2018]实现... -
索引文件之vec&vem&vemf&vemq&veq&vex(Lucene 9.9.0)
在文章索引文件之vec&vem&vex(Lucene 9.8.0)中介绍了Lucene 9.8.0版本向量数据相关的索引文件(必须先阅读下,很多重复的内容不会再提起),由于在Lucene 9.9.0中引入了Scalar Quant...