您现在的位置是：首页 > 其他

当前栏目

Lucene 分页搜索实现

搜索实现分页 Lucene

2023-09-14 09:07:45 时间

Lucene中有两种分页查询方式

1、一次查询出大量数据，然后根据页码定位是哪个文档，其实就是暴力获取了

2、通过调用searchAfter来实现

我们都知道collect是lucene中对搜索到的文档进行收集和排序过程，searchAfter也是通过一个收集器来控制的，叫PagingTopScoreDocCollector

PagingTopScoreDocCollector中最主要的方法是getLeafCollector()判断分页查询的代码为，collect中包含了判断视为当前页的结果还有结果排序，排序方法是pq.updateTop();

updateTop中就执行两部操作，在查询到结果中找到最小的，然后返回heap[1],i默认从1开始所以head【0】为空，所以返回heap[1],每次都会和heap[1]对比把最小的放在前面

这是一个弄了一个二叉堆，具体分析的可以看http://quweiprotoss.blog.163.com/blog/static/408828832011523114133876/这个

当score分数一样的时候会对比文档大小，最后是按照文档id的大小进行排列的

说白了searchAfter也是全部搜索了一遍只不过在collect过程中添加了一个上一页最后doc和当前返回的doc对比，这个过程时间复杂度为o(n)，而用普通的查询这个过程会没有从某种程度上来说兴许速度还会由于searchAfter

猜你喜欢

深入剖析Oracle互信安全机制（oracle互信）
MySQL：使用全库备份命令实现数据安全（mysql全库备份命令）
MySQL配置向导服务器打开之路（服务器打开mysql）
MacOS启动MySQL命令：简单又有效（mac启动mysql命令）
JavaScript省市联动实现代码
windows7安装iis7.0图文教程(不需要单独的安装包)
回调函数在Linux中的应用（回调函数linux）
远程调用Redis接口把数据安全开启（redis远程接口调用）
统计学大佬的派系之争，极大似然估计与最大后验概率
写给应届童鞋找工作的些许建议
Oracle数据库中的伪记录（oracle伪记录）
Wireshark系列之2 路由过程理论分析
同步网络时间的 NTP 协议被发现存在8个漏洞
Oracle中截取函数的应用（oracle之截取函数）
Oracle中查询月份的简便函数使用（oracle中月份函数）

相关主题

搜索技术(1)
C++二叉搜索树
34. 搜索范围
启发式搜索
文本搜索
搜索插入位置
搜索框的设计
ElasticSearch索引与搜索
Java搜索类
排序与搜索
二分搜索
二、搜索
简单搜索集

zl程序教程

当前栏目

Lucene 分页搜索实现

相关文章