isearch5 index,attribute和summary。
index attribute Summary
2023-09-11 14:17:25 时间
索引
isearch5 支持的索引分为:index,attribute和summary。
Index指的是倒排索引,它存储了存储了从term到DocID的映射关系,形如:
term-->(Doc1,Doc2,...,DocN);倒排索引主要用在检索中,它能快速的定位用户查询到关键字对应的document。比如同事间经常说的”xx“进召回往往指的就是这个”xx“信息被建立了倒排索引。
Attribute指的是正排索引,它存储从DocID到field的映射关系,形如:
DocID-->(term1,term2,...termn)。正排索引分单值和多值两种,单值attribute由于长度是固定的(不包括string类型),因此查找效率高,而且可以支持更新。多值attribute表示某个field中有多个数据(数量不固定),由于长度不确定,因此查找效率相较与单值更慢。正排索引主要是在查询到了某个Document后,根据docid值能快速获取到其attribute用来统计、排序、过滤中。比如我们经常听到的”xx“计算相关性,那么”xx“这个信息就往往建立了正排索引,需要注意的是ranker中使用的字段必须全部进正排,否则ranker取不到这些字段。
summary的存储形式与attribute类似,但是summary是将一个Document对应的多个field存储在一起,并且建立映射,所以能很快从docid定位到对应的summary内容。summary主要是用于结果的展示。
并不是所有的字段都需要建立索引,特别对于商品搜索,一些字段仅仅用于展示,而不用检索或者计算相关性,那么这些字段就存在Doc中,一起返回给前端供应用展示,比如商品的detail链接。
相关文章
- Index Key Column VS Index Included Column
- SQL CREATE INDEX 语句
- http://www.malware-traffic-analysis.net/2018/index.html
- Elasticsearch之索引模板index template与索引别名index alias
- mysql中force index强制索引
- nginx配置后只有根目录首页index.php能访问,其他页面404
- 转 Python-IndexError: list index out of range
- eclipse卡死在search for main types 20 files to index
- ThinkPHP在Apache和Nginx下去除index.php方法
- 【从翻译mos文章】采用高速全扫描索引(index ffs) 为了避免全表扫描
- python基础:split、join、replace、remove、del、pop、index小记
- [LeetCode] 880. Decoded String at Index 在位置坐标处解码字符串
- [LeetCode] 852. Peak Index in a Mountain Array 山形数组的顶峰坐标
- [LeetCode] 275. H-Index II 求H指数之二
- idea 一直scanning files to index的完美解决