Lucene、solr以及elasticsearch之间的区别和联系
2023-03-31 11:07:13 时间
Lucene、solr以及elasticsearch之间的区别和联系
- lucene,就是一个jar包,里面包含了封装好的各种建立倒排索引、以及进行搜索的代码,包括各种算法。我们就用java开发的时候,引入lucene jar,然后基于lucene的api去进行开发就可以了。solr和elasticsearch都是基于lucene做的一些封装
- Solr是一个有HTTP接口的基于Lucene的查询服务器,封装了很多Lucene细节,自己的应用可以直接利用诸如【 .../solr?q=abc】这样的HTTP (GET/POST)请求去查询,维护修改索引。
- Elasticsearch是一个分布式搜索引擎,采用倒排索引将每一个字段都编入索引,使其可以被搜索
- solr以及elasticsearch之间的区别:
- solr利用zookpper进行分布式管理,而elasticsearch自身带有分布式协调管理功能
- solr比elasticsearch提供的功能多,elasticsearch更注 重于核心功能,高级功能则由第三方插件提供
- elasticsearch在实时搜索方面比solr表现好
什么是全文检索、倒排索引
- 全文检索:以中文文章中的每一个词作为key,该词出现在文章中的(次数和位置)作为value建立索引(这种索引也叫倒排索引),这种以倒排索引检索数据的方式就叫全文检索;
倒排索引原理:
ES检索数据原理:
相关文章
- 为什么微服务要有独立数据库
- 中科院院士郭光灿:“要把中国量子计算机卖到国外”
- 谷歌云押注多云和边缘计算:追赶亚马逊和微软
- 性能优化系列:每个程序员都应该知道的数字
- 何为多标签分类?这里有几种实用的经典方法
- 互联网员工平均年龄出炉,年轻化日趋明显,35岁面临更大挑战
- 靠WiFi信号就能检测呼吸跌倒!北大这项硬科技研究越来越藏不住了
- 谷歌研究院最新发现:训练结果不准确,超大数据规模要背锅!
- 中国计算机协会秘书长杜京哲:软硬协同创新助力计算产业发展破局
- 仅靠合成数据就能实现真实人脸分析!微软这项新研究告别人工标注
- 小模型大趋势!Google 提出两个模型:体积下降7倍,速度提升10倍
- 美国要求台积电、三星45天内主动交出商业数据,不配合将采取行动
- 盘点Facebook“七宗罪”:元宇宙只是一块“遮羞布”?
- 谈谈反对量子计算的理由
- 错误率减半需要超过500倍算力!深度学习的未来,光靠烧钱能行吗?
- 最会造假的GAN模型!Facebook发布IC-GAN,迁移能力史上超强
- 达摩院发表Nature子刊,新型比特量子芯片将于云栖大会发布
- 网民人均每天刷短视频1.5个小时!在互联网娱乐,算浪费时间吗?
- 科学家发现一种能解决“最难”计算机问题的新方法
- Google量子计算AI实验室大公开,并分享了未来十年的路线图