【ES三周年】ElasticSearch数据库简单介绍
elasticsearch简介
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。
elasticSearch的使用场景
1、为用户提供按关键字查询的全文搜索功能。
2、实现企业海量数据的处理分析的解决方案。大数据领域的重要一份子,如著名的ELK框架(ElasticSearch,Logstash,Kibana)。
与其他数据存储进行比较
elasticsearch的特点
1,天然分片,天然集群
es 把数据分成多个shard,下图中的P0-P2,多个shard可以组成一份完整的数据,这些shard可以分布在集群中的各个机器节点中。随着数据的不断增加,集群可以增加多个分片,把多个分片放到多个机子上,已达到负载均衡,横向扩展。
在实际运算过程中,每个查询任务提交到某一个节点,该节点必须负责将数据进行整理汇聚,再返回给客户端,也就是一个简单的节点上进行Map计算,在一个固定的节点上进行Reduces得到最终结果向客户端返回。
2,天然索引
ES 所有数据都是默认进行索引的,这点和mysql正好相反,mysql是默认不加索引,要加索引必须特别说明,ES只有不加索引才需要说明。
而ES使用的是倒排索引和Mysql的B+Tree索引不同。
传统关系性数据库
弊端:
1、 对于传统的关系性数据库对于关键词的查询,只能逐字逐行的匹配,性能非常差。
2、匹配方式不合理,比如搜索“小密手机” ,如果用like进行匹配, 根本匹配不到。但是考虑使用者的用户体验的话,除了完全匹配的记录,还应该显示一部分近似匹配的记录,至少应该匹配到“手机”。
倒排索引是怎么处理的
全文搜索引擎目前主流的索引技术就是倒排索引的方式。
传统的保存数据的方式都是
记录→单词
而倒排索引的保存数据的方式是
单词→记录
索引结构对比
B+Tree
lucene 倒排索引结构
可以看到 lucene 为倒排索引(Term Dictionary)部分又增加一层Term Index结构,用于快速定位,而这Term Index是缓存在内存中的,但mysql的B+tree不在内存中,所以整体来看ES速度更快,但同时也更消耗资源(内存、磁盘)。
lucene与elasticsearch的关系
咱们之前讲的处理分词,构建倒排索引,等等,都是这个叫lucene的做的。那么能不能说这个lucene就是搜索引擎呢?
还不能。lucene只是一个提供全文搜索功能类库的核心工具包,而真正使用它还需要一个完善的服务框架搭建起来的应用。
好比lucene是类似于发动机,而搜索引擎软件(ES,Solr)就是汽车。
目前市面上流行的搜索引擎软件,主流的就两款,elasticsearch和solr,这两款都是基于lucene的搭建的,可以独立部署启动的搜索引擎服务软件。由于内核相同,所以两者除了服务器安装、部署、管理、集群以外,对于数据的操作,修改、添加、保存、查询等等都十分类似。就好像都是支持sql语言的两种数据库软件。只要学会其中一个另一个很容易上手。
从实际企业使用情况来看,elasticSearch的市场份额逐步在取代solr,国内百度、京东、新浪都是基于elasticSearch实现的搜索功能。国外就更多了 像维基百科、GitHub、Stack Overflow等等也都是基于ES的。
相关文章
- es数据库索引_sql 创建索引
- 【ES三周年】+windows安装es、kibana教程
- [ES三周年]如何使用New Bing
- mac 上学习k8s系列(48)es +grafana可视化
- 【ES三周年】写给ES开发者的Elasticsearch入门指南
- ElasticSearch全文搜索引擎 -Spring Boot操作ES(SpringData概述、Spring Data Elasticsearch、基本操作、ElasticSearch操作文档)
- docker中安装es和kibana
- 【ES三周年】- Elasticsearch简介与使用环境安装
- 【ES三周年】- Elasticsearch索引的创建、查询和删除
- 【ES三周年】Elasticsearch 常见问题分享
- 【ES三周年】Win10安装ElasticSearch笔记
- 【ES三周年】Elastic(ELK) Stack 架构师成长路径
- MySQL如何实时同步数据到ES?试试这款阿里开源的神器
- 【ES三周年】GPT引领学习之旅:一篇让程序员轻松掌握Elasticsearch的攻略
- ES与MySQL:混合技术的优势(es和mysql)
- Mongodb与ES组合,实现数据存储和搜索的双重效益(mongodb和es)
- 库 利用ES搜索MySQL数据库的实现方法(es搜索mysql数据)
- 使用ES实现Redis实时监控(用es做redis监控)
- 使用ES查询Oracle新方法进行数据挖掘(es查询oracle)
- 数据库的迁移用ES实现oracle中数据的安全迁移(ES对oracle)
- ES与Oracle数据库高效协同缔造数据之美(es和oracle数据库)
- es数据实时同步到Oracle数据库(es同步到oracle)
- ES与Oracle数据同步实现完美融合(es与oracle同步)
- 数据存储看您选择ES还是Redis(数据存es还是redis)
- 使用Redis导入ES实现高效数据迁移(把redis数据导入es)