行存储(关系型数据库)与列存储(hbase,es聚合的doc_value)[通俗易懂]
大家好,又见面了,我是你们的朋友全栈君。
1.为什么要按列存储
列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表:
Ø Row-based storage stores atable in a sequence of rows.
Ø Column-based storage storesa table in a sequence of columns.
行式存储下一张表的数据都是放在一起的,但列式存储下都被分开保存了
行式存储 | 列式存储 | |
---|---|---|
优点 | Ø 数据被保存在一起 Ø INSERT/UPDATE容易 | Ø 查询时只有涉及到的列会被读取 Ø 投影(projection)很高效 Ø 任何列都能作为索引 |
缺点 | Ø 选择(Selection)时即使只涉及某几列,所有数据也都会被读取 | Ø 选择完成时,被选择的列要重新组装 Ø INSERT/UPDATE比较麻烦 |
ps:列式数据库方便projection SQL Projection is the collective name for the columns that are Selected and returned from a query. In other words, the columns goes behind select in a query. In Oracle, a whole row is first fetched, then data values from the columns within that row are extracted into the known projection.
select某个字段就是projection。
注:关系型数据库理论回顾 – 选择(Selection)和投影(Projection)
数据压缩:通过字典表压缩数据
下面才是那张表本来的样子。经过字典表进行数据压缩后,表中的字符串才都变成数字了。正因为每个字符串在字典表里只出现一次了,所以达到了压缩的目的(有点像规范化和非规范化Normalize和Denomalize)
查询执行性能
通过一条查询的执行过程说明列式存储(以及数据压缩)的优点:
关键步骤如下:
1. 去字典表里找到字符串对应数字(只进行一次字符串比较)。
2. 用数字去列表里匹配,匹配上的位置设为1。
3. 把不同列的匹配结果进行位运算得到符合所有条件的记录下标。
4. 使用这个下标组装出最终的结果集。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/159119.html原文链接:https://javaforall.cn
相关文章
- ES 中文分词器ik
- ES版本升级报错之CheckClusterState4Scalelnerr(FailedOperation.ErrorClusterState)
- ES系列二、CentOS7安装ES head6.3.1
- 【ES三周年】+windows安装es、kibana教程
- 一次性带你搞明白面试必问题,谈谈你对ES的理解
- 【ES三周年】+Elasticsearch Service基础知识点
- IOS – OpenGL ES 调节图像白平衡/色温 GPUImageWhiteBalanceFilter
- IOS – OpenGL ES 设置图像模糊 GPUImageFastBlurFilter
- IOS – OpenGL ES 图像哈哈镜效果 GPUImageStretchDistortionFilter
- PostgreSQL 数据同步到ES 搭建操作
- Hbase(七)hbase高级编程详解大数据
- hadoop2.6.0分布式集群搭建(详细),搭建es-hadoop详解大数据
- HBase学习之路 (五)MapReduce操作Hbase详解大数据
- MySQL数据导入HBase:构建NoSQL数据库(mysql导入hbase)
- 比较:HBase与MongoDB的优劣(hbase和mongodb)
- Mongodb与ES组合,实现数据存储和搜索的双重效益(mongodb和es)
- 库 利用ES搜索MySQL数据库的实现方法(es搜索mysql数据)
- 电商搜索ES与Redis的黄金组合(电商搜索es和redis)
- Hbase与Oracle数据库深入比较(hbase与oracle)
- ES来打破传统从Oracle走向 NoSQL(es替代oracle)
- 深入比较ES数据库与Oracle数据库(es数据库和oracle)
- 简单快捷ES数据导出到Oracle(es数据导出oracle)
- 借助ES技术可靠地迁移数据至Oracle(es 数据到oracle)
- ES和Oracle一种新的数据处理方案(es和oracle)
- 数据存储看您选择ES还是Redis(数据存es还是redis)