您现在的位置是：首页 > 数据库

当前栏目

postgresql 数据库基础之索引 hash的使用介绍

数据库 postgresql 索引基础使用介绍 HASH

2023-06-13 09:19:16 时间

Syntax:
CREATE [ UNIQUE ] INDEX [ CONCURRENTLY ] [ [ IF NOT EXISTS ] name ] ON table_name [ USING method ]
( { column_name | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] [, ] )
[ WITH ( storage_parameter = value [, ] ) ]
[ TABLESPACE tablespace_name ]
[ WHERE predicate ]

[ USING method ]

method

要使用的索引方法的名称。可以选择 btree、hash、 gist、spgist、 gin以及brin。默认方法是btree。

hash 只能处理简单的等值比较，

postgres=# explain select * from tmp_t0 where c0 = d3d9446802a44259755d38e6d163e820
QUERY PLAN
-
Index Scan using idx_tmp_t0_1 on tmp_t0 (cost=0.00..8.02 rows=1 width=66)
Index Cond: ((c0)::text = d3d9446802a44259755d38e6d163e820 ::text)
(2 rows) 注意事项，官网特别强调：

Hash索引操作目前不被WAL记录，因此存在未写入修改，在数据库崩溃后需要用REINDEX命令重建Hash索引。

同样，在完成初始的基础备份后，对于Hash索引的改变也不会通过流式或基于文件的复制所复制，所以它们会对其后使用它们的查询给出错误的答案。

正因为这些原因，Hash索引已不再被建议使用。

补充：Postgresql hash索引介绍

hash索引的结构

当数据插入索引时，我们会为这个索引键通过哈希函数计算一个值。 PostgreSQL中的哈希函数始终返回“整数”类型，范围为2^32≈40亿。bucket桶的数量最初为2个，然后动态增加以适应数据大小。可以使用位算法从哈希码计算出桶编号。这个bucket将存放TID。

由于可以将与不同索引键匹配的TID放入同一bucket桶中。而且除了TID之外，还可以将键的源值存储在bucket桶中，但这会增加索引大小。为了节省空间，bucket桶只存储索引键的哈希码，而不存储索引键。

当我们通过索引查询时，我们计算索引键的哈希函数并获取bucket桶的编号。现在，仍然需要遍历存储桶的内容，并仅返回所需的哈希码匹配的TID。由于存储的“hash code TID”对是有序的，因此可以高效地完成此操作。

但是，两个不同的索引键可能会发生以下情况，两个索引键都进入一个bucket桶，而且具有相同的四字节的哈希码。因此，索引访问方法要求索引引擎重新检查表行中的情况来验证每个TID。

映射数据结构到page

Meta page 0号page,包含索引内部相关信息

Bucket pages 索引的主要page,存储 “hash code TID” 对

Overflow pages 与bucket page的结构相同，在不足一个page时,作为bucket桶使用

Bitmap pages 跟踪当前干净的overflow page，并可将其重新用于其他bucket桶

注意，哈希索引不能减小大小。虽然我们删除了一些索引行，但是分配的页面将不会返回到操作系统，只会在VACUUMING之后重新用于新数据。减小索引大小的唯一选项是使用REINDEX或VACUUM FULL命令从头开始重建索引

接下来看下hash索引如何创建

demo=# create index on flights using hash(flight_no);
demo=# explain (costs off) select * from flights where flight_no = PG0001
QUERY PLAN
-
Bitmap Heap Scan on flights
Recheck Cond: (flight_no = PG0001 ::bpchar)
- Bitmap Index Scan on flights_flight_no_idx
Index Cond: (flight_no = PG0001 ::bpchar)
(4 rows)

注意：10版本之前hash索引不记录到wal中，所以hash索引不能做recovery，当然也就不能复制了，但是从10版本以后hash所用得到了增强，可以记录到wal中，创建的时候也不会再有警告。

查看hash访问方法相关的操作函数

demo=# select opf.opfname as opfamily_name,
amproc.amproc::regproc AS opfamily_procedure
from pg_am am,
pg_opfamily opf,
pg_amproc amproc
where opf.opfmethod = am.oid
and amproc.amprocfamily = opf.oid
and am.amname = hash
order by opfamily_name,
opfamily_procedure;

hank=# select hashtext( zhang );
hashtext
-
-1172392837
(1 row)
hank=# select hashint4(10);
hashint4
-
-1547814713
(1 row) hash索引相关的属性

由于hash函数没有特定的排序规则，所以一般的hash索引只支持等值查询，可以通过下面数据字典看到，所有操作都是“=”，而且hash索引也不会处理null值，所以不会标记null值，还有就是hash索引不存储索引键，只存储hash码，所以不会 index-only扫描，也不支持多列创建hash索引

安装插件

create extension pageinspect;

查看0号page

hank=# select hash_page_type(get_raw_page( hank.idx_test_name ,0));
hash_page_type
-
metapage
(1 row)

查看索引中的行数和已用的最大存储桶数

hank=# select ntuples, maxbucket
hank-# from hash_metapage_info(get_raw_page( hank.idx_test_name ,0));
ntuples | maxbucket
+
1000 | 3
(1 row)

可以看到1号page是bucket,查看此bucket page的活动元组和死元组的数量，

也就是膨胀度，以便维护索引

hank=# select hash_page_type(get_raw_page( hank.idx_test_name ,1));
hash_page_type
-
bucket
(1 row)
hank=# select live_items, dead_items
hank-# from hash_page_stats(get_raw_page( hank.idx_test_name ,1));
live_items | dead_items
+
407 | 0
(1 row)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。如有错误或未考虑完全的地方，望不吝赐教。

我想要获取技术服务或软件
服务范围：MySQL、ORACLE、SQLSERVER、MongoDB、PostgreSQL 、程序问题
服务方式：远程服务、电话支持、现场服务，沟通指定方式服务
技术标签：数据恢复、安装配置、数据迁移、集群容灾、异常处理、其它问题

本站部分文章参考或来源于网络，如有侵权请联系站长。
数据库远程运维 postgresql 数据库基础之索引 hash的使用介绍

猜你喜欢

PHP出错界面
软件|Adobe Acrobat Pro DC 2022最新版安装包下载及安装教程
使用Bash脚本简化MySQL数据库连接（bash能连接mysql）
如何查看Redis中的数据（如何查看redis中数据）
基础架构联盟新项目：Census
使用两条宽带怎么组建局域网？两根网线如何组建局域网？两根宽带,双路由
产品测试流程
Oracle数据库中二进制文件的存放格式（oracle二进制文件存放格式）
选择特斯拉，选择的是一种生活态度!
Linux下构建进程树的奇妙之旅（linux进程树）
掌握 Oracle 数据库触发器的四种类型（oracle触发器类型）
「使用 Linux 实现无盘系统」（linux无盘系统）
Spring Cloud Gateway(微服务网关)
输入位置，控制 StyleGAN 生成图像的布局! 论文速递2022.8.31！
记一次 Runtime Hook 的问题
CCD传感器成像、尺寸、曝光时间「建议收藏」

zl程序教程

当前栏目

postgresql 数据库基础之索引 hash的使用介绍

相关文章

当前栏目

postgresql 数据库基础 之 索引 hash的使用介绍

相关文章

postgresql 数据库基础之索引 hash的使用介绍