您现在的位置是：首页 > 其他

当前栏目

【数字图像处理】霍夫曼编码（Huffman Coding）

编码数字图像处理 Coding

2023-09-14 08:56:57 时间

霍夫曼编码(Huffman Coding)是一种编码方法，霍夫曼编码是可变字长编码(VLC)的一种。

霍夫曼编码使用变长编码表对源符号（如文件中的一个字母）进行编码，其中变长编码表是通过一种评估来源符号出现机率的方法得到的，出现机率高的字母使用较短的编码，反之出现机率低的则使用较长的编码，这便使编码之后的字符串的平均长度、期望值降低，从而达到无损压缩数据的目的。

思想：常用的数据用短码表示，不常用的数据用长码表示。

霍夫曼编码的具体步骤如下：

将信源符号的概率按减小的顺序排队。
把两个最小的概率相加，并继续这一步骤，始终将较高的概率分支放在右边，直到最后变成概率１。
画出由概率１处到每个信源符号的路径，顺序记下沿路径的０和１，所得就是该符号的霍夫曼码字。
将每对组合的左边一个指定为0，右边一个指定为1（或相反）。

例：现有一个由5个不同符号组成的30个符号的字符串：

BABACAC ADADABB CBABEBE DDABEEEBB

1.首先计算出每个字符出现的次数（概率）：

2.把出现次数（概率）最小的两个相加，并作为左右子树，重复此过程，直到概率值为1

第一次：将概率最低值3和4相加，组合成7：

第二次：将最低值5和7相加，组合成12：

第三次：将8和10相加，组合成18：

第四次：将最低值12和18相加，结束组合：

3.将每个二叉树的左边指定为0，右边指定为1

4.沿二叉树顶部到每个字符路径，获得每个符号的编码

我们可以看到出现次数（概率）越多的会越在上层，编码也越短，出现频率越少的就越在下层，编码也越长。当我们编码的时候，我们是按“bit”来编码的，解码也是通过bit来完成，如果我们有这样的bitset “10111101100″ 那么其解码后就是 “ABBDE”。所以，我们需要通过这个二叉树建立我们Huffman编码和解码的字典表。

这里需要注意的是，Huffman编码使得每一个字符的编码都与另一个字符编码的前一部分不同，不会出现像’A’：00， ’B’：001，这样的情况，解码也不会出现冲突。

霍夫曼编码的局限性

利用霍夫曼编码，每个符号的编码长度只能为整数，所以如果源符号集的概率分布不是2负n次方的形式，则无法达到熵极限；输入符号数受限于可实现的码表尺寸；译码复杂；需要实现知道输入符号集的概率分布；没有错误保护功能。

猜你喜欢

基于64QAM调制解调的LDPC编译码算法误码率matlab仿真
什么时候才能都及格呢？
用 ABAP 调用 OCR 接口实现出租车发票扫描
flask中重定向所涉及的反推：由视图函数反推url
关于CRM WebClient UI缓存清理的讨论
nasm预处理器(4)
Docker 安装 Redis
自考之——我看《软件开发工具》
LDAP安装配置(原创)
阿里云数据库产品HybridDB简介——OLAP数据库，支持行列混合存储，基于数据库Greenplum的开源版本，并且吸收PostgreSQL精髓
poj1363——Rails
Echarts + Python 实现的动态实时大屏范例
数据你把它的金额-JAVA分页
Ehcache（05）——缓存的查询
Apache Doris 分析型数据库（三）Doris实践篇
android 9.0 Camera2 去掉后置摄像头仅支持前置摄像头功能
Java实现蓝桥杯算法训练区间k大数
Extended Choice Parameter拓展参数化构建
fastnlp中的CRF补齐的padding？
向容器中填充元素---fill
ASP.NET Web API 2 入门教程

相关主题

Java：字符编码
python-编码
文件编码
web编码
编码规范
huffman 编码
编码-理解
语音编码
%u编码
P1246 编码
GB2312 编码
字符编码
数的编码
什么是编码
js的编码函数
字符编码转换
网页编码
后端编码规范

zl程序教程

当前栏目

【数字图像处理】霍夫曼编码（Huffman Coding）

相关文章