您现在的位置是：首页 > 其它

当前栏目

图像、帧、片、NALU

图像

2023-09-27 14:29:31 时间

图像、帧、片、NALU 是学习 H.264 的人常常感到困惑的一些概念，我在这里对自己的理解做一些阐述，欢迎大家讨论：H.264 是一次概念的革新，它打破常规，完全没有 I 帧、P帧、B 帧的概念，也没有 IDR 帧的概念。
图像、帧、片、NALU 是学习 H.264 的人常常感到困惑的一些概念，我在这里对自己的理解做一些阐述，欢迎大家讨论：

H.264 是一次概念的革新，它打破常规，完全没有 I 帧、P帧、B 帧的概念，也没有 IDR 帧的概念。对于 H.264 中出现的一些概念从大到小排序依次是：序列、图像、片组、片、NALU、宏块、亚宏块、块、像素。这里有几点值得说明：
（1）、在 H.264 协议中图像是个集合概念，顶场、底场、帧都可以称为图像（本文图像概念时都是集合概念）。因此我们可以知道，对于 H.264 协议来说，我们平常所熟悉的那些称呼，例如：I 帧、P 帧、B 帧等等，实际上都是我们把图像这个概念具体化和细小化了。我们在 H.264 里提到的“帧”通常就是指不分场的图像；
（2）、如果不采用 FMO（灵活宏块排序）机制，则一幅图像只有一个片组；
（3）、如果不使用多个片，则一个片组只有一个片；
（4）、如果不采用 DP（数据分割）机制，则一个片就是一个 NALU，一个 NALU 也就是一个片。        否则，一个片由三个 NALU 组成（即标准“表7-1”中 nal_unit_type 值为 2、3、4 的三个 NALU 属于一个片）；    2 编码条带数据分割块A slice_data_partition_a_layer_rbsp( )

   3 编码条带数据分割块B slice_data_partition_b_layer_rbsp( )

   4 编码条带数据分割块C slice_data_partition_c_layer_rbsp( ) （5）、以上所述的片和 NALU 的大小关系并不是抽象概念上的从属关系。从概念的从属关系上来看，NALU其实又是片的一个集合概念，例如：标准“表7-1”中 nal_unit_type 值为 5 的 NALU 包括 I 片或者 SI 片。

    一幅图像根据组成它的片类型来分，可以分为标准“表7-5”中的 8 种类型。我们平常应用中所最常见到的其实是这些类型的特例。例如：我们平常所谓的“I 帧”和“IDR 帧”，其实是primary_pic_type 值为 0 的图像，我们平常所谓的“P帧”其实是 primary_pic_type 值为 1 的图像的特例，我们平常所谓的“B帧”其实是 primary_pic_type 值为 2 的图像的特例。

    一幅图像根据概念来分可以分为两种：IDR 图像和非 IDR 图像。一幅图像是否是 IDR 图像是由组成该图像的 NALU 决定的，如果组成该图像的 NALU 为标准“表7-1”中 nal_unit_type 值为 5 的 NALU，则该图像为 IDR 图像，否则为非 IDR 图像。这里也有几点值得说明：（1）、nal_unit_type 值为 5 的 NALU 只会出现在 IDR 图像中，而 IDR 图像中的所有 NALU 都是nal_unit_type 值为 5 的 NALU；
（2）、我们以组成一幅图像的片的类型来区分该图像是否是 IDR 图像是错误的。例如：一幅图像中的所有片都是 I 片并不代表这幅图像就是 IDR 图像。因为 I 片也可以从属于 nal_unit_type 值为 1 的 NALU 也即非IDR图像有可能全部包含I片。只不过我们平常最常见到的形式是：所有片都是 I 片的图像就是 IDR 图像。其实这个时候 IDR 图像的概念也被我们具体化和细小化了。但IDR图像必定全部包含I片或SI片，不过只有用NALU的类型才能判断是不是IDR图像

一幅图像由 1～N 个片组组成，而每一个片组又由一个或若干个片组成一个片由一个NALU或三个NALU（假如有数据分割）组成。图像解码过程中总是按照片进行解码，然后按照片组将解码宏块重组成图像。从这种意义上讲，片实际是最大的解码单元。一个片又包含哪些类型的宏块呢？标准“表7-10”做了最好的说明。一个 I 宏块又分为哪些类型呢？标准“表7-11”做了最好的说明。一个 P 宏块又分为哪些类型呢？标准“表7-13”做了最好的说明。一个 B 宏块又分为哪些类型呢？标准“表7-14”做了最好的说明。一个 P 宏块的亚宏块又分为哪些类型呢？标准“表7-17”做了最好的说明。一个 B 宏块的亚宏块又分为哪些类型呢？标准“表7-18”做了最好的说明。
红外热成像仪阵列插值-由 32*24 像素到 512*384 像素 MLX90640 的 32*24=768 像素虽然比以往的 8*8 或者 16*8 像素提高了很多，但若直接用这些像素还是不能很好的形成热像图，为了使用这些像素点平滑成像就需要对其进行插值，使用更多的像素来绘制图像。看了一些别人的算法，感觉主要就是多项式插值，仅是插值方法的组合方式不同。
红外热成像仪测温模块阵列插值-由 32*24 像素到 512*384 像素 MLX90640 的 32*24=768 像素虽然比以往的 8*8 或者 16*8 像素提高了很多，但若直接用这些像素还是不能很好的形成热像图，为了使用这些像素点平滑成像就需要对其进行插值，使用更多的像素来绘制图像。看了一些别人的算法，感觉主要就是多项式插值，仅是插值方法的组合方式不同。
《数字视频和高清：算法和接口》一1.3图像采样本节书摘来华章计算机《数字视频和高清：算法和接口》一书中的第1章，第1.3节，［加］查尔斯·波因顿（Charles Poynton）著刘开华褚晶辉马永涛吕卫宫霄霖等译译更多章节内容可以访问云栖社区“华章计算机”公众号查看。

猜你喜欢

AutoHotKey 用打码的快捷键
Python 文本语义识别，文本转化为图数据库，文本摘要图展示，文本数据图谱化
python opencv3 grabcut前景检测
PL/SQL 用户自定义子类型
用手机从锁定的计算机中偷取凭证信息
在CentOS上使用Nginx和Tomcat搭建高可用高并发网站
【Python】print()函数入门操作：print()函数的输出内容、输出目的地和输出形式
HP-UX 系统的发展历史
DVWA 通关指南：XSS(Stored)
fpga实操训练（lcd字符显示）
Codeforces Round #254 (Div. 2)：B. DZY Loves Chemistry
盘点2017汉诺威工业展上IT厂商的10款物联网新品
异步&线程池 CompletableFuture 异步编排【下篇】
Java8 Lambda表达式详解手册及实例
【精选】一文搞懂css三大特性

相关主题

python图像分割
PHP图像函数
opencv 图像分割
opencv 图像梯度
PHP的图像函数
opencv 图像轮廓
旋转图像
832. 翻转图像
医学图像分割
4.4. 图像滤波
6.5 图像的锐化
6.4 图像的平滑
图像仿射变换

zl程序教程

当前栏目

图像、帧、片、NALU

相关文章