zl程序教程

您现在的位置是:首页 >  其它

当前栏目

多媒体技术 2023-03-11

11 2023 03
2023-09-11 14:14:16 时间

音频的获取与处理

2.1声音的基础知识

声音的三个要素是音调、音强和音色。

音调是指声音的高低,由频率决定。高频率的声音听起来高,低频率的声音听起来低。 音乐中按音阶来表示音调的高低。赫兹Hz

音强是指声音的响度,即声音的强弱。响度取决于声音的振幅,振幅大的声音听起来响亮,振幅小的声音听起来轻柔。分贝db

音色是指声音的音质特点,是由声音波的组合产生的【谐波】。不同的乐器或声源会产生不同的音色。例如,钢琴的音色和吉他的音色是不同的,即使它们发出的是相同的音调和音强。除基音之外的高次谐波越丰富,音色就越有明亮感和层次感。

 

人可以听到的声音的频率范围约为20 Hz至20,000 Hz。这个范围称为听觉频率范围,它因人的年龄、性别和健康状况等因素而略微有所不同。婴儿和小孩可以听到更高频率的声音,而老年人可能听力下降,不能听到高频率的声音。

 

规则声音是指具有规则性、周期性的声音,例如人类说话、乐器演奏等都是规则声音。这类声音具有可测量的频率和振幅,能够被分析成一系列频率成分的叠加。规则声音的谱线呈现规则的共振峰,这些峰标志着声音特征的出现和消失。常见的规则声音包括语音、音乐、动物鸣叫等。

不规则声音则是指没有明显规律性、周期性的声音,例如雨声、嗓音、风声等。这类声音无法被分析成规则的频率成分,具有复杂的频率谱,难以精确地描述和分析其声波形态。不规则声音往往显得更加随意、自由,而不像规则声音那样受到固定规律的限制。

 

2.2 声音的数字化

模拟音频-->采集,量化,编码-->数字音频

1. 采集声音信号:使用麦克风等设备将声音转化成电信号。 2. 声音信号的预处理:将信号进行滤波、增益控制等处理,使其达到数字化的要求。 3. 采样:使用模数转换器将信号按照一定的时间间隔进行采样,将模拟信号转化为离散的数字信号。 4. 量化:使用模数转换器将采样后的信号的幅度值进行离散化。 5. 编码:使用编码器将量化后的数字信号转化为不同的二进制编码。 6. 存储或传输:将编码后的数字信号存储到存储介质中,或者通过网络传输到接收端。 7. 解码:接收端对传输过来的数字信号进行解码,恢复原先的数字信号。 8. 数字信号重建:使用数字信号处理技术对解码后的数字信号进行去噪、滤波等处理,恢复出原来的声音信号。

 

音频数字化的硬件设备

1.集成式

2.板卡式

3.外置式

 

声卡的功能

进行A/D转换

进行D/A转换

实时动态地处理数字化声音信号

输入和输出接口

 

采样定理_百度百科 (baidu.com)

mp3是有损压缩

脉冲编码调制pulse code modulation

 

音频数字化的4个设置参数

采样率

位深度

声道数

编码格式

 

数字音频文件的比特率bps

比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量

比特率=采样数*位深度*声道数目

文件大小=比特率*时长/8

 

7种常见的音频格式简析 MP3,WMA,WAV,APE,FLAC,OGG,AAC - 知乎 (zhihu.com)

声音文件的格式

有损压缩mp3,wma,ogg

无损压缩wav, ape, flac

APE是现在流行的数字音乐文件格式之一,与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。

而容量方面,APE的文件大小大概为WAV的一半左右。虽然,这个比例并不是很高,和MP3那种1/10-1/12的压缩比率难以相提并论,但是随着宽带的普及,大量下载APE格式已成为可能。

简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。

 

常用的音频软件

GoldWave

CoolEdit

SoundForge

CuBase

Adobe Audition