多媒体技术 2023-03-11
音频的获取与处理
2.1声音的基础知识
声音的三个要素是音调、音强和音色。
音调是指声音的高低,由频率决定。高频率的声音听起来高,低频率的声音听起来低。 音乐中按音阶来表示音调的高低。赫兹Hz
音强是指声音的响度,即声音的强弱。响度取决于声音的振幅,振幅大的声音听起来响亮,振幅小的声音听起来轻柔。分贝db
音色是指声音的音质特点,是由声音波的组合产生的【谐波】。不同的乐器或声源会产生不同的音色。例如,钢琴的音色和吉他的音色是不同的,即使它们发出的是相同的音调和音强。除基音之外的高次谐波越丰富,音色就越有明亮感和层次感。
人可以听到的声音的频率范围约为20 Hz至20,000 Hz。这个范围称为听觉频率范围,它因人的年龄、性别和健康状况等因素而略微有所不同。婴儿和小孩可以听到更高频率的声音,而老年人可能听力下降,不能听到高频率的声音。
规则声音是指具有规则性、周期性的声音,例如人类说话、乐器演奏等都是规则声音。这类声音具有可测量的频率和振幅,能够被分析成一系列频率成分的叠加。规则声音的谱线呈现规则的共振峰,这些峰标志着声音特征的出现和消失。常见的规则声音包括语音、音乐、动物鸣叫等。
不规则声音则是指没有明显规律性、周期性的声音,例如雨声、嗓音、风声等。这类声音无法被分析成规则的频率成分,具有复杂的频率谱,难以精确地描述和分析其声波形态。不规则声音往往显得更加随意、自由,而不像规则声音那样受到固定规律的限制。
2.2 声音的数字化
模拟音频-->采集,量化,编码-->数字音频
1. 采集声音信号:使用麦克风等设备将声音转化成电信号。 2. 声音信号的预处理:将信号进行滤波、增益控制等处理,使其达到数字化的要求。 3. 采样:使用模数转换器将信号按照一定的时间间隔进行采样,将模拟信号转化为离散的数字信号。 4. 量化:使用模数转换器将采样后的信号的幅度值进行离散化。 5. 编码:使用编码器将量化后的数字信号转化为不同的二进制编码。 6. 存储或传输:将编码后的数字信号存储到存储介质中,或者通过网络传输到接收端。 7. 解码:接收端对传输过来的数字信号进行解码,恢复原先的数字信号。 8. 数字信号重建:使用数字信号处理技术对解码后的数字信号进行去噪、滤波等处理,恢复出原来的声音信号。
音频数字化的硬件设备
1.集成式
2.板卡式
3.外置式
声卡的功能
进行A/D转换
进行D/A转换
实时动态地处理数字化声音信号
输入和输出接口
mp3是有损压缩
脉冲编码调制pulse code modulation
音频数字化的4个设置参数
采样率
位深度
声道数
编码格式
数字音频文件的比特率bps
比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量
比特率=采样数*位深度*声道数目
文件大小=比特率*时长/8
7种常见的音频格式简析 MP3,WMA,WAV,APE,FLAC,OGG,AAC - 知乎 (zhihu.com)
声音文件的格式
有损压缩mp3,wma,ogg
无损压缩wav, ape, flac
APE是现在流行的数字音乐文件格式之一,与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。
而容量方面,APE的文件大小大概为WAV的一半左右。虽然,这个比例并不是很高,和MP3那种1/10-1/12的压缩比率难以相提并论,但是随着宽带的普及,大量下载APE格式已成为可能。
简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。
常用的音频软件
GoldWave
CoolEdit
SoundForge
CuBase
Adobe Audition
相关文章
- 11.Java 加解密技术系列之 总结
- 尼恩Java面试宝典V60——3月11日最新发布(卷王专供+ 史上最全 + 2023面试必备)
- 操作系统,计算机网络,数据库刷题笔记11
- 第11周 上机报告 2:英尺到米的转换表
- ThreadLocal 夺命 11 连问,万字长文深度解析
- 【双11狂欢的背后】微服务注册中心如何承载大型系统的千万级访问?
- C++11中std::move和std::forward到底干了啥
- iOS 11开发教程(三)运行第一个iOS 11程序
- 2016第11周五
- NLP应用之知识图谱的11个应用,问答、推荐系统、信息检索等
- [LeetCode]11. 盛最多水的容器
- (第11列)C语言练习:输入数组,最大的与第一个元素交换,最小的与最后一个元素交换,输出数组。五步带你解决。
- Spring Boot—11控制器Controller
- 江西推进11个 全国智慧城市试点
- 【历史上的今天】1 月 11 日:Mac Mini 问世;ALGOL 60 诞生;人类首次关闭 FM 广播
- OpenCV 2.4.11 VS2010 Configuration
- 11.Vue安装Axios及使用
- 《Linux命令行与shell脚本编程大全 第3版》Linux命令行---11
- C++11实现argsort功能
- C++11 模板改进