zl程序教程

您现在的位置是:首页 >  后端

当前栏目

语音信号处理-基础(四):时域音频特征及Python实现

Python基础 实现 特征 音频 语音 信号处理 时域
2023-09-27 14:20:37 时间

一、振幅包络线 Amplitude envelope (AE)

振幅包络线,就是将不同频率的振幅最高点连结起来形成的曲线。其 数学定义为:

其中 指代时刻t的振幅包络, 为窗口的大小, 而 是该窗口下第k个样本的振幅。
在这里插入图片描述
振幅包络线 可以告诉我们有关响度的大体情况, 而且对于异常值比较敏感, 常用于音频节奏检测(Onset Detection),和音乐类型分类(music genre classification)。

接下来我们对比下古典音乐、摇滚、爵士三类音乐的振幅包络线。

python分析语音数据有不少工具, 最为常用的应该是librosa。

首先我们先导入相关package。

import matplotlib.pyplot as plt
import numpy as np
import librosa
import librosa.</