特定声音识别检测模块详解
2023-09-11 14:17:10 时间
需求解析
对于养宠物的人来说,识别宠物的叫声并根据它的叫声来判断是否出现了异常。宠物叫声一般都比较单一,难度相对较低,准确性有保障。
病人健康检测:通过声音识别,可以检测出人夜晚打呼噜的声音,可以检测出夜晚说梦话的声音,并把这些声音录下来,用作健康预警和疾病诊疗使用。
机器的异常检测:很多机器转动运转过程中都会发出声音。出问题之后一般会发出不一样的特定频段的声音。很多设备故障检测设备,都是根据检测特定声音来判断设备的故障信息的。
算法解析
特定声音检测,首先离不开vad检测,vad检测能检测出是否有声音存在,并可以判断出声音持续的时间。
其次,这里离不开fft福利也变换,变换后的频域信息可以看出不少有价值的信息了。很多机器出故障了都会发出特定频谱的声音,从这里就比较容易区分了。
MFCC系数:梅尔频率倒谱系数(MFCC)通过与声音内容密切相关的13个特殊频率所对应的能量分布,可以使用梅尔频率倒谱系数矩阵作为语音识别的特征。基于隐马尔科夫模型进行模式识别,找到测试样本最匹配的声音模型,从而识别语音内容。
CNN:随着神经网络的飞速发展,做技术不加一些神经网络的东西在,人们都认为你这技术不高级了。算力比较小的芯片,只能加一些算是锦上添花了。
技术特色
音频采集距离远:通过搭载定制的咪头,采集距离可达10米的以上。
工作功耗低:工作功耗控制在2ma左右,待机功耗可达ua级别。
接口丰富:数据可通过串口或者GPIO接口输出效果,接口简单,协议明晰,方便对接和测试。
算法灵活:根据不同的场景需求来适配不同的算法。
相关文章
- 使用ML.NET模型生成器来完成图片性别识别
- 文本预处理的基本方法(分词、词性标注、命名实体识别)
- 基于CNN卷积神经网络的minst数据库手写字识别
- 解决:npm中 下载速度慢 和(无法将“nrm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确, 然后再试一次)。
- Swift基础--手势识别(双击、捏、旋转、拖动、划动、长按)
- 视网膜识别VS虹膜识别 谁更胜一筹
- 面部表情识别2:Pytorch实现表情识别(含表情识别数据集和训练代码)
- 小程序图片长按识别功能的实现
- 微软手写识别模块sdk及delphi接口例子
- 海洋信息处理-非合作水声通信信号检测及识别
- OpenCV 数字验证码识别
- 图形验证码的识别