您现在的位置是：首页 > 云平台

当前栏目

自动语音识别（ASR）：研究综述【传统语音识别：基于贝叶斯公式，对联合概率P(X|W)·P(W)进行建模（语音识别结果=声学模型×语言模型）】【端到端语音识别：直接对条件概率 P(W|X)进行建模】

识别建模自动语言基于进行模型研究

2023-09-27 14:20:37 时间

一、传统语音识别基本原理（基于贝叶斯公式）

设一段语音信号经过特征提取得到特征向量序列为 X=[x1, x2, …, xN], 其中 xi 是一帧的特征向量, i=1, 2, …,N, N 为特征向量的数目. 该段语音对应的文本序列设为 W=[w1, w2, …, wM], 其中 wi 为基本组成单元, 如音素、单词、字符, i=1, 2, …, M, M 为文本序列的维度. 从贝叶斯角度, 语音识别的目标就是从所有可能产生特征向量X的文本序列中找到概率最大的W*, 可以用公式表示为式 (1) 优化问题:
在这里插入图片描述
由式(1)可知, 要找到最可能的文本序列必须使两个概率 P(X|W) 和 P(W) 的乘积最大, 其中：

P(X|W) 为条件概率, 由声学模型决定;
P(W) 为先验概率, 由语言模型决定.

声学模型和语言模型对语音信号的表示越精准, 得到的语音系统效果越准确.

从语音识别系统的构成来讲, 一套完整的语音识别系统包括预处理、特征提取、声学模型、语言模型以及搜索算法等模块,

猜你喜欢

OA选型之OA系统无缝对接CRM/ERP/HR软件
Spring Authorization Server 0.2.3发布，放出联合身份DEMO
Web自动化-Selenium自动化测试-4-编写测试用例
从大数据获益最多的7个产业
Linux cp 命令的15个示例 - 创建文件和目录的副本
《惢客创业日记》2020.09.07（周一）八月份的工作总结（李白版）
Android Binder原理（五）系统服务的获取过程
为什么HashMap线程不安全
[Oracle工程师手记]为什么flashback 的时候既需要 flashback log ,又需要 archive log?
PostgreSQL中的数组与Any
sql server 加锁 WITH(TABLOCK)
《交互式程序设计第2版》一3.3 Processing应用程序基础
nginx stream 日志设置(Version 1.9.0 +)
typora的markdown语法
深入理解Tomcat虚拟文件夹
用Nginx禁止指定IP、国外IP访问我的网站
Microsoft Office Professional Plus 2010在安装中出错解决办法安装office2010出错
小米盒子4刷三方ROM
猎豹移动内容产品遍地开花或将引领内容出海新浪潮

相关主题

物体识别
身份证识别
python 识别验证码
文字识别
目标识别1

zl程序教程

当前栏目

自动语音识别（ASR）：研究综述【传统语音识别：基于贝叶斯公式，对联合概率P(X|W)·P(W)进行建模（语音识别结果=声学模型×语言模型）】【端到端语音识别：直接对条件概率 P(W|X)进行建模】

一、传统语音识别基本原理（基于贝叶斯公式）

相关文章

当前栏目

自动语音识别（ASR）：研究综述【传统语音识别：基于贝叶斯公式，对联合概率P(X|W)·P(W)进行建模（语音识别结果=声学模型×语言模型）】【端到端语音识别：直接对条件概率 P(W|X)进行建模 】

一、传统语音识别基本原理（基于贝叶斯公式）

相关文章

自动语音识别（ASR）：研究综述【传统语音识别：基于贝叶斯公式，对联合概率P(X|W)·P(W)进行建模（语音识别结果=声学模型×语言模型）】【端到端语音识别：直接对条件概率 P(W|X)进行建模】