期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
语音识别技术的研究与发展 被引量:24
1
作者 王敏妲 《微型机与应用》 2009年第23期1-2,6,共3页
回顾了语音识别技术的发展历史,描述了语音识别系统的基本原理,介绍了语音识别的几种基本方法,并对语音识别技术面临的问题和发展前景进行了讨论。
关键词 语音识别 模式识别 特征提取 人机交互
在线阅读 下载PDF
基于BTSM和DBN模型的唇读和视素切分研究
2
作者 吕国云 赵荣椿 +3 位作者 蒋冬梅 蒋晓悦 侯云舒 Sahli H 《计算机工程与应用》 CSCD 北大核心 2007年第14期21-24,共4页
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能... 为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。 展开更多
关键词 动态贝叶斯网络 贝叶斯切线形状模型 语音识别 视觉语音
在线阅读 下载PDF
基于上下文三音素DBN模型的连续语音识别
3
作者 吕国云 赵荣椿 +1 位作者 蒋冬梅 SAHLI H 《计算机工程与应用》 CSCD 北大核心 2007年第35期35-38,共4页
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上... 考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。 展开更多
关键词 动态贝叶斯网络 语音识别 三音素 单音素 上下文相关
在线阅读 下载PDF
基于改进型DTW算法和MFCC的语音识别 被引量:9
4
作者 陈孟元 《安徽工程大学学报》 CAS 2014年第1期53-57,共5页
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一... 采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果. 展开更多
关键词 语音识别 改进型DTW 差分倒谱参数软件 MATLAB
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部