期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
语音识别技术的研究与发展
被引量:
24
1
作者
王敏妲
《微型机与应用》
2009年第23期1-2,6,共3页
回顾了语音识别技术的发展历史,描述了语音识别系统的基本原理,介绍了语音识别的几种基本方法,并对语音识别技术面临的问题和发展前景进行了讨论。
关键词
语音识别
模式识别
特征提取
人机交互
在线阅读
下载PDF
职称材料
基于BTSM和DBN模型的唇读和视素切分研究
2
作者
吕国云
赵荣椿
+3 位作者
蒋冬梅
蒋晓悦
侯云舒
Sahli H
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能...
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
展开更多
关键词
动态贝叶斯网络
贝叶斯切线形状模型
语音识别
视觉语音
在线阅读
下载PDF
职称材料
基于上下文三音素DBN模型的连续语音识别
3
作者
吕国云
赵荣椿
+1 位作者
蒋冬梅
SAHLI H
《计算机工程与应用》
CSCD
北大核心
2007年第35期35-38,共4页
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上...
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。
展开更多
关键词
动态贝叶斯网络
语音识别
三音素
单音素
上下文相关
在线阅读
下载PDF
职称材料
基于改进型DTW算法和MFCC的语音识别
被引量:
9
4
作者
陈孟元
《安徽工程大学学报》
CAS
2014年第1期53-57,共5页
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一...
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.
展开更多
关键词
语音识别
改进型DTW
差分倒谱参数软件
MATLAB
在线阅读
下载PDF
职称材料
题名
语音识别技术的研究与发展
被引量:
24
1
作者
王敏妲
机构
同济大学微电子研究中心
出处
《微型机与应用》
2009年第23期1-2,6,共3页
文摘
回顾了语音识别技术的发展历史,描述了语音识别系统的基本原理,介绍了语音识别的几种基本方法,并对语音识别技术面临的问题和发展前景进行了讨论。
关键词
语音识别
模式识别
特征提取
人机交互
Keywords
speech recognition
pattern recognition
feature extraction
human-computer interact
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于BTSM和DBN模型的唇读和视素切分研究
2
作者
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
Sahli H
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子信息系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
基金
中国科技部与比利时弗拉芒大区科技合作项目(No.[2004]487)
西北工业大学英才培养计划项目(No.04XD0102)
文摘
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
关键词
动态贝叶斯网络
贝叶斯切线形状模型
语音识别
视觉语音
Keywords
dynamic Bayesian network
Bayesian tangent shape model
speech recognition
visual speech
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于上下文三音素DBN模型的连续语音识别
3
作者
吕国云
赵荣椿
蒋冬梅
SAHLI H
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子信息系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第35期35-38,共4页
基金
中国科技部与比利时弗拉芒大区科技合作项目(No.[2004]487)
西北工业大学英才培养计划项目(No.04XD0102)。
文摘
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。
关键词
动态贝叶斯网络
语音识别
三音素
单音素
上下文相关
Keywords
Dynamic Bayesian Network(DBN)
speech recognition
triphone
mono-phone
context-dependent
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进型DTW算法和MFCC的语音识别
被引量:
9
4
作者
陈孟元
机构
安徽工程大学安徽省电气传动与控制重点实验室
出处
《安徽工程大学学报》
CAS
2014年第1期53-57,共5页
基金
安徽高校省级自然科学研究重点基金资助项目(KJ2013A041)
芜湖市科技计划基金资助项目(芜科计字[2012]95号)
文摘
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.
关键词
语音识别
改进型DTW
差分倒谱参数软件
MATLAB
Keywords
speech recognition improved DTW algorithm derivative coefficient of cepstrum MATLAB
分类号
TN912.3 [电子电信—通信与信息系统]
TP392.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
语音识别技术的研究与发展
王敏妲
《微型机与应用》
2009
24
在线阅读
下载PDF
职称材料
2
基于BTSM和DBN模型的唇读和视素切分研究
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
Sahli H
《计算机工程与应用》
CSCD
北大核心
2007
0
在线阅读
下载PDF
职称材料
3
基于上下文三音素DBN模型的连续语音识别
吕国云
赵荣椿
蒋冬梅
SAHLI H
《计算机工程与应用》
CSCD
北大核心
2007
0
在线阅读
下载PDF
职称材料
4
基于改进型DTW算法和MFCC的语音识别
陈孟元
《安徽工程大学学报》
CAS
2014
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部