期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
TONE MODELING BASED ON HIDDEN CONDITIONAL RANDOM FIELDS AND DISCRIMINATIVE MODEL WEIGHT TRAINING 被引量:1
1
作者 黄浩 朱杰 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2008年第1期43-50,共8页
The use of hidden conditional random fields (HCRFs) for tone modeling is explored. The tone recognition performance is improved using HCRFs by taking advantage of intra-syllable dynamic, inter-syllable dynamic and d... The use of hidden conditional random fields (HCRFs) for tone modeling is explored. The tone recognition performance is improved using HCRFs by taking advantage of intra-syllable dynamic, inter-syllable dynamic and duration features. When the tone model is integrated into continuous speech recognition, the discriminative model weight training (DMWT) is proposed. Acoustic and tone scores are scaled by model weights discriminatively trained by the minimum phone error (MPE) criterion. Two schemes of weight training are evaluated and a smoothing technique is used to make training robust to overtraining problem. Experiments show that the accuracies of tone recognition and large vocabulary continuous speech recognition (LVCSR) can be improved by the HCRFs based tone model. Compared with the global weight scheme, continuous speech recognition can be improved by the discriminative trained weight combinations. 展开更多
关键词 speech recognition MODELS hidden conditional random fields minimum phone error
在线阅读 下载PDF
Discriminative tone model training and optimal integration for Mandarin speech recognition
2
作者 黄浩 朱杰 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期174-178,共5页
Two discriminative methods for solving tone problems in Mandarin speech recognition are presented. First, discriminative training on the HMM (hidden Markov model) based tone models is proposed. Then an integration t... Two discriminative methods for solving tone problems in Mandarin speech recognition are presented. First, discriminative training on the HMM (hidden Markov model) based tone models is proposed. Then an integration technique of tone models into a large vocabulary continuous speech recognition system is presented. Discriminative model weight training based on minimum phone error criteria is adopted aiming at optimal integration of the tone models. The extended Baum Welch algorithm is applied to find the model-dependent weights to scale the acoustic scores and tone scores. Experimental results show that tone recognition rates and continuous speech recognition accuracy can be improved by the discriminatively trained tone model. Performance of a large vocabulary continuous Mandarin speech recognition system can be further enhanced by the discriminatively trained weight combinations due to a better interpolation of the given models. 展开更多
关键词 discriminative training minimum phone error tone modeling Mandarin speech recognition
在线阅读 下载PDF
基于模型混淆度的模型组合算法研究 被引量:3
3
作者 吴娅辉 刘刚 郭军 《自动化学报》 EI CSCD 北大核心 2009年第5期551-555,共5页
传统的声学模型训练算法如最大似然估计(Maximum likelihood estimation,MLE),在训练时只考虑了模型自身而没有考虑模型之间的相互影响.为了进一步提升模型的识别效果,区分性训练算法被提出.本文在最小音素错误(Minimum phone error,MPE... 传统的声学模型训练算法如最大似然估计(Maximum likelihood estimation,MLE),在训练时只考虑了模型自身而没有考虑模型之间的相互影响.为了进一步提升模型的识别效果,区分性训练算法被提出.本文在最小音素错误(Minimum phone error,MPE)区分性训练算法的基础上提出一种基于模型间混淆程度进行模型组合的算法:针对单混合分量模型,依据模型间混淆程度对MLE和MPE的模型进行加权组合;针对多混合分量模型,提出一种模型选择的算法来获取新的模型参数.实验表明,与MPE算法相比,对单分量的情况,该算法可以使系统的误识率相对降低4%左右;对于多分量的情况,该算法可以使系统的误识率相对降低3%左右. 展开更多
关键词 模型加权 区分性训练 最小音素错误 最大似然估计
在线阅读 下载PDF
鉴别性最大后验概率声学模型自适应 被引量:2
4
作者 齐耀辉 潘复平 +1 位作者 葛凤培 颜永红 《计算机应用》 CSCD 北大核心 2014年第1期265-269,共5页
为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相... 为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相结合的H-criterion最大后验概率(H-MAP)自适应估计先验分布中心,提出了基于最大互信息最大后验概率先验的最小音素错误最大后验概率(MPE-MMI-MAP)和基于H-criterion最大后验概率先验的最小音素错误最大后验概率(MPE-H-MAP)算法。任务自适应实验结果表明,MPE-MMI-MAP和MPE-H-MAP算法的自适应性能均优于MPE-MAP、MMI-MAP和最大后验概率(MAP)自适应方法,分别比MPE-MAP相对提高3.4%和2.7%。 展开更多
关键词 最大后验概率 鉴别性最大后验概率 最大互信息 最小音素错误 声学模型自适应
在线阅读 下载PDF
嵌入式盲人手机语音识别与控制系统设计 被引量:9
5
作者 王璟珣 滕召胜 +2 位作者 高云鹏 王一 李聪聪 《计算机测量与控制》 CSCD 北大核心 2009年第10期1951-1954,共4页
针对盲人与低视力患者群体,提出并设计了一种基于非特定人语音识别技术的嵌入式盲人手机音控系统:系统采用AD1836A为语音信号采集单元、Blackifn533DSP为语音信息处理单元核心,通过建立连续隐马尔可夫模型(CHMM)、选取美尔频率倒... 针对盲人与低视力患者群体,提出并设计了一种基于非特定人语音识别技术的嵌入式盲人手机音控系统:系统采用AD1836A为语音信号采集单元、Blackifn533DSP为语音信息处理单元核心,通过建立连续隐马尔可夫模型(CHMM)、选取美尔频率倒谱系数(MFCC)为语音特征参数,采用Baum-Welch算法及最小误差分类(MCE)方法改进HMM模型参数,设计实现了包含10个数字(0~9)和25条语音指令的全语音手机控制平台,并通过指令分级识别方式大大提高了语音指令的整体识别率。 展开更多
关键词 隐马尔可夫模型 Baum—Welch算法 最小误差分类法 盲人手机
在线阅读 下载PDF
区分性模型组合中基于决策树的声学上下文建模方法 被引量:1
6
作者 黄浩 李兵虎 吾守尔.斯拉木 《自动化学报》 EI CSCD 北大核心 2012年第9期1449-1458,共10页
上下文相关的区分性模型组合的局限在于引入大的模型权重参数集,在数据有限时容易导致区分性权重训练过拟合.针对该问题,本文提出利用决策树进行上下文建模,采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集.决策树构造... 上下文相关的区分性模型组合的局限在于引入大的模型权重参数集,在数据有限时容易导致区分性权重训练过拟合.针对该问题,本文提出利用决策树进行上下文建模,采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集.决策树构造过程中通过评估目标函数的一阶近似增量来加速最优问题集的选择,并利用精细问题集来获得更好的声学区分能力.基于多模型组合的语音识别实验表明,该方法能够增强权重训练对过拟合的鲁棒性,在大幅减小参数数量的情况下降低误识率,并优于在特征空间进行组合的方法. 展开更多
关键词 区分性模型组合 上下文建模 声学决策树 最小音子错误 语音识别
在线阅读 下载PDF
汉语语音识别声调模型集成中基于决策树的上下文相关权重参数聚类方法
7
作者 黄浩 李兵虎 吾守尔.斯拉木 《新疆大学学报(自然科学版)》 CAS 2011年第3期260-266,共7页
声调集成是汉语语音识别的一个重要任务.在语音识别的二次解码过程中,使用区分性训练的权重因子进行声调模型集成已被证明是一个有效的方法,而且使用上下文相关的得分加权进行模型组合也得到了应用.上下文相关模型组合方法的一个不足是... 声调集成是汉语语音识别的一个重要任务.在语音识别的二次解码过程中,使用区分性训练的权重因子进行声调模型集成已被证明是一个有效的方法,而且使用上下文相关的得分加权进行模型组合也得到了应用.上下文相关模型组合方法的一个不足是将会带来大量的训练参数,从而导致权重训练受到过拟合的影响.针对该问题,提出利用声学决策树对上下文相关权重参数进行参数聚类,决策树节点问题集根据最小化训练数据的期望误识率进行选择.提出问题集剪枝来加快决策树的构建速度.汉语连续语音识别实验表明与人工选择上下文相关权重参数相比,该方法能够在大大减少参数数量的条件下明显降低误识率. 展开更多
关键词 声调集成 最小音子错误 决策树 汉语语音识别 区分性模型组合 上下文相关
在线阅读 下载PDF
发音错误检错中声学模型训练准则的比较研究
8
作者 王建明 黄浩 王羡慧 《新疆大学学报(自然科学版)》 CAS 2013年第2期211-217,共7页
在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1... 在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1值函数的区分性训练准则,并利用构造弱意义辅助函数的方法对声学模型参数进行优化.通过比较,发现最大化F1值函数的区分性训练准则能够有效地增大训练和测试数据检错的F1值,同时训练数据和测试数据上的精确度、召回率都有明显改进. 展开更多
关键词 最大似然估计 最小音素错误 最大化F1值 辅助函数
在线阅读 下载PDF
维吾尔语连续语音识别声学模型优化研究 被引量:4
9
作者 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《计算机工程与应用》 CSCD 2013年第2期145-147,共3页
综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最... 综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最小音素错误区分性训练准则训练声学模型,进而完成在测试集上的识别实验。实验结果显示,Tandem区分性训练方法使识别系统的单词错误率比原先的基于最大似然估计准则的系统相对减少13%。 展开更多
关键词 维吾尔语 语音识别 最小音素错误 Tandem特征
在线阅读 下载PDF
区分性训练算法在英语语音评测中的应用
10
作者 祁均 梁维谦 《电声技术》 2011年第8期42-44,47,共4页
针对计算机英语语音客观评测给出与专家主观评测相关度的更高结果,提出基于区分性训练的声学模型用以改进客观评测置信分数。首先介绍强制匹配算法得到语音矢量的发音质量评测分数(Goodness ofPronunciation,GOP)的过程,再利用假设检验... 针对计算机英语语音客观评测给出与专家主观评测相关度的更高结果,提出基于区分性训练的声学模型用以改进客观评测置信分数。首先介绍强制匹配算法得到语音矢量的发音质量评测分数(Goodness ofPronunciation,GOP)的过程,再利用假设检验的数学理论证明基于区分性算法"最小音素错误"训练得到的声学模型比基于传统最大似然算法的声学模型更能得到接近于主观评测的置信分数。通过计算主客观评测结果的相关系数,实验验证了利用区分性声学模型的语音评测系统可以给出更高的置信分数。 展开更多
关键词 区分性训练 语音评测 最小音素错误 置信分数 假设检验
在线阅读 下载PDF
Experimental Study of Discriminative Adaptive Training and MLLR for Automatic Pronunciation Evaluation 被引量:3
11
作者 宋寅 梁维谦 《Tsinghua Science and Technology》 SCIE EI CAS 2011年第2期189-193,共5页
A stronger canonical model was developed to improve the performance of automatic pronunciation evaluations. Three different strategies were investigated with speaker adaptive training to normalize variations among spe... A stronger canonical model was developed to improve the performance of automatic pronunciation evaluations. Three different strategies were investigated with speaker adaptive training to normalize variations among speakers, minimum phone error training to identify easily confused phones and maximum likelihood linear regression (MLLR) adaptation to compensate for accent variations between native and non-native speakers. The three schemes were combined to improve the correlation coefficient between machine scores and human scores from 0.651 to 0.679 on the sentence level and from 0.788 to 0.822 on the speaker level. 展开更多
关键词 discriminative adaptive training (DAT) speaker adaptive training (SAT) minimum phone error(MPE) automatic pronunciation evaluation (APE)
原文传递
区分性模型在英语自动发音评测中的应用
12
作者 宋寅 梁维谦 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第4期503-506,共4页
为了改善英语自动发音评测中所使用的声学模型,提高评测的准确性,分别采用区分性训练中的最大互信息(MMI)和最小音素错误(MPE)算法训练出隐含Markov声学模型,并采用最大似然线性回归(MLLR)对模型进行非母语说话人的口音自适应,最后应用... 为了改善英语自动发音评测中所使用的声学模型,提高评测的准确性,分别采用区分性训练中的最大互信息(MMI)和最小音素错误(MPE)算法训练出隐含Markov声学模型,并采用最大似然线性回归(MLLR)对模型进行非母语说话人的口音自适应,最后应用到英语自动发音评测系统中。实验结果表明:分别对MMI和MPE方法训练所得模型作自适应后的机器总分与人工评分之间的相关度在说话人层次上分别提高了3.3%和5.2%,证明了在英语发音评价中区分性模型的实用性和有效性。 展开更多
关键词 区分性训练 最大互信息(MMI)算法 最小音素错误(MPE)算法 最大似然线性回归(MLLR)算法 自动发音评测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部