期刊文献+

综合非语境因素的语音数据分类与声学建模研究

Integrating non-context features in speech data classification and modeling
原文传递
导出
摘要 分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%-10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。 Effects of the non-context features, such as gender, speaker group identity, speaking rate and channel, for the classification and modeling of the speech data are studied based on data clustering and pre-classification knowledge methods. In order to incorporate non-context features with the context ones in the modeling process, generalized feature decision tree scheme is adopted and extended for the building of multiple high resolution acoustic models. Maximum likelihood model combination is then advanced to solve the subsequent model selection problem. Experimental results on two sets indicated that 8
作者 丁鹏 徐波
出处 《声学学报》 EI CSCD 北大核心 2004年第1期23-28,共6页 Acta Acustica
关键词 数据聚类 语音数据分类 非语境因素 声学建模 最大似然准则 误识率 语音识别系统 Algorithms Classification (of information) Data handling Decision theory Models
  • 相关文献

参考文献18

二级参考文献21

  • 1林焘 王理嘉.语音学教程[M].北京:北京大学出版社,..
  • 2徐波 张亮 等.基于决策树方法的语境有关HMM建模.第八届全国声学学术会议[M].,1998.421-424.
  • 3王作英 曹洪.语音识别的改进隐含马尔可夫模型[J].863智能计算机系统主题学术会议,1988,12.
  • 4计天颖.一种汉语连续语音识别的算法及其实现(博士学位论文)[M].清华大学电子工程系,1995,4..
  • 5郭锦桴.综合语音学[M].福建:福建人民出版社,1992..
  • 6Hwanq Mei Yuh,IEEE Trans SAP,1996年,4卷,6期,412页
  • 7计天颖,博士学位论文,1995年
  • 8Kai-FuLee,IEEE Trans ASSP,1990年,38卷,4期,509页
  • 9工作英,863智能计算机系统主题学术会议,1988年
  • 10Hwang Meiyuh,IEEE Trans Speech Audio Processing,1998年,4卷,6期,412页

共引文献26

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部