期刊文献+

汉语听觉视觉双模态信息的互补作用 被引量:4

原文传递
导出
摘要 从汉语听觉视觉双模态数据库CAVSR1.0中选出 10个人的视听数据 ,每人发 14个音节 /ba,bi,bian ,biao ,bin ,de ,di,dian ,duo,dong,gai,gan ,gen ,gu/ .感知实验的样本分单语音信号、语音信号 +视觉信号、单视觉信号 3类 .单语音信号、语音信号+视觉信号分别包括 5种声学条件 :无噪语音信号 ,信噪比S/N为 0 ,-8,-12 ,-16dB的语音信号 .由 2 0名观察者进行感知识别 .通过对实验结果分析 ,发现人类对单视觉信号有较强的识别能力 ;声母的发音方法、发音部位和韵母造成了视觉上的不同差异 ;在噪声环境下 ,视觉信息对听觉信息有非常明显的补偿作用 ,可以使正确识别率大幅度提高 .
出处 《中国科学(E辑)》 CSCD 2000年第3期283-288,共6页 Science in China(Series E)
基金 中国科学院声学研究所所长基金 "八六三"高科技研究计划资助项目
  • 相关文献

参考文献2

二级参考文献7

  • 1齐士钤 吕士楠 等.汉语综合资料库的设计[J].应用声学,1994,13(3):1-5.
  • 2朱维彬.汉语言语数据库自动标注系统的研究.中国科学院声学研究所博士论文[M].,1998..
  • 3林茂灿.北京话声调分布域的感知实验研究.语音研究报告[M].中国社会科学院语言研究所语音研究室,1992..
  • 4朱维彬,博士学位论文,1998年
  • 5Chiou G I,IEEE Trans Image Processing,1997年,6卷,8期,1192页
  • 6张家,应用声学,1994年,13卷,3期,1页
  • 7林茂灿,语音研究报告,1992年

共引文献16

同被引文献26

  • 1张华,王硕,王靓,陈静,岳朋朋,郭连生,赵小燕.普通话言语测听材料的数字化录制与等价性分析[J].临床耳鼻咽喉科杂志,2006,20(22):1011-1015. 被引量:26
  • 2杨维中.佛教的生死观与命运观[J].世界宗教文化,2007(2):43-45. 被引量:6
  • 3齐士钤 吕士楠 等.汉语综合资料库的设计[J].应用声学,1994,13(3):1-5.
  • 4高文.多功能感知机的框架结构[C]..见:第二届中国计算机智能接口与190 2005.3 计算机工程与应用智能应用学术会议论文集[C].威海,1995.7-20.
  • 5.[EB/OL].http://amp.ece.cmu.edu/.,.
  • 6.[EB/OL].http://www.intel.com/research/mrl/research/avcsr.htm#.,.
  • 7.[EB/OL].http://www.ee.surrey.ac.uk/Research/VSSP/xm2vtsdb/.,.
  • 8S Pfeiffer. Pause Concepts for audio Segmentation at Different Semartic Levels[J].ACM Multimedia,2001:187~193.
  • 9Dong Wang, Lie Lu , Hong Jiang Zhang. Speech"Segnentation Without Speech Recognition "[C].In: ICASSP 2003 Papers, 2003.
  • 10Gerasimos tamianos,ChalapathyNeti,GiridharanIyengar et al.Large-Vocabulary Audio-Visual Speech Recognition by Machines and Humans.IBM Thomas J Watson Research Center,Aalborg,Denmark,2001.

引证文献4

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部