汉语听觉视觉双模态信息的互补作用被引量：4

导出

摘要从汉语听觉视觉双模态数据库CAVSR1.0中选出 10个人的视听数据 ,每人发 14个音节 /ba,bi,bian ,biao ,bin ,de ,di,dian ,duo,dong,gai,gan ,gen ,gu/ .感知实验的样本分单语音信号、语音信号 +视觉信号、单视觉信号 3类 .单语音信号、语音信号+视觉信号分别包括 5种声学条件 :无噪语音信号 ,信噪比S/N为 0 ,-8,-12 ,-16dB的语音信号 .由 2 0名观察者进行感知识别 .通过对实验结果分析 ,发现人类对单视觉信号有较强的识别能力 ;声母的发音方法、发音部位和韵母造成了视觉上的不同差异 ;在噪声环境下 ,视觉信息对听觉信息有非常明显的补偿作用 ,可以使正确识别率大幅度提高 .

作者周治杜利民徐彦君

机构地区中国科学院声学研究所语音交互信息技术研究中心

出处《中国科学（E辑）》 CSCD 2000年第3期283-288,共6页 Science in China(Series E)

基金中国科学院声学研究所所长基金 "八六三"高科技研究计划资助项目

关键词听觉视觉双模态语音识别汉语视听信息互补作

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1徐彦君,杜利民,李国强,张欣,周治.汉语听觉视觉双模态数据库CAVSR1.0[J].声学学报,2000,25(1):42-49. 被引量：17
2张家----，应用声学，1994年，13卷，3期，5页

二级参考文献7

1齐士钤吕士楠等.汉语综合资料库的设计[J].应用声学,1994,13(3):1-5.
2朱维彬.汉语言语数据库自动标注系统的研究.中国科学院声学研究所博士论文[M].,1998..
3林茂灿.北京话声调分布域的感知实验研究.语音研究报告[M].中国社会科学院语言研究所语音研究室,1992..
4朱维彬，博士学位论文，1998年
5Chiou G I，IEEE Trans Image Processing，1997年，6卷，8期，1192页
6张家，应用声学，1994年，13卷，3期，1页
7林茂灿，语音研究报告，1992年

共引文献16

1洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：8
2张欣,杜利民,陈柯,赵向阳.汉语语音视觉合成研究数据库CVSS1.0[J].微计算机应用,2007,28(3):260-265. 被引量：3
3李刚,王蒙军,林凌.面向残疾人的汉语可视语音数据库[J].中国生物医学工程学报,2007,26(3):355-360. 被引量：3
4张军,韦岗,余华.基于特征分量输出概率加权的多数据流鲁棒语音识别方法[J].声学学报,2008,33(2):102-108. 被引量：2
5奉小慧.基于改进的level set嘴唇轮廓定位方法[J].计算机应用,2009,29(1):92-94. 被引量：2
6ZHANG Jun WEI Gang YU Hua NING Genxin.Robust multi-stream speech recognition based on weighting the output probabilities of feature components[J].Chinese Journal of Acoustics,2009,28(3):269-279. 被引量：4
7赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
8赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：7
9严乐贫,奉小慧.双模态车载语音控制仿真系统的设计与实现[J].计算机与现代化,2010(8):211-215.
10陈妍玲,肖惜.PETS-3口语测试评分方法对信度的影响[J].金华职业技术学院学报,2011,11(4):36-38. 被引量：1

同被引文献26

1张华,王硕,王靓,陈静,岳朋朋,郭连生,赵小燕.普通话言语测听材料的数字化录制与等价性分析[J].临床耳鼻咽喉科杂志,2006,20(22):1011-1015. 被引量：26
2杨维中.佛教的生死观与命运观[J].世界宗教文化,2007(2):43-45. 被引量：6
3齐士钤吕士楠等.汉语综合资料库的设计[J].应用声学,1994,13(3):1-5.
4高文.多功能感知机的框架结构[C]..见:第二届中国计算机智能接口与190 2005．3 计算机工程与应用智能应用学术会议论文集[C].威海,1995.7-20.
5.[EB/OL].http://amp.ece.cmu.edu/.,.
6.[EB/OL].http://www.intel.com/research/mrl/research/avcsr.htm#.,.
7.[EB/OL].http://www.ee.surrey.ac.uk/Research/VSSP/xm2vtsdb/.,.
8S Pfeiffer. Pause Concepts for audio Segmentation at Different Semartic Levels[J].ACM Multimedia,2001:187～193.
9Dong Wang, Lie Lu , Hong Jiang Zhang. Speech"Segnentation Without Speech Recognition "[C].In: ICASSP 2003 Papers, 2003.
10Gerasimos tamianos,ChalapathyNeti,GiridharanIyengar et al.Large-Vocabulary Audio-Visual Speech Recognition by Machines and Humans.IBM Thomas J Watson Research Center,Aalborg,Denmark,2001.

引证文献4

1洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：8
2郗昕,吴事儒,赵乌兰,冀飞,陈艾婷,王枫,韩东一.噪声下汉语语句识别表在视、听、视＋听三种模式下的等价性研究[J].中国听力语言康复科学杂志,2010(4):19-22. 被引量：4
3王东,蒙山,张有为.汉语听觉视觉语音识别(CAVSR)双模态数据库的建立与结构[J].五邑大学学报（自然科学版）,2001,15(1):50-54. 被引量：2
4李雪莹,李仲凡.曹禺《原野》中的听觉叙事[J].陕西理工大学学报（社会科学版）,2023,41(4):52-60. 被引量：3

二级引证文献16

1李刚,王蒙军,林凌.面向残疾人的汉语可视语音数据库[J].中国生物医学工程学报,2007,26(3):355-360. 被引量：3
2赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
3赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：7
4严乐贫,奉小慧.双模态车载语音控制仿真系统的设计与实现[J].计算机与现代化,2010(8):211-215.
5肖庆阳,张金,左闯,范娟婷,梁碧玮,邸硕临.基于语义约束的口型序列识别方法[J].计算机应用与软件,2012,29(9):226-229.
6陈鱼,王悦,王巍,陈太生,林鹏.单、双耳佩戴助听器对助听效果的影响[J].听力学及言语疾病杂志,2014,22(2):184-186. 被引量：11
7李文靖,王永华,王枫,郗昕.唇读信息对听力损失患者语句识别的影响[J].听力学及言语疾病杂志,2014,22(2):187-189. 被引量：1
8鲁宏华,陈鱼,王巍,王悦,陈太生,徐开旭,赵晖,程岩,马元煦,林鹏.老年性聋患者佩戴助听器效果的评估[J].临床耳鼻咽喉头颈外科杂志,2016,30(10):788-790. 被引量：4
9任玉强,田国栋,周祥东,吕江靖,周曦.高安全性人脸识别系统中的唇语识别算法研究[J].计算机应用研究,2017,34(4):1221-1225. 被引量：19
10骆天依,刘大运,李修政,房国志,安欣,魏华杰,胡城.基于CNN与Bi-LSTM的唇语识别研究[J].软件导刊,2019,18(10):36-39. 被引量：2

1徐彦君,杜利民,李国强,张欣,周治.汉语听觉视觉双模态数据库CAVSR1.0[J].声学学报,2000,25(1):42-49. 被引量：17
2黄耀霖.多媒体在教学中的应用方式[J].职业技术教育,2007,28(35):44-44. 被引量：2
3赵伟江.计算机多媒体技术及其应用[J].金融管理与研究（杭州金融研修学院学报）,1995,0(2):35-37.
4徐超汉.DVI——多媒体系统全数字化的代表[J].计算机应用研究,1993,10(4):11-12. 被引量：1
5徐彦君,杜利民,侯自强.面向未来的交互信息技术——听觉视觉双模态语音识别(AVSR)(下)[J].电子科技导报,1999(2):11-13. 被引量：2
6李晟.机载和离机电子战的互补作用[J].电子战技术文选,1993(4):10-13.
7李春玉.机载和离机电子战的互补作用[J].电子对抗参考资料,1993,0(1):27-30.
8张闻波.入侵监测系统在计算机网络安全中的作用[J].东北水利水电,2003,21(8):51-52. 被引量：1
9张付志.一个集成多媒体和数据库的专家系统[J].计算机工程与应用,2002,38(2):83-85.
10崔国华,张友明,洪帆.6圈和8圈DES的差分攻击改进及实现[J].华中科技大学学报（自然科学版）,2003,31(5):17-19. 被引量：1

中国科学（E辑）

2000年第3期

浏览历史

内容加载中请稍等...

汉语听觉视觉双模态信息的互补作用被引量：4

参考文献2

二级参考文献7

共引文献16

同被引文献26

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语听觉视觉双模态信息的互补作用 被引量：4

参考文献2

二级参考文献7

共引文献16

同被引文献26

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语听觉视觉双模态信息的互补作用被引量：4