计算机唇读研究进展被引量：2

Research Advances in Computer Lip-Reading

下载PDF

导出

摘要计算机唇读是利用计算机对说话者的唇动等视觉语音信息进行分析以识别出其所说内容的过程,并可与听觉语音信息相融合以进一步提高计算机的识别率,从而使人机交互更加自然。本文从计算机唇读系统的各环节入手综述了该领域的研究进展,并讨论了现有诸方法的优缺点,最后提出了有待进一步研究的问题。 As a hotspot in the field of human-computer interaction, computer lip-reading aims at recognizing what human says by analyzing visual speech information, such as lip movement. It can be further integrated with audio speech information to improve recognition accuracy for more convenient human-computer interaction. This paper gives a survey of lip-reading approaches and discusses their benefits and drawbacks. Finally, several key issues to be researched in the field are pointed out.

作者王晓平郝玉峰付德刚袁春伟

机构地区东南大学生物电子学国家重点实验室北京捷通华声语音技术有限公司

出处《数据采集与处理》 CSCD 北大核心 2007年第3期353-359,共7页 Journal of Data Acquisition and Processing

基金国家自然科学基金(60121101)资助项目

关键词唇读定位特征抽取信息融合 lip-reading location feature extraction information fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献50

1Hennecke M E,Prasad K V,Stork D G.Automatic speech recognition system using acoustic and visual signals[C]//29th Annual Asilomar Conference on Signals,Systems and Computers.Pacific Grove,CA:IEEE Computer Society Press,1995,2:1214-1218.
2Petajan E D.Automatic lipreading to enhance speech recognition[D].Urbana-Champain:University of Illinois at Urbana-Champain,1984.
3姚鸿勋,刘明宝,高文,范旭彤,张洪明,吕雅娟.基于彩色图像的色系坐标变换的面部定位与跟踪法[J].计算机学报,2000,23(2):158-165. 被引量：54
4王瑞,高文.非监督、多级嘴唇区域分割方法[J].计算机工程与应用,2003,39(2):53-56. 被引量：4
5Lee D J,Bates D,Dromey C,et al.An image system correlating lip shapes with tongue contact patterns for speech pathology research[C]//16th IEEE Symposium on Computer-Based Medical Systems.New York,USA:IEEE Computer Society Press,2003:307-313.
6Lewis T W,Powers D M W.Lip feature extraction using red exclusion[C]//Selected papers from Pan-Sydney Area Workshop on Visual Information Processing.Sydney,Australia:Australian Computer Society,2001,2:61-67.
7Kaynak M N,Zhi Q,Cheok A D,et al.Analysis of lip geometric features for audio-visual speech recognition[J].IEEE Transactions on System,Man,and Cybernetics,Part A:Systems and Humans,2004,34(4):564-570.
8Zhang X Z,Mersereau R M,Clements M A.Audiovisual speech recognition by speechreading[C]//14th International Conference on Digital Signal Processing.Santorini,Greece:IEEE,2002,2:1069-1072.
9Xie L,Cai X L,Fu Z H,et al.Lip temporal pattern analysis for automatic visual speech recognition[C]//7th International Conference on Signal Processing.Beijing,China:IEEE Computer Society Press,2004,1:703-706.
10Delmas P,Coulon P Y,Fristot V.Automatic snakes for robust lip boundaries extraction[C]//IEEE International Conference on Acoustics,Speech,and Signal Processing.Phoenix,AZ,USA:IEEE,1999,6:3069-3072.

二级参考文献41

1Potamianos G, Neti C, Iyengar G, et al. A cascade visual front end for speaker independent automatic speechreading[J]. International Journal of speech technology, 2001 (4) :193 -208.
2Gerasimos Potamianos, Chalapathy Neti. Improved ROI and within frame discriminant features for lipreading[A]. In: Proceedings of the International Conference on Image Processing[C]. Piscataway: IEEE, 2001.
3Kazuhiro Nakamura, Noriaki Murakam, Ka-zuyoshi Takagi, et al. A real-time lipreading LSI for word recognition [J/OL]. http:∥www. ap-asic. org/2002/proceedings/SC/3C _ 5. pdf, 2002.
4AWC Liew, SH Leung, WH Lau. Lip contour extraction from color images using a deformable model[J]. Pattern Recognition, 2002, 35: 2949- 2962.
5Uda K, Tagawa N, Minagawa A, et al. Effectiveness evaluation of word characteristics obtained from 3D image information for lipreading[A]. In: Proceedings 11th International Conference on Image Analysis and Processing[C]. Los Alamitos: IEEE, 2001.
6Matthews I, Potamianos G, Neti C, et al. A comparison of model and transform-based visual features for audiovisual LVCSR[A]. In: Proc lnt Conf Multimedia Expo[C]. Los Alamitos: IEEE, 2001.
7lain Matthews J , Andrew Bangham , Richard Harvey.Extraction of visual features for lipreading [J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2002,24(2) :198 -213.
8Zhang Jian-ming, Wang Liang-min, Niu De-jiao, et al.Research and implementation of a real time approach to lip detection in video sequences [A]. In: Proceedings of 2003 International Conference on Machine Learning and Cybernetics [C]. Piscataway: IEEE, 2003.
9Lewis T W, Powers D M. Lip feature extraction using red exclusion[A]. In: Proc Selected Papers from PanSydney Workshop on Visual Information Processing[C],Sydney: Australian Computer Society, 2000.
10[1]Marcus E Hennecke,David G Stork ,K Venkatesh Prasad.Visionary speech :Looking ahead to practical speechreading systems[C].In:DavidG Stork,Marcus E Hennecke eds. Speechreading by Humans and Machines, volume 150 of NATO ASI Series, Series F: Computer and Systems Sciences,Berlin, 1995

共引文献109

1吴小俊,王士同,杨静宇,刘同明.基于扰动方法和广义K-L变换的人脸特征抽取[J].系统仿真学报,2006,18(z2):906-908.
2陈彪,吴成东,郑君刚.基于人脸识别技术的智能门禁系统设计[J].现代建筑电气,2010,1(4):1-5. 被引量：4
3荣传振,岳振军,贾永兴,王渊,杨宇.唇语识别关键技术研究进展[J].数据采集与处理,2012,27(S2):277-283. 被引量：4
4曾宪贵,黎绍发,左文明.基于颜色的皮肤区域探测[J].计算机工程与应用,2004,40(17):98-99. 被引量：4
5高全学,张洪才,潘泉,程咏梅.基于肤色、知识和2DPCA的人脸检测[J].计算机工程与应用,2004,40(32):56-58.
6刘洪发,黄铭晖,覃祖军,夏春和,樊月华.一种分布动态网络安全系统框架[J].计算机工程与应用,2005,41(2):157-160. 被引量：1
7丁海波,薛质,李生红.基于HSI空间的肤色检测方法[J].计算机应用,2004,24(B12):210-211. 被引量：20
8尤媛媛,吴小俊.一种个体特征脸子空间与奇异值相结合的人脸验证算法[J].华东船舶工业学院学报,2005,19(1):44-48. 被引量：3
9范晓,申铉京.基于IE浏览器的色情图片过滤器[J].吉林大学学报（信息科学版）,2004,22(6):631-637. 被引量：8
10董卫军,周明全,耿国华,黎晓.基于内容的图像检索技术研究[J].计算机工程,2005,31(10):162-163. 被引量：23

同被引文献15

1石现峰,张学智,张峰.基于HTK的语音识别系统设计[J].计算机技术与发展,2006,16(10):37-38. 被引量：23
2陈文钢,田岚,姜晓庆.基于语音卡的语音信号处理平台的设计与实现[C] //2006中国控制与决策学术年会论文集.天津,2006:331-334.
3Steve Young,Gunnar Evermann,Mark Gales.The HTK Book(for HTK Version 3.4)[EB/OL].http://htk.eng.cam.ac.uk/docs/docs.shtml,2009-03-13.
4Feng Xiaohui,He Qianhua,Wang Weining.An improved GAC model for lip contour detection[C] // Proc.of the 9th Int.Conf.on sinal processing.Beijing,China,2008:1215-1218.
5Feng Xiaohui,Wang Weining.DTCWT-based dynamic texture features for visual speech recognition[C] //IEEE Asia Pacific Conference on Circuits and Systems.Macao China,2008:497-500.
6奉小慧,王伟凝,吴绪镇,潘爵雨.基于多色彩空间的自适应嘴唇区域定位算法[J].计算机应用,2009,29(7):1924-1926. 被引量：8
7赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：7
8汪斯斯,雷江华.唇读大脑机制的功能性核磁共振研究[J].中国特殊教育,2010(7):39-43. 被引量：3
9邓蓓,宋艳辉,冯莲,谢雨君.国内引文分析领域研究状况的可视化分析——基于论文数量、作者、主题词的知识图谱分析[J].情报杂志,2011,30(6):91-97. 被引量：11
10徐彦君,杜利民,李国强,张欣,周治.汉语听觉视觉双模态数据库CAVSR1.0[J].声学学报,2000,25(1):42-49. 被引量：17

引证文献2

1严乐贫,奉小慧.双模态车载语音控制仿真系统的设计与实现[J].计算机与现代化,2010(8):211-215.
2宫慧娜,雷江华,陈亮.1946-2017年国际唇读研究进展——基于科学知识图谱的可视化研究[J].岭南师范学院学报,2018,39(2):43-54. 被引量：1

二级引证文献1

1雷江华,杨雪,梁璐,徐九平,宋红帅.聋校听障教师与健听教师汉语唇读理解能力比较[J].岭南师范学院学报,2019,40(3):20-27. 被引量：4

1鹿佳,姚鸿勋.改进AdaBoost对基于HMM的唇读系统识别率的提高[J].哈尔滨商业大学学报（自然科学版）,2005,21(5):604-607.
2陈蓉,姚鸿勋,洪晓鹏,万玉奇.视觉单通道唇读系统的有效性[J].计算机工程与应用,2007,43(20):28-30. 被引量：2
3武利娟,王士林,傅剑文.基于图像序列的模糊聚类嘴唇分割算法[J].信息技术,2016,40(12):107-111.
4梁亚玲,杜明辉.基于DT-CWT和PCA的唇部特征提取方法[J].电视技术,2011,35(3):93-96. 被引量：1
5王罡.一种有效的唇部特征定位算法[J].科技资讯,2015,13(23):3-4. 被引量：5
6王良民,张建明,牛德姣,詹永照.实时视频图像快速唇部检测方法的研究与实现[J].计算机应用,2004,24(1):70-72. 被引量：2
7荣传振,岳振军,王渊,杨宇.模糊语言模型在唇读系统中的应用[J].信号处理,2015,31(10):1301-1306. 被引量：1
8荣传振,岳振军,贾永兴,杨宇,王渊.基于改进的空间模式聚类算法的唇部分割[J].军事通信技术,2013,34(4):16-19.
9吕国云,赵荣椿,蒋冬梅,蒋晓悦,侯云舒,Sahli H.基于BTSM和DBN模型的唇读和视素切分研究[J].计算机工程与应用,2007,43(14):21-24.
10梁亚玲,杜明辉.基于DCT和ONPP的唇部特征提取[J].计算机科学,2011,38(5):261-264. 被引量：1

数据采集与处理

2007年第3期

浏览历史

内容加载中请稍等...

计算机唇读研究进展被引量：2

参考文献50

二级参考文献41

共引文献109

同被引文献15

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

计算机唇读研究进展 被引量：2

参考文献50

二级参考文献41

共引文献109

同被引文献15

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

计算机唇读研究进展被引量：2