语谱图二次傅里叶变换特定人二字汉语词汇识别被引量：2

Recognition of specific two-word Chinese vocabulary by applying Fourier transform twice to the spectrogram

下载PDF

导出

摘要以语音信号的语谱图作为处理对象,提出了基于语谱图二次傅里叶变换对特定人二字词汇识别的方法.首先对语谱图二次傅里叶变换频域图的图像意义以及相应的语音特性表征进行了详细剖析;然后对语谱图频域图像进行二进宽度行投影,将投影值作为语音识别特征值,以支持向量机为分类器,进行特定人二字词汇语音整体识别.采用1 000个语音样本进行了仿真实验.结果表明,该方法正确识别率可达到92.4%,为汉语词汇整体识别提供了新的思路. This paper illustrates a method to recognize specific two-word Chinese vocabulary by analyzing speech signals using a spectrogram after Fourier transform is applied to it twice. First, we analyze the spectrogram in the frequency domain and its corresponding voice characteristics in detail after applying Fourier transform twice. Then, binary width zoning projection is carried out in the frequency domain. The projection value is treated as the characteristic value of semantic recognition feature and the support vector machine （SVM）is considered as the classifier for recognizing the semantics of specific two-word Chinese vocabulary. A total of 1000 voice samples were used in the simulation. The results using this method show a remarkable recognition rate of 92.4 %. The proposed method provides a new way for vocabulary recognition.

作者潘迪梁士利魏莹李广岩许廷发王双维

机构地区东北师范大学物理学院北京理工大学光电成像与信息工程研究所

出处《东北师大学报（自然科学版）》 CAS CSCD 北大核心 2017年第2期95-100,共6页 Journal of Northeast Normal University(Natural Science Edition)

基金国家自然科学基金资助项目(61471111)

关键词语谱图二次傅里叶变换支持向量机二进宽度行投影 spectrogram fourier transform twice support vector machine （SVM） binary widthzoning projection

分类号 TN7 [电子电信—电路与系统]

引文网络
相关文献

参考文献5

1潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
2马义德,袁敏,齐春亮,刘悦,刘映杰.基于PCNN的语谱图特征提取在说话人识别中的应用[J].计算机工程与应用,2005,41(20):81-84. 被引量：24
3陈向民,张军,韦岗.基于语谱图的语音端点检测算法[J].电声技术,2006,30(4):46-49. 被引量：4
4姜洪臣,任晓磊,赵耀宏,徐波.基于音频语谱图像识别的广告检索[J].清华大学学报（自然科学版）,2011,51(9):1249-1252. 被引量：9
5吴迪,赵鹤鸣,陶智,张晓俊,肖仲喆,许宜申.低信噪比下采用感知语谱结构边界参数的语音端点检测算法[J].声学学报,2014,39(3):392-399. 被引量：9

二级参考文献37

1陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
2Foote J. An Overview of Audio Information Retrieval [D]. Singapore: National University of Singapore, 1997.
3LIANG Wei, ZHANG Shuwu, XU Bo. A histogram algorithm for fast audio retrieval [C]// Proceedings of the 6t International Conference on Music Information Retrieval. London, UK, 2005:586-589.
4LU Lie, ZHANG Hongjiang, JIANG Hao. Content analysis for audio classification and segmentation[J]. IEEE Transaction on Speech and Auido Processing, 2002, 10(7) : 504 - 516.
5Kashino K, Kurozumi T, Murase H. A quick search method for audio and video signals based on histogram pruning [J]. IEEE Transaction on Multimedia, 2003, 5(3) : 348 - 357.
6Viola P, Jones M. Rapid object detection using a boosted cascade of simple features [C]// Proceedings of Computer Vision and Pattern Recognition. Hawaii, USA, 2001:511 -518.
7Haitsma J, Kalker T. A highly robust audio fingerprinting system [C]// Proceedings of International Symposium on Music Information Retrieval. Paris, France, 2002 : 107-115.
8Freund Y, Schapire R. Experiments with a new boosting algorithm [C]// Proceedings of International Conference on Machine Learning. Bari, Italy, 1996:148-156.
9Gionis A, Indyk P, Motwani R. Similarity search in high dimensions via hashing [C]// Proceedings of International Conference on Very Large Databases. Edinburgh, Scotland, 1999:518-529.
10Fischler M, Bolles R. Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography[J]. Communications of the ACM, 1981, 24(6) : 381 - 395.

共引文献41

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2王科俊,张燕,唐墨,徐晶.PCNN在图像处理中的应用[J].哈尔滨工程大学学报,2006,27(B07):182-188. 被引量：2
3马义德,刘映杰,夏春水,钱志柏.基于改进模型的PCNN动态行为的实验研究[J].中国生物医学工程学报,2006,25(5):632-636. 被引量：4
4张晓俊,陶智,施晓敏,顾济华.改进脉冲耦合神经网络的语音识别研究[J].计算机工程与应用,2007,43(8):51-53. 被引量：4
5张晓俊,陶智,顾济华,赵鹤鸣,施晓敏.基于PCNN和DTW的语音识别系统设计[J].通信技术,2007,40(4):60-62. 被引量：3
6应武.基于元音MFCC的说话人识别系统研究[J].电子测量与仪器学报,2007,21(3):48-51. 被引量：5
7梁泽,马义德,张恩溯,朱望飞,汤书森.一种基于脉冲耦合神经网络的语音情感识别新方法[J].计算机应用,2008,28(3):710-713. 被引量：3
8刘琨,金文标.基于脉冲耦合神经网络的孤立词语音识别研究[J].重庆邮电大学学报（自然科学版）,2008,20(2):217-220. 被引量：1
9刘琨,金文标.基于PCNN和RBF的孤立词语音识别研究[J].计算机工程与设计,2008,29(24):6298-6301. 被引量：2
10李建文,王彪,王钟斐.基于时频分布的皮肤听声器简单语音辨析研究[J].计算机测量与控制,2011,19(1):127-130. 被引量：2

同被引文献14

1汪勇,熊前兴.MP3文件格式解析[J].计算机应用与软件,2004,21(12):126-128. 被引量：13
2马义德,袁敏,齐春亮,刘悦,刘映杰.基于PCNN的语谱图特征提取在说话人识别中的应用[J].计算机工程与应用,2005,41(20):81-84. 被引量：24
3陈向民,张军,韦岗.基于语谱图的语音端点检测算法[J].电声技术,2006,30(4):46-49. 被引量：4
4任艳斐.直方图均衡化在图像处理中的应用[J].科技信息,2007(4):37-38. 被引量：39
5芮璋现,肖海波.支持向量机(SVM)及其应用[J].福建电脑,2007,23(4):110-110. 被引量：7
6段群,刘小豫,吴粉侠.一种基于高频强调滤波和直方图均衡化的图像增强方法[J].计算技术与自动化,2009,28(2):95-97. 被引量：13
7曾斌,姚路,陈志诚.基于声纹识别的Web身份认证系统设计[J].计算机工程,2011,37(15):149-151. 被引量：5
8姜洪臣,任晓磊,赵耀宏,徐波.基于音频语谱图像识别的广告检索[J].清华大学学报（自然科学版）,2011,51(9):1249-1252. 被引量：9
9黄成龙.普米语研究综述[J].阿坝师范高等专科学校学报,2013,30(1):17-20. 被引量：1
10吴迪,赵鹤鸣,陶智,张晓俊,肖仲喆,许宜申.低信噪比下采用感知语谱结构边界参数的语音端点检测算法[J].声学学报,2014,39(3):392-399. 被引量：9

引证文献2

1杨花,江涛,董华珍,陈绍雄,傅美君,潘文林.基于PSO-SVM的普米语语谱图识别[J].云南民族大学学报（自然科学版）,2018,27(5):439-443. 被引量：5
2林晓勤,毛敏,宫玲玲,吉理.基于语音比对的远程面试身份认证[J].华东师范大学学报（自然科学版）,2020(6):164-171. 被引量：1

二级引证文献6

1和丽华,江涛,潘文林,杨建香,解雪琴,王璐,余彩裙.佤语语音语料端点检测算法[J].云南民族大学学报（自然科学版）,2019,28(2):186-190. 被引量：2
2黄成龙.2018年羌语支语言研究前沿[J].阿坝师范学院学报,2019,36(1):5-10. 被引量：1
3杨建香,佘玉梅,傅美君,和丽华,解雪琴,潘文林.基于自适应变分模态分解的佤语孤立词共振峰估计[J].云南民族大学学报（自然科学版）,2019,28(3):297-305. 被引量：1
4解雪琴,张天军,潘文林,王璐,和丽华,杨建香.基于小波分析与Boll改进谱减法的普米语语音增强算法[J].云南民族大学学报（自然科学版）,2019,28(3):306-312. 被引量：1
5侯俊龙,潘文林,王璐,何翠玲,王翠.基于剪枝AlexNet的普米语孤立词识别[J].云南民族大学学报（自然科学版）,2020,29(4):382-389. 被引量：2
6张瑶,李军,曹冬梅,崔彤彤.公立医院线上招聘面试模式构建及应用探索[J].中国医药导报,2022,19(26):194-196. 被引量：3

1梁士利,魏莹,潘迪,张玲,许廷发,王双维.基于语谱图行投影的特定人二字汉语词汇识别[J].吉林大学学报（工学版）,2017,47(1):294-300. 被引量：6
2宋晶晶.基于FPGA的信号源设计与实现[J].无线电工程,2003,33(4):27-29. 被引量：6
3魏莹,王双维,潘迪,张玲,许廷发,梁士利.宽窄带语谱图融合分带投影的特定人汉语词汇识别[J].计算机科学,2016,43(S2):215-219. 被引量：1
4米德忠,张哲.基于FPGA实现的伪随机序列快速同步[J].电子元器件应用,2007,9(12):17-19. 被引量：1
5杜海明,付川南.基于时间调制阵列的单通道测向估计方法[J].探测与控制学报,2017,39(1):111-115. 被引量：1
6刘镜,刘加.置信度的原理及其在语音识别中的应用[J].计算机研究与发展,2000,37(7):882-890. 被引量：13
7王栋,贾海蓉.改进相位谱补偿的语音增强算法[J].西安电子科技大学学报,2017,44(3):83-88. 被引量：14
8李丹凤,方倪,张修娟,胡安正.基于MATLAB的回音抵消器的设计[J].物理通报,2017,46(7):128-129.
9马文静,吴东亚.ISLI/OID协同标识体系在出版物流领域中的应用[J].出版参考,2017(4):18-19. 被引量：1
10张震,程伟伟,吴磊,张斌.基于不变矩和SVM的圆形交通标志识别方法研究[J].电子测量与仪器学报,2017,31(5):773-779. 被引量：18

东北师大学报（自然科学版）

2017年第2期

浏览历史

内容加载中请稍等...

语谱图二次傅里叶变换特定人二字汉语词汇识别被引量：2

参考文献5

二级参考文献37

共引文献41

同被引文献14

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

语谱图二次傅里叶变换特定人二字汉语词汇识别 被引量：2

参考文献5

二级参考文献37

共引文献41

同被引文献14

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

语谱图二次傅里叶变换特定人二字汉语词汇识别被引量：2