基于K-L距离的两步固定音频检索方法被引量：8

Two-stage Specific Audio Retrieval Method Based on K-L Distance

下载PDF

导出

摘要根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。 Due to the huge amount of audio data,and some relation among them,this paper proposes a two-stage specific audio retrieval method based on K-L Distance.The method uses histogram retrieval method based on variable threshold to choose audio file of high similarity,compares precisely with residual audio using K-L distance of feature matrix,and obtains good effect.Experimental results show that the retrieval accuracy is over 90%.

作者齐晓倩陈鸿昶黄海

机构地区解放军信息工程大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2011年第19期160-162,共3页 Computer Engineering

基金国家"863"计划基金资助项目(2008AA011002)

关键词固定音频检索过零率直方图美尔频率倒谱系数 K-L距离 specific audio retrieval Zero Crossing Rate（ZCR） histogram Mel Frequency Cepstral Coefficient（MFCC） K-L distance

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1Hanesn J H L, Huang Rongqing. Speech Find: Advances in Spoken Document Retrieval for a National Gallery of the Spoken Word[J]. IEEE Transactions on Speech and Audio Processing, 2005, 13(5): 712-730.
2Chechil G, Le E, Rehn M, et al. Large Scale Content Based Audio Retrieval from Text Queries[C]//Proceedings of the 1st ACM International Conference on Multimedia Information Retrieval. New York, USA: ACM Press, 2008: 105-112.
3张卫强,刘加.网络音频数据检索技术[J].通信学报,2007,28(12):152-155. 被引量：10
4张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：7
5Smith G, Murase H, Kashino K. Quick Audio Retrieval Using Active Search[C]//Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. New York, USA: IEEE Press, 1998: 3777-3780.
6Kashino K, Kurozumi T, Murase H. A Quick Search Method for Audio and Video Signals Based on Histogram Pruning[J]. IEEE Transactions on Multimedia, 2003, 5(3): 384-357.
7Kedem B. Spectral Analysis and Discrimination by Zero- crossings[J]. Proceedings of the IEEE, 1986, 74(11): 1477-1493.
8Saunders J. Real-time Discrimination of Broadcast Speech Music[C]//Proceedings of IEEE ICASSP’96. [S. 1.]: IEEE Press, 1996: 993-996.
9Li S Z. Content-based Classification and Retrieval of Audio Using the Nearest Feature Line Method[J]. IEEE Trans. on Speech Audio Processing, 2000, 8(5): 619-625.
10江星华,李应.基于LPCMCC的音频数据检索方法[J].计算机工程,2009,35(11):246-247. 被引量：5

二级参考文献26

1张成,蒋皓石,林嘉宇.基于16位单片机的语音电子门锁系统[J].电子技术应用,2005,31(7):18-21. 被引量：9
2王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
3Wang Y, Liu Z, Huang JC. Multimedia content analysis-using both audio and visual clues. IEEE Signal Processing Magazine, 2000, 17(6): 12-36
4Foote J. An overview of audio information retrieval. Multimedia Systems, 1999, 7(1):2-10
5Hansen JHL, Huang R, Zhou B, et al. Speechfind.. Advances in spoken document retrieval for a national gallery of the spoken word. IEEE Transactions on Speech and Audio Processing, 2005, 13(5): 712-730
6Kashino K, KurozumiT, Murase H. A quick search method for audio and video signals based on histogram pruning. IEEE Transactions on Multimedia, 2003, 5(3) : 348-357
7Kim KM, Kim SY, Jeon JK, et al. Quick audio retrieval using multiple feature vectors. IEEE Transactions on Consumer Electronics, 2006, 52(1): 200-205
8Zhang WQ, Liu J. Two-stage method for specific audio retrieval. IEEE International Conference on Acoustics, Speech, and Signa Processing(ICASSP), Hawaii, 2007. New Jersey: IEEE Press 2007, Ⅳ 85-88
9Wang SJ, Liu YY. An algorithm for removing facial makeup disturbances based on high dimensional imaginal geometry. Chinese Journal of Electronics, 2006, 15(4A): 789-792
10Haykin S著,宋铁成,等译.通信系统.北京:电子工业出版社,2003,56-58

共引文献15

1杨继臣,王伟凝.一种基于随机段的固定音频检索方法[J].计算机应用,2010,30(1):230-232. 被引量：4
2魏丹芳,李应.基于MFCC和加权动态特征组合的环境音分类[J].计算机与数字工程,2010,38(2):7-10. 被引量：4
3谈会星,陈福才,李邵梅.基于模板子空间的快速固定音频检索方法[J].计算机工程,2012,38(20):260-263. 被引量：3
4于志华,张兴明,杨镇西,张丽.一种高性能固定语音识别并行处理架构[J].计算机应用研究,2013,30(8):2419-2421. 被引量：1
5章宗标.一种基于PCA-BP 神经网络的示例优选方法[J].计算机工程与应用,2013,49(19):108-111. 被引量：5
6曹文明,王耀南.基于音频识别的无人值守变电站设备在线监测[J].湖南大学学报（自然科学版）,2013,40(9):48-55. 被引量：12
7金国平,余宗桥,郭延文,蒋和.基于GPU加速的音频检索技术[J].计算机工程,2014,40(5):266-269.
8曹雪昭,杜秀华,曹俊.基于压缩感知的固定音频检索方法[J].实验室研究与探索,2015,34(6):50-54. 被引量：2
9陈阳,覃鸿,李卫军,周新奇,董肖莉,张丽萍,李浩光.仿生模式识别技术研究与应用进展[J].智能系统学报,2016,11(1):1-14. 被引量：4
10孙卫国,夏秀渝,乔立能,叶于林.面向音频检索的音频分割和标注研究[J].微型机与应用,2017,36(5):38-41. 被引量：5

同被引文献69

1熊福生.对数伽玛与负对数伽玛分布的再生性[J].经济数学,2003,20(4):63-69. 被引量：10
2郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
3李超,熊璋,朱成军.基于距离相关图的音频相似性度量方法[J].北京航空航天大学学报,2006,32(2):224-227. 被引量：7
4蔡择林,李开灿.常见分布的最大Kullback-Leibler距离[J].武汉大学学报（理学版）,2007,53(5):513-517. 被引量：12
5周颀.基于音频匹配的广告智能建波系统[D].南京:南京理工大学,2013.
6Pruzansky S.Pattern-matching procedure for automatictalker recognition[J].The Journal of the Acoustical Societyof America,1963,50:637-655.
7Atal B S.Automatic speaker recognition based on pitchcontour[D].Brooklyn:Polytechnic Inst,1968.
8Doddington G R.A new method of speaker verification[J].The Journal of the Acoustical Society of America,1971,139(A).
9Itakura F.Line spectrum representation of linear predictivecoefficients[J].The Journal of the Acoustical Societyof Japan,1975,75(S).
10Colombi J M,Ruck D W,Anderson T R,et al.Cohortselection and word grammar effects for speaker recognition[C]//IEEE International Conference on Acoustics,Speech,and Signal Processing,1996:85-88.

引证文献8

1金国平,余宗桥,郭延文,蒋和.基于GPU加速的音频检索技术[J].计算机工程,2014,40(5):266-269.
2华斌,张丽超,赵富强.基于加权MFCC的音频检索[J].计算机工程与应用,2015,51(8):200-204. 被引量：8
3高晓芳,罗森林,吕英,罗志军,潘丽敏.双哈希索引的高精度大规模音频样例检索[J].声学学报,2015,40(6):886-893. 被引量：1
4乔立能,夏秀渝,叶于林.基于音频指纹的两步固定音频检索[J].计算机系统应用,2017,26(5):266-271. 被引量：1
5张学帅,邹学强,胡琪,张鹏远.基于指纹权重的音频模板检索方法[J].中国科技论文,2018,13(20):2295-2300. 被引量：3
6赵文兵,贾懋珅,王琪.基于压缩感知和音频指纹的固定音频检索方法[J].计算机系统应用,2020,29(8):165-172. 被引量：2
7陈树丽,张学帅,张鹏远,刘建.静音掩蔽和频域分段的音频指纹检索算法[J].声学学报,2022,47(4):531-540. 被引量：4
8朱成莲.两对数伽玛分布之间的相对熵及渐近性[J].淮阴师范学院学报（自然科学版）,2024,23(4):283-287.

二级引证文献19

1卢良进.基于词袋模型的微课视频跨媒体检索研究[J].软件导刊,2016,15(2):123-125.
2宣传忠,马彦华,武佩,张丽娜,郝敏,张曦宇.基于声信号特征加权的设施养殖羊行为分类识别[J].农业工程学报,2016,32(19):195-202. 被引量：19
3宋江珉,成雨含,李子炎,洪亮,孙科学.一种心音身份识别中序列码的安全性分析[J].计算机技术与发展,2017,27(11):128-131. 被引量：1
4胡耀文,龙华,孙俊,周涛,邵玉斌.基于音频特征的乐器分类研究[J].软件导刊,2018,17(6):17-21. 被引量：3
5赵宏旭,张一闻,杨文帅.基于支持向量机的混合车辆音频信号的车型识别研究[J].激光杂志,2018,39(9):133-137. 被引量：8
6聂昂,刘树林,杨洪柏,肖青峰.基于MFCC和CNN的音频相似度判别研究[J].机械制造,2019,57(4):7-10. 被引量：4
7常峥,罗萍,杨波,张晓晓.基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别[J].计算机应用,2021,41(2):598-603. 被引量：5
8王大飞,尚茜.计算机网络技术的应用与发展[J].新一代信息技术,2020,3(14):36-39.
9徐清钏,赵彦钧,张丹露,弓创,杨光.基于Matlab的听音识曲系统的设计与实现[J].科技视界,2021(18):96-98. 被引量：1
10何蕊伽,夏秀渝.基于LSTM的关键词识别系统设计[J].计算机与网络,2022,48(2):64-69. 被引量：5

1魏永超.基于K-L距离的改进D-S证据合成方法[J].电讯技术,2011,51(1):27-30. 被引量：17
2谈会星,陈福才,李邵梅.基于模板子空间的快速固定音频检索方法[J].计算机工程,2012,38(20):260-263. 被引量：3
3张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：7
4曹雪昭,杜秀华,曹俊.基于压缩感知的固定音频检索方法[J].实验室研究与探索,2015,34(6):50-54. 被引量：2
5崔潇潇,王贵锦,林行刚.基于Adaboost权值更新以及K-L距离的特征选择算法[J].自动化学报,2009,35(5):462-468. 被引量：6
6樊爱法.Visual FoxPro环境字符排序探讨[J].河南科学,2011,29(7):859-862.
7唐和生,张伟,陈镕,薛松涛,杨晓楠.基于自适应粒子滤波的结构损伤识别[J].振动．测试与诊断,2008,28(3):211-215. 被引量：4
8杨家红,许灿辉,王耀南.基于Contourlet广义高斯模型的纹理图像检索[J].中国图象图形学报,2007,12(4):691-694. 被引量：11
9杨小东,张磊,王彩芬.可证明安全的可变门限代理重签名方案[J].计算机工程与科学,2014,36(7):1250-1254. 被引量：2
10吴有富,许连清.一种基于Kullback-Leiblar距离的自动多门限图象分割方法及应用[J].贵州大学学报（自然科学版）,1998,15(4):270-275. 被引量：2

计算机工程

2011年第19期

浏览历史

内容加载中请稍等...

基于K-L距离的两步固定音频检索方法被引量：8

参考文献10

二级参考文献26

共引文献15

同被引文献69

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于K-L距离的两步固定音频检索方法 被引量：8

参考文献10

二级参考文献26

共引文献15

同被引文献69

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于K-L距离的两步固定音频检索方法被引量：8