期刊文献+

基于改进池化层的弱标记声音事件检测 被引量:5

Weakly Labeled Sound Event Detection Based on Improved Pooling Layer
在线阅读 下载PDF
导出
摘要 针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了attention和linear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种"指数可学习的幂函数softmax"池化层。实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用"指数可学习的幂函数softmax"池化层的检测系统,将段级别的声音事件预测的F1值从0.556提高到0.652,帧级别预测的F1值从0.518提高到0.583,帧级别预测的error rate(ER)从0.730降低到0.667。 For the large scale weakly labeled data set provided by the Detection and Classification of Acoustic Scenes and Events(DCASE)2017 Challenge Task 4,we built a multi-class sound event detection system based on the Mel filter bank features(Fbank),convolutional neural networks(CNN),and recurrent neural networks(RNN).In this paper,we analyzed the partial deduction process of two existing common pooling layers,attention and linear softmax,in neural network back propagation.On the basis of linear softmax pooling layer,"exponential learnable power function softmax"pooling layer was proposed.Our experimental results show that,compared to the first-placed model in the DCASE competition,the sound event detection system applying the proposed"exponential learnable power function softmax"pooling function increases the clip level F1 value of sound event prediction from 0.556 to 0.652,the frame level F1 value from 0.555 to 0.583 and reduces the frame level error rate(ER)from 0.660 to 0.667.
作者 刘淼 王晶 董桂官 易伟明 LIU Miao;WANG Jing;DONG Guiguan;YI Weiming(School of Information and Electronics,Beijing Institute of Technology,Beijing 100081,China;China Electronics Standardization Institute,Beijing 100176,China;School of Foreign Languages,Beijing Institute of Technology,Beijing 100081,China)
出处 《信号处理》 CSCD 北大核心 2021年第10期1907-1913,共7页 Journal of Signal Processing
基金 国家自然科学基金(62071039,61620106002)。
关键词 弱标记 声音事件检测 池化层 指数可学习的幂函数softmax weak labeled sound event detection pooling function exponential learnable power function softmax
  • 相关文献

参考文献2

二级参考文献2

共引文献11

同被引文献59

引证文献5

二级引证文献45

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部