期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于时空频多维特征的短时窗口脑电听觉注意解码网络
1
作者 王春丽 李金絮 +2 位作者 高玉鑫 王晨名 张珈豪 《电子与信息学报》 北大核心 2025年第3期814-824,共11页
在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信... 在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信号的时域或频域单个特征或二者的组合(如时频特征),而忽略了时-空-频域特征之间的互补性,这在一定程度上限制了模型的分类能力,进而影响了模型在决策窗口上的解码精度。同时,已有AAD模型大多在长时决策窗口(1~5 s)中有较高的解码精度。该文提出一种基于时-空-频多维特征的短时窗口脑电信号听觉注意解码网络(TSF-AADNet),用于提高短时决策窗口(0.1~1 s)的解码精度。该模型由两个并行的时空、频空特征提取分支以及特征融合和分类模块组成,其中,时空特征提取分支由时空卷积块和高阶特征交互模块组成,频空特征提取分支采用基于频空注意力的3维卷积模块(FSA-3DCNN),最后将双分支网络提取的时空和频空特征进行融合,得到最终的听觉注意力二分类解码结果。实验结果表明,TSF-AADNet模型在听觉注意检测数据集KULeuven(KUL)和听觉注意检测的脑电和音频数据集(DTU)的0.1 s决策窗口下,解码精度分别为91.8%和81.1%,与最新的AAD模型一种基于时频融合的双分支并行网络(DBPNet)相比,分别提高了5.40%和7.99%。TSF-AADNet作为一种新的短时决策窗口的AAD模型,可为听力障碍诊断以及神经导向助听器研发提供有效参考。 展开更多
关键词 脑电信号 听觉注意力解码 短时决策窗口 时空频特征 神经导向助听器
在线阅读 下载PDF
融合双视角特征的两阶段脑控语音增强
2
作者 邱泽林 姚鼎鼎 李军锋 《声学学报》 北大核心 2025年第2期362-372,共11页
提出一种融合双视角特征的两阶段脑控语音增强方法。首先使用语音分离算法对混合语音进行分离,然后利用一种融合双视角特征的端到端语音增强模块进行听觉注意解码,并根据解码结果对所分离的语音进行选择性输出。该增强模块一方面提取脑... 提出一种融合双视角特征的两阶段脑控语音增强方法。首先使用语音分离算法对混合语音进行分离,然后利用一种融合双视角特征的端到端语音增强模块进行听觉注意解码,并根据解码结果对所分离的语音进行选择性输出。该增强模块一方面提取脑电信号中与语音能量变化等相关的动态特征,另一方面提取与说话人发声特性相关的静态特征,使混合语音能够更好地与脑电信号中的注意力信息相融合。由于增强模块仅被用于解码,与已有方法相比,所提方法在有效获取注意力信息的同时,降低了脑电信号对语音输出质量的负面影响。实验结果表明,在“2024稀疏脑辅助式语音增强挑战赛”数据集上,所提方法能够使目标语音的信号失真比提升18.08 dB,比已有方法高6.44 dB,且在使用较少脑电通道或较低信噪比的脑电信号时,仍能保持较高的语音输出质量。 展开更多
关键词 语音增强 听觉注意解码 脑电信号 神经网络
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部