期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于时空频多维特征的短时窗口脑电听觉注意解码网络 被引量:1
1
作者 王春丽 李金絮 +2 位作者 高玉鑫 王晨名 张珈豪 《电子与信息学报》 北大核心 2025年第3期814-824,共11页
在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信... 在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信号的时域或频域单个特征或二者的组合(如时频特征),而忽略了时-空-频域特征之间的互补性,这在一定程度上限制了模型的分类能力,进而影响了模型在决策窗口上的解码精度。同时,已有AAD模型大多在长时决策窗口(1~5 s)中有较高的解码精度。该文提出一种基于时-空-频多维特征的短时窗口脑电信号听觉注意解码网络(TSF-AADNet),用于提高短时决策窗口(0.1~1 s)的解码精度。该模型由两个并行的时空、频空特征提取分支以及特征融合和分类模块组成,其中,时空特征提取分支由时空卷积块和高阶特征交互模块组成,频空特征提取分支采用基于频空注意力的3维卷积模块(FSA-3DCNN),最后将双分支网络提取的时空和频空特征进行融合,得到最终的听觉注意力二分类解码结果。实验结果表明,TSF-AADNet模型在听觉注意检测数据集KULeuven(KUL)和听觉注意检测的脑电和音频数据集(DTU)的0.1 s决策窗口下,解码精度分别为91.8%和81.1%,与最新的AAD模型一种基于时频融合的双分支并行网络(DBPNet)相比,分别提高了5.40%和7.99%。TSF-AADNet作为一种新的短时决策窗口的AAD模型,可为听力障碍诊断以及神经导向助听器研发提供有效参考。 展开更多
关键词 脑电信号 听觉注意力解码 短时决策窗口 时空频特征 神经导向助听器
在线阅读 下载PDF
融合双视角特征的两阶段脑控语音增强 被引量:1
2
作者 邱泽林 姚鼎鼎 李军锋 《声学学报》 北大核心 2025年第2期362-372,共11页
提出一种融合双视角特征的两阶段脑控语音增强方法。首先使用语音分离算法对混合语音进行分离,然后利用一种融合双视角特征的端到端语音增强模块进行听觉注意解码,并根据解码结果对所分离的语音进行选择性输出。该增强模块一方面提取脑... 提出一种融合双视角特征的两阶段脑控语音增强方法。首先使用语音分离算法对混合语音进行分离,然后利用一种融合双视角特征的端到端语音增强模块进行听觉注意解码,并根据解码结果对所分离的语音进行选择性输出。该增强模块一方面提取脑电信号中与语音能量变化等相关的动态特征,另一方面提取与说话人发声特性相关的静态特征,使混合语音能够更好地与脑电信号中的注意力信息相融合。由于增强模块仅被用于解码,与已有方法相比,所提方法在有效获取注意力信息的同时,降低了脑电信号对语音输出质量的负面影响。实验结果表明,在“2024稀疏脑辅助式语音增强挑战赛”数据集上,所提方法能够使目标语音的信号失真比提升18.08 dB,比已有方法高6.44 dB,且在使用较少脑电通道或较低信噪比的脑电信号时,仍能保持较高的语音输出质量。 展开更多
关键词 语音增强 听觉注意解码 脑电信号 神经网络
原文传递
基于频段特异性时空频融合的听觉注意力解码分析
3
作者 王春丽 高玉鑫 李金絮 《浙江大学学报(工学版)》 2026年第4期887-895,共9页
针对听觉注意力检测方法忽视脑电信号频段特异性贡献的问题,提出时空频特征融合框架(SSF-ConvLSTM).该框架系统评估δ(1~4Hz)、θ(4~8Hz)、α(8~13Hz)、β(13~30Hz)和γ(30~50 Hz)频段的差异化贡献,从而实现关键频段的定量筛选与动态耦... 针对听觉注意力检测方法忽视脑电信号频段特异性贡献的问题,提出时空频特征融合框架(SSF-ConvLSTM).该框架系统评估δ(1~4Hz)、θ(4~8Hz)、α(8~13Hz)、β(13~30Hz)和γ(30~50 Hz)频段的差异化贡献,从而实现关键频段的定量筛选与动态耦合建模.通过脑地形图揭示不同频段神经活动的空间权重分布,筛选与目标语音编码密切相关的频段.构建SSF-ConvLSTM模型,通过卷积层提取频带空间特征,并融合长短时记忆网络(LSTM)对注意力时变动态的建模能力,从而实现跨频段时空动态特征的联合解码.在公开KUL和DTU数据集上进行算法验证,结果表明:随着频率不断增高,与听觉注意解码相关的额叶和颞叶权重在α频带达到峰值,随后至γ频带逐渐降低;在KUL数据集上,低频带α在5 s决策窗口具有最优解码精确度93.38%,较基线模型提高了9.78个百分点;在DTU数据集上,α频带解码精度较基线模型显著提高5.5个百分点.本研究证实了频段特异性特征对AAD解码的关键作用,为开发基于特征优化的新型频段-时空耦合脑机接口提供了理论依据. 展开更多
关键词 脑电图(EEG) 听觉注意力检测(aad) 频带分析 解码精度 鸡尾酒会效应
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部