期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
Inner speech, secondary planner in Tower of London task in natural old age
1
作者 Maryam Atabati Nader Jahangiri Naghmeh Mokhber 《World Journal of Neuroscience》 2012年第1期47-56,共10页
In this study the mechanical version of the three-disk Tower of London task with changes in the movements was conducted by fifteen elderly participants with concurrent articulatory suppression. Also, this executive ta... In this study the mechanical version of the three-disk Tower of London task with changes in the movements was conducted by fifteen elderly participants with concurrent articulatory suppression. Also, this executive task was conducted without verbal secondary task and the results of these two states were com- pared with each other. From this comparison, got evidences based on inner speech role in more complicated Tower of London tasks, although in general, the results suggest a more outstanding role of inner scribe in spatial planning in this executive task. Then inner speech and inner scribe roles have been described in Tower of London task applying “Baddeley and Logie” working memory model. 展开更多
关键词 Inner speech TOWER of LONDON task PHONOLOGICAL Loop VISUOSPATIAL Sketchpad Articulatory Suppression
暂未订购
结合性别信息的多任务语音情感识别
2
作者 姚佳 李冬冬 王喆 《计算机科学》 北大核心 2026年第1期180-186,共7页
现有的语音情感识别方法通常依赖深度学习模型提取声学特征,但大多仅关注通用特征的建模,未能充分挖掘数据中与情感密切相关的先验知识。为此,提出了一种端到端的多任务学习框架,利用自监督预训练模型WavLM提取包含丰富情感信息的语音特... 现有的语音情感识别方法通常依赖深度学习模型提取声学特征,但大多仅关注通用特征的建模,未能充分挖掘数据中与情感密切相关的先验知识。为此,提出了一种端到端的多任务学习框架,利用自监督预训练模型WavLM提取包含丰富情感信息的语音特征,并将性别识别作为辅助任务,以捕捉性别差异对情感识别的潜在影响。针对传统多任务学习框架中固定权重计算损失导致的学习不均衡问题,进一步提出了一种自适应温度系数的动态权重平均方法(Temperature-aware Dynamic Weight Averaging,TA-DWA)。该方法通过动态调整温度系数平衡不同任务的学习速度,并结合任务损失变化率实现更合理的权重分配。实验结果表明,在IEMOCAP和EMODB数据集上,所提方法显著提高了情感识别准确率,验证了性别识别作为辅助任务的有效性以及动态权重策略在多任务学习中的优势。 展开更多
关键词 语音情感识别 多任务学习 动态权重分配 自监督模型
在线阅读 下载PDF
高考英语书面表达试题的语用要求分析——以2022—2025年天津卷为例
3
作者 姚卫盛 杨立剑 +1 位作者 郭蕊 李留建 《考试研究》 2026年第1期10-19,共10页
为探究考生语用能力的考查要求,以2022年至2025年高考天津卷英语书面表达题为研究对象,依据课程标准对学生语用能力要求,结合语用学理论构建“交际语境—言语行为—语用策略”三维分析框架开展研究。研究发现,书面表达题在交际语境维度... 为探究考生语用能力的考查要求,以2022年至2025年高考天津卷英语书面表达题为研究对象,依据课程标准对学生语用能力要求,结合语用学理论构建“交际语境—言语行为—语用策略”三维分析框架开展研究。研究发现,书面表达题在交际语境维度强调特定身份下的交际,在言语行为维度突出复合言语行为的运用,在语用策略维度引导从“语言正确”到“语用得体”的跃迁。提出强化语用意识、丰富教学内容、加强写作指导的教学建议。 展开更多
关键词 高考英语 书面表达 交际语境 言语行为 语用策略
在线阅读 下载PDF
多任务师生模型的语音情感识别实验设计
4
作者 孙林慧 李平安 +1 位作者 雷云龙 张子晓 《实验科学与技术》 2025年第4期1-11,共11页
针对人机智能交互中语音情感识别的研究热点,将基于多任务约束师生模型的含噪语音情感识别设计为研究型教学实验,观察教师模型的指导作用、学生模型的学习过程和多级增强损失的约束力。设计基于Wav2vec 2.0的师生模型和多级增强损失机制... 针对人机智能交互中语音情感识别的研究热点,将基于多任务约束师生模型的含噪语音情感识别设计为研究型教学实验,观察教师模型的指导作用、学生模型的学习过程和多级增强损失的约束力。设计基于Wav2vec 2.0的师生模型和多级增强损失机制,将语音增强辅助任务引入学生模型,使学生模型能够通过学习获取教师模型的特征表示能力。在测试阶段学生模型直接从含噪语音中提取关键情感特征,用于情感分类,最后通过大量实验分析情感识别系统的性能和鲁棒性。该师生模型实验设计有助于提升学生思考能力、科研创新和探索意识。 展开更多
关键词 语音情感识别 多任务约束 语音增强 Wav2vec 2.0 教师学生模型
在线阅读 下载PDF
言语在筛查老年人认知功能下降中的应用
5
作者 王思文 殷潇潇 +4 位作者 高琳琳 贵文君 胡巧霞 楼琼 王钦文 《生物化学与生物物理进展》 北大核心 2025年第2期456-463,共8页
阿尔茨海默病是一种严重影响老年人健康的慢性神经系统退行性疾病,其前期就可以检测到言语变化。基于计算机分析言语的方法在筛查认知功能下降方面正确率超过80%。这种方法通过分析被试在自发言语、语义流畅性以及阅读等任务中的言语表... 阿尔茨海默病是一种严重影响老年人健康的慢性神经系统退行性疾病,其前期就可以检测到言语变化。基于计算机分析言语的方法在筛查认知功能下降方面正确率超过80%。这种方法通过分析被试在自发言语、语义流畅性以及阅读等任务中的言语表现,以一种非侵入性、易于操作且具有高度特异性的方式,为认知功能下降的早期诊断提供了一种创新的解决方案。本文总结言语数据获取方式和认知功能下降患者的言语特点,在此基础上讨论基于计算机技术进行早期筛查的研究进展。 展开更多
关键词 阿尔茨海默病 认知功能障碍 早期筛查 言语识别
原文传递
多任务学习型民航陆空通话语音识别Conformer模型
6
作者 马广林 任晋 +3 位作者 师一华 张海刚 王莉 杨金锋 《计算机应用与软件》 北大核心 2025年第10期183-190,244,共9页
民航陆空通话在用语发音、遣词造句和通话方式等方面具有显著行业特点,通用语音识别模型无法充分适配上述特点对陆空通话进行声学建模。针对上述问题,提出一种端到端的多任务学习型民航陆空通话语音识别Conformer模型。通过将卷积模块引... 民航陆空通话在用语发音、遣词造句和通话方式等方面具有显著行业特点,通用语音识别模型无法充分适配上述特点对陆空通话进行声学建模。针对上述问题,提出一种端到端的多任务学习型民航陆空通话语音识别Conformer模型。通过将卷积模块引入Transformer模型,Conformer模型在保留上下文长距离依赖关系的全局信息建模能力基础上,进一步增强了局部信息的捕获。同时联合连接时序分类(Connectionist Temporal Classification,CTC)和基于注意力的编码解码模型进行多任务学习以进一步提升其性能。实验结果表明,该方法能有效兼顾全局和局部信息的声学建模,在陆空通话数据集上将字符错误率和句错误率分别降低至1.98%和2.89%。 展开更多
关键词 民航陆空通话 语音识别 多任务学习 CONFORMER 端到端
在线阅读 下载PDF
基于多任务学习和知识蒸馏的多模态蒙古语端到端的语音翻译
7
作者 臧日成 高光来 飞龙 《计算机工程与科学》 北大核心 2025年第12期2261-2268,共8页
端到端语音翻译技术,旨在实现从源语言到目标语言的自动转换,近年来在多个领域取得了显著进展。然而,在蒙古语的语音翻译方面,效果尚有待提升。其挑战主要源于蒙汉语音翻译数据集的稀缺,现有模型在处理蒙古语语音翻译任务时效果较差。... 端到端语音翻译技术,旨在实现从源语言到目标语言的自动转换,近年来在多个领域取得了显著进展。然而,在蒙古语的语音翻译方面,效果尚有待提升。其挑战主要源于蒙汉语音翻译数据集的稀缺,现有模型在处理蒙古语语音翻译任务时效果较差。为了克服这些难题,采取了以下措施:首先,收集并构建了一个大规模的蒙汉对照语音翻译数据集,以支持翻译模型的训练。其次,引入联合学习策略,通过编码器和解码器之间的参数共享,促进语音翻译与机器翻译任务之间的知识迁移。此外,为了缩小语音与文本之间的模态差异,采用了交叉注意力正则化方法,以增强模型对不同模态输入的理解和利用。通过知识蒸馏技术,动态更新机器翻译模型,进一步提升了语音翻译模型的性能。最后,集成语音合成模块,实现了从蒙古语语音到汉语语音的翻译。实验结果表明,所提模型在翻译准确率上取得了显著提升,与直接训练的语音翻译模型相比,其BLEU将近提升了2.00。 展开更多
关键词 蒙古语 语音翻译 知识蒸馏 多任务学习
在线阅读 下载PDF
外语同伴互动言语行为、投入度及其关系研究——任务复杂度与语用能力组合类型影响
8
作者 董行 王立宾 《外语学刊》 北大核心 2025年第5期58-67,共10页
本文以36名中国英语专业学生为研究对象,考察任务复杂度和语用能力组合类型对外语同伴互动言语行为、投入度及二者关系的影响。研究发现,任务复杂度对互动言语行为具有显著影响。具体而言,简单任务中的简短反馈和协作贡献数量更多,且互... 本文以36名中国英语专业学生为研究对象,考察任务复杂度和语用能力组合类型对外语同伴互动言语行为、投入度及二者关系的影响。研究发现,任务复杂度对互动言语行为具有显著影响。具体而言,简单任务中的简短反馈和协作贡献数量更多,且互动言语行为数量整体较多,而复杂任务中的会话核实和维护面子数量更多。其次,语用能力组合类型对互动言语行为和投入度具有显著影响。具体而言,高高组的维护面子、话语补救、合作共建、协作贡献,以及简短反馈数量最多;其互动言语行为数量整体最多,且投入度最高,高低组次之、低低组最低。再次,互动言语行为与投入度之间呈现非线性的正向增长关系,而任务复杂度与语用能力组合类型对两者关系的中介调节作用不显著。 展开更多
关键词 外语同伴 互动言语行为 语用能力组合类型 任务复杂度 中介作用 调节效应
原文传递
铁路调度规范用语安全检测关键技术应用研究
9
作者 赵永亮 肖永慧 +1 位作者 张俊武 李斌 《铁路通信信号工程技术》 2025年第10期68-74,共7页
为解决铁路调度录音安全检查工作对于人工检查的强依赖性问题,提出基于端到端语音识别的铁路调度规范用语安全检测方法。通过研究铁路调度语音业务管理现状,对铁路行业智能语音分析技术应用现状及现存问题进行整理归纳。研究CTC端到端... 为解决铁路调度录音安全检查工作对于人工检查的强依赖性问题,提出基于端到端语音识别的铁路调度规范用语安全检测方法。通过研究铁路调度语音业务管理现状,对铁路行业智能语音分析技术应用现状及现存问题进行整理归纳。研究CTC端到端语音识别框架和双向长短时记忆神经网络,构建一套铁路调度语音识别和安全检测任务框架,设计一套契合行业应用现状的铁路调度语音识别分析流程,通过实验室试验验证了基于端到端语音识别的铁路调度规范用语安全检测系统的有效性、准确性以及识别算法的鲁棒性,为铁路调度指挥安全保障能力提升提供有力的技术支撑。 展开更多
关键词 铁路调度 语音识别 神经网络 安全检测任务 安全检测信息修正
在线阅读 下载PDF
端到端语音翻译中辅助数据的使用策略研究
10
作者 刘晓倩 韩宇晨 +7 位作者 朱靖波 许晨 张裕浩 杜扬帆 赫洱锋 马安香 张春良 肖桐 《中文信息学报》 北大核心 2025年第5期60-71,共12页
端到端语音翻译模型由于数据稀缺问题很难直接进行有效训练。为此,已有方法基于利用辅助数据进行改进的思路,采取了多种不同的策略,但如何将这些策略有机地结合起来仍是一个难题。该文基于编码分解的统一建模架构,实现了对数据增强、预... 端到端语音翻译模型由于数据稀缺问题很难直接进行有效训练。为此,已有方法基于利用辅助数据进行改进的思路,采取了多种不同的策略,但如何将这些策略有机地结合起来仍是一个难题。该文基于编码分解的统一建模架构,实现了对数据增强、预训练和多任务学习三个关键技术的有效联合。在MuST-C英-中语音翻译数据集上的实验结果表明,数据增强在三种方法中具有最大的潜力,能够显著提升语音翻译模型的性能(5.18 BLEU),并通过联合预训练技术实现了在单个模型上最大程度的性能提升(5.48 BLEU),使模型获得更好的泛化性。尽管进一步结合多任务学习无法带来正向效果,但通过对多种模型进行集成仍可获得5.61 BLEU提升。 展开更多
关键词 语音翻译 预训练 数据增强 多任务学习
在线阅读 下载PDF
面向儿童的多通道交互系统 被引量:15
11
作者 李杰 田丰 +1 位作者 王维信 戴国忠 《软件学报》 EI CSCD 北大核心 2002年第9期1846-1851,共6页
设计和实现了一个基于笔和语音的面向儿童的多通道三维交互系统.系统中包含了基于笔和语音的交互信息整合框架,用来整合儿童输入的笔和语音信息.同时,系统中定义了一些基于笔和语音的交互技术,可以支持孩子们以自然的方式,通过笔和语音... 设计和实现了一个基于笔和语音的面向儿童的多通道三维交互系统.系统中包含了基于笔和语音的交互信息整合框架,用来整合儿童输入的笔和语音信息.同时,系统中定义了一些基于笔和语音的交互技术,可以支持孩子们以自然的方式,通过笔和语音同系统进行交互.用笔来勾画三维的场景和小动物等实体,同时用笔和语音同场景和场景中的实体进行一定的交互. 展开更多
关键词 多通道交互系统 儿童 语音检测 手势 交互原语 交互任务 语音识别 信息处理
在线阅读 下载PDF
说话人特征约束的多任务卷积网络语音增强 被引量:3
12
作者 龙华 张林濮 +1 位作者 邵玉斌 杜庆治 《小型微型计算机系统》 CSCD 北大核心 2021年第10期2178-2183,共6页
针对噪声干扰环境下的说话人识别问题,提出了一种基于多任务学习的语音增强方法作为说话人识别系统的前端.在卷积神经网络(CNN)的基础上,通过构建语音增强与说话人识别的融合网络多任务学习模型,同时在输入输出端拼接梅尔频谱倒谱系数(M... 针对噪声干扰环境下的说话人识别问题,提出了一种基于多任务学习的语音增强方法作为说话人识别系统的前端.在卷积神经网络(CNN)的基础上,通过构建语音增强与说话人识别的融合网络多任务学习模型,同时在输入输出端拼接梅尔频谱倒谱系数(MFCC)和基音周期特征作为辅助任务,以及利用同方差不确定性自适应调整损失权重.实验结果表明,相比只输入对数功率谱(LPS)的CNN以及DNN模型,加入辅助任务的CNN模型可以提高语音增强的表现.另外,语音增强与说话人识别任务的联合训练可以增强噪声干扰下的说话人识别效果,提高模型的鲁棒性. 展开更多
关键词 语音增强 多任务学习 说话人识别 卷积神经网络
在线阅读 下载PDF
基于模型过滤的多任务回归在帕金森症预测中的应用 被引量:2
13
作者 刘峰 季薇 李云 《计算机应用》 CSCD 北大核心 2018年第11期3221-3224,3230,共5页
传统基于语音的帕金森症(PD)病情预测方法则是分别预测运动症状评分(motor-UPDRS)和总体症状评分(total-UPDRS)。为解决在单任务预测过程中,传统方法无法利用任务之间的共享信息和预测性能不佳的问题,提出了一种基于模型过滤的多任务回... 传统基于语音的帕金森症(PD)病情预测方法则是分别预测运动症状评分(motor-UPDRS)和总体症状评分(total-UPDRS)。为解决在单任务预测过程中,传统方法无法利用任务之间的共享信息和预测性能不佳的问题,提出了一种基于模型过滤的多任务回归方法来预测帕金森症患者的motor-UPDRS和total-UPDRS。首先,考虑到子任务语音特征对预测motor-UPDRS和total-UPDRS不同的影响,添加L1正则化项进行特征选择;其次,在构建模型的同时,根据不同帕金森患者对象分布在不同的域,添加了过滤机制,来提高预测精度。在远程帕金森数据集仿真实验中,基于模型过滤的多任务回归方法在预测UPDRS时,较单任务条件下最小二乘法(LS)模型预测motor值准确度提高了67.2%,预测total值则提高了83.3%;相比单任务条件下决策回归树(CART)模型预测motor值提高了64%,预测total值则提高了78.4%。实验结果表明,基于模型过滤的多任务回归算法对UPDRS预测要优于单任务回归算法。 展开更多
关键词 帕金森症 语音 多任务回归 模型过滤 特征选择 统一帕金森评定量表
在线阅读 下载PDF
基于多任务稀疏表达的二元麦克风小阵列话音增强算法 被引量:3
14
作者 杨立春 叶敏超 钱沄涛 《通信学报》 EI CSCD 北大核心 2014年第2期87-94,共8页
针对常规二元麦克风小阵列话音增强算法通常需要话音活动检测技术支持,并且难以有效抑制第一帧含目标信号的噪声。提出了一种基于多任务稀疏表达的二元麦克风小阵列话音增强算法,首先利用字典学习方法分别获得目标信号和噪声信号的过完... 针对常规二元麦克风小阵列话音增强算法通常需要话音活动检测技术支持,并且难以有效抑制第一帧含目标信号的噪声。提出了一种基于多任务稀疏表达的二元麦克风小阵列话音增强算法,首先利用字典学习方法分别获得目标信号和噪声信号的过完备字典,然后利用2 1???混合范数对信号在其字典上的表示系数进行正则化稀疏约束,使得2个阵元接收到信号中的噪声信号被抑制,而话音信号尽量保持不变,从而达到话音增强的目标。仿真和实验数据表明,无论开始位置是否含有目标话音信号,所提出的非话音活动检测支持的二元麦克风小阵列话音增强算法均能有效实现话音增强的目标。 展开更多
关键词 麦克风小阵列 话音增强 字典学习 多任务稀疏表达
在线阅读 下载PDF
基于建构主义学习理论的高职高专英语口语教学设计模式 被引量:6
15
作者 尹艳 《武汉职业技术学院学报》 2006年第6期109-112,共4页
我国的高职高专英语教学大多是本科压缩型、以阅读为主的教学模式。这种教学模式重笔头轻口头、重讲授轻实践,培养出来的学生不能适应经济和社会的发展的需要。建构主义学习理论作为教育心理学的最新理论对高职高专英语教学和应用型人... 我国的高职高专英语教学大多是本科压缩型、以阅读为主的教学模式。这种教学模式重笔头轻口头、重讲授轻实践,培养出来的学生不能适应经济和社会的发展的需要。建构主义学习理论作为教育心理学的最新理论对高职高专英语教学和应用型人才的培养具有良好的借鉴作用。本文在分析建构主义学习理论的基础上,结合高职高专英语教学的特点,探讨了建构主义学习理论在高职高专英语口语教学中的应用,旨在探索研究具有高职高专特色的英语口语教学模式。 展开更多
关键词 建构主义 高职高专 英语口语 设计模式
在线阅读 下载PDF
汉语图画命名过程的年老化机制:非选择性抑制能力的影响 被引量:3
16
作者 杨群 张清芳 《心理学报》 CSSCI CSCD 北大核心 2019年第10期1079-1090,共12页
采用图画-词汇干扰任务考察和比较了青年人和老年人在汉语口语词汇产生中的干扰词频效应,以及非选择性抑制能力对两组人群干扰词频效应和图画命名潜伏期的影响。结果发现:无关干扰词的词频影响了青年人的图画命名过程,出现了干扰词频效... 采用图画-词汇干扰任务考察和比较了青年人和老年人在汉语口语词汇产生中的干扰词频效应,以及非选择性抑制能力对两组人群干扰词频效应和图画命名潜伏期的影响。结果发现:无关干扰词的词频影响了青年人的图画命名过程,出现了干扰词频效应,这一效应更可能发生在反应排除阶段,且不受非选择性抑制能力的影响;相比而言,老年人中未出现干扰词频效应,这可能是由于老年人的音韵表征衰退导致其不能利用干扰词的词频信息,支持了口语产生认知年老化的传输不足假设。非选择性抑制能力影响了老年人的图画-词汇干扰任务中图画命名的潜伏期,非选择性抑制能力减弱,图画命名时间延长,表明一般性认知能力的衰退影响了语言产生过程。 展开更多
关键词 口语产生年老化 图画-词汇干扰任务 干扰词频效应 词频效应 非选择性抑制能力
在线阅读 下载PDF
老年人听配能调控行为初探与启发 被引量:2
17
作者 张敏 Catherine V.Palmer 《中国听力语言康复科学杂志》 2019年第5期327-331,共5页
老年人听配能(listening effort)调控的研究,能够指导我们从行为、认知和神经科学的角度探索激发老年人听觉潜能和言语沟通积极性的早期有效干预方法。由于老年人对听配能驱动因子的敏感度和听配能客观生理测量的信效度等方面与年轻人... 老年人听配能(listening effort)调控的研究,能够指导我们从行为、认知和神经科学的角度探索激发老年人听觉潜能和言语沟通积极性的早期有效干预方法。由于老年人对听配能驱动因子的敏感度和听配能客观生理测量的信效度等方面与年轻人存在很大差异,从而增加了对该群体听觉认知的研究复杂度与难度。本文探索性研究了老年人听配能调控时通常思考的问题。介绍了丹麦听力学家正在持续进行的一项基于听觉认知心理生理学的助听器临床应用研究,以示听配能理论研究的临床应用价值。 展开更多
关键词 听配能 任务负荷 绩效反馈 言语理解
暂未订购
基于调度下令的录音自动识别方法及关键技术研究 被引量:1
18
作者 傅靖 季铮铮 +1 位作者 周红杰 谈叶月 《自动化与仪表》 2022年第3期96-101,共6页
为提高企业办公中录音的识别率,该研究应用机器人流程自动化技术,建立基于PRA接口的录音自动识别调度下令系统,使用主流的RPA开发工具UiPath,实现企业业务流程自动化。建立基于注意力机制的AVSR双模态语音识别模型,对原始音频信号进行... 为提高企业办公中录音的识别率,该研究应用机器人流程自动化技术,建立基于PRA接口的录音自动识别调度下令系统,使用主流的RPA开发工具UiPath,实现企业业务流程自动化。建立基于注意力机制的AVSR双模态语音识别模型,对原始音频信号进行谱减法去噪,使用注意力机制对特征进行前期和后期融合,在音频缺失和噪声污染的情况下辅助修正音频特征。为提高系统的任务执行效率,提出一种基于动态优先级的任务调度下令方法,计算等待队列中等待任务的实时优先级,选择动态优先级最高的任务执行。实验结果表明,该研究系统的任务调度完成时间较低,任务数高达80个时任务调度完成时间为3086ms,训练次数达到200次时对存在噪声的语音信号的识别率高达99%。 展开更多
关键词 机器人流程自动化 注意力机制 双模态语音识别 动态优先级 任务调度下令
在线阅读 下载PDF
自我聚焦对社交焦虑个体外部注意与状态焦虑的作用——来自眼动与生理指标的证据 被引量:5
19
作者 陈慧菁 林沐雨 钱铭怡 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第1期170-178,共9页
为模拟真实的社会化场景,探究自我聚焦如何影响社交焦虑个体对外部社交反馈信息的注意与状态焦虑,采用演讲与自由观看任务,105名被试在实验室中面对屏幕进行即兴演讲,同时自由观看提前录制的包含12位听众的录像,听众分别表现出正性、中... 为模拟真实的社会化场景,探究自我聚焦如何影响社交焦虑个体对外部社交反馈信息的注意与状态焦虑,采用演讲与自由观看任务,105名被试在实验室中面对屏幕进行即兴演讲,同时自由观看提前录制的包含12位听众的录像,听众分别表现出正性、中性和负性的反馈。研究中操纵被试的自我聚焦(高自我聚焦条件或低自我聚焦条件),采用眼动仪测量被试在演讲中对正性、中性和负性反馈的注意,并使用生理仪测量皮肤电和心率。结果显示,自我聚焦在整体上减少了高、低社交焦虑组对外部社交反馈信息的注意,高、低社交焦虑组的心率在高自我聚焦条件下均比低自我聚焦条件下快。研究结果表明,自我聚焦削弱了社交焦虑个体对外部刺激的注意加工。 展开更多
关键词 社交焦虑 自我聚焦 注意偏向 状态焦虑 演讲任务 眼动
在线阅读 下载PDF
基于Conformer的端到端中英文管制语音识别 被引量:1
20
作者 孔建国 韩琪聪 +1 位作者 梁海军 李煜琨 《航空计算技术》 2024年第3期1-5,共5页
将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conf... 将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conformer共享编码器对输入序列进行语言分类并以参数有效的方式对音频序列的局部和全局相依性进行建模,添加了语种分类模块来判断输入语音序列的语种,还采用了CTC解码器和注意力解码器联合解码的多任务建模方法。最后在建立的民航数据集对所提出的框架进行验证,试验结果表明,Conformer-CTC/Attention(Language-Category)相对于基线模型错误率降低,识别效果达到预期。 展开更多
关键词 空中交通管制 中英文语音识别 Conformer-CTC/Attention 多任务学习 端到端
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部