期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于Logistic模型的翻译机器人语义自动校准方法
1
作者 胡志坤 《电子设计工程》 2025年第3期47-52,共6页
针对翻译机器人在语义翻译过程中由于翻译误差容易导致翻译结果与原始语言意图不符的问题,提出一种基于Logistic模型的语义自动校准方法。通过语音识别模块将语音信号映射为语义文本,对识别的语义文本进行处理,通过改进的广义线性回归模... 针对翻译机器人在语义翻译过程中由于翻译误差容易导致翻译结果与原始语言意图不符的问题,提出一种基于Logistic模型的语义自动校准方法。通过语音识别模块将语音信号映射为语义文本,对识别的语义文本进行处理,通过改进的广义线性回归模型(GLR)进行误差检测,并基于Logistic模型对翻译结果进行特征分析,预测流畅度以及准确度,实现语义自动校准。设计了针对翻译机器人语义自动校准的对比实验,实验结果表明,与基于Seq2Seq模型的翻译机器人语义自动校准方法相比,所研究方法语义校准的准确率为98%~100%,BLEU评分为35,语义校准时间为8.5~9.4 s。 展开更多
关键词 语义校准 广义线性回归 LOGISTIC模型 一维映射 相似度
在线阅读 下载PDF
融合注意力机制轻量级网络的语声情感识别
2
作者 冀常鹏 佟婷婷 代巍 《应用声学》 CSCD 北大核心 2024年第4期892-899,共8页
在语声情感识别过程中,为解决缺乏方言数据库、识别模型准确率低等问题,建立辽西方言语声情感数据库,并提出一种融合注意力机制轻量级网络的语声情感识别模型。模型由特征组合网络、CBAM注意力机制、深度卷积网络及输出层四部分组成。利... 在语声情感识别过程中,为解决缺乏方言数据库、识别模型准确率低等问题,建立辽西方言语声情感数据库,并提出一种融合注意力机制轻量级网络的语声情感识别模型。模型由特征组合网络、CBAM注意力机制、深度卷积网络及输出层四部分组成。利用3个大小不同的并行卷积提取浅层语声特征并进行拼接;引入CBAM注意力模块将空间特征与通道特征融合;融合后的特征输入深度卷积网络,提取语声深层次特征,输出多维特征向量;输出层对语声进行情感分类识别。模型在IEMOCAP、Emo-DB和自建辽西语声情感数据库上验证,分别取得82.5%、96.2%和90.8%的准确率。实验结果表明,与其他深度学习的模型相比,该文提出的模型在参数量更少的同时识别率更高。 展开更多
关键词 语声情感识别 辽西方言 深度学习 轻量级
在线阅读 下载PDF
基于Conformer的端到端语音识别方法 被引量:3
3
作者 胡从刚 申艺翔 +1 位作者 孙永奇 赵思聪 《计算机应用研究》 CSCD 北大核心 2024年第7期2018-2024,共7页
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将... 针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将多分支融合为单分支,以降低计算复杂度、加快模型推理速度。然后,利用基于压缩和激励网络的通道注意力机制弥补缺失的通道特征信息,以提高语音识别准确率。最后,在公开数据集Aishell-1上的实验结果表明:相较于Conformer,所提出方法的字错误率降低了10.67%,验证了方法的先进性。此外,RepVGG-SE声学输入网络能够有效提高多种Transformer变体的端到端语音识别模型的整体性能,具有很好的泛化能力。 展开更多
关键词 语音识别 CONFORMER RepVGG 压缩和激励网络
在线阅读 下载PDF
藏语孤立词语音识别技术研究 被引量:6
4
作者 赵尔平 王聪华 +1 位作者 党红恩 雒伟群 《西北师范大学学报(自然科学版)》 CAS 北大核心 2015年第5期50-54,共5页
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通... 针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用. 展开更多
关键词 藏语孤立词 共振峰 M el倒谱特征 循环迭代 隐马尔可夫模型 语音识别
在线阅读 下载PDF
提取混沌中谐波信号的时频方法 被引量:3
5
作者 王国光 王树勋 何丽桥 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第6期963-966,共4页
首先采用谐波小波变换将观测信号分解成窄带信号,然后使用经验模态分解方法将每一个窄带信号分解为有限个内禀模态函数(IMFs),根据功率谱密度选取内禀模态函数,提取谐波信号。该方法的性能可由噪声缩减因子和相关系数两个指标度量。理... 首先采用谐波小波变换将观测信号分解成窄带信号,然后使用经验模态分解方法将每一个窄带信号分解为有限个内禀模态函数(IMFs),根据功率谱密度选取内禀模态函数,提取谐波信号。该方法的性能可由噪声缩减因子和相关系数两个指标度量。理论分析和仿真实验表明,在信噪比不太低的情况下,该方法对提取淹没在混沌和噪声背景下的谐波信号非常有效。 展开更多
关键词 信息处理技术 信号提取 经验模态分解 谐波小波 混沌
在线阅读 下载PDF
基于SOPC的说话人识别算法的实现与优化 被引量:3
6
作者 何伟 徐阳 张玲 《计算机应用》 CSCD 北大核心 2012年第5期1463-1466,共4页
利用可编程片上系统(SOPC)灵活的可编程性和现场可编程门阵列(FPGA)强大的并行处理能力,在FPGA上实现说话人识别算法,并从识别速度和识别精度两个方面对系统进行优化。研究了说话人识别算法的原理,针对其特点构建了SOPC系统,用乒乓操作... 利用可编程片上系统(SOPC)灵活的可编程性和现场可编程门阵列(FPGA)强大的并行处理能力,在FPGA上实现说话人识别算法,并从识别速度和识别精度两个方面对系统进行优化。研究了说话人识别算法的原理,针对其特点构建了SOPC系统,用乒乓操作实现语音采集和处理,利用FPGA的硬件实现算法中较为耗时的模块,提高了识别速度,同时又利用遗传算法来生成模板码书,提高了识别精度。最终,实现对说话人身份进行识别的功能,系统具有较高的实时性和识别精度。 展开更多
关键词 可编程片上系统 现场可编程门阵列 说话人识别 乒乓操作 遗传算法
在线阅读 下载PDF
基于CRNN的汽车发动机声纹个体识别方法 被引量:4
7
作者 高晓利 李捷 +2 位作者 王维 赵火军 骆明伟 《火力与指挥控制》 CSCD 北大核心 2021年第3期150-153,159,共5页
为提高声纹个体识别率,提出了一种基于卷积神经网络(CNN)和深度循环神经网络(RNN)的声纹个体识别方案CRNN,用于发动机声纹个体识别。该方法通过优化CRNN网络参数,挖掘声谱图“纹路”特征和时序特征,解决现有方法不能充分利用声音信号特... 为提高声纹个体识别率,提出了一种基于卷积神经网络(CNN)和深度循环神经网络(RNN)的声纹个体识别方案CRNN,用于发动机声纹个体识别。该方法通过优化CRNN网络参数,挖掘声谱图“纹路”特征和时序特征,解决现有方法不能充分利用声音信号特征的问题。基于实采汽车发动机声音信号的仿真结果表明,相对于传统方法,改进CRNN能获得更高识别率,达到了98.75%。 展开更多
关键词 声纹个体识别 卷积神经网络 深度循环神经网络 声谱图
在线阅读 下载PDF
基于无线局域网络技术的PACS系统 被引量:2
8
作者 同鸣 卞正中 +1 位作者 李晓辉 张亮 《计算机工程与应用》 CSCD 北大核心 2003年第20期29-31,共3页
随着人们对医疗系统准确性、及时性、方便性要求的不断提高,医疗数据与图象的处理、存档及传输等技术成为大量的医疗系统人员近年来研究的热点。DICOM标准的出现又进一步大大推进了这一领域的研究。该文分析了目前我国医疗处理及传输技... 随着人们对医疗系统准确性、及时性、方便性要求的不断提高,医疗数据与图象的处理、存档及传输等技术成为大量的医疗系统人员近年来研究的热点。DICOM标准的出现又进一步大大推进了这一领域的研究。该文分析了目前我国医疗处理及传输技术的现状,提出了一种基于无线局域网的PACS解决方案,对该系统的体系结构和关键技术进行了剖析,并分析了它在未来医疗系统发展中的重要作用。 展开更多
关键词 无线局域网 DICOM标准 PACS
在线阅读 下载PDF
基于duffing随机共振的说话人特征提取方法 被引量:4
9
作者 潘平 何朝霞 《计算机工程与应用》 CSCD 2012年第35期123-125,142,共4页
说话人特征参数的提取直接影响识别模型的建立,MFCC与LPC参数提取方法,分别以局域低频信息和全局AR信号为主要特征。提出一种基于duffing随机共振的说话人频谱特征提取方法。仿真结果表明,该方法能识别说话人之间频谱的微小差别,有效地... 说话人特征参数的提取直接影响识别模型的建立,MFCC与LPC参数提取方法,分别以局域低频信息和全局AR信号为主要特征。提出一种基于duffing随机共振的说话人频谱特征提取方法。仿真结果表明,该方法能识别说话人之间频谱的微小差别,有效地提取说话人频谱的基本特征,从而为说话人识别模型提供更为精细的识别模型。 展开更多
关键词 duffing随机共振 说话人识别(SR) 特征提取
在线阅读 下载PDF
基于非参数直方图模型的鲁棒说话人识别算法 被引量:1
10
作者 李燕萍 唐振民 +1 位作者 丁辉 张燕 《数据采集与处理》 CSCD 北大核心 2010年第1期81-85,共5页
建立一种非参数模型来刻画说话人的特征分布,并采用地面移动距离来度量分布之间的相似性。该方法能有效地利用有限的数据表达说话人的身份信息,直接计算特征分布与测试语音分布之间的距离,与传统的矢量量化和高斯混合模型相比,不需要通... 建立一种非参数模型来刻画说话人的特征分布,并采用地面移动距离来度量分布之间的相似性。该方法能有效地利用有限的数据表达说话人的身份信息,直接计算特征分布与测试语音分布之间的距离,与传统的矢量量化和高斯混合模型相比,不需要通过对所有语音帧计算总平均失真误差和最小相似度,计算简单,主要能够降低系统对数据量的依赖性。并且通过自适应直方图均衡化方法对原始语音特征进行修正,使得噪声环境下获得的语音特征经过修正后更符合真实分布,增强了特征的抗噪性。实验表明,本文提出的方法在噪声环境下的短语音说话人识别系统中表现出较强的优势。 展开更多
关键词 说话人识别 非参数模型 地面移动距离 自适应直方图均衡化
在线阅读 下载PDF
基于VMD的双通道构音障碍语音特征图谱提取算法
11
作者 薛珮芸 白静 +1 位作者 张楠 赵建星 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期793-801,共9页
针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(... 针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果. 展开更多
关键词 构音障碍语音识别 变分模态分解 卷积神经网络 MBCFbank特征
在线阅读 下载PDF
强混沌和噪声背景下微弱信号的检测 被引量:1
12
作者 王国光 王树勋 何丽桥 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第B03期116-121,共6页
分析了检测或提取混沌和噪声背景下信号的一些典型方法所存在的局限性,提出以信号的统计独立性来区分混沌和信号特征,使用信息论中的负熵作为统计独立性的判据,进而应用独立分量分析技术,采取逐次分离方法将信号从混沌和噪声中分离出来... 分析了检测或提取混沌和噪声背景下信号的一些典型方法所存在的局限性,提出以信号的统计独立性来区分混沌和信号特征,使用信息论中的负熵作为统计独立性的判据,进而应用独立分量分析技术,采取逐次分离方法将信号从混沌和噪声中分离出来,从而实现检测的目的。计算机仿真实验表明,这种方法不仅能检测出能量较大的信号,而且对淹没在强混沌和噪声背景下的微弱信号的检测也具有高度的稳定性和可靠性。 展开更多
关键词 信息处理技术 信号检测 独立分量分析 混沌
在线阅读 下载PDF
基于LPC的语音谱分析 被引量:2
13
作者 田玉静 姬光荣 左红伟 《电声技术》 2007年第6期50-52,63,共4页
介绍了自回归模型、线性预测编码原理及其参数算法。对实际语音信号进行线性预测编码分析实验,重点讨论了实际语音信号线性预测时自回归模型参数求取及模型阶数确定,MATLAB仿真绘出了功率谱图。分析实验残差,研究表明线性预测编码分析... 介绍了自回归模型、线性预测编码原理及其参数算法。对实际语音信号进行线性预测编码分析实验,重点讨论了实际语音信号线性预测时自回归模型参数求取及模型阶数确定,MATLAB仿真绘出了功率谱图。分析实验残差,研究表明线性预测编码分析对短数据的频谱分辨率效果明显。 展开更多
关键词 自回归模型 线性预测编码分析 谱估计
在线阅读 下载PDF
孤立词语音识别系统的DSP实现 被引量:1
14
作者 郑德忠 宋婧婧 周朝霞 《微计算机信息》 2010年第26期118-119,133,共3页
传统语音识别系统存在识别率低、接口复杂、功耗大等缺点。针对这一问题,可以采用TI公司生产的TMS320C6201B DSP开发非特定人孤立词语音识别系统。DSP主机接口部分与单片机89C51相连。由单片机控制LCD显示电路和USB与PC的通信。USB2.0... 传统语音识别系统存在识别率低、接口复杂、功耗大等缺点。针对这一问题,可以采用TI公司生产的TMS320C6201B DSP开发非特定人孤立词语音识别系统。DSP主机接口部分与单片机89C51相连。由单片机控制LCD显示电路和USB与PC的通信。USB2.0总线标准数据传输速率高、接口方便。软件部分采用传统的双门限端点检测算法和DHMM识别算法。实验结果表明,该系统功耗低、体积小,并且具有较高的识别率。 展开更多
关键词 数字信号处理 孤立词识别 离散隐马尔可夫模型 双门限端点检测算法 线性预测分析美尔倒谱参数
在线阅读 下载PDF
基于Duffing共振的语音真伪检测技术研究
15
作者 何朝霞 刘凯 《微型机与应用》 2016年第2期35-38,共4页
在数字语音真伪技术中,基于电网频率的检测方法是当前研究的热点。由于数字录音设备在录音过程中不仅记录语音内容本身,还携带微弱的电网电压或电流信号,利用Duffing共振理论来提取数字录音信号中的微弱电网信号,根据其输出特征参数的... 在数字语音真伪技术中,基于电网频率的检测方法是当前研究的热点。由于数字录音设备在录音过程中不仅记录语音内容本身,还携带微弱的电网电压或电流信号,利用Duffing共振理论来提取数字录音信号中的微弱电网信号,根据其输出特征参数的幅频特性和相频特性来判断录音文件的真伪性。通过实验分析论证了该方法的可行性和实用性,为数字录音真伪鉴别技术提供了一条新的研究方向。 展开更多
关键词 语音真伪鉴别 电网频率 Duffing共振 特征参数
在线阅读 下载PDF
基于改进GMM的耳语语音情感识别方法研究 被引量:3
16
作者 蒋庆斌 包永强 +1 位作者 王浩 赵力 《计算机应用与软件》 CSCD 北大核心 2012年第11期73-74,136,共3页
提出一种基于改进GMM模型的耳语情感语音识别方法。该方法在GMM的每个成员通过用矢量量化误差值取代传统GMM的输出概率值来计算模型的得分,使得建模时所需训练数据量减少,并且识别速度有所提高。实验结果表明当训练数据较少时,提出的新... 提出一种基于改进GMM模型的耳语情感语音识别方法。该方法在GMM的每个成员通过用矢量量化误差值取代传统GMM的输出概率值来计算模型的得分,使得建模时所需训练数据量减少,并且识别速度有所提高。实验结果表明当训练数据较少时,提出的新的识别方法的实验结果明显好于传统的GMM方法,证明了该方法的有效性。 展开更多
关键词 耳语语音 高斯混合模型 情感识别
在线阅读 下载PDF
基于非线性共振的说话人特征提取研究与仿真 被引量:4
17
作者 何朝霞 潘平 罗辉 《科学技术与工程》 北大核心 2012年第25期6507-6510,共4页
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识... 针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。 展开更多
关键词 非线性共振 语音信号 特征提取 识别率
在线阅读 下载PDF
抗噪声语音识别及语音增强算法的应用 被引量:5
18
作者 汤玲 戴斌 《计算机仿真》 CSCD 2006年第9期80-82,143,共4页
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性... 提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。 展开更多
关键词 语音识别 噪声 鲁棒性 掩蔽特性 谱减
在线阅读 下载PDF
混合CTC/attention架构端到端带口音普通话识别 被引量:12
19
作者 杨威 胡燕 《计算机应用研究》 CSCD 北大核心 2021年第3期755-759,共5页
针对普通话语音识别任务中的多口音识别问题,提出了链接时序主义(connectionist temporal classification,CTC)和多头注意力(multi-head attention)的混合端到端模型,同时采用多目标训练和联合解码的方法。实验分析发现随着混合架构中... 针对普通话语音识别任务中的多口音识别问题,提出了链接时序主义(connectionist temporal classification,CTC)和多头注意力(multi-head attention)的混合端到端模型,同时采用多目标训练和联合解码的方法。实验分析发现随着混合架构中链接时序主义权重的降低和编码器层数的加深,混合模型在带口音的数据集上表现出了更好的学习能力,同时训练一个深度达到48层的编码器—解码器架构的网络,生成模型的表现超过之前所有端到端模型,在数据堂开源的200 h带口音数据集上达到了5.6%字错率和26.2%句错率。实验证明了提出的端到端模型超过一般端到端模型的识别率,在解决带口音的普通话识别上有一定的先进性。 展开更多
关键词 口音 混合CTC/attention的端到端模型 多头注意力 链接时序主义 语音识别
在线阅读 下载PDF
基于隐马尔可夫模型的语音识别技术在载人航天器上的应用 被引量:3
20
作者 李皖玲 梁吴迪 张天湘 《航天器环境工程》 2013年第4期441-445,共5页
利用嵌入式平台构建了基于隐马尔可夫模型(Hidden Markov Model,HMM)技术的载人航天器语音识别系统,并针对载人航天器特殊的噪声背景和声学训练,对传统语音端点检测算法进行了改进。通过试验在嵌入式运行环境下实现了指令发送、文字输... 利用嵌入式平台构建了基于隐马尔可夫模型(Hidden Markov Model,HMM)技术的载人航天器语音识别系统,并针对载人航天器特殊的噪声背景和声学训练,对传统语音端点检测算法进行了改进。通过试验在嵌入式运行环境下实现了指令发送、文字输入等功能,证实该系统适应航天员的口音和发音习惯,可对连贯自然发音方式的命令进行识别,能够满足航天员及任务使用需求。 展开更多
关键词 载人航天器 语音识别 隐马尔可夫模型 硬件设计 软件设计
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部