期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
DFSMN-T:结合强语言模型Transformer的中文语音识别 被引量:18
1
作者 胡章芳 蹇芳 +2 位作者 唐珊珊 明子平 姜博文 《计算机工程与应用》 CSCD 北大核心 2022年第9期187-194,共8页
自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以... 自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以深度前馈序列记忆神经网络DFSMN作为声学模型,执行语音转中文音节任务,进而将拼音转汉字理解成翻译任务,引入Transformer作为语言模型;同时提出一种减少Transformer计算复杂度的简易方法,在计算注意力权值时引入Hadamard矩阵进行滤波,对低于阈值的参数进行丢弃,使得模型解码速度更快。在Aishell-1、Thchs30等数据集上的实验表明,相较于DFSMN结合3-gram模型,基于DFSMN和改进Transformer的语音识别系统在最优模型上的字符错误率相对下降了3.2%,达到了11.8%的字符错误率;相较于BLSTM模型语音识别系统,其字符错误率相对下降了7.1%。 展开更多
关键词 语音识别 深度前馈序列记忆神经网络(dfsmn) TRANSFORMER 中文音节 HADAMARD矩阵
在线阅读 下载PDF
基于改进DFSMN的非特定人语音识别模型
2
作者 王世刚 严瑾 《电声技术》 2023年第12期111-114,共4页
深度前馈序列记忆网络(Deep Feedforward Sequential Memory Network,DFSMN)是一种识别准确率较高且在非特定人语音识别领域得到良好应用的声学模型,但存在参数冗余、模型训练困难的情况。针对此问题,提出一种基于改进DFSMN的非特定人... 深度前馈序列记忆网络(Deep Feedforward Sequential Memory Network,DFSMN)是一种识别准确率较高且在非特定人语音识别领域得到良好应用的声学模型,但存在参数冗余、模型训练困难的情况。针对此问题,提出一种基于改进DFSMN的非特定人语音识别模型。该模型改进了DFSMN记忆模块大小和模块之间的连接方式,并结合连接时序分类(Connectionist Temporal Classification,CTC)端到端语音识别框架。实验结果表明,在相同条件下,该改进模型的参数量较之前减少了约1/10,在不同数据集上与几种常见语音识别模型相比,其语音识别字符错误率均最低,在识别准确率和模型训练效率方面具有一定的优越性。 展开更多
关键词 语音识别 深度前馈序列记忆网络(dfsmn) 非特定人 连接时序分类(CTC)
在线阅读 下载PDF
基于深度学习的桥梁非线性气动力模型研究 被引量:2
3
作者 张文明 冯丹典 葛耀君 《桥梁建设》 EI CSCD 北大核心 2023年第3期16-24,共9页
为准确模拟桥梁断面气动力的非线性特性和流体记忆效应,构建了基于深度学习的非线性气动力降阶模型。引入前馈神经网络(FNN)和长短时记忆(LSTM)网络2种深度学习框架,利用CFD强迫振动数值模拟获取非线性气动力数据,采用谐波叠加法合成强... 为准确模拟桥梁断面气动力的非线性特性和流体记忆效应,构建了基于深度学习的非线性气动力降阶模型。引入前馈神经网络(FNN)和长短时记忆(LSTM)网络2种深度学习框架,利用CFD强迫振动数值模拟获取非线性气动力数据,采用谐波叠加法合成强迫振动位移信号;结合2种框架的结构特征,以断面位移为输入、气动力为输出,针对性构建了用于网络训练、验证和测试的数据集。以某三塔悬索桥钢箱梁断面为例,分别建立基于FNN和基于LSTM网络的气动力降阶模型,并针对不同频率、自由度的强迫振动和自由振动等工况,评估对比了模型的性能。结果表明:2种降阶模型均可较好地模拟任意合理振动工况下断面非线性气动力,计算效率较数值模拟有极大提升,其中,基于LSTM网络的降阶模型具备更优的非线性气动力模拟性能。 展开更多
关键词 桥梁工程 非线性气动力 深度学习 前馈神经网络 长短时记忆网络 数值模拟
在线阅读 下载PDF
面向人体行为识别的深度特征学习方法比较 被引量:9
4
作者 匡晓华 何军 +1 位作者 胡昭华 周媛 《计算机应用研究》 CSCD 北大核心 2018年第9期2815-2817,2822,共4页
针对人体行为识别问题,比较了两种基于智能手机惯性加速度传感器数据的深度特征学习方法。先将传感器数据进行重叠加窗的预处理;然后将带标签的样本数据直接输入深度网络模型中,通过端到端的特征学习,最终输出行为分类结果。通过对比深... 针对人体行为识别问题,比较了两种基于智能手机惯性加速度传感器数据的深度特征学习方法。先将传感器数据进行重叠加窗的预处理;然后将带标签的样本数据直接输入深度网络模型中,通过端到端的特征学习,最终输出行为分类结果。通过对比深度卷积神经网络、长短期记忆网络两种深度学习方法在公开网站UCI的机器学习知识库的人体行为识别数据集上的识别效果。实验结果表明,采用Dropout深度卷积神经网络特征学习方法识别准确率为90.98%,是一种有效的深度特征学习方法。 展开更多
关键词 深度学习 行为识别 序列数据分类 深度卷积神经网络 长短期时间记忆网络
在线阅读 下载PDF
基于深度学习与SPRT的风电机组齿轮箱轴承状态监测 被引量:18
5
作者 刘旭斌 郭鹏 林峰 《动力工程学报》 CAS CSCD 北大核心 2020年第11期889-896,共8页
为提高故障发生率较高的齿轮箱高速轴轴承状态监测效率和准确性,提出了一种基于深度学习模型的状态监测方法。首先采用ReliefF方法初选建模变量,并通过降噪自编码网络对这些变量进行降维处理,使用长短期记忆网络对降维简化后的高速轴轴... 为提高故障发生率较高的齿轮箱高速轴轴承状态监测效率和准确性,提出了一种基于深度学习模型的状态监测方法。首先采用ReliefF方法初选建模变量,并通过降噪自编码网络对这些变量进行降维处理,使用长短期记忆网络对降维简化后的高速轴轴承温度与其影响变量之间的非线性关系进行建模,然后在监测阶段引入序贯概率比检验方法,捕捉模型预测轴承温度残差的异常变化,及时发出机组运行异常报警,最后以华东地区2台1.5 MW实验机组为例对模型进行验证。结果表明:采用本文方法能够及时准确地发现齿轮箱异常导致的高速轴轴承温度超温,为风电机组齿轮箱状态监测和故障预警提供参考。 展开更多
关键词 状态监测 深度学习 降噪自编码 长短期记忆网络 序贯概率比检验
在线阅读 下载PDF
基于CNN与Bi-LSTM的唇语识别研究 被引量:2
6
作者 骆天依 刘大运 +4 位作者 李修政 房国志 安欣 魏华杰 胡城 《软件导刊》 2019年第10期36-39,共4页
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立N... 针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。 展开更多
关键词 唇语识别 卷积神经网络 双向长短时记忆网络 深度学习 时序编码
在线阅读 下载PDF
一种基于前馈序列记忆神经网络的改进方法 被引量:2
7
作者 梁翀 刘迪 +1 位作者 浦正国 张彬彬 《山东农业大学学报(自然科学版)》 北大核心 2021年第2期313-315,共3页
针对具有时序性的信号的分析和建模,主流的RNN、LSTM由于反馈连接的影响,在学习效率和稳定上有所不足。本文基于标准的前馈神经网络,借鉴滤波器中的抽头延迟线结构,提出一种改进的前馈序列记忆神经网络FSMN(cFSMN)和深层cFSMN(Deep-cFSM... 针对具有时序性的信号的分析和建模,主流的RNN、LSTM由于反馈连接的影响,在学习效率和稳定上有所不足。本文基于标准的前馈神经网络,借鉴滤波器中的抽头延迟线结构,提出一种改进的前馈序列记忆神经网络FSMN(cFSMN)和深层cFSMN(Deep-cFSMN),实现时序的音视频信号快速建模,减少了反馈连接,具有更高的学习速率和更好的稳定性。 展开更多
关键词 前馈序列记忆神经网络 改进方法
在线阅读 下载PDF
基于深度学习的闽南语语音识别
8
作者 郭新华 《智能物联技术》 2023年第4期13-19,共7页
目前的智能家居语音控制仍以普通话为主,较难进行方言的识别。闽南语作为福建第一大方言,使用人数众多,将闽南语语音识别用于智能家居系统将有广阔前景。为了提高闽南语语音识别模型的性能,本文将cFSMN声学模型、DFSMN声学模型和MTL-DF... 目前的智能家居语音控制仍以普通话为主,较难进行方言的识别。闽南语作为福建第一大方言,使用人数众多,将闽南语语音识别用于智能家居系统将有广阔前景。为了提高闽南语语音识别模型的性能,本文将cFSMN声学模型、DFSMN声学模型和MTL-DFSMN声学模型分别在闽南语语音语料库上进行验证,最终选择声学模型MTL-DFSMN用于闽南语语音识别。该模型能更精准识别用户的闽南语语音指令和满足智能家居系统的要求。 展开更多
关键词 深度学习 闽南方言语音识别 智能家居 多任务学习 深层前馈序列记忆神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部