期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于VMD-SE-CNN-BiLSTM的电动汽车充电负荷短期预测
1
作者 吴方权 李斯琦 +2 位作者 胡骏涵 汤成佳 邹建业 《电力系统保护与控制》 北大核心 2025年第22期153-161,共9页
近年来,随着电动汽车保有量的快速增长,准确预测电动汽车充电负荷已成为电网规划和充电设施优化的重要研究课题。针对传统预测方法难以处理负荷数据复杂非线性特征和多因素动态影响的问题,提出了一种基于数据预处理、结合变分模态分解-... 近年来,随着电动汽车保有量的快速增长,准确预测电动汽车充电负荷已成为电网规划和充电设施优化的重要研究课题。针对传统预测方法难以处理负荷数据复杂非线性特征和多因素动态影响的问题,提出了一种基于数据预处理、结合变分模态分解-样本熵(variational mode decomposition-sample entropy,VMD-SE)数据重构和卷积神经网络-双向长短期记忆网络(convolutional neural network-bidirectional long short-term memory,CNN-BiLSTM)深度学习框架的充电负荷预测模型。首先,利用高斯混合模型-K最近邻(Gaussian mixture model-K-nearest neighbor,GMM-KNN)方法检测并填补数据中的异常值和缺失值,提升数据质量。然后,采用VMD对负荷数据进行分解,并通过SE筛选重要模态重构信号以提取多尺度特征。最后,结合CNN和BiLSTM模型,构建混合深度学习框架,捕捉负荷的局部特征和时序依赖关系以实现准确预测。实验结果表明,该方法在多季节负荷预测中表现出较高的精度和鲁棒性,显著优于传统方法,为电动汽车充电负荷预测提供了有效解决方案。 展开更多
关键词 电动汽车 充电负荷预测 VMD-SE CNN-BiLSTM 深度学习
在线阅读 下载PDF
基于SE-CNN的人体摔倒检测方法 被引量:9
2
作者 杨志勇 王俊杰 金磊 《计算机工程》 CAS CSCD 北大核心 2022年第6期270-277,共8页
人口老龄化是当今社会发展不可忽视的问题,目前有很大一部分老年人在无人照顾的境况下独自生活,摔倒后无法及时得到救助成为威胁老人生命安全的重要原因之一。现有的人体摔倒检测方法存在适应性差、高入侵性、易误判、成本昂贵等问题,... 人口老龄化是当今社会发展不可忽视的问题,目前有很大一部分老年人在无人照顾的境况下独自生活,摔倒后无法及时得到救助成为威胁老人生命安全的重要原因之一。现有的人体摔倒检测方法存在适应性差、高入侵性、易误判、成本昂贵等问题,且无法快速、实时检测老人摔倒。提出一种基于机器学习和无线传感器网络的摔倒检测方法,使用多个物联网传感节点组建无线传感器网络采集RSS数据,对采集到的RSS数据进行预处理后,通过XGBoost模型对时域特征分量和小波域特征分量进行处理,并以排列组合方式得到具有强鲁棒性的联合特征分量。利用深度学习网络获得数据潜在规律的特点构建人体摔倒识别模型,采用卷积神经网络作为主干网络,并在相邻网络层之间引入通道注意力模块,通过构建SE-CNN模型实现人体摔倒检测。实验结果表明,联合特征的加入能够提高RSS数据的可区分性,且SE-CNN模型的识别准确率高于CNN模型,可以实现高准确率的人体摔倒检测。 展开更多
关键词 摔倒检测 无线传感 小波变换 联合特征 se-cnn模型
在线阅读 下载PDF
基于多源信号融合和SE-CNN的滚动轴承故障诊断方法 被引量:3
3
作者 杨冠雄 陈曦晖 余红坤 《煤矿机械》 2024年第4期158-160,共3页
针对传统轴承故障诊断方法存在对故障特征不敏感、特征提取不充分以及易受外界环境干扰等问题,提出了一种基于多源信号融合的滚动轴承故障诊断方法。首先为降低单通道信号中的异常值干扰,对多源传感器采集到的原始振动信号开展基于多通... 针对传统轴承故障诊断方法存在对故障特征不敏感、特征提取不充分以及易受外界环境干扰等问题,提出了一种基于多源信号融合的滚动轴承故障诊断方法。首先为降低单通道信号中的异常值干扰,对多源传感器采集到的原始振动信号开展基于多通道特征信息的数据层融合,实现类内故障特征信息互补;然后构建引入SE注意力机制的卷积神经网络(CNN)故障诊断模型,对无效特征信息进行过滤,增强特征提取表征能力,实现滚动轴承故障的精准识别;最后搭建多工况模拟实验台开展了不同干扰工况下的验证。实验结果表明,该方法的平均准确率可达98%以上,在不同程度的干扰工况下均能实现准确的轴承故障类型识别,具有较高的泛化能力。 展开更多
关键词 故障诊断 CNN 信号融合 SE注意力机制
原文传递
基于时频表征和注意力增强卷积神经网络的猕猴桃无损硬度检测
4
作者 邓奕男 廖发发 +5 位作者 欧阳尚韬 曾焕强 刘建春 李斌 陈楠 刘燕德 《农业工程学报》 北大核心 2026年第2期327-336,共10页
水果硬度是采后成熟度分级与市场精准供应的核心品质指标。传统基于近红外光谱和机器视觉的无损水果检测方法受光干扰、温度漂移等环境因素的制约,且难以精准捕捉水果内部结构变化。为此该研究提出了一种融合时频表征与注意力增强卷积... 水果硬度是采后成熟度分级与市场精准供应的核心品质指标。传统基于近红外光谱和机器视觉的无损水果检测方法受光干扰、温度漂移等环境因素的制约,且难以精准捕捉水果内部结构变化。为此该研究提出了一种融合时频表征与注意力增强卷积神经网络(convolutional neural network,CNN)的猕猴桃触觉无损硬度检测方法。首先,研制了集成应变传感器的三指鳍状射线柔性抓夹,采集与果实内部力学响应有关的触觉信号。然后,针对时域触觉信号深层特征提取不足的问题,引入连续小波变换(continuous wavelet transform,CWT),提取信号中的时频特征。为进一步实现关键频带特征的自适应强化,在卷积神经网络架构中引入注意力(squeeze and excitation,SE)模块,同时配合动态卷积核,聚焦局部纹理敏感区域。最后,采用数据增强策略优化模型,确保其在样本量受限条件下仍保持高泛化性。检测试验选择表皮无显著特征的猕猴桃作为样本水果,结果表明:所提出的方法对五级成熟度猕猴桃的分类准确率达93.3%,相较于输入时域信号的传统CNN模型提升8.5个百分点。呼吸试验的统计检验结果不显著(P > 0.05),验证了抓取过程未对果实造成显著生理损伤。该研究为猕猴桃这类表皮无显著变化的果实提供了基于触觉感知和时频表征的无损硬度检测新方法。 展开更多
关键词 水果 触觉感知 时频表征 se-cnn 硬度检测
在线阅读 下载PDF
基于CEEMDAN-SE和串行CNN-GRU的光伏功率组合预测模型
5
作者 窦真兰 吴松梅 +2 位作者 郭慧 张春雁 汪飞 《太阳能学报》 北大核心 2026年第2期67-75,共9页
为提高光伏功率的预测精度,提出一种基于完全自适应噪声经验模态分解(CEEMDAN)和串行卷积神经网络及门控神经网络(CNN-GRU)的光伏功率组合预测模型。首先,针对光伏功率波动性对预测结果的影响,采用CEEMDAN将原始光伏功率分解为若干子序... 为提高光伏功率的预测精度,提出一种基于完全自适应噪声经验模态分解(CEEMDAN)和串行卷积神经网络及门控神经网络(CNN-GRU)的光伏功率组合预测模型。首先,针对光伏功率波动性对预测结果的影响,采用CEEMDAN将原始光伏功率分解为若干子序列降低序列的非平稳性,并通过样本熵(SE)计算各子序列的复杂度,将SE值相近的序列,进行重组以减少计算量。其次,为克服单一神经网络在学习光伏功率历史数据特征的局限性,提出串行CNN-GRU混合神经网络以充分挖掘光伏功率的时空特征;将各子序列输入串行CNN-GRU得到预测结果,并将子序列预测结果叠加得到光伏功率预测结果。最后,对两个地区的光伏电站进行实例验证,同时构建LSTM、GRU、CEEMDAN-LSTM、CEEMDAN-GRU和串行CNN-GRU,进行对比验证。结果表明,所提模型能得到良好的预测结果,拥有良好的预测精度和泛化能力。 展开更多
关键词 光伏功率预测 CNN GRU 混合神经网络 CEEMDAN SE
原文传递
血清HBsAg感染的Vis-NIR光谱模式识别研究
6
作者 高乔基 吴振邦 +6 位作者 徐茜 陈敏 刘文轩 曹诚诚 廖敬龙 欧超 潘涛 《分析测试学报》 北大核心 2025年第6期1016-1023,共8页
乙肝表面抗原(HBsAg)是乙肝病毒感染的重要标志物。该文建立了血清HBsAg感染的无试剂可见-近红外(Vis-NIR)光谱模式识别新方法。收集到临床血清样品1243例(HBsAg阳性601、阴性642),采用训练-预测-检验实验设计,搭建了基于多尺度卷积、压... 乙肝表面抗原(HBsAg)是乙肝病毒感染的重要标志物。该文建立了血清HBsAg感染的无试剂可见-近红外(Vis-NIR)光谱模式识别新方法。收集到临床血清样品1243例(HBsAg阳性601、阴性642),采用训练-预测-检验实验设计,搭建了基于多尺度卷积、压缩-激励网络(SE Net)注意力机制和多尺度膨胀卷积的新型卷积神经网络(CNN)集成算法,连同经典的偏最小二乘-判别分析(PLS-DA)和普通浅层CNN算法,被用于建立HBsAg阳性和阴性血清的Vis-NIR光谱判别模型。该研究采用标准正态变量(SNV)变换进行光谱预处理。基于近红外区(780~1118 nm)经SNV处理的光谱的PLS-DA模型和新型CNN模型取得更优的建模效果,新型CNN模型的灵敏度(SEN)达到99.3%,漏诊率(FNR)达到0.7%。结果表明,采用Vis-NIR光谱精准判别HBsAg阳性和阴性血清具有可行性,提出的新型深度学习算法可望应用于其他光谱分析领域。 展开更多
关键词 可见-近红外光谱模式识别 血清HBsAg感染判别 偏最小二乘-判别分析(PLS-DA) 卷积神经网络(CNN) SE Net注意力机制 多尺度膨胀卷积
在线阅读 下载PDF
基于改进Faster R-CNN的文本检测方法研究
7
作者 田鑫宇 刘蕾 +1 位作者 吴金聪 朱大洲 《信息技术》 2025年第5期45-49,56,共6页
当前针对文本检测的Faster R-CNN模型存在以下问题:特征提取对小目标效果不佳,语义理解能力差,对形状变化的适应能力不强。针对以上问题,提出一种基于改进Faster R-CNN的文本检测方法。首先,将特征提取网络更换为HRnet网络,同时在stage... 当前针对文本检测的Faster R-CNN模型存在以下问题:特征提取对小目标效果不佳,语义理解能力差,对形状变化的适应能力不强。针对以上问题,提出一种基于改进Faster R-CNN的文本检测方法。首先,将特征提取网络更换为HRnet网络,同时在stage1前加入SE通道注意力机制;其次,在特征融合部分将FPN替换为高分辨率特征金字塔网络(HRFPN);再次,在回归部分将L1损失替换为CIOU损失;最终在COCO模型进行检测,结果显示目标检测查准率AP由53.2%提升到55.0%,查全率从64.4%提升至65.4%。结果表明,改进后的Faster R-CNN模型有效提升了文本检测的查准率和查全率,为文本检测任务提供了新方法。 展开更多
关键词 Faster R-CNN HRNet SE通道注意力 HRFPN CIOU损失
在线阅读 下载PDF
水轮发电机组水导轴瓦温度SE注意力机制-CNN预测模型
8
作者 刘轩 巩宇 +3 位作者 吴昊 雷俊雄 熊江翱 王卓艺 《机电工程技术》 2025年第22期40-44,共5页
水轮机水导轴瓦温度是衡量水轮机运行状态的一个重要参数,其准确预测可以为水轮机的安全检测、故障预报提供保障。为解决水轮发电机组水导轴瓦温度预测问题,融合卷积神经网络(Convolutional Neural Networks,CNN)和SE(Squeeze-and-Excit... 水轮机水导轴瓦温度是衡量水轮机运行状态的一个重要参数,其准确预测可以为水轮机的安全检测、故障预报提供保障。为解决水轮发电机组水导轴瓦温度预测问题,融合卷积神经网络(Convolutional Neural Networks,CNN)和SE(Squeeze-and-Excita⁃tion)注意力机制,构建了水轮发电机组水导轴瓦温度的SE-CNN预测模型。研究利用CNN从原始时间序列数据中提取局部特征,从而捕捉温度数据中的依赖关系,结合SE注意力机制能够增强对任务有用的特征通道,并抑制对当前任务用处不大的特征通道,以更准确地预测水轮机的水导轴瓦温度。基于实际抽蓄电站发电实际数据进行实验,结果表明所提出SE-CNN预测模型在MAE、MAPE、RMSE评价指标分别为1.5692,3.6081%和2.0286℃,优于GRU、LSTM、CNN预测方法,说明方法具有较高的预测精度和稳健性,为抽水蓄能电站的故障诊断与预警提供了有效的技术手段。 展开更多
关键词 水轮机 水导轴瓦温度 时序预测 CNN SE注意力机制
在线阅读 下载PDF
面向触觉识别的神经结构搜索算法
9
作者 邹子超 李玉良 +1 位作者 陈萌 马飞红 《哈尔滨工程大学学报》 北大核心 2025年第6期1209-1217,共9页
针对手工设计神经网络需要耗费一定时间和精力的问题,本文提出了一种基于自学习遗传算法的两级式神经结构搜索算法,并应用于触觉识别领域。设计了一种自学习遗传算法,利用强化学习优化遗传算法的选择、交叉和变异算子,以求遗传算法加速... 针对手工设计神经网络需要耗费一定时间和精力的问题,本文提出了一种基于自学习遗传算法的两级式神经结构搜索算法,并应用于触觉识别领域。设计了一种自学习遗传算法,利用强化学习优化遗传算法的选择、交叉和变异算子,以求遗传算法加速收敛,并在陷入局部最优时跳出局部最优;基于自学习遗传算法,提出了两级式神经网络结构搜索算法,用于搜索适合处理触觉时序数据的卷积神经网络和循环神经网络串联模型,且为卷积神经网络和循环神经网络模块引入了层间残差连接以解决网络退化问题,并使用公开触觉数据集对算法进行了实验验证。自建包含22类实验样品的触觉数据集,基于数据集进行了搜索算法实验,并对搜索得到的最优网络进行了分类识别测试,识别准确率为96.81%,与长短期记忆网络、门控循环单元网络和卷积神经网络与长短记忆网络串联模型进行对比,对比结果显示:本文搜索算法搜索出的网络性能更加优异,识别率更高,进一步证明了算法的有效性。 展开更多
关键词 神经网络结构搜索 触觉识别 强化学习 遗传算法 卷积神经网络和循环神经网络串联模型 触觉传感器 卷积神经网络与循环神经网络串联模型 层间残差连接循环神经网络模型
在线阅读 下载PDF
基于CNN‑LSTM‑SE的心电图分类算法研究 被引量:5
10
作者 王建荣 邓黎明 +1 位作者 程伟 李国翚 《测试技术学报》 2024年第3期264-273,共10页
心血管疾病是我国死亡率较高的疾病之一,通过观察心电图来判断心电信号是否出现异常能够对心血管疾病进行预防和筛查。由于心电图数据规模大且繁杂,临床医护人员在心电图筛查时,工作负担大且容易出现误诊或漏诊的情况。为了提高心电图... 心血管疾病是我国死亡率较高的疾病之一,通过观察心电图来判断心电信号是否出现异常能够对心血管疾病进行预防和筛查。由于心电图数据规模大且繁杂,临床医护人员在心电图筛查时,工作负担大且容易出现误诊或漏诊的情况。为了提高心电图的筛查效率、减少医护人员的压力,提出了一种基于卷积神经网络、长短期记忆神经网络和SE网络的心电图分类算法模型(CNN-LSTM-SE),该模型将心电图分成5种不同的类别。主要研究内容包括:选用MIT-BIH心律失常数据集作为心电信号的数据来源,使用巴特沃斯带通滤波器对心电信号进行去噪处理,通过Z-score方法对心电信号进行标准化处理,利用独热编码方法对心电信号标签进行编码,最后使用处理后的心电数据对所提算法模型进行训练和测试。实验结果表明:所提模型相较于其它模型,能够有效提高心电图分类的准确性,在实验数据集上的分类准确率达到99.1%。 展开更多
关键词 心律失常 心电图 卷积神经网络 SE网络 长短期记忆神经网络
在线阅读 下载PDF
基于改进Mask R-CNN的牙齿识别与分割 被引量:6
11
作者 赵庶旭 罗庆 王小龙 《中国医学物理学杂志》 CSCD 2021年第10期1229-1236,共8页
针对当前的研究方法在牙齿全景X光片上提取的信息较为单一,而未曾考虑将牙齿的类别信息与形状位置信息融合提取的问题,提出一种实例分割方法同时实现牙齿识别与分割。主要通过融合跳跃结构和SE(Squeeze and Excitation)模块对Mask R-CN... 针对当前的研究方法在牙齿全景X光片上提取的信息较为单一,而未曾考虑将牙齿的类别信息与形状位置信息融合提取的问题,提出一种实例分割方法同时实现牙齿识别与分割。主要通过融合跳跃结构和SE(Squeeze and Excitation)模块对Mask R-CNN实例分割模型中的分割分支进行改进,并以牙齿功能与FDI牙位两种类别编码方式,采用400张牙齿全景X光片数据进行实验仿真。实验结果表明改进后的模型相比于其他模型,可以同时有效地进行牙齿分类和分割,实现牙齿类别、形状、位置信息的融合提取,改善了Mask R-CNN实例分割模型在分割分支中语义信息提取不足的问题。 展开更多
关键词 牙齿识别 牙齿分割 Mask R-CNN 跳跃结构 SE模块
在线阅读 下载PDF
改进LeNet5-CNN的车牌识别工程应用优化设计 被引量:3
12
作者 陈冬英 黄悦 +3 位作者 李凌懿 王杰 高泽晖 舒萍 《武夷学院学报》 2022年第12期33-38,共6页
为兼顾车牌识别的精确度与鲁棒性,提高工程应用价值,提出一种基于改进LeNet5-CNN(卷积神经网络)的车牌识别工程应用优化算法。使用SE模块代替传统LeNet5模型中第三层及第五层的对应内容,同时将第2个全连接层以平均池化层来代替,且增加... 为兼顾车牌识别的精确度与鲁棒性,提高工程应用价值,提出一种基于改进LeNet5-CNN(卷积神经网络)的车牌识别工程应用优化算法。使用SE模块代替传统LeNet5模型中第三层及第五层的对应内容,同时将第2个全连接层以平均池化层来代替,且增加正则化及归一化处理,保证精度的前提下,减少计算量。在已有工程智能摄像头识别后,增加车牌识别再处理服务器,服务器中架设本算法,通过双重化识别优化工程应用。实验结果表明:设计的精度和收敛时长,明显优于传统方案;横向对比数据显示,本设计精确度更优,高达98.6%;实际工程应用对比该算法很好的解决第二位字母A和B无法识别问题,极大提高工程效应。 展开更多
关键词 车牌识别 改进LeNet5 卷积神经网络 SE模块
在线阅读 下载PDF
基于CEEMDAN-SE-VMD和CNN-BIGRU的短期负荷预测 被引量:4
13
作者 张超 张菁 李洋帆 《电子器件》 CAS 2024年第3期849-857,共9页
针对电力负荷预测的精度较低问题,提出一种基于CEEMDAN-SE-VMD和CNN-BIGRU组合模型的负荷预测方法。首先该模型采用自适应噪声的完全经验模态分解(CEEMDAN)处理成分复杂的原始负荷数据,经过分解后得到若干个包含不同频率成分的本征模函... 针对电力负荷预测的精度较低问题,提出一种基于CEEMDAN-SE-VMD和CNN-BIGRU组合模型的负荷预测方法。首先该模型采用自适应噪声的完全经验模态分解(CEEMDAN)处理成分复杂的原始负荷数据,经过分解后得到若干个包含不同频率成分的本征模函数(IMF)。再利用样本熵(SE)对分解后不同频率的本征模函数进行熵值聚类重组。然后,利用变分模态分解(VMD)对重组后的高频序列进行二次分解,将二次分解后得到的子序列和样本熵重组的低频序列和趋势序列数据输入卷积神经网络(CNN)网络,利用其来提取反映负荷序列复杂相关的高位特征向量。最后,再输入到双向门控循环单元(BIGRU)网络中进行预测,得到各子序列的预测结果,叠加得到最终的负荷序列预测结果。通过横向和纵向实验结果对比,证明所提出的模型能够较好地提升电力负荷预测精度。 展开更多
关键词 CEEMDAN 二次分解 样本熵 卷积神经网络 双向门控循环单元
在线阅读 下载PDF
基于挤压-激励注意力机制的CNN-LSTM煤矿用电机异常状态检测 被引量:1
14
作者 郭开宇 袁逸萍 +2 位作者 陈彩凤 陈钧钖 杜汶聪 《煤炭技术》 CAS 2024年第10期223-227,共5页
针对环境恶劣和复杂工况导致煤矿用电机故障频发,为保障煤矿用电机的可靠运行,提出一种基于挤压-激励注意力机制的CNN-LSTM煤矿用电机异常状态检测模型。首先引入卷积神经网络(CNN)获取多特征输入空间联系,采用长短期记忆网络(LSTM)提... 针对环境恶劣和复杂工况导致煤矿用电机故障频发,为保障煤矿用电机的可靠运行,提出一种基于挤压-激励注意力机制的CNN-LSTM煤矿用电机异常状态检测模型。首先引入卷积神经网络(CNN)获取多特征输入空间联系,采用长短期记忆网络(LSTM)提取序列时序变化特征,结合挤压-激励注意力机制(SE)为LSTM层进行自适应权重分配来增强电机定子电流的关键信息提取;然后通过均方根误差(RMSE)对电机定子电流进行残差分析,检测电机定子电流的异常变化;最后,以新疆某大型露天煤矿121带式输送机1#煤矿用电机实时运行状态数据验证所提方法的实用性,结果表明该方法能够精准检测到电机定子电流异常状态,为煤矿用电机可靠运行提供重要依据。 展开更多
关键词 煤矿用电机 卷积神经网络 长短期记忆网络 挤压-激励注意力机制 异常状态检测
原文传递
基于非对称卷积−压缩激发−次代残差网络的人脸关键点检测 被引量:5
15
作者 王贺兵 张春梅 《计算机应用》 CSCD 北大核心 2021年第9期2741-2747,共7页
级联深度卷积神经网络(DCNN)算法为首先在人脸关键点检测中使用卷积神经网络(CNN)的模型,CNN的使用使得检测精度得到极大的提升。针对该策略需要对相邻阶段间的数据反复进行回归处理使得算法流程十分复杂的问题,提出基于非对称卷积−压... 级联深度卷积神经网络(DCNN)算法为首先在人脸关键点检测中使用卷积神经网络(CNN)的模型,CNN的使用使得检测精度得到极大的提升。针对该策略需要对相邻阶段间的数据反复进行回归处理使得算法流程十分复杂的问题,提出基于非对称卷积−压缩激发−次代残差网络(AC-SE-ResNeXt)的人脸关键点检测算法。所提算法仅使用单阶段回归,既避免了级联策略中多阶段回归的算法流程复杂性,又解决了相邻阶段间数据需要进行预处理的问题。为了不降低精度,在次代残差网络(ResNeXt)块的基础上添加了非对称卷积(AC)模块和压缩激发(SE)模块,构建了AC-SE-ResNeXt网络模型。同时,为了能够精确拟合在不同光照、姿态、表情等复杂环境下的人脸,将AC-SEResNeXt网络模型加深到101层。对训练好的模型分别在数据集BioID和LFPW上进行测试,其中该模型在BioID数据集上的人脸五点关键点检测的综合平均误差率为1.99%,在LFPW数据集上的人脸五点关键点检测的综合平均误差率为2.3%。实验结果表明,所改进的算法不但简化了算法流程使之能进行端到端处理,而且其精度与级联DCNN算法相当,鲁棒性也有明显提升。 展开更多
关键词 人脸关键点检测 非对称卷积 压缩激发模块 卷积神经网络 次代残差网络(ResNeXt)
在线阅读 下载PDF
基于残差卷积神经网络的语音识别算法 被引量:2
16
作者 冯成立 程雯 《计算机与数字工程》 2023年第2期440-444,共5页
传统语音识别声学模型DFCNN在对语音特征进行提取的时,采用深度卷积模型只考虑了局部特征,对不同的声学特征无法抓重点选择,且训练速度较慢,难以收敛。文本针对这些问题,提出一种基于深度残差的卷积神经网络的声学模型DRCNN。结合CTC技... 传统语音识别声学模型DFCNN在对语音特征进行提取的时,采用深度卷积模型只考虑了局部特征,对不同的声学特征无法抓重点选择,且训练速度较慢,难以收敛。文本针对这些问题,提出一种基于深度残差的卷积神经网络的声学模型DRCNN。结合CTC技术,直接使用DRCNN对声学特征进行建模,使用SE-Block通道加权残差机制和深度堆叠结构,加快声学特征提取过程,增强拟合能力,提高训练速度。在此基础上搭建基于transformer的语言模型。相比传统DFCNN-HMM模型,更能学习到语音信息的深度特征,增强声学模型,语言模型鲁棒性。实验结果表明,在中文语音识别数据集,文本提出的语音识别算法相比DFCNN-HMM有在字错误率WER上有4.03%的提升。 展开更多
关键词 语音识别 CNN TRANSFORMER 自注意力机制 残差链接 SE-Block
在线阅读 下载PDF
基于深度学习的车载导航导光板表面缺陷检测研究 被引量:1
17
作者 王昊 李俊峰 《软件工程》 2022年第3期34-38,16,共6页
针对车载导航导光板表面缺陷像素值分布不均且普遍较小、背景复杂多变等特点,提出了基于改进掩膜区域卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)模型检测车载导航导光板表面缺陷的检测方法。首先,引入Pi... 针对车载导航导光板表面缺陷像素值分布不均且普遍较小、背景复杂多变等特点,提出了基于改进掩膜区域卷积神经网络(Mask Region-based Convolutional Neural Network,Mask R-CNN)模型检测车载导航导光板表面缺陷的检测方法。首先,引入PinFPN模块改进原有Mask R-CNN的特征融合网络,充分利用高低语义信息构成各级语义、位置信息兼备的共享特征层,提升整体网络的检测精度;其次,通过引入跳层连接结构和SE(Sequence and Excitation)模块对网络的分割分支进行改进,改善了传统Mask R-CNN网络语义信息获取不充分的问题;最后,通过在自建的车载导航导光板数据集上的一系列实验对比,证明了本方法在检测精度和分割上的优势,在自建数据集上的检测准确率达到了95.3%,满足工业检测的要求。 展开更多
关键词 缺陷检测 深度学习 Mask R-CNN 多尺度融合 SE模块
在线阅读 下载PDF
多尺度SE-Xception服装图像分类 被引量:20
18
作者 陈巧红 陈翊 +1 位作者 李文书 贾宇波 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第9期1727-1735,共9页
应用当前较新颖且分类性能靠前的卷积神经网络Xception作为基础网络结构,尝试采用多尺度的深度可分离卷积来提升模型特征信息的丰富度,在模型中嵌入SE-Net模块增强有用特征通道,减弱无用特征通道.实验结果表明:提出的多尺度SE-Xception... 应用当前较新颖且分类性能靠前的卷积神经网络Xception作为基础网络结构,尝试采用多尺度的深度可分离卷积来提升模型特征信息的丰富度,在模型中嵌入SE-Net模块增强有用特征通道,减弱无用特征通道.实验结果表明:提出的多尺度SE-Xception模型在2种噪声程度不同的服装数据集中均取得不错表现;ACS数据集的平均分类准确率为78.34%,分别高于VGG-16、ResNet-50和Xception模型8.52%、4.81%、3.69%;验证了多尺度SEXception模型具有更好的特征提取能力,能够提取到更多的服装信息,从而提高服装图像分类效果,一定程度上解决了特征尺度单一、信息丰富度低的问题. 展开更多
关键词 服装图像分类 多尺度SE-Xception 图像识别 深度学习 机器学习 卷积神经网络(CNN)
在线阅读 下载PDF
基于通道注意力和层次多任务的糖网视网膜病变分类
19
作者 方雨程 李瑞瑞 《中国体视学与图像分析》 2023年第4期349-359,共11页
糖尿病视网膜病变眼底图像通常病灶尺寸较小且相似度较高,容易出现误诊和漏诊等情况,对其进行准确分类是一项重要且具有挑战性的任务。针对深度卷积神经网络分类不准确的问题,本文提出利用通道注意力模块(SE)来优化特征的提取,同时设计... 糖尿病视网膜病变眼底图像通常病灶尺寸较小且相似度较高,容易出现误诊和漏诊等情况,对其进行准确分类是一项重要且具有挑战性的任务。针对深度卷积神经网络分类不准确的问题,本文提出利用通道注意力模块(SE)来优化特征的提取,同时设计了一种基于层次树的多任务分类方法,以进一步提升分类性能。本文在糖尿病视网膜病变眼底图像数据集DDR上进行了实验,本文模型在整体准确率(OA)这一项上表现最好,在DDR数据上达到了87.3%,其整体分类准确率较其基准结果有7.02%的提升。消融实验表明,本文所提出的结合SE模块和层次多任务模块均能提升糖尿病视网膜病变分类的整体精度。本文也利用层次化类激活图(LayerCAM)生成病变热图,对网络的分类依据做出可视化解释。 展开更多
关键词 卷积神经网络 眼底图像 图像分类 多任务网络 ResNet50 SE LayerCAM
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部