期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于CSC-Mamba模型的遥感图像去雾方法
1
作者 王京 何建军 +4 位作者 易善信 张俸铖 肖辉 郭洋 杨伊凡 《物探化探计算技术》 2025年第6期867-875,共9页
卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系... 卫星捕获的遥感数据容易受到成像过程中悬浮粒子的影响而造成图像雾化现象,极大地影响遥感图像的清晰度。为了弥补这一不足,遥感图像去雾(RSID)非常必要。最近兴起的状态空间模型State Space Model(SSM)在建模线性复杂性和远程依赖关系方面的性能卓越,受其启发,笔者设计了一种基于CSC-Mamba(Cross-Shaped Convolutional Mamba Model)视觉模型遥感图像去雾技术。该技术基于SSM设计了RSMamba模块,利用其线性复杂性来实现全局上下文编码,大大降低了模型的复杂度。同时,利用卷积神经网络CNN以及基于自注意力机制设计CSwin模块来聚合不同方向域上的特征,以有效地感知雾分布的空间变化特征。通过这种方式,CSC-Mamba能够更好地提取雾特征,从而有效地去除雾对遥感图像的影响。通过在SateHaze1K公共数据集上的实验,结果表明本CSC-Mamba模型遥感图像去雾技术不仅具有较好的轻量化特征的同时性,还具有较高的去雾效果。 展开更多
关键词 图像去雾 状态空间模型 卷积神经网络 自注意力机制 CSC-Mamba模型
在线阅读 下载PDF
基于BERT的多特征融合中文命名实体识别 被引量:2
2
作者 孙璐冰 康怡琳 +1 位作者 王俊 朱容波 《中南民族大学学报(自然科学版)》 CAS 2025年第1期68-74,共7页
针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCN... 针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCNN模块增强特征提取能力.前者利用相对位置编码和多头自注意力机制来捕获输入序列的隐藏特征,使模型能够考虑到字符间的距离方向信息;后者则可以对空间特征建模,获得输入序列的全局信息.通过将两个模块的输出特征进行连接,增强模型性能.实验结果表明:模型在MSRA、Resume和Weibo三个公共数据集上的F1值分别达到了95.12%、95.45%和66.14%,优于其它最新模型,验证了模型在中文命名实体识别上的有效性. 展开更多
关键词 自然语言处理 中文命名实体识别 BERT模型 迭代膨胀卷积神经网络 自注意力
在线阅读 下载PDF
融合Transformer与卷积神经网络的图像分类算法 被引量:1
3
作者 朱灵龙 王亚刚 陈怡 《电子科技》 2025年第10期96-105,共10页
在传统图像分类网络中,卷积神经网络(Convolutional Neural Network,CNN)的卷积运算需要大量乘法和累加操作,计算成本较高。Transformer模型灵活的自注意力机制使其需要大规模数据以减少过拟合风险,导致其具有较大的参数量与计算复杂度... 在传统图像分类网络中,卷积神经网络(Convolutional Neural Network,CNN)的卷积运算需要大量乘法和累加操作,计算成本较高。Transformer模型灵活的自注意力机制使其需要大规模数据以减少过拟合风险,导致其具有较大的参数量与计算复杂度。针对上述问题,文中提出一种多阶段图像分类模型HTCNet(Hybrid Transformer-Convolution Network)。在模型的浅层阶段使用部分卷积,利用特征图冗余对部分通道进行卷积运算以减少模型的浮点运算次数(Floating Point Operations,FLOPs)。在深层阶段将卷积运算加入自注意力机制,构建一种高效的自注意力机制,有效缓解模型的过拟合风险并降低对数据的依赖性。通过自适应输入分辨率能够获取更多位置信息的卷积位置编码(Convolution Positional Encoding,CPE)。HTCNet在不同规模数据集CIFAR-10和ImageNet-1K上的分类准确率分别达到95.4%和82.6%。实验结果表明与同等规模的卷积神经网络和其他Transformer模型比较,HTCNet性能更好。 展开更多
关键词 图像分类 卷积神经网络 TRANSFORMER 自注意力机制 模型融合 HTCNet 深度学习 过拟合
在线阅读 下载PDF
融合动态卷积Transformer与CMA-ES的锂电池寿命预测方法
4
作者 王雄燃 张菁 《太阳能学报》 北大核心 2025年第6期1-8,共8页
锂电池寿命预测对能源管理和维护具有重要意义,为解决预测过程中复杂的多维时间序列数据、长时间依赖关系以及特征的动态变化等问题,提出一种基于动态卷积神经网络层和Transformer(DCF)、协方差矩阵自适应调整的进化策略(CMAES)和多头... 锂电池寿命预测对能源管理和维护具有重要意义,为解决预测过程中复杂的多维时间序列数据、长时间依赖关系以及特征的动态变化等问题,提出一种基于动态卷积神经网络层和Transformer(DCF)、协方差矩阵自适应调整的进化策略(CMAES)和多头自注意力机制的锂电池寿命预测模型。DCF通过动态提取时间序列中的关键特征,降低数据维度和冗余性,捕捉长时间依赖;CMA-ES优化模型超参数,增强模型对局部特征与全局依赖的建模能力;多头自注意力机制则进一步聚焦重要特征,处理复杂的非线性动态关系。使用NASA提供的公开锂电池数据集进行实验验证,结果表明该方法的平均绝对误差最小达到0.28%,优于大部分使用同一数据集的现有方法。实验结果进一步证明,模型在预测准确度和泛化能力上均有提升,尤其在长期寿命预测中展现出更高的精度和鲁棒性,可为锂电池的寿命预测提供更为可靠的技术支持。 展开更多
关键词 锂电池 卷积神经网络 协方差矩阵 多头自注意力机制 模型超参数 非线性
原文传递
基于多信息融合分析的客户精准画像与推送算法设计 被引量:1
5
作者 齐光鹏 《现代电子技术》 北大核心 2025年第6期175-179,共5页
针对原始图卷积神经网络推送模型存在的冷启动和过平滑问题,文中基于堆叠重构网络和改进自编码器网络,提出一种针对用户画像的多信息推送模型。对于冷启动问题,在图卷积网络的输出部分,将用户画像中的评价信息嵌入到网络中,之后通过注... 针对原始图卷积神经网络推送模型存在的冷启动和过平滑问题,文中基于堆叠重构网络和改进自编码器网络,提出一种针对用户画像的多信息推送模型。对于冷启动问题,在图卷积网络的输出部分,将用户画像中的评价信息嵌入到网络中,之后通过注意力网络层提取特征信息,并对模型进行堆叠,以提升用户交互数据的质量。对于过平滑问题,增加网络层数的同时,使用改进的自编码器和度预测模块对动态图网络进行局部训练,从而提升算法的个性化推荐能力。在实验测试中,相较基线最优算法,所提算法的HR指标分别提升22.7%、12.2%,NDCG指标分别提升4.7%和6.5%。证明了该算法性能良好,能够为用户提供精确化的推送服务。 展开更多
关键词 图卷积神经网络 堆叠重构网络 用户精准画像 自注意力模型 度预测模块 推送算法
在线阅读 下载PDF
基于FFT+CNN-Transformer的雷达有源干扰识别
6
作者 徐航 程东升 李建东 《电声技术》 2025年第10期4-12,18,共10页
针对传统方法在单一时频域进行特征提取导致识别效率低下的问题,提出一种利用快速傅里叶变换(Fast Fourier Transform,FFT)获取频域信息,同时结合双通道卷积神经网络(Convolutional Neural Network,CNN)与Transformer的网络模型。首先... 针对传统方法在单一时频域进行特征提取导致识别效率低下的问题,提出一种利用快速傅里叶变换(Fast Fourier Transform,FFT)获取频域信息,同时结合双通道卷积神经网络(Convolutional Neural Network,CNN)与Transformer的网络模型。首先模型通过双通道CNN提取一维信号时频域重要特征,其次利用多头注意力机制融合两个通道提取的特征,最后经过全连接层和Softmax分类器实现识别效能。实验结果表明,该方法对6种干扰的识别率都很高,相较于传统卷积神经网络模型具有更优异的识别能力,具有较强的可靠性和优越性。 展开更多
关键词 雷达有源干扰 快速傅里叶变换(FFT) 卷积神经网络(CNN) Transformer模型 多头自注意力
在线阅读 下载PDF
基于增强Bi-LSTM的船舶运动模型辨识 被引量:2
7
作者 张浩晢 杨智博 +2 位作者 焦绪国 吕成兴 雷鹏 《中国舰船研究》 北大核心 2025年第1期76-84,共9页
[目的]针对基于数据驱动的船舶建模策略获得的模型预测精度低、适应性差等特点,提出一种增强的双向长短期记忆(Bi-LSTM)神经网络用于船舶的高精度非参数化建模。[方法]首先,利用Bi-LSTM神经网络的特点,实现对序列双向时间维度的特征提... [目的]针对基于数据驱动的船舶建模策略获得的模型预测精度低、适应性差等特点,提出一种增强的双向长短期记忆(Bi-LSTM)神经网络用于船舶的高精度非参数化建模。[方法]首先,利用Bi-LSTM神经网络的特点,实现对序列双向时间维度的特征提取。基于此,设计一维卷积神经网络(1D-CNN)提取序列的空间维度特征。然后,采用多头自注意力机制(MHSA)多角度对序列进行自适应加权处理。利用KVLCC2船舶航行数据,将所提增强Bi-LSTM模型与支持向量机(SVM)、门控循环单元(GRU)、长短期记忆神经网络(LSTM)模型的预测效果进行对比。[结果]所提增强Bi-LSTM模型在测试集中均方根误差(RMSE)、平均绝对误差(MAE)性能指标分别低于0.015和0.011,决定系数(R2)高于0.99913,预测精度显著高于SVM,GRU,LSTM模型。[结论]增强Bi-LSTM模型泛化性能优异,预测稳定性及预测精度高,有效实现了船舶的运动模型辨识。 展开更多
关键词 系统辨识 非参数化建模 一维卷积神经网络 双向长短期记忆神经网络 多头自注意力机制
在线阅读 下载PDF
基于BERT的语义增强中文文本自动摘要研究
8
作者 盖泽超 池越 周亚同 《中文信息学报》 北大核心 2025年第5期110-119,共10页
目前,基于BERT预训练的文本摘要模型效果良好。然而,预训练模型内部使用的自注意力机制倾向于关注文本中字与字之间的相关信息,对词信息关注度较低,并且在解码时存在语义理解不充分的情况。针对上述问题,该文提出了一种基于BERT的语义... 目前,基于BERT预训练的文本摘要模型效果良好。然而,预训练模型内部使用的自注意力机制倾向于关注文本中字与字之间的相关信息,对词信息关注度较低,并且在解码时存在语义理解不充分的情况。针对上述问题,该文提出了一种基于BERT的语义增强文本摘要模型CBSUM-Aux(Convolution and BERT Based Summarization Model with Auxiliary Information)。首先,使用窗口大小不同的卷积神经网络模块提取原文中的词特征信息,并与输入的字嵌入进行特征融合,之后通过预训练模型对融合特征进行深度特征挖掘。然后,在解码输出阶段,将卷积之后的词特征信息作为解码辅助信息输入解码器中指导模型解码。最后,针对束搜索算法倾向于输出短句的问题对其进行优化。该文使用LCSTS和CSTSD数据集对模型进行验证,实验结果表明,该文模型在ROUGE指标上有明显提升,生成的摘要与原文语义更加贴合。 展开更多
关键词 生成式文本摘要 预训练模型 自注意力机制 卷积神经网络 辅助信息
在线阅读 下载PDF
基于自注意力层的神经网络弹道落点预测方法
9
作者 马月红 曹彦敏 +5 位作者 李超旺 赵辰 周辉 赵慧亮 王晓成 李乾 《弹箭与制导学报》 北大核心 2025年第1期53-61,共9页
针对现有的弹道落点预测方法误差大和气象变化适应不足的问题,建立了包含气象条件的弹道数据集,并提出了一种基于自注意力层的CNN-BiLSTM-BiGRU弹道落点预测方法。在所构建的组合模型中引入自注意力层和残差连接,加强模型在处理输入序... 针对现有的弹道落点预测方法误差大和气象变化适应不足的问题,建立了包含气象条件的弹道数据集,并提出了一种基于自注意力层的CNN-BiLSTM-BiGRU弹道落点预测方法。在所构建的组合模型中引入自注意力层和残差连接,加强模型在处理输入序列时动态关注不同时刻信息的能力,缓解网络中的梯度爆炸问题。采用多维时间序列数据的输入表示方法,结合历史弹道轨迹数据和目标特征等信息,减小弹道落点预测误差。仿真结果表明,基于自注意力层的CNN-BiLSTM-BiGRU网络模型的预测效果优于其他模型,射程预测的最大误差占真实值的0.156%,横偏预测的最大误差占真实值的5.904%。文中研究为弹道落点预测领域提供了重要的参考依据。 展开更多
关键词 弹道落点预测 深度学习 弹道模型 自注意力层 卷积神经网络 长短期记忆网络 门控循环神经网络
在线阅读 下载PDF
一种基于YOLOv10s改进的无人机目标检测及识别方法
10
作者 李鹏 李鹏飞 +4 位作者 殷瑞杰 刘志青 廉博 张锴 张二威 《测绘科学技术学报》 2025年第2期204-211,共8页
无人机在现代战争中扮演着越来越重要的角色,以其难发现、难反制及超高费效比快速赢得各军事组织及作战单元的高度关注及作战使用。反无人机作战则越发成为各作战单元必备作战能力。为实现战场快速发现并检测识别无人机目标,提出一种基... 无人机在现代战争中扮演着越来越重要的角色,以其难发现、难反制及超高费效比快速赢得各军事组织及作战单元的高度关注及作战使用。反无人机作战则越发成为各作战单元必备作战能力。为实现战场快速发现并检测识别无人机目标,提出一种基于YOLOv10s改进的无人机目标检测及识别算法。首先将YOLOv10s模型骨干网络中的C2fCIB模块替换成自校准卷积SCConv模块提升网络性能,其次在颈部网络中使用轻量级上采样算子DySample替代YOLOv10s中的标准采样算子Upsample提升图像处理效率和质量,最后在头部网络前增加3组MLCA注意力模块,提升网络表达能力。结果表明:在12类无人机目标识别的训练模型中,改进的YOLOv10s算法精确度较原始YOLOv10s算法提升了2.24%,召回率提升了11.59%,平均精度值mAP50提升了4.01%,平均精度值mAP50-95提升了8.06%,推理时间减少了6.56%。为基于视频图像的无人机目标检测提供了一个高精度、高效率的解决方案。 展开更多
关键词 无人机目标 识别 YOLOv10s算法 自校准卷积 动态上采样算子 混合局部通道注意力
在线阅读 下载PDF
基于CNN-TCN的电能质量扰动信号识别模型
11
作者 于红 任行 俞瑞龙 《机电工程技术》 2025年第10期145-149,共5页
电能质量扰动信号的识别与分类是电力系统监测中的一个关键科学问题,传统方法依赖于手动特征提取,效率低且易受主观因素影响。提出了一种基于卷积神经网络(CNN)和时序卷积网络(TCN)的混合模型,结合自注意力机制,旨在解决电能质量扰动信... 电能质量扰动信号的识别与分类是电力系统监测中的一个关键科学问题,传统方法依赖于手动特征提取,效率低且易受主观因素影响。提出了一种基于卷积神经网络(CNN)和时序卷积网络(TCN)的混合模型,结合自注意力机制,旨在解决电能质量扰动信号的自动高效分类。通过利用CNN进行空间特征的精确提取和TCN加强对时间序列数据的分析处理,该模型显著提升了电能质量扰动信号的识别精度和效率。实验结果表明,该模型在多种电能质量扰动信号的处理上展现出卓越的性能,具有98.7%的测试正确率和优异的泛化能力。不仅成功验证了混合模型在处理电能质量扰动信号分类任务中的有效性,还展示了混合深度学习技术在电力系统监测领域的巨大应用潜力。 展开更多
关键词 电能质量扰动信号识别 分类模型 卷积神经网络 时序卷积网络 卷自注意力机制
在线阅读 下载PDF
基于注意力机制的循环卷积方法在长江感潮河段潮位预测中的应用
12
作者 张典豪 冯思敏 吴艳鸣 《中国水利》 2025年第14期47-55,共9页
针对传统潮位预测模型在水文特征深度提取和长时序依赖关系建模中的不足,研究构建了融合深度学习技术的预测方法,以提升长江下游复杂水文条件下的潮位预报精度。基于卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)与transformer的协同... 针对传统潮位预测模型在水文特征深度提取和长时序依赖关系建模中的不足,研究构建了融合深度学习技术的预测方法,以提升长江下游复杂水文条件下的潮位预报精度。基于卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)与transformer的协同机制,提出CNN-BiLSTM-transformer耦合模型,模型采用CNN提取水位序列多尺度空间特征,通过BiLSTM捕捉双向时序关联,并引入transformer注意力机制解析长程依赖关系。基于天生港潮位站2012—2024年逐时观测数据开展实证研究,结果表明,在24 h、48 h、60 h、80 h预见期下,模型的均方根误差(MSE)较BiLSTM基准模型分别降低了88.38%、89.85%、91.04%、93.90%。随着预测周期的延长,模型预测精度进一步提升,验证了模型在长周期预测中的有效性。这主要得益于时空耦合注意力机制对空间和时间依赖性的协同建模,以及transformer注意力机制对长程依赖关系的有效捕捉。本模型有效解决了水文预测中的时空特征耦合难题,其预测成果可为长江口防洪调度提供高精度的决策支持。 展开更多
关键词 潮位预测 卷积神经网络(CNN) 循环神经网络 双向长短期记忆神经网络(BiLSTM) 自注意力模型(transformer) 长江下游 潮位
在线阅读 下载PDF
面向信息与通信技术供应链网络画像构建的文本语义匹配方法 被引量:7
13
作者 罗森林 杨俊楠 +1 位作者 潘丽敏 吴舟婷 《北京理工大学学报》 EI CAS CSCD 北大核心 2021年第8期864-872,共9页
针对信息与通信技术(information and communication,ICT)项目及产品数据种类多、形式复杂,难以提取其语义匹配信息,且现有句子级文本匹配模型对不同长度文本无差别编码会引入噪声导致匹配效果差的问题,本文提出一种融合局部和全局特征... 针对信息与通信技术(information and communication,ICT)项目及产品数据种类多、形式复杂,难以提取其语义匹配信息,且现有句子级文本匹配模型对不同长度文本无差别编码会引入噪声导致匹配效果差的问题,本文提出一种融合局部和全局特征的实体文档级联合匹配模型,利用TextCNN编码器提取实体级招投标项目和产品名称的局部信息,消除产品描述中与招投标项目无关信息的影响,再利用卷积-自注意力编码器提取文档级产品描述的局部和全局信息,最后结合实体级和文档级匹配信息进行决策.实验结果表明,招投标项目与供应商产品匹配映射准确率92%以上,方法可直接实际应用. 展开更多
关键词 信息与通信技术供应链 文本匹配 卷积网络 自注意力网络 联合匹配模型
在线阅读 下载PDF
融合序列语法知识的卷积-自注意力生成式摘要方法 被引量:3
14
作者 罗森林 王睿怡 +2 位作者 吴倩 潘丽敏 吴舟婷 《北京理工大学学报》 EI CAS CSCD 北大核心 2021年第1期93-101,共9页
针对基于编码-解码的生成式摘要模型不能充分提取语法知识导致摘要出现不符合语法规则的问题,循环神经网络易遗忘历史信息且训练时无法并行计算导致处理长文本时生成的摘要主旨不显著以及编码速度慢的问题,提出了一种融合序列语法知识... 针对基于编码-解码的生成式摘要模型不能充分提取语法知识导致摘要出现不符合语法规则的问题,循环神经网络易遗忘历史信息且训练时无法并行计算导致处理长文本时生成的摘要主旨不显著以及编码速度慢的问题,提出了一种融合序列语法知识的卷积-自注意力生成式摘要方法.该方法对文本构建短语结构树,将语法知识序列化并嵌入到编码器中,使编码时能充分利用语法信息;使用卷积-自注意力模型替换循环神经网络进行编码,更好学习文本的全局和局部信息.在CNN/Daily Mail语料上进行实验,结果表明提出的方法优于当前先进方法,生成的摘要更符合语法规则、主旨更显著且模型的编码速度更快. 展开更多
关键词 生成式摘要 编码-解码模型 语法分析 卷积-自注意力模型 注意力机制
在线阅读 下载PDF
基于空间信息关注和纹理增强的短小染色体分类方法
15
作者 彭文 林金炜 《图学学报》 CSCD 北大核心 2024年第5期1017-1029,共13页
染色体分类是核型分析中的重要任务之一。尽管残差神经网络已经在染色体分类领域取得了显著成就,但由于部分染色体具有长度较短、分类特征难以识别以及形态相似度较高的特点,使得其分类仍然具有挑战性。提出了基于空间信息关注和纹理增... 染色体分类是核型分析中的重要任务之一。尽管残差神经网络已经在染色体分类领域取得了显著成就,但由于部分染色体具有长度较短、分类特征难以识别以及形态相似度较高的特点,使得其分类仍然具有挑战性。提出了基于空间信息关注和纹理增强的染色体分类模型(SIATE-Net),以Inception_ResNetV2模型作为骨干网络提取染色体的深层特征,自注意力机制和深度可分离卷积的引入能够更好地关注和保留短小染色体的空间信息。染色体长度较短易造成显带信息混淆,模型融入了纹理增强机制以扩大染色体间的差异性,为分类任务增加更多的判定依据。SIATE-Net模型分别在私人数据集与公开数据集上进行验证,分类性能明显优于其他方法,尤其是短小染色体。在私人数据集上,SIATE-Net模型表现出了最佳的总体分类准确率98.05%,短小染色体分类精度高达97.42%。在公开数据集上,SIATE-Net模型的总体分类准确率为98.95%,而短小染色体也达到了98.51%。实验结果表明,具有较强针对性的自注意力模块、深度可分离卷积和纹理增强模块在不降低整体分类准确性的前提下,能够有效地解决短小染色体分类任务。 展开更多
关键词 医学图像处理 短小染色体分类 Inception_ResNetV2模型 自注意力机制 深度可分离卷积 纹理增强
在线阅读 下载PDF
一种基于模型压缩的行人重识别方法
16
作者 关晓惠 孙欣欣 《浙江水利水电学院学报》 2022年第4期85-90,共6页
深度学习模型在行人重识别领域虽已取得较大的发展,但由于对计算力和存储空间的要求比较高,仍然制约着其在开放空间中的应用。针对上述问题,提出一种通道剪枝、分组卷积、自注意力机制优化组合策略进行行人重识别模型压缩,提升模型在开... 深度学习模型在行人重识别领域虽已取得较大的发展,但由于对计算力和存储空间的要求比较高,仍然制约着其在开放空间中的应用。针对上述问题,提出一种通道剪枝、分组卷积、自注意力机制优化组合策略进行行人重识别模型压缩,提升模型在开放空间中的精准度和高效率。此方法可根据具体场景的需求灵活组合、获得适用于边缘智能设备的最佳Re-ID模型,具有高效、灵活、易拓展等特性。 展开更多
关键词 行人重识别 模型压缩 通道剪枝 分组卷积 自注意力机制
在线阅读 下载PDF
基于ELMo-GCN的核电领域命名实体识别 被引量:5
17
作者 荆鑫 王华峰 +2 位作者 刘潜峰 罗嗣梧 张凡 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第12期2556-2565,共10页
在核电领域的知识管理过程中,需要使用命名实体识别技术抽取高质量语义实体,以进行核电领域文本的智能分析和处理。在现有研究的基础上,通过增强网络对上下文信息的提取能力,提升模型对嵌套命名实体的识别准确率。经实验验证,所提方法... 在核电领域的知识管理过程中,需要使用命名实体识别技术抽取高质量语义实体,以进行核电领域文本的智能分析和处理。在现有研究的基础上,通过增强网络对上下文信息的提取能力,提升模型对嵌套命名实体的识别准确率。经实验验证,所提方法较现有方法在准确率与召回率指标上提升显著,与BiFlaG网络对比,准确率提高9.52%,召回率提高8.51%,F_(1)值提高9.02%。所提方法对嵌套命名实体识别优于BiFlaG等网络。 展开更多
关键词 命名实体识别 核电 双向语言模型 图卷积神经网络 自注意力机制
原文传递
基于混合特征网络的学生评教文本情感分析模型 被引量:4
18
作者 吴奇林 党亚固 +2 位作者 熊山威 吉旭 毕可鑫 《计算机工程》 CAS CSCD 北大核心 2023年第11期24-29,39,共7页
以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合... 以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示,解决传统词向量模型存在的一词多义问题,增强向量语义表示的准确性;混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层,全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息,提升模型的深层次特征表示能力,自注意力机制通过计算每个分类特征对分类结果的重要程度,识别出对情感识别结果影响较大的关键特征,避免无关特征对结果造成干扰,影响分类性能,将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明,该模型F1值达到97.8%,高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外,消融实验结果也证明了各模块的有效性。 展开更多
关键词 情感分析 预训练模型 自注意力 双向简单循环单元 多尺度卷积网络
在线阅读 下载PDF
基于多块和自注意TCN结合的冷水机组故障诊断 被引量:3
19
作者 孙雨 丁强 +1 位作者 夏宇栋 李聪 《过程工程学报》 CAS CSCD 北大核心 2024年第2期162-171,共10页
针对冷水机组故障运行数据特征参数耦合且时序特征难以提取的问题,提出一种基于多块和自注意时间卷积网络(Multiblock Self-attention Temporal Convolutional Networks,MB-SATCN)的故障诊断模型。该模型根据冷水机组传感器与系统结构... 针对冷水机组故障运行数据特征参数耦合且时序特征难以提取的问题,提出一种基于多块和自注意时间卷积网络(Multiblock Self-attention Temporal Convolutional Networks,MB-SATCN)的故障诊断模型。该模型根据冷水机组传感器与系统结构的物理关系将变量划分为多个子块,在子块中使用TCN挖掘冷水机组运行数据的特征信息,并通过自注意力层加强关键特征对故障诊断结果的影响权重,然后将各子块模型输出的局部特征利用自注意力机制加权融合以构建全局特征,并使用softmax函数进行分类。与对照方法相比,MB-SATCN方法在冷水机组常见故障诊断方面表现更优,对系统故障识别能力更强,平均故障诊断精确率和平均召回率均在97%以上。 展开更多
关键词 冷水机组 故障诊断 时间卷积网络 自注意力机制 算法 神经网络 模型
原文传递
基于季节分解的混合神经网络的时间序列预测 被引量:6
20
作者 徐筠雯 陈宗镭 +1 位作者 李天瑞 李崇寿 《计算机科学》 CSCD 北大核心 2024年第S02期543-549,共7页
近年来,时间序列预测已经在金融、气象、军事等多个领域得到广泛应用。深度学习已开始在时间序列预测任务中展现巨大的潜力和应用前景。其中,循环神经网络在跨度较大的时间序列预测中容易出现信息丢失和梯度爆炸等问题。而Transformer... 近年来,时间序列预测已经在金融、气象、军事等多个领域得到广泛应用。深度学习已开始在时间序列预测任务中展现巨大的潜力和应用前景。其中,循环神经网络在跨度较大的时间序列预测中容易出现信息丢失和梯度爆炸等问题。而Transformer模型及其变种在使用注意力机制时通常忽略了时间序列变量之间的时序关系。为了应对这些问题,提出了一种基于季节分解的混合神经网络时间序列预测模型。该模型利用季节分解模块来捕获时间序列中不同周期频率分量的变化,同时通过融合多头注意力机制和复合扩张卷积层,利用全局信息和局部信息的交互获取数据之间的多尺度时序位置信息。最终,在4个领域的公开数据集上进行了实验,结果表明模型的预测性能优于当前的主流方法。 展开更多
关键词 时间序列预测 季节分解 注意力机制 扩张卷积 混合模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部