期刊文献+
共找到7,866篇文章
< 1 2 250 >
每页显示 20 50 100
An Image Inpainting Approach Based on Parallel Dual-Branch Learnable Transformer Network
1
作者 Rongrong Gong Tingxian Zhang +2 位作者 Yawen Wei Dengyong Zhang Yan Li 《Computers, Materials & Continua》 2025年第10期1221-1234,共14页
Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of im... Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of image in tasks and the growth of data scale,existing deep learning methods still have some limitations.For example,they lack the ability to capture long-range dependencies and their performance in handling multi-scale image structures is suboptimal.To solve this problem,the paper proposes an image inpainting method based on the parallel dual-branch learnable Transformer network.The encoder of the proposed model generator consists of a dual-branch parallel structure with stacked CNN blocks and Transformer blocks,aiming to extract global and local feature information from images.Furthermore,a dual-branch fusion module is adopted to combine the features obtained from both branches.Additionally,a gated full-scale skip connection module is proposed to further enhance the coherence of the inpainting results and alleviate information loss.Finally,experimental results from the three public datasets demonstrate the superior performance of the proposed method. 展开更多
关键词 Artificial intelligence image inpainting transformer network dual-branch fusion gated full-scale skip connection
在线阅读 下载PDF
局部特征增强的磁共振图像Transformer重构 被引量:1
2
作者 熊承义 陈文旗 +2 位作者 高志荣 马帅 李帆 《中南民族大学学报(自然科学版)》 CAS 2025年第1期50-57,共8页
研究了一种基于多头自注意力与卷积特征融合的磁共振图像Transformer重构方法.采用U型网络结构,通过学习图像的多尺度特征以提升重构性能.采用深度分离卷积与多头自注意力融合的Swin Transformer结构,改善网络的特征学习能力.在CC359-Br... 研究了一种基于多头自注意力与卷积特征融合的磁共振图像Transformer重构方法.采用U型网络结构,通过学习图像的多尺度特征以提升重构性能.采用深度分离卷积与多头自注意力融合的Swin Transformer结构,改善网络的特征学习能力.在CC359-Brain数据集下基于多种采样模式进行仿真实验,结果证明了该方法在提升磁共振图像重构质量与降低系统复杂度方面的有效性. 展开更多
关键词 磁共振成像 卷积神经网络 变换器 深度学习
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
3
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 transformER 注意力模块 梯度融合
在线阅读 下载PDF
融合Gabor滤波与Transformer的图像水印方法 被引量:1
4
作者 张天骐 谭霜 +1 位作者 沈夕文 唐娟 《信号处理》 北大核心 2025年第4期694-705,共12页
图像水印在数字版权保护和身份验证领域中具有关键意义,是保护图像信息安全和确保数据可信性的重要技术手段。目前,大多数已发表的基于深度学习的图像水印方法都是基于卷积神经网络设计的,此类方法存在无法充分捕捉图像的全局信息和细... 图像水印在数字版权保护和身份验证领域中具有关键意义,是保护图像信息安全和确保数据可信性的重要技术手段。目前,大多数已发表的基于深度学习的图像水印方法都是基于卷积神经网络设计的,此类方法存在无法充分捕捉图像的全局信息和细节信息,以及忽略图像高频信息具备稳定和不可感知特点等问题,为了克服上述问题,该论文提出一种融合Gabor滤波与Transformer的图像水印模型。该模型由嵌入网络、提取网络和判别网络组成:在嵌入网络设计了水印信息处理模块对水印信息引入冗余和扩展操作,以增加水印信息在传输过程中的鲁棒性;在嵌入网络引入Gabor滤波的思想在特征提取模块通过卷积分支来捕捉局部特征,通过Transformer分支捕捉全局信息,来充分挖掘图像的稳定特征;在提取网络中融合标准卷积和差分卷积,来准确感知图像的细微信息,进而提高水印的提取精度;引入判别网络与嵌入网络形成对抗训练关系,评估生成水印图像的真实性和质量,从而提升嵌入网络生成水印图像的视觉质量。分别在COCO、ImageNet和VOC2012数据集下进行综合对比实验,结果表明,该文方法针对不可感知性和鲁棒性,相比于相关水印模型取得了更优的指标,具有较为突出的增强性能与泛化能力。此外,还进行了相关的消融实验,结果进一步验证了该模型的可靠性和有效性。 展开更多
关键词 图像水印 不可感知 鲁棒性 卷积神经网络 transformER
在线阅读 下载PDF
融合CNN与Transformer的遥感影像道路信息提取
5
作者 曲海成 王莹 +1 位作者 刘腊梅 郝明 《自然资源遥感》 北大核心 2025年第1期38-45,共8页
利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络... 利用高分辨率遥感影像进行道路信息提取时,深度神经网络很难同时学习影像全局上下文信息和边缘细节信息,为此,该文提出了一种同时学习全局语义信息和局部空间细节的级联神经网络。首先将输入的特征图分别送入到双分支编码器卷积神经网络(convolutional neural networks,CNN)和Transformer中,然后,采用了双分支融合模块(shuffle attention dual branch fusion block,SA-DBF)来有效地结合这2个分支学习到的特征,从而实现全局信息与局部信息的融合。其中,双分支融合模块通过细粒度交互对这2个分支的特征进行建模,同时利用多重注意力机制充分提取特征图的通道和空间信息,并抑制掉无效的噪声信息。在公共数据集Massachusetts道路数据集上对模型进行测试,准确率(overall accuracy,OA)、交并比(intersection over union,IoU)和F 1等评价指标分别达到98.04%,88.03%和65.13%;与主流方法U-Net和TransRoadNet等进行比较,IoU分别提升了2.01个百分点和1.42个百分点,实验结果表明所提出的方法优于其他的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 级联神经网络 transformER 特征融合 注意力机制
在线阅读 下载PDF
基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络 被引量:1
6
作者 陶永鹏 柏诗淇 周正文 《计算机应用》 北大核心 2025年第7期2378-2386,共9页
脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人... 脑胶质瘤在磁共振成像(MRI)图像中的形状大小变化大、边界模糊且组织结构复杂,这些特点导致了脑肿瘤分割任务的挑战性,通常这种任务需要具备深厚专业知识的研究人员设计复杂定制的网络模型才能完成。这一过程不仅耗时,而且需要大量的人力资源。为了简化网络设计流程并自动获取最优的网络结构,提出一种基于卷积和Transformer神经网络架构搜索的脑胶质瘤多组织分割网络(NASCT-Net),以在构建用于多模态MRI脑肿瘤分割的网络架构的过程中,提高分割的精确度。首先,将神经架构搜索(NAS)技术应用于编码器的构建,形成可堆叠的NAS编解码模块,以自动优化适用于脑胶质瘤精准分割的网络架构;其次,在编码器底层集成基于Transformer的特征编码模块,以增强对肿瘤各组之间的相对位置和全局信息的表征能力;最后,通过构建体积加权Dice损失函数(VWDiceLoss),解决前景与背景的不平衡问题。在BraTS2019脑肿瘤数据集上与Swin-Unet等方法进行比较的实验结果表明,NASCT-Net的平均Dice相似系数(DSC)提高了0.009,同时平均Hausdorff距离(HD)降低了1.831 mm,验证了NASCT-Net在提高脑肿瘤多组织分割精度方面的有效性。 展开更多
关键词 网络架构 神经网络架构搜索 脑肿瘤分割 卷积神经网络 transformER
在线阅读 下载PDF
基于GAN和Transformer模型组合的格陵兰地区PWV短时预报方法
7
作者 张胜凯 胡希成 +4 位作者 龚力 雷锦韬 李文浩 马超 肖峰 《大地测量与地球动力学》 北大核心 2025年第9期881-887,893,共8页
基于2010—2018年GPS反演的PWV时间序列数据以及同时期ERA5再分析资料计算的格陵兰地区PWV数据,采用深度学习中的生成对抗网络模型(GAN)和Transformer神经网络模型组合,实现由GPS-PWV数据对格陵兰地区PWV数据的短时预报。采用2019年的E... 基于2010—2018年GPS反演的PWV时间序列数据以及同时期ERA5再分析资料计算的格陵兰地区PWV数据,采用深度学习中的生成对抗网络模型(GAN)和Transformer神经网络模型组合,实现由GPS-PWV数据对格陵兰地区PWV数据的短时预报。采用2019年的ERA5数据对预测结果进行评估,结果表明,模型在大部分地区表现较好,RMSE优于4.5 mm,相关系数大于0.7。在春、秋、冬季,相关系数均高于0.5;受天气剧烈变化影响,夏季少部分时间相关系数略低。该方法能够预测格陵兰地区PWV的空间分布和随时间的变化情况。 展开更多
关键词 生成对抗网络 transformER GPS 格陵兰 PWV 短时预报
在线阅读 下载PDF
基于Transformer和多关系图卷积网络的行人轨迹预测 被引量:3
8
作者 刘桂红 周宗润 孟祥福 《计算机科学与探索》 北大核心 2025年第5期1353-1364,共12页
在自动导航应用领域,行人轨迹相对复杂,有效且合理地预测行人未来轨迹对自动驾驶和出行安全至关重要。行人轨迹随机性和动态性极高且与交通环境有着复杂相互作用,因此需要对行人的时间依赖性和空间相互作用进行合理建模。为了解决该问题... 在自动导航应用领域,行人轨迹相对复杂,有效且合理地预测行人未来轨迹对自动驾驶和出行安全至关重要。行人轨迹随机性和动态性极高且与交通环境有着复杂相互作用,因此需要对行人的时间依赖性和空间相互作用进行合理建模。为了解决该问题,提出了一种基于Transformer和多关系图卷积网络(GCN)的行人轨迹预测模型。该模型由交互捕获模块、锚点控制模块和轨迹修正补全模块构成。交互捕获模块由T-Transformer和多关系图卷积网络组成,分别提取每个行人在时间序列和空间序列上的运动特征,并结合锚点控制模块推断行人的中间目的地以减少递归累计误差,由修正补全模块进行最终轨迹细化。在提取特征时添加逆关系可得到更为优化的结果,使用高斯剪枝减少虚假路径的生成也可提高模型效率。在ETH与UCY数据集上的实验结果表明,在平均位移误差(ADE)和最终位移误差(FDE)方面,该模型具有比现有大部分主流模型更好的性能。由于该模型在行人轨迹预测上的出色性能,可避免不必要的轨迹变更和碰撞风险,为行人轨迹预测应用提供了更为可能的解决方案。 展开更多
关键词 T-transformer 图卷积网络(GCN) 锚点控制 行人轨迹预测
在线阅读 下载PDF
多变量时序标记Transformer及其在电潜泵故障诊断中的应用 被引量:2
9
作者 李康 李爽 +2 位作者 高小永 李强 张来斌 《控制与决策》 北大核心 2025年第4期1145-1153,共9页
电潜泵故障诊断对于确保安全可靠采油至关重要,但是,电潜泵数据呈现出的多变量、非线性和动态变化等复杂特性为该任务带来了严峻挑战.近年来,深度学习在复杂数据特征提取方面表现出的强大能力催生了一系列基于神经网络的电潜泵故障诊断... 电潜泵故障诊断对于确保安全可靠采油至关重要,但是,电潜泵数据呈现出的多变量、非线性和动态变化等复杂特性为该任务带来了严峻挑战.近年来,深度学习在复杂数据特征提取方面表现出的强大能力催生了一系列基于神经网络的电潜泵故障诊断方法.然而,多数方法忽略了电潜泵数据的动态特性以及长时依赖特征提取困难的问题.针对上述问题,提出一种多变量时序标记Transformer神经网络来实现电潜泵故障诊断.该模型设计新的多变量时间序列标记策略,继承引入多头注意力机制和残差连接的传统Transformer神经网络编码器在长时依赖特征提取方面的优势,用前向神经网络替代传统Transformer神经网络解码器来简化模型复杂度.通过对油田现场故障数据分析,验证所提出方法的有效性.实验结果表明,所提出方法实现了10类电潜泵故障的精确诊断,相比于流行的深度学习方法诊断性能更优. 展开更多
关键词 电潜泵 transformer神经网络 深度学习 特征提取 故障诊断 多变量时序标记
原文传递
基于CNN和Transformer双流融合的人体姿态估计
10
作者 李鑫 张丹 +2 位作者 郭新 汪松 陈恩庆 《计算机工程与应用》 北大核心 2025年第5期187-199,共13页
卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transfor... 卷积神经网络(CNN)和Transformer模型在人体姿态估计中有着广泛应用,然而Transformer更注重捕获图像的全局特征,忽视了局部特征对于人体姿态细节的重要性,而CNN则缺乏Transformer的全局建模能力。为了充分利用CNN处理局部信息和Transformer处理全局信息的优势,构建一种CNN-Transformer双流的并行网络架构来聚合丰富的特征信息。由于传统Transformer的输入需要将图片展平为多个patch,不利于提取对位置敏感的人体结构信息,因此将其多头注意力结构进行改进,使模型输入能够保持原始2D特征图的结构;同时提出特征耦合模块融合两个分支不同分辨率下的特征,最大限度地保留局部特征与全局特征;最后引入改进后的坐标注意力模块(coordinate attention),进一步提升网络的特征提取能力。在COCO和MPII数据集上的实验结果表明所提模型相对目前主流模型具有更高的检测精度,从而说明所提模型能够充分捕获并融合人体姿态中的局部和全局特征。 展开更多
关键词 卷积神经网络 transformER 局部特征 全局特征 2D特征图 特征耦合
在线阅读 下载PDF
基于Transformer与注意力机制的肺部肿瘤分割方法
11
作者 曾安 王丹 +4 位作者 杨宝瑶 张小波 石镇维 刘再毅 潘丹 《广东工业大学学报》 2025年第1期24-32,共9页
肺部肿瘤的准确分割对于肿瘤的诊断和治疗具有重要作用,然而肺部肿瘤分割中存在病灶与周围组织的对比度低、肿瘤与正常组织易粘连和背景噪声大等问题。针对这些问题,本文提出了一种基于Transformer和注意力机制的肺部肿瘤分割方法。在Tr... 肺部肿瘤的准确分割对于肿瘤的诊断和治疗具有重要作用,然而肺部肿瘤分割中存在病灶与周围组织的对比度低、肿瘤与正常组织易粘连和背景噪声大等问题。针对这些问题,本文提出了一种基于Transformer和注意力机制的肺部肿瘤分割方法。在Transformer编码器阶段引入全局和局部的注意力机制,使得网络可以同时关注全局和局部的上下文信息;在跳跃连接阶段,使用通道优先卷积注意力机制,可以增强复杂病灶的空间感知能力和降低通道维度冗余,从而提高肿瘤的分割精度。在私有数据集GDPH和公共数据集LUNG1上的测试结果表明,本文方法相比其他8种分割方法,Dice指标在两个数据集上表现最优,分别为90.96%和88.18%,可以为临床的诊疗提供可靠辅助。 展开更多
关键词 肺部肿瘤 医学图像分割 卷积神经网络 transformER 注意力机制
在线阅读 下载PDF
基于STGCN-Transformer的短期电力净负荷预测
12
作者 孟伟 俞斌 +3 位作者 白隆 徐婕 顾晋豪 郭锋 《中国测试》 北大核心 2025年第6期160-169,共10页
智能电网的发展认识到短期电力净负荷预测对综合能源系统(integrated energy system,IES)的重要性。净负荷预测代表用电负荷与安装的可再生能源之间的差异,是能量管理和优化调度的基础。为解决IES波动性大,传统统计模型预测精较差的问题... 智能电网的发展认识到短期电力净负荷预测对综合能源系统(integrated energy system,IES)的重要性。净负荷预测代表用电负荷与安装的可再生能源之间的差异,是能量管理和优化调度的基础。为解决IES波动性大,传统统计模型预测精较差的问题,该文提出一种基于时空图卷积网络(spatial temporal graph convolutional networks,STGCN)和Transformer相结合的综合能源系统短期负荷预测模型。首先,利用STGCN作为输入嵌入层对多元输入序列进行编码,填补Transformer中没有充分考虑相关信息的空白。然后,利用Transformer中的自注意机制捕获序列数据的时间依赖性。最后,利用前馈神经网络输出预测负荷值。以浙江省某地区电力数据集为例,与其他4种预测模型相比较平均绝对百分比误差均在5%以内,结果表明该文模型具有较高的预测精度和稳定性。 展开更多
关键词 时空图卷积网络 transformER 多头注意力机制 短期净负荷预测
在线阅读 下载PDF
基于音乐情感的ERoPE-Transformer音乐生成方法 被引量:1
13
作者 张玉梅 陈章杰 +2 位作者 吕小姣 延成岭 卢恒 《榆林学院学报》 2025年第2期78-86,共9页
针对音乐生成缺乏情感表达和交互性的问题,提出一种基于音乐情感的ERoPE-Transformer音乐生成方法。基于情感的旋转位置编码Transformer模型(Emotion Rotary Position Embedding Transformer,ERoPE-Transformer)以CP Transformer模型为... 针对音乐生成缺乏情感表达和交互性的问题,提出一种基于音乐情感的ERoPE-Transformer音乐生成方法。基于情感的旋转位置编码Transformer模型(Emotion Rotary Position Embedding Transformer,ERoPE-Transformer)以CP Transformer模型为基础模型,在CP编码的基础上加入情感标签,将音乐序列转换成离散的符号序列,并且引入旋转位置编码,提高模型的外推性,更好地捕获长序列建模中的音乐信息和情感特征。最后通过客观和主观实验对音乐质量和情感效果进行验证,与其他常用的音乐生成模型进行比较,包括Transformer-XL模型、CP Transformer模型和CEG-Transformer模型。客观实验从音高、节奏和音乐结构三个方面评价音乐质量,同时采用DUPSO-DSKSVM民歌快速分类算法对音乐情感进行分类,以验证生成音乐的情感效果。主观实验通过人耳听力测试从不同方面对音乐质量进行打分评价,同时使用人耳听力测试对音乐的情感效果进行评价。实验结果表明,本文提出的ERoPE-Transformer模型在音乐质量和情感表达上都有很好的效果,优于其他三种方法。 展开更多
关键词 情感音乐生成 transformer网络 旋转位置编码
在线阅读 下载PDF
基于融合卷积Transformer的航空发动机故障诊断 被引量:2
14
作者 赵洪利 杨佳强 《北京航空航天大学学报》 北大核心 2025年第4期1117-1126,共10页
航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊... 航空发动机长期处于恶劣的气路环境下工作会面临腐蚀、侵蚀等问题,且故障参数特征不明显,因此,精准的航空发动机故障诊断方法对保证飞机安全运行具有重要意义。为提高预测准确性,提出了一种基于融合卷积Transformer的航空发动机故障诊断方法。利用自注意力机制提取有用特征,抑制冗余信息,并将最大池化层引入Transformer模型中,进一步降低模型内存消耗及参数量,缓解过拟合现象。采用基于GasTurb建模的涡扇发动机仿真数据集进行验证,结果与Transformer模型和反向传播(BP)神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等传统深度学习模型相比,准确率分别提高了6.552%和28.117%、13.189%、10.29%,证明了所提方法的有效性,可为航空发动机故障诊断提供一定的参考。 展开更多
关键词 航空发动机 故障诊断 自注意力机制 融合卷积transformer 深度神经网络
原文传递
基于DRSN-Transformer编码器的域自适应辐射源个体识别方法研究
15
作者 张冠杰 李艳斌 +1 位作者 畅鑫 闫红超 《河北工业科技》 2025年第4期303-313,共11页
为了使深度神经网络能够准确识别不同传输信道的辐射源个体,提出了一种基于深度残差收缩网络(deep residual shrinkage network,DRSN)融合Transformer编码器的域自适应个体识别方法。采用DRSN软阈值模块自动去掉I/Q接收信号中的噪声,利... 为了使深度神经网络能够准确识别不同传输信道的辐射源个体,提出了一种基于深度残差收缩网络(deep residual shrinkage network,DRSN)融合Transformer编码器的域自适应个体识别方法。采用DRSN软阈值模块自动去掉I/Q接收信号中的噪声,利用Transformer编码器进一步提取信号中各符号间的依赖特征,使用域自适应对抗学习方法将不同域的目标信号映射为相同分布的目标特征,使得DRSN-Transformer编码器网络模型能够准确提取与信道无关的射频指纹特征(radio frequency fingerprint,RFF),实现信道变化时目标辐射源个体的精准识别,并利用调制器畸变信号模型进行了仿真试验。结果表明:与ResNet和DRSN网络模型相比,所提DRSN-Transformer网络模型的平均识别准确率分别提升了2.98个百分点和1.65个百分点;采用域自适应对抗学习方法的DRSN-Transformer编码器网络模型能够有效降低源域和目标域信号特征分布的不一致性,与传统方法训练的DRSN-Transformer编码器网络模型相比,在信噪比为27 dB时,识别准确率提升了20.73个百分点,显著改善了信道变化时的辐射源个体识别性能。与传统学习方法相比,所提方法虽然增加了特征提取网络与域判别网络的对抗训练过程,但训练完成的特征提取网络能够准确提取与信道变化无关的指纹特征,在辐射源个体识别领域具有一定的应用价值。 展开更多
关键词 计算机神经网络 深度残差收缩网络 transformer编码器 域对抗神经网络 特定辐射源识别 信道自适应
在线阅读 下载PDF
不均衡样本下轴承故障的LSGAN‑Swin Transformer诊断方法
16
作者 刘杰 谭玉涛 +1 位作者 谷艳玲 杨娜 《振动工程学报》 北大核心 2025年第8期1775-1787,共13页
针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或... 针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或缺少的轴承数据集,引入窗口自注意力网络进行轴承故障状态识别,使用两种数据集验证所提方法的有效性,并分别与SGAN、WGAN进行对比,证明LSGAN生成的数据训练模型具有更高的准确率。在小样本条件下训练LSGAN,将所提Swin Transformer(Swin-T)模型与CNN、AlexNe和SqueezeNet进行对比,诊断准确率分别提升了34.85%、13.45%和12.95%。通过t-SNE可视化分析对模型分类效果进行评估,结果表明,LSGAN-Swin-T模型在训练样本数量较少时仍能较好地满足故障诊断中的需求,为不均衡数据下的轴承故障诊断研究提供思路。 展开更多
关键词 故障诊断 滚动轴承 不均衡样本 最小二乘生成对抗网络 Swin transformer
在线阅读 下载PDF
CNN结合Transformer的高光谱图像和LiDAR数据协同地物分类方法
17
作者 吴海滨 左云逸 +2 位作者 王爱丽 吕浩然 王敏慧 《仪器仪表学报》 北大核心 2025年第8期286-301,共16页
在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Tran... 在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Transformer的高光谱图像和LiDAR数据的多模态遥感数据协同地物分类方法。首先,该模型通过主成分分析对高光谱图像进行降维处理以去除光谱的冗余信息,继而利用CNN分层捕获局部纹理特征,同时借助Transformer自注意力机制构建全局光谱-空间表征。然后通过双向特征交互机制,将Transformer输出的全局上下文信息注入CNN特征通道,同时将CNN通道提取的局部细节反馈至Transformer支路,经特征耦合单元实现跨尺度特征对齐,强化模型对高光谱图像全局结构与局部细节的联合提取能力。对于LiDAR数据,采用动态卷积级联模块有效捕获高程信息和上下文关系,最终通过跨模态特征融合模块实现双源数据特征的深度交互与融合,在双模态语义互补中提升复杂地物的分类精度。在Houston2013、Trento和Augsburg这3个公开数据集上的实验表明,该方法总体分类精度分别达到99.85%、99.68%和97.34%,平均准确率分别达到99.87%、99.34%和90.60%,较GLT、HCT等主流方法的分类精度有所提高,充分证明所提方法进行多模态数据协同分类的优势和有效性。 展开更多
关键词 高光谱图像 LIDAR数据 transformER 卷积神经网络 多模态数据
原文传递
一种3D可变形卷积结合Transformer的视频压缩感知方法
18
作者 杜秀丽 朱金耀 +2 位作者 高星 吕亚娜 邱少明 《计算机科学》 北大核心 2025年第11期150-156,共7页
面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有... 面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有待进一步提高。随着深度学习技术的引入,基于深度学习的分布式视频压缩感知给视频压缩感知重构提供了新思路。因此,结合3D可变形卷积与Transformer构建CS3Dformer网络,利用3D可变形卷积捕获视频的局部特征和时空特征的有效性,学习视频帧间的时空特征;同时,利用Transformer捕获长距离依赖特征的优点,一定程度上弥补了卷积神经网络方法在捕获图像的非局部相似性方面的缺陷,能更好地实现对视频的建模。所提方法是一种端到端的视频压缩感知方法,在多个数据集上的实验结果验证了该方法的有效性。 展开更多
关键词 压缩感知 视频重构 可变形卷积 transformER 卷积神经网络
在线阅读 下载PDF
基于改进Vision Transformer的水稻叶片病害图像识别
19
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision transformer网络 归纳偏置 局部特征
原文传递
基于LSTM预训练-Transformer修正的船舶运动极短期预报 被引量:1
20
作者 张睿 孟帅 +2 位作者 张小卿 刘震 封培元 《船舶工程》 北大核心 2025年第4期37-45,共9页
[目的]为减少Transformer模型复杂度和推理时间,提高船舶运动极短期预报精度,[方法]提出将传统LSTM模型和改进的LSTM-OneShot模型进行预训练,借用梯度提升决策树(GBDT)算法和集成学习思路,基于Transformer模型引入注意力机制来修正预报... [目的]为减少Transformer模型复杂度和推理时间,提高船舶运动极短期预报精度,[方法]提出将传统LSTM模型和改进的LSTM-OneShot模型进行预训练,借用梯度提升决策树(GBDT)算法和集成学习思路,基于Transformer模型引入注意力机制来修正预报残差。采用某远洋船在三级海况下时历数据进行试验。[结果]研究发现:1)在船舶运动曲线预报方面,Transformer修正可显著提高LSTM模型预报精度。在预报时长2s时,拟合优度系数R^(2)可从0.807提高到0.940;Transformer修正在一定程度上可提高LSTM-OneShot模型预报精度。在预报时长2 s时,R^(2)可从0.938提高到0.941;Transformer修正的LSTM-OneShot模型整体表现最佳。2)在船舶运动包络线预报方面,包络线的周期性在可行的输入序列时间不显著,多层感知机提取的历史特征成为干扰信息,导致LSTM-OneShot模型预报结果明显不如传统LSTM模型。在预报时长2s时,R^(2)从0.938降低至0.881;注意力机制修正可以显著提高传统的LSTM模型预报精度。在预报时长2 s时,R^(2)从0.938提高到0.963;注意力机制修正在一定程度上可提高LSTM-OneShot模型的预报精度,但是无法从根本上去除多层感知机带来的干扰信息。在预报时长2s时,R^(2)可从0.881提高到0.887;Transformer修正的传统LSTM模型整体表现最佳。[结论]研究成果可为船舶运动极短期预报提供一定参考。 展开更多
关键词 船舶运动 极短期预报 长短期记忆循环神经网络 transformer模型 注意力机制
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部