期刊文献+
共找到190篇文章
< 1 2 10 >
每页显示 20 50 100
基于融合Swin Transformer网络的腰椎解剖区域自动分割方法 被引量:2
1
作者 张英迪 史泽林 +6 位作者 王欢 崔少千 张磊 刘嘉琛 单修祺 刘云鹏 赵恩波 《信息与控制》 北大核心 2025年第3期390-400,共11页
腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transf... 腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transformer融合网络,将Swin Transformer网络和多尺度空洞卷积融合作为编码器来得到全局和局部特征的层次化表达。设计了特征耦合模块,在通道和空间2个维度将来自Transformer模块和卷积模块的特征进行耦合,提高了模型的局部和长距离建模能力。为了解决开源数据缺乏的问题,提出了带有体素级标注的、包含663个腰椎椎骨计算断层成像的数据集。在此数据集上的实验表明提出的模型分割精度超过了典型医学图像分割方法,本文模型的骰子系数、Hausdorff距离和平均表面距离分别为88.24%、14.48和0.997。消融实验进一步验证了所提出模块的有效性。 展开更多
关键词 卷积神经网络 医学图像分割 transformer 多尺度特征提取
原文传递
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
2
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊swin transformer模块 多尺度胶囊swin transformer网络 SAR图像目标识别
在线阅读 下载PDF
多尺度Transformer结合残差卷积的管道微泄漏孔径识别
3
作者 王新颖 田豪杰 +2 位作者 蒋婷婷 江志伟 陈俨 《安全与环境学报》 北大核心 2026年第3期1025-1035,共11页
为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution co... 为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution combined model,MS Transformer-Residual)来预测微泄漏孔径。该模型通过模拟燃气管道系统采集不同孔径泄漏下的声发射信号,利用残差卷积模块提取局部时序特征,并采用多尺度Transformer自注意力机制建模全局信号依赖关系,使用五折交叉验证及独立测试集评估模型性能,并与三种消融基准模型进行对比。结果表明:MS Transformer-Residual模型的微泄漏孔径识别准确率达99.96%,与CNN、CNN-Transformer、残差CNN-Transformer模型相比,模型的最高准确率至少提升4.53百分点。研究证实多尺度特征融合策略显著提升了毫米级泄漏孔径的辨识精度,为工业管道健康监测提供了新的解决方案。 展开更多
关键词 安全工程 多尺度学习 transformer 微泄漏检测 残差卷积神经网络
原文传递
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法 被引量:5
4
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 swin transformer SPST模块 EMA模块
在线阅读 下载PDF
基于Swin Transformer的生成对抗网络水下图像增强模型 被引量:4
5
作者 李慧 贾炳志 +4 位作者 王晨曦 董子宇 李纪龙 仲兆满 陈艳艳 《计算机应用》 北大核心 2025年第5期1439-1446,共8页
针对水下图像对比度低、噪声大和存在色彩偏差等问题,以生成对抗网络(GAN)为核心框架,提出一种基于Swin Transformer的生成对抗网络水下图像增强模型SwinGAN(GAN based on Swin Transformer)。首先,生成网络部分遵循编码器-瓶颈层-解码... 针对水下图像对比度低、噪声大和存在色彩偏差等问题,以生成对抗网络(GAN)为核心框架,提出一种基于Swin Transformer的生成对抗网络水下图像增强模型SwinGAN(GAN based on Swin Transformer)。首先,生成网络部分遵循编码器-瓶颈层-解码器的结构设计,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口;其次,引入双路窗口多头自注意力机制(DWMSA),在加强捕获全局信息和长距离依赖关系的同时,增强局部注意力;最后,在解码器中将下采样后的特征图经过多个上采样窗口重新组合成原始尺寸的特征图,判别网络则采用马尔可夫判别器。实验结果表明,与URSCT-SESR模型相比,在UFO-120数据集上,SwinGAN的峰值信噪比(PSNR)提升了0.837 2 dB,结构相似度(SSIM)提高了0.003 6;在EUVP-515数据集上,SwinGAN的PSNR提升了0.843 9 dB,SSIM提高了0.005 1,水下图像质量评价指标(UIQM)增加了0.112 4,水下彩色图像质量评估指标(UCIQE)略有上升,增加了0.001 0。可见,SwinGAN的主观评价以及客观评价指标都表现出色,在改善水下图像的色彩偏差问题上取得了不错的效果。 展开更多
关键词 水下图像增强 swin transformer 生成对抗网络 多头自注意力机制 马尔可夫判别器
在线阅读 下载PDF
基于Swin-Transformer的多尺度多源域自适应轴承故障诊断 被引量:2
6
作者 周玉国 张志凯 +2 位作者 张金超 于春风 周立俭 《机床与液压》 北大核心 2025年第1期32-42,共11页
针对当前多源域自适应方法无法充分挖掘多源域中不同尺度故障信息的问题,提出一种基于Swin-Transformer(Swin-T)的多尺度多源域自适应轴承故障诊断方法。通过连续小波变换,获得振动信号在不同频带的特征。为更充分地利用多源域中不同尺... 针对当前多源域自适应方法无法充分挖掘多源域中不同尺度故障信息的问题,提出一种基于Swin-Transformer(Swin-T)的多尺度多源域自适应轴承故障诊断方法。通过连续小波变换,获得振动信号在不同频带的特征。为更充分地利用多源域中不同尺度的故障信息,提出基于Swin-T的多尺度特征提取网络。为了减小各域之间的数据分布差异,构建基于最大均值差异的特征对齐网络,并根据不同尺度对分类的贡献赋予权值。此外,构建多尺度特征融合模块,对不同尺度的特征信息进行融合,得到故障特征集。最后,利用Softmax对特征集进行故障分类,并通过最小化多分类器预测差异损失得到最终分类结果。在凯斯西储大学和青岛理工大学轴承数据集上,该方法的故障分类准确度分别达到99.63%和99.40%。 展开更多
关键词 轴承 故障诊断 多源域自适应 swin-transformer 多尺度特征提取 最大均值差异
在线阅读 下载PDF
基于Swin Transformer与多尺度特征融合的图像描述方法
7
作者 王子怡 李卫军 +3 位作者 刘雪洋 丁建平 刘世侠 苏易礌 《计算机应用》 北大核心 2025年第10期3154-3160,共7页
基于Transformer的图像描述方法通过多头注意力会在整个输入序列上计算注意力权重,缺乏层次化的特征提取能力,并且两阶段的图像描述方法限制了模型性能。针对上述问题,提出一种基于Swin Transformer与多尺度特征融合的图像描述方法(STM... 基于Transformer的图像描述方法通过多头注意力会在整个输入序列上计算注意力权重,缺乏层次化的特征提取能力,并且两阶段的图像描述方法限制了模型性能。针对上述问题,提出一种基于Swin Transformer与多尺度特征融合的图像描述方法(STMSF)。在编码器中通过Agent Attention保持全局上下文建模能力的同时,提高计算效率;在解码器中提出多尺度交叉注意力(MSCA),融合交叉注意力与深度可分离卷积,在得到多尺度特征的同时更充分地融合多模态特征。实验结果表明,在MSCOCO数据集上与SCD-Net(Semantic-Conditional Diffusion Network)方法相比,STMSF的BLEU4(BiLingual Evaluation Understudy with 4-grams)和CIDEr(Consensus-based Image Description Evaluation)指标分别提升了1.1和5.3个百分点。对比实验和消融实验的结果表明,所提的一阶段STMSF能够有效提高模型性能,生成高质量的图像描述语句。 展开更多
关键词 swin transformer 多尺度特征 特征融合 图像描述 深度可分离卷积
在线阅读 下载PDF
基于MCSP和Swin Transformer的转录因子结合位点预测模型
8
作者 李雪 石晋雪 +2 位作者 王会青 闫奥煜 王森 《华东理工大学学报(自然科学版)》 北大核心 2025年第4期552-563,共12页
预测转录因子结合位点(Transcription Factor Binding Sites,TFBS)可以帮助识别特定细胞和组织的特异性调控机制,对于理解基因表达调控机制至关重要。现有方法结合DNA的序列和形状信息进行TFBS的预测,生成的形状信息未考虑长侧翼核苷酸... 预测转录因子结合位点(Transcription Factor Binding Sites,TFBS)可以帮助识别特定细胞和组织的特异性调控机制,对于理解基因表达调控机制至关重要。现有方法结合DNA的序列和形状信息进行TFBS的预测,生成的形状信息未考虑长侧翼核苷酸的影响,在对序列信息进行特征提取时忽略了不同通道间特征的互补性,模型的预测能力有待提高。本文提出了TFBS预测模型MSSW,考虑长侧翼核苷酸来生成形状信息;利用Swin Transformer提取形状信息中长程依赖和局部关联相结合的特性,将分裂注意力融入多尺度卷积神经网络(Multiscale Convolution and Split attention,MCSP)来捕获序列中不同通道间特征的互补性,获得跨通道的多尺度序列特征;结合提取的高级序列和形状特征进行TFBS的预测。结果表明,MSSW模型优于现有TFBS预测模型,可有效预测TFBS。 展开更多
关键词 转录因子结合位点 多尺度卷积 分裂注意力 swin transformer Deep DNAshape
在线阅读 下载PDF
基于Swin Transformer的位移与应变测量
9
作者 但西佐 杨浩 李桂华 《光学精密工程》 北大核心 2025年第15期2455-2467,共13页
为解决传统数字图像相关(DIC)方法依赖固定子集而导致的高频位移捕捉能力不足及对复杂应变适应性差的问题,提出了一种基于Swin Transformer的位移与应变同步预测网络模型。该模型由ST-DIC-d(位移预测)和ST-DIC-s(应变预测)两个子网络组... 为解决传统数字图像相关(DIC)方法依赖固定子集而导致的高频位移捕捉能力不足及对复杂应变适应性差的问题,提出了一种基于Swin Transformer的位移与应变同步预测网络模型。该模型由ST-DIC-d(位移预测)和ST-DIC-s(应变预测)两个子网络组成。首先,利用Swin Transformer的分层编码器-解码器结构进行多尺度特征提取;然后,通过注意力机制与跳跃连接有效捕捉图像的局部和全局特征,从而得到位移场;最后,通过应变计算层从位移场精确计算应变分量。在DIC Challenge数据集上的实验结果表明,ST-DIC相比传统DIC方法和基于CNN的模型,平均绝对误差在垂直位移预测上减少21%。在实际拉伸实验中,ST-DIC在高梯度区域最大应变精度提高8%。本文所提出的方法在测量复杂变形方面具有更高的可靠性与精度。 展开更多
关键词 数字图像相关 swin transformer 高频位移 多尺度特征提取 应变测量
在线阅读 下载PDF
MSFSwin:SAR与改进Swin Transformer相结合的多特征融合水体提取方法 被引量:1
10
作者 王雷 刘文宋 +3 位作者 张连蓬 李二珠 郭风成 路琦 《地球信息科学学报》 北大核心 2025年第7期1638-1655,共18页
【目的】精细提取全球地表水对水资源管理及气候监测具有重要意义。合成孔径雷达(SAR)凭借主动微波成像技术,可面向多云多雨地区实现全天时、全天候水体动态变化监测。针对传统方法对河网密布、地形复杂地区水体提取精度低以及由于SAR... 【目的】精细提取全球地表水对水资源管理及气候监测具有重要意义。合成孔径雷达(SAR)凭借主动微波成像技术,可面向多云多雨地区实现全天时、全天候水体动态变化监测。针对传统方法对河网密布、地形复杂地区水体提取精度低以及由于SAR成像特性导致难以精准区分水体、山体阴影、裸地等难题,本文提出了一种顾及SAR多通道信息的多尺度特征融合水体提取MSFSwin(Multi-Scale Feature Fusion Swin)网络模型。【方法】通过融合升、降轨Sentinel-1影像的双极化特征及数字高程模型(DEM)构建多通道遥感水体数据集;并引入空洞空间金字塔池化(ASPP)模块,通过不同感受野的特征聚合增强对多尺度水体区域的感知能力,弥补Swin Transformer在跨窗口特征整合方面的不足;同时,设计多层次解码结构,通过层级特征融合强化跨尺度信息交互,实现水体精细提取。为验证本文提出MSFSwin模型的有效性与鲁棒性,选取青藏高原典型水体覆盖区进行水体提取实验,并定性、定量比较不同水体提取方法(含多种深度学习模型及KNN算法)的精度。【结果】MSFSwin模型在水体提取精度上明显优于Swin Transformer、Segformer、ViT等模型及KNN算法。其中,MSFSwin模型在干流湖泊交汇区的BF-score较原模型Swin Transformer提升了4.15%,在细小水体区IoU提升了3.52%,实现了复杂地形下的水体高精度自动提取。【结论】本文通过MSFSwin模型及多通道融合策略对水体、山体阴影等区分效果明显,有效提升了模型在复杂地形条件下水体提取的鲁棒性与适用性,为全天时、全天候、高精度水体提取提供了可靠技术支持。 展开更多
关键词 青藏高原 水体提取 合成孔径雷达 swin transformer网络 多尺度特征融合 山体阴影 复杂地形
原文传递
融合Swin Transformer的变速箱中壳检测方法研究
11
作者 杨洋 雷钧 +1 位作者 王伟鸣 徐洪胜 《智能计算机与应用》 2025年第7期168-174,共7页
针对汽车变速箱中壳生产线中存在壳体表面孔系定位效率低,检测样本不均衡等问题,本文提出了一种融合Swin Transformer的变速箱中壳检测方法。首先,Swin Transformer作为骨干网络,并结合多尺度特征融合结构,使输出特征能够同时捕捉浅层... 针对汽车变速箱中壳生产线中存在壳体表面孔系定位效率低,检测样本不均衡等问题,本文提出了一种融合Swin Transformer的变速箱中壳检测方法。首先,Swin Transformer作为骨干网络,并结合多尺度特征融合结构,使输出特征能够同时捕捉浅层和深层语义的信息,从而增强检测方法对特征的提取能力;其次,针对Swin Transformer训练需大量数据问题,采用Affine Transformation的方法来提升模型的鲁棒性;最后,通过引入Huber Loss和Focal Loss优化损失函数,以平衡检测样本不均衡的问题。实验结果表明,融合Swin Transformer的检测方法相较于现阶段主流的目标检测算法,在5%~95%IoU的平均精度AP_(5-95)、50%IoU的平均精度AP_(50)和75%IoU的平均精度AP_(75)指标上提高了0.4%~4.5%。同时通过消融实验,进一步验证了该方法在变速箱中壳检测的有效性。 展开更多
关键词 目标检测 swin transformer 多尺度特征融合 变速箱中壳
在线阅读 下载PDF
MS-SwinCE:融合多尺度Swin Transformer与对比特征增强的遥感图像变化检测
12
作者 朱永进 李熹 +1 位作者 李永胜 苏湘粤 《计算机系统应用》 2025年第12期67-74,共8页
遥感图像变化检测在城市扩张与灾害监测等领域中具有重要意义,然而,现有方法在特征提取能力、抗伪变化干扰以及多尺度融合方面仍存在不足之处.本文提出一种融合多尺度Swin Transformer、对比特征增强模块(contrastive feature enhanceme... 遥感图像变化检测在城市扩张与灾害监测等领域中具有重要意义,然而,现有方法在特征提取能力、抗伪变化干扰以及多尺度融合方面仍存在不足之处.本文提出一种融合多尺度Swin Transformer、对比特征增强模块(contrastive feature enhancement module, CFEM)与双向特征金字塔网络(bi-directional feature pyramid network,BiFPN)的变化检测模型MS-SwinCE.该模型利用局部窗口和移位机制增强长程依赖建模能力, CFEM精准提取变化差异并抑制噪声, BiFPN实现多尺度语义信息的高效融合.实验结果表明, MS-SwinCE在LEVIR-CD数据集上,相较于ChangeFormer, IoU提升了1.18%, F1分数提升了0.70%, Precision提升了0.32%, Recall提升了1.06%;在WHU-CD数据集上,相较于BIT, IoU提升了1.84%, F1分数提升了1.06%, Precision提升了0.47%, Recall提升了1.66%.此外,在保持较高精度的同时,模型参数量为31.66M,明显低于精度相近的ChangeFormer(41.03M),在精度与效率间实现了良好权衡.消融实验进一步验证了各模块的有效性与协同增益. 展开更多
关键词 遥感图像变化检测 swin transformer 对比特征增强模块 多尺度特征融合 双向特征金字塔网络
在线阅读 下载PDF
基于改进Swin Transformer的玉米植株品种识别方法
13
作者 王慎思 刘成忠 《软件工程》 2025年第8期26-31,共6页
玉米作为中国关键粮食作物,其品种识别技术随深度学习和计算机视觉技术的发展而进步。针对玉米籽粒品种识别技术已有所发展,但植株品种分类研究较少的不足,提出一种改进的Swin Transformer模型;通过多尺度特征融合和改进的CBAM注意力机... 玉米作为中国关键粮食作物,其品种识别技术随深度学习和计算机视觉技术的发展而进步。针对玉米籽粒品种识别技术已有所发展,但植株品种分类研究较少的不足,提出一种改进的Swin Transformer模型;通过多尺度特征融合和改进的CBAM注意力机制增强模型的特征表达,提升了模型性能。在自建数据集上的实验结果显示,该方法识别准确率达93.4%,较原模型提高2.7%,且优于ResNet34、VGGNet、MobileNetV2等模型。以上结果表明,所提方法能够进行高效的玉米植株品种识别。 展开更多
关键词 swintransformer 多尺度特征融合 CBAM 品种识别
在线阅读 下载PDF
基于Swin Transformer的联合信源信道编码算法
14
作者 廖潇 李智 《现代信息科技》 2025年第7期1-4,共4页
联合信源信道编码作为语义通信的关键研究方向,已取得初步研究成果。然而,随着图像分辨率的提升,传统的基于卷积神经网络的联合信源信道编码算法在图像语义特征提取方面表现出局限性。为了解决该问题,文章提出了一种基于Swin Transforme... 联合信源信道编码作为语义通信的关键研究方向,已取得初步研究成果。然而,随着图像分辨率的提升,传统的基于卷积神经网络的联合信源信道编码算法在图像语义特征提取方面表现出局限性。为了解决该问题,文章提出了一种基于Swin Transformer的联合信源信道编码算法。该算法首先利用多尺度大核注意力机制初步捕获图像的局部信息和长距离依赖性,然后通过Swin Transformer进一步对图像语义特征进行分层提取和自适应码率编码。实验结果表明,在AWGN和Rayleigh信道模型下,所提出的算法在PSNR和MS-SSIM指标上均优于传统的算法。 展开更多
关键词 联合信源信道编码 swin transformer 多尺度大核注意力
在线阅读 下载PDF
基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络
15
作者 孙林 薛红科 吕娟 《模式识别与人工智能》 北大核心 2025年第8期684-698,共15页
皮肤病变的准确分割对诊断和治疗皮肤病至关重要.针对现有网络因皮肤病变形态多样、与周围组织相似性较高及边界模糊导致的分割结果不精准的问题,文中提出基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络.首先,针... 皮肤病变的准确分割对诊断和治疗皮肤病至关重要.针对现有网络因皮肤病变形态多样、与周围组织相似性较高及边界模糊导致的分割结果不精准的问题,文中提出基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络.首先,针对普通卷积对全局信息捕捉能力不足的问题,构建基于Swin Transformer V2的骨干网络,通过分层结构设计和自注意力机制,实现多尺度特征融合,建立特征的长距离依赖关系,增强多形态下皮肤病变的语义特征提取能力.然后,为了增强网络的特征表达能力,设计动态代理瓶颈模块,根据输入特征自适应生成代理向量与位置偏置,自适应调整局部感受野的关注焦点,进一步解决现有网络在高相似度皮肤组织干扰下皮肤病变分割偏差的问题.最后,为了提高对皮肤病变边缘的感知能力,设计多尺度空洞注意力融合模块,构建基于多分支并行的多尺度空洞卷积特征提取架构,结合空间通道注意力机制,提升对病变边缘的敏感性.文中网络在ISIC2017、PH2、ISIC2018数据集上的实验均取得较优性能,由此验证其有效性. 展开更多
关键词 皮肤病分割 自注意力机制 多尺度特征 swin transformer 特征融合
在线阅读 下载PDF
融合Transformer和Inception的网络入侵检测研究
16
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformer INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
语义感知下的多尺度U型Swin Transformer人脸超分辨方法
17
作者 张凯兵 张智启 孟雅蕾 《西安工程大学学报》 2025年第5期135-145,共11页
现有的基于卷积神经网络的人脸超分辨方法在细节恢复方面表现出色,然而卷积处理在保持图像整体结构和捕捉长距离依赖方面存在局限性,导致重建质量达不到人们满意的效果。针对上述问题,提出一种新的人脸图像超分辨方法。该方法采用多尺... 现有的基于卷积神经网络的人脸超分辨方法在细节恢复方面表现出色,然而卷积处理在保持图像整体结构和捕捉长距离依赖方面存在局限性,导致重建质量达不到人们满意的效果。针对上述问题,提出一种新的人脸图像超分辨方法。该方法采用多尺度连接的编码器和解码器结构作为主干,旨在重建出结构完整、细节丰富的高分辨人脸图像。具体而言,该方法首先通过浅层特征提取模块提取浅层特征,然后分别通过语义先验模块提取人脸语义信息和多尺度连接的U型Swin Transformer提取深层细节特征,并且将人脸语义信息融合进U型结构中,最后通过图像重建模块重建出高分辨图像。该研究将语义感知与多尺度连接的Transformer架构结合起来,克服了传统卷积网络在长距离依赖和结构保持方面的不足。实验表明:文中方法重建不仅在视觉效果上更清晰,同时为后续相关研究提供了新的思路,与SPARNet相比,在CelebA数据集和Helen数据集上PSNR分别提高了0.99 dB和0.84 dB,在SSIM和LPIPS指标上也具有一定优势。 展开更多
关键词 人脸超分辨 swin transformer 生成对抗网络(GAN) 多头自注意力(MSA) 多尺度特征融合块
在线阅读 下载PDF
融合KAN与Transformer的分心驾驶行为增强检测模型
18
作者 陈万志 于南洋 范兴杰 《安全与环境学报》 北大核心 2026年第1期88-99,共12页
分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kol... 分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kolmogorov-Arnold网络,通过有理函数逼近与分组参数共享减少参数量,增强微动作特征的提取;其次,采用多尺度扩张注意力机制,通过滑动窗口稀疏采样与渐进扩张率分配,实现局部细节感知与长程上下文建模的协同优化;最后,通过训练优化模型实现分心驾驶行为的分类检测。试验结果表明,所提模型在典型数据集上检测精度达92.3%(较基线提升8.5百分点),实时速度为45帧/s,遮挡召回率提升11.7百分点。所提模型在平衡检测精度的同时实现了轻量化设计,满足智能驾驶安全预警中分心驾驶行为的实时检测需求。 展开更多
关键词 安全工程 驾驶安全 Kolmogorov-Arnold网络 transformer模型 分组共享 多尺度扩张注意力
原文传递
结合Swin Transformer的多尺度遥感图像变化检测研究 被引量:6
19
作者 刘丽 张起凡 +1 位作者 白宇昂 黄凯烨 《图学学报》 CSCD 北大核心 2024年第5期941-956,共16页
由于地物信息的复杂性及变化检测数据的多元性,遥感图像特征提取的充分性和有效性难以得到保证,导致变化检测方法获取的检测结果可靠性较低。虽然卷积神经网络(CNN)凭借有效提取语义特征的优势,被广泛应用于遥感领域的变化检测之中,但... 由于地物信息的复杂性及变化检测数据的多元性,遥感图像特征提取的充分性和有效性难以得到保证,导致变化检测方法获取的检测结果可靠性较低。虽然卷积神经网络(CNN)凭借有效提取语义特征的优势,被广泛应用于遥感领域的变化检测之中,但卷积操作固有的局部性导致感受野受限,无法捕获时空上的全局信息以至于特征空间对中远距离依赖关系的建模受限。为捕获远距离的语义依赖,提取深层全局语义特征,设计了一种基于Swin Transformer的多尺度特征融合网络SwinChangeNet。首先,SwinChangeNet采用孪生的多级Swin Transformer特征编码器进行远距离上下文建模;其次,编码器中引入特征差异提取模块,计算不同尺度下变化前后的多级特征差异,再通过自适应融合层将多尺度特征图进行融合;最后,引入残差连接和通道注意力机制对融合后的特征信息进行解码,从而生成完整准确的变化图。在CDD和CD_Data_GZ 2个公开数据集上分别与7种经典和前沿变化检测方法进行比较,CDD数据集中本文模型的性能最优,相比于性能第二的模型,F1分数提高了1.11%,精确率提高了2.38%。CD_Data_GZ数据集中本文模型的性能最优,相比于性能第二的模型,F1分数、精确率和召回率分别提高了4.78%,4.32%,4.09%,提升幅度较大。对比实验结果证明了该模型具有更好的检测效果。在消融实验中也证实了模型中各个改进模块的稳定性和有效性。本文模型针对遥感图像变化检测任务,引入了Swin Transformer结构,使网络可以对遥感图像的局部特征和全局特征进行更有效地编码,让检测结果更加准确,同时保证网络在地物要素种类繁多的数据集上容易收敛。 展开更多
关键词 变化检测 孪生网络 swin transformer 多尺度特征融合 注意力机制 特征差异提取
在线阅读 下载PDF
一种融合Transformer的多尺度结构图像去模糊方法 被引量:1
20
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 transformer 卷积神经网络 注意力机制
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部