期刊文献+
共找到551篇文章
< 1 2 28 >
每页显示 20 50 100
基于Swin-PIDNet的纸质工程制图线型识别方法
1
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
YOLO11-Swin:一种面向复杂水下环境的目标检测模型
2
作者 郑广海 张倩 张薇 《计算机科学与应用》 2026年第1期374-387,共14页
水下目标检测在海洋资源开发与生态环境监测中至关重要,但水下图像的低对比度、色彩失真及复杂背景干扰为精准检测带来巨大挑战。为克服传统方法在特征提取与小目标识别上的局限,本文提出一种深度融合Swin Transformer与YOLO11架构的新... 水下目标检测在海洋资源开发与生态环境监测中至关重要,但水下图像的低对比度、色彩失真及复杂背景干扰为精准检测带来巨大挑战。为克服传统方法在特征提取与小目标识别上的局限,本文提出一种深度融合Swin Transformer与YOLO11架构的新型检测模型(A Novel Detection Model with Deep Integration of Swin Transformer and YOLO11 Architectures, YOLO11-Swin)。该模型以Swin Transformer作为主干特征提取网络,利用其分层设计与滑动窗口自注意力机制,有效捕获图像的全局上下文依赖关系,增强对模糊、遮挡目标的表征能力。在特征融合阶段,本文设计了一种跨层特征聚合机制(Cross-layer Feature Aggregation, CFA),通过全局池化与自适应权重计算,引导不同尺度特征图进行高效信息交互,以解决特征金字塔中的语义间隙与尺度不匹配问题。此外,在各级特征图输出端嵌入卷积注意力模块(Convolutional Block Attention Module, CBAM),通过串行的通道与空间注意力子模块,自适应地优化特征响应,突出目标区域并抑制背景噪声。针对水下数据集正负样本不均衡的问题,模型采用Focal Loss作为分类损失函数,以聚焦困难样本的训练,提升模型收敛速度与稳健性。在URPC数据集上的实验结果表明,YOLO11-Swin的mAP@50达到75.54%,相比基线YOLO11模型显著提升9.42%。特别地,对小目标(如扇贝)的检测平均精度(AP)提升10.16%,召回率(Recall)提高4.55%,充分验证了所提模型在复杂水下环境下的有效性与先进性。 展开更多
关键词 水下目标检测 YOLO11 swin Transformer 跨层融合 注意力机制
在线阅读 下载PDF
基于Swin Transforme方法分析慢性非特异性腰痛的坐姿压力
3
作者 颜威 刘宽 +6 位作者 孔令军 朱清广 何天翔 张帅攀 周鑫 奚小冰 房敏 《医用生物力学》 北大核心 2026年第1期182-188,共7页
目的通过采集受试者的坐姿压力数据,结合Swin Transformer神经网络模型,提出一种基于压力数据的慢性非特异性腰痛(chronic non-specific low back pain,cNSLBP)病情客观评估方法。方法招募100名cNSLBP受试者,利用压敏传感器阵列采集其... 目的通过采集受试者的坐姿压力数据,结合Swin Transformer神经网络模型,提出一种基于压力数据的慢性非特异性腰痛(chronic non-specific low back pain,cNSLBP)病情客观评估方法。方法招募100名cNSLBP受试者,利用压敏传感器阵列采集其在坐姿前倾、后仰、左倾、右倾及正坐5种姿势下的压力数据,并将其转化为压力图像。通过数据预处理与增强方法,构建了包含多层次特征的压力图像数据集。采用Swin Transformer模型对压力图像进行分析,提取特征并预测病情程度,并与传统卷积神经网络(convolutional neural network,CNN)进行性能对比。结果Swin Transformer模型在cNSLBP患者压力数据集上表现优异,平均绝对误差为0.1368,平均平方根误差为0.1729,显著优于传统CNN模型。在样本量有限的情况下,数据增强有效提升了模型的泛化能力,模型能够正确区分不同患者病情的严重程度。结论基于Swin Transformer的坐姿压力图像分析方法能够实现对cNSLBP患者病情严重程度的准确评估,为临床提供了一种客观、高效的辅助诊断工具,有助于更好地指导cNSLBP的诊疗实践。 展开更多
关键词 慢性非特性腰痛 坐姿压力 病情评估 swin Transformer模型
原文传递
DiST-DR:扩散模型驱动的Swin Transformer非线性医学图像微分同胚配准
4
作者 马可航 夏春潮 +3 位作者 陈梦遥 李飞 张思敏 孙怀强 《四川大学学报(自然科学版)》 北大核心 2026年第1期13-24,共12页
医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-D... 医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-DR(Diffusiondriven Swin Transformer for Diffeomorphic Registration)。该模型融合CNN与Swin Transformer作为骨干网络,并引入密集乘法连接(Dense Multiplicative Connection,DMC)模块,以有效融合多尺度特征。此外,DiST-DR引入微分同胚变换,以在配准过程中保持形变场的平滑性与拓扑结构。在心脏MRI与肝脏CT数据集上的实验证明,DiST-DR优于现有先进的配准方法,展现出其在实现精确且拓扑保持的图像配准任务中的应用潜力。 展开更多
关键词 医学图像配准 扩散模型 swin Transformer 微分同胚配准
在线阅读 下载PDF
基于Swin Transformer的无线图传语义通信系统性能优化
5
作者 李旋 赖雪冰 +1 位作者 王辩铮 申滨 《华中科技大学学报(自然科学版)》 北大核心 2026年第3期50-60,共11页
为了解决现有语义通信研究大多数采用传统的卷积神经网络(CNN)作为骨干网络,难以兼顾全局信息与局部信息,一定程度上限制了系统的性能表现问题,提出了一种基于Swin Transformer的无线图像传输语义通信(WIT-SC)系统,可以在单个系统模型... 为了解决现有语义通信研究大多数采用传统的卷积神经网络(CNN)作为骨干网络,难以兼顾全局信息与局部信息,一定程度上限制了系统的性能表现问题,提出了一种基于Swin Transformer的无线图像传输语义通信(WIT-SC)系统,可以在单个系统模型下自适应工作于不同的信道状态和传输速率.首先,设计了注意力噪声自适应网络(ANANet),通过引入不同SNR对系统进行训练,并根据SNR水平的变化自动调整系统参数,实现对SNR的动态适应;然后,引入最大互信息网络(MMINet),通过最大化信道两端互信息量来优化编码器,使输出信号具有抵抗信道噪声的鲁棒性;最后,为了控制在不同信噪比(SNR)无线图像的传输速率,重新设计了自适应速率控制网络(ARCNet),通过输出动态的二进制掩码选择所传输的特征,实现对无线图像传输速率的自适应调整.仿真结果表明:与其他基于深度学习的JSCC和传统的信源信道分离编码方案相比,所提出的WIT-SC系统在PSNR和SSIM方面均表现出更优的性能. 展开更多
关键词 语义通信 图像传输 swin Transformer SNR自适应 速率自适应
原文传递
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
6
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 swin Transformer 级联群体注意力机制
原文传递
样本不均衡条件下滚动轴承故障FCWT-DDIM-SwinT识别方法
7
作者 孙祥海 邱明 +4 位作者 李军星 张松林 刘志卫 刘静涛 高锐 《河南科技大学学报(自然科学版)》 北大核心 2026年第1期53-62,M0005,共11页
针对滚动轴承故障识别中因样本不均衡导致准确率低的问题,提出一种去噪扩散隐式模型(DDIM)结合Swin Transformer(SwinT)的故障识别方法。首先,对采集到的滚动轴承原始振动信号进行快速连续小波变换(FCWT),将其重构为二维时频图像。然后... 针对滚动轴承故障识别中因样本不均衡导致准确率低的问题,提出一种去噪扩散隐式模型(DDIM)结合Swin Transformer(SwinT)的故障识别方法。首先,对采集到的滚动轴承原始振动信号进行快速连续小波变换(FCWT),将其重构为二维时频图像。然后,使用DDIM扩充原始不均衡数据集,构建出故障样本类别分布均衡数据集。最后,将均衡数据集应用于SwinT模型的训练过程,从而实现滚动轴承多种故障类型的准确诊断。工程实例表明:利用DDIM能够有效解决故障样本不均衡的问题;同时,与其他识别模型相比,SwinT模型的平均识别准确率提高了5.72%,具有更优越的轴承故障识别能力。 展开更多
关键词 滚动轴承 快速连续小波变换 去噪扩散隐式模型 swin Transformer 故障识别
在线阅读 下载PDF
基于信息修正的Swin-SR网络重力背景图高分辨率重建方法
8
作者 张嗣卿 李宁 +2 位作者 王钊 任俊 张勇刚 《中国惯性技术学报》 北大核心 2026年第3期248-257,共10页
惯性/重力匹配导航定位精度在一定程度上取决于重力背景图的分辨率与精度。针对现有重力背景图插值算法难以充分刻画数据整体空间相关性,且在强非线性重力异常区域插值精度有限的问题,提出一种基于信息修正的Swin-SR网络重力背景图高分... 惯性/重力匹配导航定位精度在一定程度上取决于重力背景图的分辨率与精度。针对现有重力背景图插值算法难以充分刻画数据整体空间相关性,且在强非线性重力异常区域插值精度有限的问题,提出一种基于信息修正的Swin-SR网络重力背景图高分辨率重建方法。首先,采用滑动窗口策略对大尺寸重力背景图进行分块处理,并利用融合卷积与全局Swin Transformer的特征提取器,对重力背景图进行多尺度特征建模;其次,利用特征上采样层对低分辨率重力背景图特征进行上采样,并通过信息重建层恢复高分辨率重力信息;最后,引入信息修正模块对重建结果进行进一步校正,从而获得高分辨率的重力背景图。实验结果表明,所提出的方法相较于现有插值方法在重力背景图重建精度上提升70%以上。在惯性/重力匹配导航实验中,采用所提出的方法将2′×2′和4′×4′的重力背景图分别重建至1′×1′后,匹配导航定位精度分别提升了4.7%和39.2%。 展开更多
关键词 重力背景图重建 惯性/重力匹配导航 信息修正 swin-SR网络
在线阅读 下载PDF
基于Swin-UNet的破损碑刻文字识别方法
9
作者 李晓亮 李光亚 孟志琳 《机械与电子》 2026年第1期28-34,共7页
提出了基于Swin-UNet的破损碑刻文字识别方法。为了能够获取准确的碑刻文字信息,采用Swin Transformer结构代替U-Net结构在分割任务中的下采样和上采样过程,并在其中添加了优化融合特征信息的注意力模块CBAM与SENet模块,同时使用带权重... 提出了基于Swin-UNet的破损碑刻文字识别方法。为了能够获取准确的碑刻文字信息,采用Swin Transformer结构代替U-Net结构在分割任务中的下采样和上采样过程,并在其中添加了优化融合特征信息的注意力模块CBAM与SENet模块,同时使用带权重的交叉熵损失函数对损失函数进行优化。自然场景下的碑刻文字往往会受到各种各样的损害,故之后在数据集的基础上建立文字的语义分割数据库,同时设计算法对缺损的碑刻文字基于数据库进行识别。实验表明,在真实碑刻图片中,文字缺失2个笔画以内,识别正确率为32.60%,识别结果前5个文字中有正确的汉字视为识别正确的概率为64.20%,识别结果前10个文字中有正确的汉字视为识别正确的概率为77.20%。所提方法相较于其他的语义分割模型对笔画的分割更为准确,效果更好。 展开更多
关键词 碑刻文字 文字识别 swin Transformer U-Net 语义分割
在线阅读 下载PDF
基于改进Swin Transformer的钢丝绳漏磁信号分类方法
10
作者 姜帅 胡而已 孙燕华 《无损检测》 2026年第2期13-20,共8页
为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数... 为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数据集,用于模型训练与测试。试验结果表明,所提出的模型在各项评价指标上均优于传统的一维卷积神经网络(1D-CNN)、长短时记忆网络(LSTM)和门控循环单元(GRU),具有强大的特征提取与分类能力。最后,利用可视化工具对模型决策过程进行了解释。 展开更多
关键词 钢丝绳 swin Transformer 漏磁检测 磁敏感元件阵列 信号分类
在线阅读 下载PDF
基于改进Swin Transformer的公路隧道衬砌裂缝检测算法
11
作者 刘健 牛沛 +2 位作者 郭峰 寇磊 张瀚鸣 《中国公路学报》 北大核心 2026年第2期187-201,共15页
针对已有目标检测算法在隧道衬砌裂缝检测过程中出现的误检、漏检、抗干扰能力差及检测精度低等问题,提出一种面向实际工况的隧道衬砌裂缝检测算法RSwin。该算法的创新点在于:(1)首次提出了Residual Swin Transformer Block(RSTB),该模... 针对已有目标检测算法在隧道衬砌裂缝检测过程中出现的误检、漏检、抗干扰能力差及检测精度低等问题,提出一种面向实际工况的隧道衬砌裂缝检测算法RSwin。该算法的创新点在于:(1)首次提出了Residual Swin Transformer Block(RSTB),该模块具有针对复杂衬砌裂缝特征的全局建模及局部特征提取能力,增强了多尺度衬砌裂缝特征融合与表征,提高了模型性能及泛化能力;(2)首次融合了Shape-IoU损失函数,优化了形状匹配问题的评估方法,全面地考虑了边界框特性并以此来计算损失值,提高了模型在隧道衬砌裂缝识别任务中的目标框匹配表现。为验证所提出算法的有效性,在自采隧道巡检数据集上采用共11种经典目标检测模型(YOLOv7、YOLOv8、YOLOv9、YOLOv10、Cascade Mask R-CNN、Cascade R-CNN、Faster R-CNN、FSAF(Feature Selective Anchor-free Module)、FCOS(Fully Convolutional One-stage Object Detection)、NAS FCOS(Neural Architecture Search Fully Convolutional One-stage Object Detection)、Mask R-CNN)进行模型对比、训练、验证和测试。训练结果和可视化结果表明:RSwin算法的mAP50为97.6%,相对7种对比算法,分别提高了14.51%、5.57%、4.41%、2.98%、3.2%、2.5%、6.43%、11.7%、3.1%、4.7%、2.4%;同时拥有最快的推理速度,在807像素×606像素的条件下,帧率为9.3帧·s^(-1)。RSwin算法识别精度最高,综合性能最优,可有效应用于实际隧道裂缝检测任务。 展开更多
关键词 隧道工程 目标识别 衬砌检测 swin Transformer 计算机视觉 残差结构
原文传递
基于时空Swin Transformer的流固耦合交互序列图像预测网络
12
作者 邹长军 葛志宇 钟晨曦 《系统仿真学报》 北大核心 2026年第1期112-124,共13页
针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口... 针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口多头自注意力(W-MSA)动态嵌入ConvLSTM输出门,实现时序-空间特征的自适应耦合;设计多级ConvLSTM特征提取框架,分层解析固体与流固耦合的复杂时空关联。在自建流固交互数据集上的实验结果表明:所提方法在各数据集上的PSNR指标均取得第一的优异成绩,在SSIM指标上也处于领先位置,且在涡旋细节保持与边界一致性方面显著优于主流模型。所提方法为动态流体交互场景的高效预测提供了新思路。 展开更多
关键词 深度学习 流体动力学 图像预测 ConvLSTM swin Transformer
原文传递
基于UCC-Swin的糖尿病视网膜病变分类研究
13
作者 陶烨豪 《电脑与信息技术》 2026年第1期44-49,共6页
针对现有方法在糖尿病视网膜病变(diabetic retinopathy,DR)分类任务中存在的挑战,提出了一种改进的UCC-Swin网络架构。该网络在Swin Transformer骨干的基础上进行了3方面关键改进:(1)引入U形特征金字塔网络(U-shaped feature pyramid n... 针对现有方法在糖尿病视网膜病变(diabetic retinopathy,DR)分类任务中存在的挑战,提出了一种改进的UCC-Swin网络架构。该网络在Swin Transformer骨干的基础上进行了3方面关键改进:(1)引入U形特征金字塔网络(U-shaped feature pyramid network,U-FPN)模块实现多尺度特征的有效融合,平衡语义信息与空间细节,以增强对不同尺度病灶特征的捕获能力;(2)在编码结构中嵌入CBAM注意力机制,通过通道与空间双重加权,提升模型对微小病灶区域的聚焦能力;(3)设计了融合类别重加权、相似性惩罚及标签平滑机制的CDS混合损失函数,以缓解类别不平衡,提升模型对病变等级细微差异的敏感性并增强泛化能力。在APTOS2019数据集上,UCC-Swin模型的准确率、召回率、特异性和F1分数分别达到95.36%、94.82%、98.92%和94.96%,在EyePACS数据集上,UCC-Swin同样实现了93.69%的准确率和92.57%的F1分数,均优于VGG16、ResNet50、MobileViT和EfficientNetV2等主流模型。实验结果表明,UCC-Swin在DR分类任务中能够有效提升分类精度与鲁棒性,为糖尿病视网膜病变的自动化辅助诊断提供了有力支持。 展开更多
关键词 糖尿病视网膜病变 swin Transformer U-FPN CBAM 混合损失函数
在线阅读 下载PDF
基于多序列MRI和Swin Transformer深度学习模型的肝细胞癌微血管侵犯预测
14
作者 黄倩 庄银平 +1 位作者 徐鹏 巩萍 《中国医学物理学杂志》 2026年第2期245-254,共10页
目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊... 目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊的HCC患者,收集患者的术前多序列MRI图像[动脉期(AP)、延迟期(DP)、脂肪抑制T2加权成像(T2WI-FS)、扩散加权成像(DWI)],经过图像预处理和增强后,构建基于ST的DL模型,并将其与基于卷积神经网络(CNN)架构的DenseNet121、DenseNet169、ResNet34、ResNet50、VGG16、GoogleNet模型,基于Transformer架构的Vision Transformer(ViT)模型以及影像组学模型进行对比,计算模型的准确率、受试者工作特征曲线下面积(AUC)、敏感度、特异度,通过混淆矩阵和决策曲线分析(DCA)评估性能。为提高模型的可解释,采用梯度加权类激活映射(Grad-CAM)可视化模型关注区域。结果:ST模型在4个序列的MVI预测任务中总体性能最好,特别是DP序列上预测结果最优,其准确度、AUC(95%CI)、敏感度和特异度分别为0.944、0.993(0.985~0.998)、0.984和0.904,显著优于其他深度学习模型和影像组学模型,DCA图进一步证实其卓越的临床应用价值。Grad-CAM结果显示ST模型能够有效关注肿瘤相关区域。结论:ST在不同序列MRI图像上的各项指标均表现出优异的预测性能,可为临床诊断、治疗决策及预后评估提供有力的辅助工具。 展开更多
关键词 肝细胞癌 微血管侵犯 多序列磁共振成像 swin Transformer 影像组学
暂未订购
Robust Swin Transformer for Vehicle Re-Identification with Dynamic Feature Fusion
15
作者 Saifullah Tumrani Abdul Jabbar Siddiqui 《Computers, Materials & Continua》 2026年第5期605-620,共16页
Vehicle re-identification(ReID)is a challenging task in intelligent transportation,and urban surveillance systems due to its complications in camera viewpoints,vehicle scales,and environmental conditions.Recent transf... Vehicle re-identification(ReID)is a challenging task in intelligent transportation,and urban surveillance systems due to its complications in camera viewpoints,vehicle scales,and environmental conditions.Recent transformer-based approaches have shown impressive performance by utilizing global dependencies,these models struggle with aspect ratio distortions and may overlook fine-grained local attributes crucial for distinguishing visually similar vehicles.We introduce a framework based on Swin Transformers that addresses these challenges by implementing three components.First,to improve feature robustness and maintain vehicle proportions,our Aspect Ratio-Aware Swin Transformer(AR-Swin)preserve the native ratio via letterbox,uses a non-square(16×8)patch-embedding stem,and keeps fixed 7×7 token windows.Second,we introduce a Dynamic Feature Fusion Network(DFFNet)that adaptively integrates global Swin features with local attribute embeddings;such as color and vehicle type enablingmore discriminative representations.Third,our Regional Attention Blocks incorporate regionalmasks into the transformer’s windowed attentionmechanism,effectively highlighting critical details like manufacturer logos or lights.On VeRi-776,we obtain 82.55 mAP,97.26 Rank-1 and 99.23 Rank-5,and on VehicleID we obtain 91.8 Rank-1 and 97.75 Rank-5.The design is drop-in for Swin backbones and emphasizes robustness without increasing architectural complexity.Code:https://github.com/sft110/Swinvreid. 展开更多
关键词 Vehicle ReID swin transformer aspect ratio robustness multi-attribute learning
在线阅读 下载PDF
基于多头自注意力机制优化的Swin Transformer牛肝菌图像识别模型
16
作者 袁梓殊 《南方农业》 2026年第1期105-110,共6页
针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swi... 针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swin Transformer网络进行分类,在包含7类牛肝菌的自建图像数据集上进行训练与测试,结果显示:模型的分类准确率为96.8%,与原始Swin Transformer模型相比,改进模型在类别相似度高的样本上识别更稳定,推理时间保持在单图2 s以内,具备良好的实用性与部署效率,在遮挡、光照变化等非理想条件下测试,该方法具有较强的鲁棒性与泛化能力。 展开更多
关键词 多头自注意力机制 swin Transformer 野生牛肝菌 图像分割
在线阅读 下载PDF
基于REA-Swin-Unet模型的肺部医学影像分割技术
17
作者 龚梁钰 韩波 +2 位作者 李泽慧 李栋梁 朱旭辉 《兰州文理学院学报(自然科学版)》 2026年第2期66-71,107,共7页
人工智能技术的发展推动了计算机视觉在多领域的应用,其中深度学习在医学图像分割中对提升诊断准确性具有重要意义.针对肺部CT图像分割任务,本文提出REA-Swin-Unet网络.该网络在Swin-Unet的基础上,融合了残差网络,同时引入两种注意力模... 人工智能技术的发展推动了计算机视觉在多领域的应用,其中深度学习在医学图像分割中对提升诊断准确性具有重要意义.针对肺部CT图像分割任务,本文提出REA-Swin-Unet网络.该网络在Swin-Unet的基础上,融合了残差网络,同时引入两种注意力模块,有效增强了对不同尺度特征和细节信息的捕捉能力.实验结果表明,REA-Swin-Unet的平均交并比、平均精确率、平均召回率和平均Dice系数分别达到85.29%、93.04%、90.86%和91.65%,相较于基准Swin-Unet网络分别提高了4.61%、2.45%、3.60%和3.08%.与其他主流图像分割网络相比,REA-Swin-Unet取得了最佳分割效果,证明了该方法的优越性. 展开更多
关键词 深度学习 RAM-swin-Unet 注意力机制 图像分割
在线阅读 下载PDF
基于SCEM-Swin-UNet模型脑出血微波检测技术
18
作者 朱旭辉 韩波 +2 位作者 李栋梁 李泽慧 龚梁钰 《淮北师范大学学报(自然科学版)》 2026年第1期61-67,共7页
针对传统微波成像技术存在成像速度缓慢,以及传统神经网络模型在人脑出血图像生成中易出现预测偏差、伪影等问题,提出一种改进SCEM-Swin-UNet模型以实现高精度脑出血图像生成。该模型在Swin-UNet基础上进行结构创新,通过设计串联模块整... 针对传统微波成像技术存在成像速度缓慢,以及传统神经网络模型在人脑出血图像生成中易出现预测偏差、伪影等问题,提出一种改进SCEM-Swin-UNet模型以实现高精度脑出血图像生成。该模型在Swin-UNet基础上进行结构创新,通过设计串联模块整合多尺度特征,引入稀疏混合专家层动态分配计算资源,结合EMA注意力机制增强对图像细微结构捕捉能力,在降低计算复杂度同时显著提升特征提取精度。为满足模型训练需求,采用HFSS仿真系统构建包含丰富出血位置与大小信息的微波成像数据集,通过该数据集对模型参数进行优化训练。与DCGAN、UNet系列等主流模型对比结果表明,SCEM-Swin-UNet生成脑出血图像在精度上显著优于其他模型,能够更准确地预测出血位置与大小,有效抑制伪影产生,大幅降低定位偏差。该模型通过结构优化与数据集创新,成功兼顾计算效率与预测精度,为脑出血疾病无创检测提供一种高效可靠技术方案。 展开更多
关键词 SCEM-swin-UNet HFSS 微波 脑出血 稀疏混合专家层 EMA注意力机制
在线阅读 下载PDF
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
19
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊swin Transformer模块 多尺度胶囊swin Transformer网络 SAR图像目标识别
在线阅读 下载PDF
基于BMF-GADF与改进Swin Transformer的配电网故障选线方法
20
作者 吴小欢 沈景贵 +3 位作者 张欣 胡裕民 徐烨玲 石明玉 《综合智慧能源》 2026年第2期86-95,共10页
由于配电网小电流系统发生单相接地故障时故障特征比较微弱,现有故障选线方法存在准确率低、鲁棒性弱等问题。为此,提出了一种基于巴特沃斯均值滤波-格拉姆角差场(BMF-GADF)与改进Swin Transformer的配电网故障选线方法。该方法将BMF与G... 由于配电网小电流系统发生单相接地故障时故障特征比较微弱,现有故障选线方法存在准确率低、鲁棒性弱等问题。为此,提出了一种基于巴特沃斯均值滤波-格拉姆角差场(BMF-GADF)与改进Swin Transformer的配电网故障选线方法。该方法将BMF与GADF相结合,把零序电流转换为特征增强的GADF图像;将图像样本输入改进的Swin Transformer模型中进行特征提取;改进的Swin Transformer在原架构基础上引入模块并行的卷积注意力机制可实现更准确的特征自适应选择,有效提升模型精度;利用Softmax分类器实现故障线路的选取,试验结果表明,该方法选线准确率达98.96%,相较于其他故障选线方法,具有更高的选线精度与噪声鲁棒性,为配电网故障选线提供了新方案。 展开更多
关键词 故障选线 格拉姆角差场 卷积注意力机制 滑动窗口变换器 特征提取
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部