期刊文献+
共找到414篇文章
< 1 2 21 >
每页显示 20 50 100
DiST-DR:扩散模型驱动的Swin Transformer非线性医学图像微分同胚配准
1
作者 马可航 夏春潮 +3 位作者 陈梦遥 李飞 张思敏 孙怀强 《四川大学学报(自然科学版)》 北大核心 2026年第1期13-24,共12页
医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-D... 医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-DR(Diffusiondriven Swin Transformer for Diffeomorphic Registration)。该模型融合CNN与Swin Transformer作为骨干网络,并引入密集乘法连接(Dense Multiplicative Connection,DMC)模块,以有效融合多尺度特征。此外,DiST-DR引入微分同胚变换,以在配准过程中保持形变场的平滑性与拓扑结构。在心脏MRI与肝脏CT数据集上的实验证明,DiST-DR优于现有先进的配准方法,展现出其在实现精确且拓扑保持的图像配准任务中的应用潜力。 展开更多
关键词 医学图像配准 扩散模型 swin transformer 微分同胚配准
在线阅读 下载PDF
基于Swin Transformer的无线图传语义通信系统性能优化
2
作者 李旋 赖雪冰 +1 位作者 王辩铮 申滨 《华中科技大学学报(自然科学版)》 北大核心 2026年第3期50-60,共11页
为了解决现有语义通信研究大多数采用传统的卷积神经网络(CNN)作为骨干网络,难以兼顾全局信息与局部信息,一定程度上限制了系统的性能表现问题,提出了一种基于Swin Transformer的无线图像传输语义通信(WIT-SC)系统,可以在单个系统模型... 为了解决现有语义通信研究大多数采用传统的卷积神经网络(CNN)作为骨干网络,难以兼顾全局信息与局部信息,一定程度上限制了系统的性能表现问题,提出了一种基于Swin Transformer的无线图像传输语义通信(WIT-SC)系统,可以在单个系统模型下自适应工作于不同的信道状态和传输速率.首先,设计了注意力噪声自适应网络(ANANet),通过引入不同SNR对系统进行训练,并根据SNR水平的变化自动调整系统参数,实现对SNR的动态适应;然后,引入最大互信息网络(MMINet),通过最大化信道两端互信息量来优化编码器,使输出信号具有抵抗信道噪声的鲁棒性;最后,为了控制在不同信噪比(SNR)无线图像的传输速率,重新设计了自适应速率控制网络(ARCNet),通过输出动态的二进制掩码选择所传输的特征,实现对无线图像传输速率的自适应调整.仿真结果表明:与其他基于深度学习的JSCC和传统的信源信道分离编码方案相比,所提出的WIT-SC系统在PSNR和SSIM方面均表现出更优的性能. 展开更多
关键词 语义通信 图像传输 swin transformer SNR自适应 速率自适应
原文传递
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
3
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 swin transformer 级联群体注意力机制
原文传递
基于改进Swin Transformer的钢丝绳漏磁信号分类方法
4
作者 姜帅 胡而已 孙燕华 《无损检测》 2026年第2期13-20,共8页
为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数... 为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数据集,用于模型训练与测试。试验结果表明,所提出的模型在各项评价指标上均优于传统的一维卷积神经网络(1D-CNN)、长短时记忆网络(LSTM)和门控循环单元(GRU),具有强大的特征提取与分类能力。最后,利用可视化工具对模型决策过程进行了解释。 展开更多
关键词 钢丝绳 swin transformer 漏磁检测 磁敏感元件阵列 信号分类
在线阅读 下载PDF
基于改进Swin Transformer的公路隧道衬砌裂缝检测算法
5
作者 刘健 牛沛 +2 位作者 郭峰 寇磊 张瀚鸣 《中国公路学报》 北大核心 2026年第2期187-201,共15页
针对已有目标检测算法在隧道衬砌裂缝检测过程中出现的误检、漏检、抗干扰能力差及检测精度低等问题,提出一种面向实际工况的隧道衬砌裂缝检测算法RSwin。该算法的创新点在于:(1)首次提出了Residual Swin Transformer Block(RSTB),该模... 针对已有目标检测算法在隧道衬砌裂缝检测过程中出现的误检、漏检、抗干扰能力差及检测精度低等问题,提出一种面向实际工况的隧道衬砌裂缝检测算法RSwin。该算法的创新点在于:(1)首次提出了Residual Swin Transformer Block(RSTB),该模块具有针对复杂衬砌裂缝特征的全局建模及局部特征提取能力,增强了多尺度衬砌裂缝特征融合与表征,提高了模型性能及泛化能力;(2)首次融合了Shape-IoU损失函数,优化了形状匹配问题的评估方法,全面地考虑了边界框特性并以此来计算损失值,提高了模型在隧道衬砌裂缝识别任务中的目标框匹配表现。为验证所提出算法的有效性,在自采隧道巡检数据集上采用共11种经典目标检测模型(YOLOv7、YOLOv8、YOLOv9、YOLOv10、Cascade Mask R-CNN、Cascade R-CNN、Faster R-CNN、FSAF(Feature Selective Anchor-free Module)、FCOS(Fully Convolutional One-stage Object Detection)、NAS FCOS(Neural Architecture Search Fully Convolutional One-stage Object Detection)、Mask R-CNN)进行模型对比、训练、验证和测试。训练结果和可视化结果表明:RSwin算法的mAP50为97.6%,相对7种对比算法,分别提高了14.51%、5.57%、4.41%、2.98%、3.2%、2.5%、6.43%、11.7%、3.1%、4.7%、2.4%;同时拥有最快的推理速度,在807像素×606像素的条件下,帧率为9.3帧·s^(-1)。RSwin算法识别精度最高,综合性能最优,可有效应用于实际隧道裂缝检测任务。 展开更多
关键词 隧道工程 目标识别 衬砌检测 swin transformer 计算机视觉 残差结构
原文传递
基于时空Swin Transformer的流固耦合交互序列图像预测网络
6
作者 邹长军 葛志宇 钟晨曦 《系统仿真学报》 北大核心 2026年第1期112-124,共13页
针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口... 针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口多头自注意力(W-MSA)动态嵌入ConvLSTM输出门,实现时序-空间特征的自适应耦合;设计多级ConvLSTM特征提取框架,分层解析固体与流固耦合的复杂时空关联。在自建流固交互数据集上的实验结果表明:所提方法在各数据集上的PSNR指标均取得第一的优异成绩,在SSIM指标上也处于领先位置,且在涡旋细节保持与边界一致性方面显著优于主流模型。所提方法为动态流体交互场景的高效预测提供了新思路。 展开更多
关键词 深度学习 流体动力学 图像预测 ConvLSTM swin transformer
原文传递
基于多序列MRI和Swin Transformer深度学习模型的肝细胞癌微血管侵犯预测
7
作者 黄倩 庄银平 +1 位作者 徐鹏 巩萍 《中国医学物理学杂志》 2026年第2期245-254,共10页
目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊... 目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊的HCC患者,收集患者的术前多序列MRI图像[动脉期(AP)、延迟期(DP)、脂肪抑制T2加权成像(T2WI-FS)、扩散加权成像(DWI)],经过图像预处理和增强后,构建基于ST的DL模型,并将其与基于卷积神经网络(CNN)架构的DenseNet121、DenseNet169、ResNet34、ResNet50、VGG16、GoogleNet模型,基于Transformer架构的Vision Transformer(ViT)模型以及影像组学模型进行对比,计算模型的准确率、受试者工作特征曲线下面积(AUC)、敏感度、特异度,通过混淆矩阵和决策曲线分析(DCA)评估性能。为提高模型的可解释,采用梯度加权类激活映射(Grad-CAM)可视化模型关注区域。结果:ST模型在4个序列的MVI预测任务中总体性能最好,特别是DP序列上预测结果最优,其准确度、AUC(95%CI)、敏感度和特异度分别为0.944、0.993(0.985~0.998)、0.984和0.904,显著优于其他深度学习模型和影像组学模型,DCA图进一步证实其卓越的临床应用价值。Grad-CAM结果显示ST模型能够有效关注肿瘤相关区域。结论:ST在不同序列MRI图像上的各项指标均表现出优异的预测性能,可为临床诊断、治疗决策及预后评估提供有力的辅助工具。 展开更多
关键词 肝细胞癌 微血管侵犯 多序列磁共振成像 swin transformer 影像组学
暂未订购
Robust Swin Transformer for Vehicle Re-Identification with Dynamic Feature Fusion
8
作者 Saifullah Tumrani Abdul Jabbar Siddiqui 《Computers, Materials & Continua》 2026年第5期605-620,共16页
Vehicle re-identification(ReID)is a challenging task in intelligent transportation,and urban surveillance systems due to its complications in camera viewpoints,vehicle scales,and environmental conditions.Recent transf... Vehicle re-identification(ReID)is a challenging task in intelligent transportation,and urban surveillance systems due to its complications in camera viewpoints,vehicle scales,and environmental conditions.Recent transformer-based approaches have shown impressive performance by utilizing global dependencies,these models struggle with aspect ratio distortions and may overlook fine-grained local attributes crucial for distinguishing visually similar vehicles.We introduce a framework based on Swin Transformers that addresses these challenges by implementing three components.First,to improve feature robustness and maintain vehicle proportions,our Aspect Ratio-Aware Swin Transformer(AR-Swin)preserve the native ratio via letterbox,uses a non-square(16×8)patch-embedding stem,and keeps fixed 7×7 token windows.Second,we introduce a Dynamic Feature Fusion Network(DFFNet)that adaptively integrates global Swin features with local attribute embeddings;such as color and vehicle type enablingmore discriminative representations.Third,our Regional Attention Blocks incorporate regionalmasks into the transformer’s windowed attentionmechanism,effectively highlighting critical details like manufacturer logos or lights.On VeRi-776,we obtain 82.55 mAP,97.26 Rank-1 and 99.23 Rank-5,and on VehicleID we obtain 91.8 Rank-1 and 97.75 Rank-5.The design is drop-in for Swin backbones and emphasizes robustness without increasing architectural complexity.Code:https://github.com/sft110/Swinvreid. 展开更多
关键词 Vehicle ReID swin transformer aspect ratio robustness multi-attribute learning
在线阅读 下载PDF
基于多头自注意力机制优化的Swin Transformer牛肝菌图像识别模型
9
作者 袁梓殊 《南方农业》 2026年第1期105-110,共6页
针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swi... 针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swin Transformer网络进行分类,在包含7类牛肝菌的自建图像数据集上进行训练与测试,结果显示:模型的分类准确率为96.8%,与原始Swin Transformer模型相比,改进模型在类别相似度高的样本上识别更稳定,推理时间保持在单图2 s以内,具备良好的实用性与部署效率,在遮挡、光照变化等非理想条件下测试,该方法具有较强的鲁棒性与泛化能力。 展开更多
关键词 多头自注意力机制 swin transformer 野生牛肝菌 图像分割
在线阅读 下载PDF
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
10
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊swin transformer模块 多尺度胶囊swin transformer网络 SAR图像目标识别
在线阅读 下载PDF
不均衡样本下轴承故障的LSGAN‑Swin Transformer诊断方法 被引量:1
11
作者 刘杰 谭玉涛 +1 位作者 谷艳玲 杨娜 《振动工程学报》 北大核心 2025年第8期1775-1787,共13页
针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或... 针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或缺少的轴承数据集,引入窗口自注意力网络进行轴承故障状态识别,使用两种数据集验证所提方法的有效性,并分别与SGAN、WGAN进行对比,证明LSGAN生成的数据训练模型具有更高的准确率。在小样本条件下训练LSGAN,将所提Swin Transformer(Swin-T)模型与CNN、AlexNe和SqueezeNet进行对比,诊断准确率分别提升了34.85%、13.45%和12.95%。通过t-SNE可视化分析对模型分类效果进行评估,结果表明,LSGAN-Swin-T模型在训练样本数量较少时仍能较好地满足故障诊断中的需求,为不均衡数据下的轴承故障诊断研究提供思路。 展开更多
关键词 故障诊断 滚动轴承 不均衡样本 最小二乘生成对抗网络 swin transformer
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:2
12
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 swin transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
Swin Transformer和ConvNeXt的融合无权重遥感场景分类方法
13
作者 奥勇 黄福星 +3 位作者 赵永华 倪赟 丁志豪 李敏 《地理研究》 北大核心 2025年第12期3270-3286,共17页
近年来,深度学习方法被广泛应用到遥感场景影像的分类任务中并取得了较好的效果,极大地提高了遥感场景影像分类效率,然而,现有方法大多依赖模型的预训练权重,如果没有预训练权重,结果可能不理想。针对此问题,本文提出了融合Swin Transfo... 近年来,深度学习方法被广泛应用到遥感场景影像的分类任务中并取得了较好的效果,极大地提高了遥感场景影像分类效率,然而,现有方法大多依赖模型的预训练权重,如果没有预训练权重,结果可能不理想。针对此问题,本文提出了融合Swin Transformer和ConvNeXt模型并在每个阶段融合之后利用EMA模块进行进一步的全局上下文信息提取的三分支融合算法(EMA_ConvNeXt_Swin Transformer:ECST模型),可以在不依赖权重的情况下依然取得较好的分类效果。其中的Swin Transformer分支用于提取图像的全局信息,ConvNeXt分支用于提取图像的局部信息,设计融合模块,对两分支提取得到的结果进一步处理并融合,最后再利用EMA模块对输出特征图在空间位置方向上建立长程依赖关系,可以更加突出特征图的全局上下文信息,从而实现更加丰富的特征聚合。本文选取了NWPU-RESISC45和AID两个数据集进行了相关的实验,得到的最高精度分别为91.25%和90.9%。同时设计了两组对比实验,一组对比实验在同样不利用预训练权重的情况下,将本文模型与经典的深度学习模型AlexNet、VGG、Vision Transformer、ConvNeXt、Swin Transformer进行对比;另一组对比实验与利用预训练权重的主流训练模型进行对比。实验结果表明,本文所提出的模型在精度上取得了明显的优势。在同样不利用预训练权重的情况下,本文所提出的模型与经典模型相比较在精度上得到了更有竞争力的分类精度;和现阶段流行的利用预训练权重的模型进行精度对比,本文所提出的模型亦得到了具有竞争力的分类精度。 展开更多
关键词 遥感影像 swin transformer ConvNeXt 特征融合 场景分类 无权重
原文传递
基于Swin Transformer和归一化流的色织物表面缺陷检测 被引量:1
14
作者 张宏伟 张思怡 王海博 《纺织高校基础科学学报》 2025年第3期39-47,共9页
针对传统深度学习方法在色织物缺陷检测中受限于缺陷样本稀缺、背景复杂和小目标缺陷难以识别的问题,提出一种基于Swin Transformer和归一化流的无监督色织物缺陷检测与定位方法。首先,在训练阶段,仅利用无缺陷色织物图像构建训练集,并... 针对传统深度学习方法在色织物缺陷检测中受限于缺陷样本稀缺、背景复杂和小目标缺陷难以识别的问题,提出一种基于Swin Transformer和归一化流的无监督色织物缺陷检测与定位方法。首先,在训练阶段,仅利用无缺陷色织物图像构建训练集,并采用Swin Transformer提取多尺度特征。接着,利用归一化流建立概率密度估计模型,对正常样本特征进行分布建模,使模型能够学习正常织物特征的潜在空间表示。在推理阶段,将待测色织物图像的特征投影到已学习的特征分布,并计算其异常分数。最后,通过异常分数实现色织物缺陷区域的检测和定位。实验结果表明,该方法能够有效学习正常色织物的特征分布,在复杂背景下准确检测和定位多种织物的缺陷。在YDFID-1数据集上,该方法实现了98.4%的图像级AUROC和96.9%的像素级AUROC,显著优于现有无监督色织物缺陷检测方法。该方法无需缺陷样本和缺陷标注,仅依赖正常样本的特征分布即可进行缺陷判别,提高了检测的泛化能力和鲁棒性。 展开更多
关键词 织物缺陷检测 色织物 swin transformer 无监督缺陷检测 概率密度估计模型 归一化流
在线阅读 下载PDF
基于Swin Transformer的宽带无线图传语义联合编解码方法
15
作者 申滨 李旋 +1 位作者 赖雪冰 杨舒涵 《电子与信息学报》 北大核心 2025年第8期2665-2674,共10页
现有的图像语义通信研究大多集中在高斯信道和瑞利衰落信道等理想化场景中。在实际的无线通信环境中,信道特性往往表现为复杂的多径衰落效应,需要复杂的收发端链路信号处理机制。针对这一现状,该文结合正交频分复用(OFDM)技术,提出一种... 现有的图像语义通信研究大多集中在高斯信道和瑞利衰落信道等理想化场景中。在实际的无线通信环境中,信道特性往往表现为复杂的多径衰落效应,需要复杂的收发端链路信号处理机制。针对这一现状,该文结合正交频分复用(OFDM)技术,提出一种基于Swin Transformer的宽带无线图像传输语义通信(WWIT-SC)系统,旨在解决多径衰落信道下的图像传输问题。WWIT-SC采用Swin Transformer作为语义编解码器的骨干网络,通过在语义编解码器处引入基于信道状态信息(CSI)和坐标注意力(CA)机制,使模型能够将关键的语义特征精确地映射到子载波上,并可以适应时变的信道条件。此外,在接收端设计了信道估计子网(CES)以补偿信道估计误差,从而提升CSI的精确度。实验结果表明,相较于现有最优的基于注意力机制的联合信源信道语义编码方法,WWIT-SC取得了最高9.8%的PSNR增益。 展开更多
关键词 语义通信 swin transformer 正交频分复用 图像传输
在线阅读 下载PDF
基于移位窗口自注意力Swin Transformer的电力系统暂态稳定评估
16
作者 安军 卞浩洋 周毅博 《东北电力大学学报》 2025年第3期1-9,共9页
目前以Transformer为代表的深度学习算法在电力系统暂态稳定评估问题中表现优异,但标准Transformer对暂态数据中的局部特征提取不足。为进一步提高评估准确率,提出一种基于Swin Transformer的电力系统暂态稳定评估方法。该方法使用非重... 目前以Transformer为代表的深度学习算法在电力系统暂态稳定评估问题中表现优异,但标准Transformer对暂态数据中的局部特征提取不足。为进一步提高评估准确率,提出一种基于Swin Transformer的电力系统暂态稳定评估方法。该方法使用非重叠局部窗口+移位窗口代替标准Transformer中固定分块计算自注意力的模式,能够进行局部-全局注意力协同计算,有效提取电力系统暂态数据中的多粒度特征信息,提高模型评估准确率。同时,通过注意力机制引导模型自适应识别并聚焦关键机组,分析注意力权重与系统失稳模式的对应关系,对模型决策进行解释。此外,模型在预测系统暂态稳定性时,计算复杂度仅与特征图大小呈线性关系,与Transformer和特征图大小为平方关系的计算复杂度相比,显著降低模型的训练成本。通过仿真算例表明所提方法与传统深度学习和机器学习方法相比评估性能更优,且相较于标准Transformer计算成本更低。 展开更多
关键词 电力系统 暂态稳定评估 深度学习 swin transformer 自注意力
在线阅读 下载PDF
基于Swin Transformer的太空台风识别模型 被引量:1
17
作者 乔枫 张清和 +5 位作者 邢赞扬 王勇 马羽璋 陆盛 张红波 王飞飞 《极地研究》 北大核心 2025年第3期427-436,共10页
太空台风是发生于地磁平静期极盖区内的一种涡旋状极光亮斑结构,可由局地堪比磁暴的太阳风能量注入引起。为解决从海量星载极光数据中准确而高效地识别出太空台风事件,进而研究太阳风能量注入过程等关键问题,本文基于Swin Transformer... 太空台风是发生于地磁平静期极盖区内的一种涡旋状极光亮斑结构,可由局地堪比磁暴的太阳风能量注入引起。为解决从海量星载极光数据中准确而高效地识别出太空台风事件,进而研究太阳风能量注入过程等关键问题,本文基于Swin Transformer构建了可用于美国国防气象卫星星载紫外光谱成像仪极光图像的太空台风识别模型。该模型通过拆分窗口加速计算,并使用移动窗口多头自注意力方法搭建窗口间信息传输通道,从而实现太空台风的自动识别。研究表明,该模型通过南北半球极盖区的太空台风图像数据集进行训练,实现了对太空台风事件更加精准的识别,其准确率高达95.94%。 展开更多
关键词 swin transformer 太空台风 识别模型 深度学习
在线阅读 下载PDF
Swin Transformer V2和特征融合的U-Net图像去噪方法 被引量:1
18
作者 利铭康 柳薇 陈卫东 《中国图象图形学报》 北大核心 2025年第11期3524-3534,共11页
目的Transformer神经网络在图像去噪上效果显著,但要进一步提升去噪质量,需要增加大量的训练和预测资源;另外,原始Swin Transformer对高分辨率图像输入缺少良好的适应性。对此,设计了一种基于Swin Transformer V2的U-Net图像去噪深度学... 目的Transformer神经网络在图像去噪上效果显著,但要进一步提升去噪质量,需要增加大量的训练和预测资源;另外,原始Swin Transformer对高分辨率图像输入缺少良好的适应性。对此,设计了一种基于Swin Transformer V2的U-Net图像去噪深度学习网络。方法该网络在下采样阶段设计了一种包括Swin Transformer V2和卷积并行提取特征的Transformer块,然后在上采样阶段设计了一种特征融合机制以提升网络的特征学习能力。针对图像去噪任务对Transformer块修改了归一化位置及采用镜像填充机制,提高Swin Transformer V2块的适应性。结果在CBSD68(color Berkeley segmentation dataset)、Kodak24、McMaster和彩色Urban100这4个图像去噪常用测试集上进行去噪实验,选择峰值信噪比(peak signal-to-noise ratio,PSNR)作为去噪效果的评价指标,在噪声等级为50的去噪实验中,得到的平均PSNR值分别为28.59 dB、29.87 dB、30.27 dB和29.88 dB,并与几种流行的基于卷积和基于Transformer的去噪方法进行比较。本文的去噪算法优于基于卷积的去噪方法,而相比于性能接近的基于Transformer方法,本文去噪算法所需浮点运算量仅为26.12%。结论本文方法使用的Swin Transformer V2和特征融合机制均可以有效提升图像去噪效果。与现有方法相比,本文方法在保证或提升图像去噪效果的前提下,大幅度降低了训练和预测所需要的计算资源。 展开更多
关键词 深度学习 图像去噪 swin transformer U-Net 特征融合
原文传递
一种基于改进Swin Transformer模型的阿尔茨海默病MRI图像分类方法研究 被引量:2
19
作者 赵姗姗 史浩霖 +1 位作者 王颖帅 万艳丽 《医学信息学杂志》 2025年第5期79-85,97,共8页
目的/意义开发更有效的磁共振成像分类模型,提升阿尔茨海默病早期诊断准确率,提高患者生活质量。方法/过程基于Swin Transformer模型,结合多分辨率特征融合(multi-resolution feature fusion,MRFF)模块,提出一种改进的网络结构Swin Tran... 目的/意义开发更有效的磁共振成像分类模型,提升阿尔茨海默病早期诊断准确率,提高患者生活质量。方法/过程基于Swin Transformer模型,结合多分辨率特征融合(multi-resolution feature fusion,MRFF)模块,提出一种改进的网络结构Swin Transformer+MRFF。采用数据增强和扩充策略,解决样本不足和类别不平衡问题。通过与其他深度学习模型的对比实验,评估改进模型在阿尔茨海默病识别中的优势。结果/结论改进后的Swin Transformer+MRFF模型在OASIS-1数据集上表现显著优于基础模型,显著提高了轻度痴呆和无痴呆类别的识别能力。 展开更多
关键词 swin transformer模型 多分辨率特征融合 磁共振成像医学图像分类 阿尔茨海默病
暂未订购
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法 被引量:5
20
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 swin transformer SPST模块 EMA模块
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部