期刊文献+
共找到534篇文章
< 1 2 27 >
每页显示 20 50 100
基于Swin-PIDNet的纸质工程制图线型识别方法
1
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
YOLO11-Swin:一种面向复杂水下环境的目标检测模型
2
作者 郑广海 张倩 张薇 《计算机科学与应用》 2026年第1期374-387,共14页
水下目标检测在海洋资源开发与生态环境监测中至关重要,但水下图像的低对比度、色彩失真及复杂背景干扰为精准检测带来巨大挑战。为克服传统方法在特征提取与小目标识别上的局限,本文提出一种深度融合Swin Transformer与YOLO11架构的新... 水下目标检测在海洋资源开发与生态环境监测中至关重要,但水下图像的低对比度、色彩失真及复杂背景干扰为精准检测带来巨大挑战。为克服传统方法在特征提取与小目标识别上的局限,本文提出一种深度融合Swin Transformer与YOLO11架构的新型检测模型(A Novel Detection Model with Deep Integration of Swin Transformer and YOLO11 Architectures, YOLO11-Swin)。该模型以Swin Transformer作为主干特征提取网络,利用其分层设计与滑动窗口自注意力机制,有效捕获图像的全局上下文依赖关系,增强对模糊、遮挡目标的表征能力。在特征融合阶段,本文设计了一种跨层特征聚合机制(Cross-layer Feature Aggregation, CFA),通过全局池化与自适应权重计算,引导不同尺度特征图进行高效信息交互,以解决特征金字塔中的语义间隙与尺度不匹配问题。此外,在各级特征图输出端嵌入卷积注意力模块(Convolutional Block Attention Module, CBAM),通过串行的通道与空间注意力子模块,自适应地优化特征响应,突出目标区域并抑制背景噪声。针对水下数据集正负样本不均衡的问题,模型采用Focal Loss作为分类损失函数,以聚焦困难样本的训练,提升模型收敛速度与稳健性。在URPC数据集上的实验结果表明,YOLO11-Swin的mAP@50达到75.54%,相比基线YOLO11模型显著提升9.42%。特别地,对小目标(如扇贝)的检测平均精度(AP)提升10.16%,召回率(Recall)提高4.55%,充分验证了所提模型在复杂水下环境下的有效性与先进性。 展开更多
关键词 水下目标检测 YOLO11 swin Transformer 跨层融合 注意力机制
在线阅读 下载PDF
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
3
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 swin Transformer 级联群体注意力机制
原文传递
样本不均衡条件下滚动轴承故障FCWT-DDIM-SwinT识别方法
4
作者 孙祥海 邱明 +4 位作者 李军星 张松林 刘志卫 刘静涛 高锐 《河南科技大学学报(自然科学版)》 北大核心 2026年第1期53-62,M0005,共11页
针对滚动轴承故障识别中因样本不均衡导致准确率低的问题,提出一种去噪扩散隐式模型(DDIM)结合Swin Transformer(SwinT)的故障识别方法。首先,对采集到的滚动轴承原始振动信号进行快速连续小波变换(FCWT),将其重构为二维时频图像。然后... 针对滚动轴承故障识别中因样本不均衡导致准确率低的问题,提出一种去噪扩散隐式模型(DDIM)结合Swin Transformer(SwinT)的故障识别方法。首先,对采集到的滚动轴承原始振动信号进行快速连续小波变换(FCWT),将其重构为二维时频图像。然后,使用DDIM扩充原始不均衡数据集,构建出故障样本类别分布均衡数据集。最后,将均衡数据集应用于SwinT模型的训练过程,从而实现滚动轴承多种故障类型的准确诊断。工程实例表明:利用DDIM能够有效解决故障样本不均衡的问题;同时,与其他识别模型相比,SwinT模型的平均识别准确率提高了5.72%,具有更优越的轴承故障识别能力。 展开更多
关键词 滚动轴承 快速连续小波变换 去噪扩散隐式模型 swin Transformer 故障识别
在线阅读 下载PDF
基于Swin-UNet的破损碑刻文字识别方法
5
作者 李晓亮 李光亚 孟志琳 《机械与电子》 2026年第1期28-34,共7页
提出了基于Swin-UNet的破损碑刻文字识别方法。为了能够获取准确的碑刻文字信息,采用Swin Transformer结构代替U-Net结构在分割任务中的下采样和上采样过程,并在其中添加了优化融合特征信息的注意力模块CBAM与SENet模块,同时使用带权重... 提出了基于Swin-UNet的破损碑刻文字识别方法。为了能够获取准确的碑刻文字信息,采用Swin Transformer结构代替U-Net结构在分割任务中的下采样和上采样过程,并在其中添加了优化融合特征信息的注意力模块CBAM与SENet模块,同时使用带权重的交叉熵损失函数对损失函数进行优化。自然场景下的碑刻文字往往会受到各种各样的损害,故之后在数据集的基础上建立文字的语义分割数据库,同时设计算法对缺损的碑刻文字基于数据库进行识别。实验表明,在真实碑刻图片中,文字缺失2个笔画以内,识别正确率为32.60%,识别结果前5个文字中有正确的汉字视为识别正确的概率为64.20%,识别结果前10个文字中有正确的汉字视为识别正确的概率为77.20%。所提方法相较于其他的语义分割模型对笔画的分割更为准确,效果更好。 展开更多
关键词 碑刻文字 文字识别 swin Transformer U-Net 语义分割
在线阅读 下载PDF
基于改进Swin Transformer的钢丝绳漏磁信号
6
作者 姜帅 胡而已 孙燕华 《无损检测》 2026年第2期13-20,共8页
为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数... 为了解决钢丝绳漏磁检测过程中抖动信号的干扰问题并实现缺陷信号的准确分类,提出一种基于改进Swin Transformer的多通道漏磁信号分类方法。通过环形阵列传感器采集多通道漏磁信号,并结合数据增强技术,构建一个包含4类信号的漏磁信号数据集,用于模型训练与测试。试验结果表明,所提出的模型在各项评价指标上均优于传统的一维卷积神经网络(1D-CNN)、长短时记忆网络(LSTM)和门控循环单元(GRU),具有强大的特征提取与分类能力。最后,利用可视化工具对模型决策过程进行了解释。 展开更多
关键词 钢丝绳 swin Transformer 漏磁检测 磁敏感元件阵列 信号分类
在线阅读 下载PDF
基于时空Swin Transformer的流固耦合交互序列图像预测网络
7
作者 邹长军 葛志宇 钟晨曦 《系统仿真学报》 北大核心 2026年第1期112-124,共13页
针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口... 针对现有流体动力学模拟方法在动态流固耦合交互场景中长时间依赖建模与多尺度特征提取不足的问题,提出一种融合ConvLSTM与Swin Transformer的时空深度学习模型(SwinLSTM)。通过门控驱动的时空协同注意力机制,将Swin Transformer的窗口多头自注意力(W-MSA)动态嵌入ConvLSTM输出门,实现时序-空间特征的自适应耦合;设计多级ConvLSTM特征提取框架,分层解析固体与流固耦合的复杂时空关联。在自建流固交互数据集上的实验结果表明:所提方法在各数据集上的PSNR指标均取得第一的优异成绩,在SSIM指标上也处于领先位置,且在涡旋细节保持与边界一致性方面显著优于主流模型。所提方法为动态流体交互场景的高效预测提供了新思路。 展开更多
关键词 深度学习 流体动力学 图像预测 ConvLSTM swin Transformer
原文传递
基于多序列MRI和Swin Transformer深度学习模型的肝细胞癌微血管侵犯预测
8
作者 黄倩 庄银平 +1 位作者 徐鹏 巩萍 《中国医学物理学杂志》 2026年第2期245-254,共10页
目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊... 目的:开发并验证基于多序列MRI的Swin Transformer(ST)深度学习模型在肝细胞癌(HCC)微血管侵犯(MVI)预测中的应用价值,为HCC患者的精准诊疗提供新的解决方案和客观、科学依据。方法:回顾性纳入徐州医科大学附属医院174例经手术病理确诊的HCC患者,收集患者的术前多序列MRI图像[动脉期(AP)、延迟期(DP)、脂肪抑制T2加权成像(T2WI-FS)、扩散加权成像(DWI)],经过图像预处理和增强后,构建基于ST的DL模型,并将其与基于卷积神经网络(CNN)架构的DenseNet121、DenseNet169、ResNet34、ResNet50、VGG16、GoogleNet模型,基于Transformer架构的Vision Transformer(ViT)模型以及影像组学模型进行对比,计算模型的准确率、受试者工作特征曲线下面积(AUC)、敏感度、特异度,通过混淆矩阵和决策曲线分析(DCA)评估性能。为提高模型的可解释,采用梯度加权类激活映射(Grad-CAM)可视化模型关注区域。结果:ST模型在4个序列的MVI预测任务中总体性能最好,特别是DP序列上预测结果最优,其准确度、AUC(95%CI)、敏感度和特异度分别为0.944、0.993(0.985~0.998)、0.984和0.904,显著优于其他深度学习模型和影像组学模型,DCA图进一步证实其卓越的临床应用价值。Grad-CAM结果显示ST模型能够有效关注肿瘤相关区域。结论:ST在不同序列MRI图像上的各项指标均表现出优异的预测性能,可为临床诊断、治疗决策及预后评估提供有力的辅助工具。 展开更多
关键词 肝细胞癌 微血管侵犯 多序列磁共振成像 swin Transformer 影像组学
暂未订购
基于多头自注意力机制优化的Swin Transformer牛肝菌图像识别模型
9
作者 袁梓殊 《南方农业》 2026年第1期105-110,共6页
针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swi... 针对复杂自然环境下野生牛肝菌图像识别难的问题,提出一种融合图像分割与Swin Transformer结构的野生牛肝菌分类方法,通过Labelme标注实现前景掩码提取,并将前景图像输入基于多头自注意力机制(Multi-Head Self-Attention,MHSA)优化的Swin Transformer网络进行分类,在包含7类牛肝菌的自建图像数据集上进行训练与测试,结果显示:模型的分类准确率为96.8%,与原始Swin Transformer模型相比,改进模型在类别相似度高的样本上识别更稳定,推理时间保持在单图2 s以内,具备良好的实用性与部署效率,在遮挡、光照变化等非理想条件下测试,该方法具有较强的鲁棒性与泛化能力。 展开更多
关键词 多头自注意力机制 swin Transformer 野生牛肝菌 图像分割
在线阅读 下载PDF
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
10
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊swin Transformer模块 多尺度胶囊swin Transformer网络 SAR图像目标识别
在线阅读 下载PDF
基于BMF-GADF与改进Swin Transformer的配电网故障选线方法
11
作者 吴小欢 沈景贵 +3 位作者 张欣 胡裕民 徐烨玲 石明玉 《综合智慧能源》 2026年第2期86-95,共10页
由于配电网小电流系统发生单相接地故障时故障特征比较微弱,现有故障选线方法存在准确率低、鲁棒性弱等问题。为此,提出了一种基于巴特沃斯均值滤波-格拉姆角差场(BMF-GADF)与改进Swin Transformer的配电网故障选线方法。该方法将BMF与G... 由于配电网小电流系统发生单相接地故障时故障特征比较微弱,现有故障选线方法存在准确率低、鲁棒性弱等问题。为此,提出了一种基于巴特沃斯均值滤波-格拉姆角差场(BMF-GADF)与改进Swin Transformer的配电网故障选线方法。该方法将BMF与GADF相结合,把零序电流转换为特征增强的GADF图像;将图像样本输入改进的Swin Transformer模型中进行特征提取;改进的Swin Transformer在原架构基础上引入模块并行的卷积注意力机制可实现更准确的特征自适应选择,有效提升模型精度;利用Softmax分类器实现故障线路的选取,试验结果表明,该方法选线准确率达98.96%,相较于其他故障选线方法,具有更高的选线精度与噪声鲁棒性,为配电网故障选线提供了新方案。 展开更多
关键词 故障选线 格拉姆角差场 卷积注意力机制 滑动窗口变换器 特征提取
在线阅读 下载PDF
不均衡样本下轴承故障的LSGAN‑Swin Transformer诊断方法 被引量:1
12
作者 刘杰 谭玉涛 +1 位作者 谷艳玲 杨娜 《振动工程学报》 北大核心 2025年第8期1775-1787,共13页
针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或... 针对轴承在复杂环境下工作时故障数据难以大量获取,正常数据与故障数据比例严重失衡造成的深度模型训练不充分、诊断精度低等问题,提出一种基于LSGAN-Swin Transformer的轴承故障诊断方法,利用最小二乘生成对抗网络(LSGAN)扩充不均衡或缺少的轴承数据集,引入窗口自注意力网络进行轴承故障状态识别,使用两种数据集验证所提方法的有效性,并分别与SGAN、WGAN进行对比,证明LSGAN生成的数据训练模型具有更高的准确率。在小样本条件下训练LSGAN,将所提Swin Transformer(Swin-T)模型与CNN、AlexNe和SqueezeNet进行对比,诊断准确率分别提升了34.85%、13.45%和12.95%。通过t-SNE可视化分析对模型分类效果进行评估,结果表明,LSGAN-Swin-T模型在训练样本数量较少时仍能较好地满足故障诊断中的需求,为不均衡数据下的轴承故障诊断研究提供思路。 展开更多
关键词 故障诊断 滚动轴承 不均衡样本 最小二乘生成对抗网络 swin Transformer
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:2
13
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 swin Transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
Swin Transformer和ConvNeXt的融合无权重遥感场景分类方法
14
作者 奥勇 黄福星 +3 位作者 赵永华 倪赟 丁志豪 李敏 《地理研究》 北大核心 2025年第12期3270-3286,共17页
近年来,深度学习方法被广泛应用到遥感场景影像的分类任务中并取得了较好的效果,极大地提高了遥感场景影像分类效率,然而,现有方法大多依赖模型的预训练权重,如果没有预训练权重,结果可能不理想。针对此问题,本文提出了融合Swin Transfo... 近年来,深度学习方法被广泛应用到遥感场景影像的分类任务中并取得了较好的效果,极大地提高了遥感场景影像分类效率,然而,现有方法大多依赖模型的预训练权重,如果没有预训练权重,结果可能不理想。针对此问题,本文提出了融合Swin Transformer和ConvNeXt模型并在每个阶段融合之后利用EMA模块进行进一步的全局上下文信息提取的三分支融合算法(EMA_ConvNeXt_Swin Transformer:ECST模型),可以在不依赖权重的情况下依然取得较好的分类效果。其中的Swin Transformer分支用于提取图像的全局信息,ConvNeXt分支用于提取图像的局部信息,设计融合模块,对两分支提取得到的结果进一步处理并融合,最后再利用EMA模块对输出特征图在空间位置方向上建立长程依赖关系,可以更加突出特征图的全局上下文信息,从而实现更加丰富的特征聚合。本文选取了NWPU-RESISC45和AID两个数据集进行了相关的实验,得到的最高精度分别为91.25%和90.9%。同时设计了两组对比实验,一组对比实验在同样不利用预训练权重的情况下,将本文模型与经典的深度学习模型AlexNet、VGG、Vision Transformer、ConvNeXt、Swin Transformer进行对比;另一组对比实验与利用预训练权重的主流训练模型进行对比。实验结果表明,本文所提出的模型在精度上取得了明显的优势。在同样不利用预训练权重的情况下,本文所提出的模型与经典模型相比较在精度上得到了更有竞争力的分类精度;和现阶段流行的利用预训练权重的模型进行精度对比,本文所提出的模型亦得到了具有竞争力的分类精度。 展开更多
关键词 遥感影像 swin Transformer ConvNeXt 特征融合 场景分类 无权重
原文传递
一种改进型粘连大米实例分割模型Swin-STR
15
作者 张庆辉 张浩宇 +3 位作者 张梦雅 陈卫东 田国军 武勇 《中国粮油学报》 北大核心 2025年第7期177-186,共10页
现有基于卷积神经网络的图像分割方法虽能有效提取粘连大米图像中相似米粒的特征,但在边界模糊和粘连程度不一的情况下,难以实现理想的分割效果。研究受Swin Transformer启发,设计了更加适合粘连大米分割任务的主干网络STRNet,通过考虑... 现有基于卷积神经网络的图像分割方法虽能有效提取粘连大米图像中相似米粒的特征,但在边界模糊和粘连程度不一的情况下,难以实现理想的分割效果。研究受Swin Transformer启发,设计了更加适合粘连大米分割任务的主干网络STRNet,通过考虑图像全局关系及优化粘连大米边缘的分割合理性,构建了一种改进型粘连大米实例分割模型Swin-STR。STRNet包含特征先验模块(FPM)和特征交互融合模块(FIF)2个重要设计,FPM模块通过结合不同尺度的卷积操作,捕捉从局部到全局的多尺度空间信息,增强粘连区域识别,FIF通过多尺度特征融合提升模型对米粒不同程度粘连的分割能力。为了验证所提出模型的有效性,本文构建了包含4种品种大米、多光照干扰、非单一程度粘连的粘连大米实例分割数据集STR-900。实验结果表明,Swin-STR在粘连大米分割任务上相比多种基于卷积神经网络的实例分割模型有更好的效果。与Swin Transformer相比,Swin-STR在Box AP和Mask AP有4.8%和6.7%的提升,表明所提出模型在随机散落籽粒粘连分割任务上的优势。 展开更多
关键词 粘连大米图像 实例分割 swin Transformer 多尺度特征 特征交互融合
在线阅读 下载PDF
基于Swin Transformer和归一化流的色织物表面缺陷检测 被引量:1
16
作者 张宏伟 张思怡 王海博 《纺织高校基础科学学报》 2025年第3期39-47,共9页
针对传统深度学习方法在色织物缺陷检测中受限于缺陷样本稀缺、背景复杂和小目标缺陷难以识别的问题,提出一种基于Swin Transformer和归一化流的无监督色织物缺陷检测与定位方法。首先,在训练阶段,仅利用无缺陷色织物图像构建训练集,并... 针对传统深度学习方法在色织物缺陷检测中受限于缺陷样本稀缺、背景复杂和小目标缺陷难以识别的问题,提出一种基于Swin Transformer和归一化流的无监督色织物缺陷检测与定位方法。首先,在训练阶段,仅利用无缺陷色织物图像构建训练集,并采用Swin Transformer提取多尺度特征。接着,利用归一化流建立概率密度估计模型,对正常样本特征进行分布建模,使模型能够学习正常织物特征的潜在空间表示。在推理阶段,将待测色织物图像的特征投影到已学习的特征分布,并计算其异常分数。最后,通过异常分数实现色织物缺陷区域的检测和定位。实验结果表明,该方法能够有效学习正常色织物的特征分布,在复杂背景下准确检测和定位多种织物的缺陷。在YDFID-1数据集上,该方法实现了98.4%的图像级AUROC和96.9%的像素级AUROC,显著优于现有无监督色织物缺陷检测方法。该方法无需缺陷样本和缺陷标注,仅依赖正常样本的特征分布即可进行缺陷判别,提高了检测的泛化能力和鲁棒性。 展开更多
关键词 织物缺陷检测 色织物 swin Transformer 无监督缺陷检测 概率密度估计模型 归一化流
在线阅读 下载PDF
基于Swin Transformer的宽带无线图传语义联合编解码方法
17
作者 申滨 李旋 +1 位作者 赖雪冰 杨舒涵 《电子与信息学报》 北大核心 2025年第8期2665-2674,共10页
现有的图像语义通信研究大多集中在高斯信道和瑞利衰落信道等理想化场景中。在实际的无线通信环境中,信道特性往往表现为复杂的多径衰落效应,需要复杂的收发端链路信号处理机制。针对这一现状,该文结合正交频分复用(OFDM)技术,提出一种... 现有的图像语义通信研究大多集中在高斯信道和瑞利衰落信道等理想化场景中。在实际的无线通信环境中,信道特性往往表现为复杂的多径衰落效应,需要复杂的收发端链路信号处理机制。针对这一现状,该文结合正交频分复用(OFDM)技术,提出一种基于Swin Transformer的宽带无线图像传输语义通信(WWIT-SC)系统,旨在解决多径衰落信道下的图像传输问题。WWIT-SC采用Swin Transformer作为语义编解码器的骨干网络,通过在语义编解码器处引入基于信道状态信息(CSI)和坐标注意力(CA)机制,使模型能够将关键的语义特征精确地映射到子载波上,并可以适应时变的信道条件。此外,在接收端设计了信道估计子网(CES)以补偿信道估计误差,从而提升CSI的精确度。实验结果表明,相较于现有最优的基于注意力机制的联合信源信道语义编码方法,WWIT-SC取得了最高9.8%的PSNR增益。 展开更多
关键词 语义通信 swin Transformer 正交频分复用 图像传输
在线阅读 下载PDF
基于移位窗口自注意力Swin Transformer的电力系统暂态稳定评估
18
作者 安军 卞浩洋 周毅博 《东北电力大学学报》 2025年第3期1-9,共9页
目前以Transformer为代表的深度学习算法在电力系统暂态稳定评估问题中表现优异,但标准Transformer对暂态数据中的局部特征提取不足。为进一步提高评估准确率,提出一种基于Swin Transformer的电力系统暂态稳定评估方法。该方法使用非重... 目前以Transformer为代表的深度学习算法在电力系统暂态稳定评估问题中表现优异,但标准Transformer对暂态数据中的局部特征提取不足。为进一步提高评估准确率,提出一种基于Swin Transformer的电力系统暂态稳定评估方法。该方法使用非重叠局部窗口+移位窗口代替标准Transformer中固定分块计算自注意力的模式,能够进行局部-全局注意力协同计算,有效提取电力系统暂态数据中的多粒度特征信息,提高模型评估准确率。同时,通过注意力机制引导模型自适应识别并聚焦关键机组,分析注意力权重与系统失稳模式的对应关系,对模型决策进行解释。此外,模型在预测系统暂态稳定性时,计算复杂度仅与特征图大小呈线性关系,与Transformer和特征图大小为平方关系的计算复杂度相比,显著降低模型的训练成本。通过仿真算例表明所提方法与传统深度学习和机器学习方法相比评估性能更优,且相较于标准Transformer计算成本更低。 展开更多
关键词 电力系统 暂态稳定评估 深度学习 swin Transformer 自注意力
在线阅读 下载PDF
基于Swin-Unet的二维电阻率反演
19
作者 余国锋 任波 +2 位作者 韩云春 黄刚 杨庆开 《绿色科技》 2025年第24期188-195,共8页
针对传统电阻率反演方法在处理强非线性地质结构时存在的模型失配与局部极小值问题,本研究提出了一种基于Swin-Unet的二维电阻率反演方法。该方法融合了Swin Transformer的滑动窗口自注意力机制与U-Net的编解码架构,可实现对地下电阻率... 针对传统电阻率反演方法在处理强非线性地质结构时存在的模型失配与局部极小值问题,本研究提出了一种基于Swin-Unet的二维电阻率反演方法。该方法融合了Swin Transformer的滑动窗口自注意力机制与U-Net的编解码架构,可实现对地下电阻率分布的高精度、高效率反演。利用pyGIMLi构建了包含9000个地电模型的综合数据集,并通过有限元正演模拟生成对应的视电阻率数据。实验结果表明:Swin-Unet在验证集上的决定系数(R^(2))达到0.9321,均方误差(MSE)为0.0654,相比标准U-Net和迭代重加权最小二乘法(iteratively reweighted least squares,IRLS),误差分别降低了31.9%和47.7%。同时,该方法单样本推理耗时仅为15 ms,效率约为IRLS的21倍。在单、双异常体模型中,Swin-Unet均能准确还原异常体的位置(水平偏差小于3 m)、形态及其电阻率对比度。本研究为地球物理反演提供了一种新的深度学习范式,其高效性与准确性可用于水文地质、工程勘探等领域的地下异常体识别与成像。 展开更多
关键词 swin-Unet 电阻率反演 电法勘探 目标检测 深度学习
在线阅读 下载PDF
基于Swin Transformer的太空台风识别模型 被引量:1
20
作者 乔枫 张清和 +5 位作者 邢赞扬 王勇 马羽璋 陆盛 张红波 王飞飞 《极地研究》 北大核心 2025年第3期427-436,共10页
太空台风是发生于地磁平静期极盖区内的一种涡旋状极光亮斑结构,可由局地堪比磁暴的太阳风能量注入引起。为解决从海量星载极光数据中准确而高效地识别出太空台风事件,进而研究太阳风能量注入过程等关键问题,本文基于Swin Transformer... 太空台风是发生于地磁平静期极盖区内的一种涡旋状极光亮斑结构,可由局地堪比磁暴的太阳风能量注入引起。为解决从海量星载极光数据中准确而高效地识别出太空台风事件,进而研究太阳风能量注入过程等关键问题,本文基于Swin Transformer构建了可用于美国国防气象卫星星载紫外光谱成像仪极光图像的太空台风识别模型。该模型通过拆分窗口加速计算,并使用移动窗口多头自注意力方法搭建窗口间信息传输通道,从而实现太空台风的自动识别。研究表明,该模型通过南北半球极盖区的太空台风图像数据集进行训练,实现了对太空台风事件更加精准的识别,其准确率高达95.94%。 展开更多
关键词 swin Transformer 太空台风 识别模型 深度学习
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部