期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
1
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊swin transformer模块 多尺度胶囊swin transformer网络 SAR图像目标识别
在线阅读 下载PDF
基于融合Swin Transformer网络的腰椎解剖区域自动分割方法
2
作者 张英迪 史泽林 +6 位作者 王欢 崔少千 张磊 刘嘉琛 单修祺 刘云鹏 赵恩波 《信息与控制》 北大核心 2025年第3期390-400,共11页
腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transf... 腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transformer融合网络,将Swin Transformer网络和多尺度空洞卷积融合作为编码器来得到全局和局部特征的层次化表达。设计了特征耦合模块,在通道和空间2个维度将来自Transformer模块和卷积模块的特征进行耦合,提高了模型的局部和长距离建模能力。为了解决开源数据缺乏的问题,提出了带有体素级标注的、包含663个腰椎椎骨计算断层成像的数据集。在此数据集上的实验表明提出的模型分割精度超过了典型医学图像分割方法,本文模型的骰子系数、Hausdorff距离和平均表面距离分别为88.24%、14.48和0.997。消融实验进一步验证了所提出模块的有效性。 展开更多
关键词 卷积神经网络 医学图像分割 transformer 多尺度特征提取
原文传递
轻量型Swin Transformer与多尺度特征融合相结合的人脸表情识别方法 被引量:1
3
作者 李艳秋 李胜赵 +1 位作者 孙光灵 颜普 《光电工程》 北大核心 2025年第1期24-37,共14页
针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利... 针对Swin Transformer模型应用在表情识别上参数量过大、实时性较差和对表情中存在的复杂且微小的表情变化特征捕捉能力有限的问题,提出了一个轻量型Swin Transformer和多尺度特征融合(EMA)模块相结合的人脸表情识别方法。该方法首先利用提出的SPST模块替换掉原Swin Transformer模型第四个stage中的Swin Transformer block模块,来降低模型的参数量,实现模型的轻量化。然后在轻量型模型的第二个stage后嵌入了多尺度特征融合(EMA)模块,通过多尺度特征提取和跨空间信息聚合,有效地增强了模型对人脸表情细节的捕捉能力,从而提高人脸表情识别的准确性和鲁棒性。实验结果表明,所提方法在JAFFE、FERPLUS、RAF-DB和FANE这4个公共数据集上分别达到了97.56%、86.46%、87.29%和70.11%的识别准确率,且相比于原Swin Transformer模型,改进后的模型参数量下降了15.8%,FPS提升了9.6%,在保持模型较低参数量的同时,显著增强了模型的实时性。 展开更多
关键词 表情识别 swin transformer SPST模块 EMA模块
在线阅读 下载PDF
基于Swin Transformer的生成对抗网络水下图像增强模型 被引量:2
4
作者 李慧 贾炳志 +4 位作者 王晨曦 董子宇 李纪龙 仲兆满 陈艳艳 《计算机应用》 北大核心 2025年第5期1439-1446,共8页
针对水下图像对比度低、噪声大和存在色彩偏差等问题,以生成对抗网络(GAN)为核心框架,提出一种基于Swin Transformer的生成对抗网络水下图像增强模型SwinGAN(GAN based on Swin Transformer)。首先,生成网络部分遵循编码器-瓶颈层-解码... 针对水下图像对比度低、噪声大和存在色彩偏差等问题,以生成对抗网络(GAN)为核心框架,提出一种基于Swin Transformer的生成对抗网络水下图像增强模型SwinGAN(GAN based on Swin Transformer)。首先,生成网络部分遵循编码器-瓶颈层-解码器的结构设计,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口;其次,引入双路窗口多头自注意力机制(DWMSA),在加强捕获全局信息和长距离依赖关系的同时,增强局部注意力;最后,在解码器中将下采样后的特征图经过多个上采样窗口重新组合成原始尺寸的特征图,判别网络则采用马尔可夫判别器。实验结果表明,与URSCT-SESR模型相比,在UFO-120数据集上,SwinGAN的峰值信噪比(PSNR)提升了0.837 2 dB,结构相似度(SSIM)提高了0.003 6;在EUVP-515数据集上,SwinGAN的PSNR提升了0.843 9 dB,SSIM提高了0.005 1,水下图像质量评价指标(UIQM)增加了0.112 4,水下彩色图像质量评估指标(UCIQE)略有上升,增加了0.001 0。可见,SwinGAN的主观评价以及客观评价指标都表现出色,在改善水下图像的色彩偏差问题上取得了不错的效果。 展开更多
关键词 水下图像增强 swin transformer 生成对抗网络 多头自注意力机制 马尔可夫判别器
在线阅读 下载PDF
基于Swin Transformer与多尺度特征融合的图像描述方法
5
作者 王子怡 李卫军 +3 位作者 刘雪洋 丁建平 刘世侠 苏易礌 《计算机应用》 北大核心 2025年第10期3154-3160,共7页
基于Transformer的图像描述方法通过多头注意力会在整个输入序列上计算注意力权重,缺乏层次化的特征提取能力,并且两阶段的图像描述方法限制了模型性能。针对上述问题,提出一种基于Swin Transformer与多尺度特征融合的图像描述方法(STM... 基于Transformer的图像描述方法通过多头注意力会在整个输入序列上计算注意力权重,缺乏层次化的特征提取能力,并且两阶段的图像描述方法限制了模型性能。针对上述问题,提出一种基于Swin Transformer与多尺度特征融合的图像描述方法(STMSF)。在编码器中通过Agent Attention保持全局上下文建模能力的同时,提高计算效率;在解码器中提出多尺度交叉注意力(MSCA),融合交叉注意力与深度可分离卷积,在得到多尺度特征的同时更充分地融合多模态特征。实验结果表明,在MSCOCO数据集上与SCD-Net(Semantic-Conditional Diffusion Network)方法相比,STMSF的BLEU4(BiLingual Evaluation Understudy with 4-grams)和CIDEr(Consensus-based Image Description Evaluation)指标分别提升了1.1和5.3个百分点。对比实验和消融实验的结果表明,所提的一阶段STMSF能够有效提高模型性能,生成高质量的图像描述语句。 展开更多
关键词 swin transformer 多尺度特征 特征融合 图像描述 深度可分离卷积
在线阅读 下载PDF
基于Swin-Transformer的多尺度多源域自适应轴承故障诊断 被引量:1
6
作者 周玉国 张志凯 +2 位作者 张金超 于春风 周立俭 《机床与液压》 北大核心 2025年第1期32-42,共11页
针对当前多源域自适应方法无法充分挖掘多源域中不同尺度故障信息的问题,提出一种基于Swin-Transformer(Swin-T)的多尺度多源域自适应轴承故障诊断方法。通过连续小波变换,获得振动信号在不同频带的特征。为更充分地利用多源域中不同尺... 针对当前多源域自适应方法无法充分挖掘多源域中不同尺度故障信息的问题,提出一种基于Swin-Transformer(Swin-T)的多尺度多源域自适应轴承故障诊断方法。通过连续小波变换,获得振动信号在不同频带的特征。为更充分地利用多源域中不同尺度的故障信息,提出基于Swin-T的多尺度特征提取网络。为了减小各域之间的数据分布差异,构建基于最大均值差异的特征对齐网络,并根据不同尺度对分类的贡献赋予权值。此外,构建多尺度特征融合模块,对不同尺度的特征信息进行融合,得到故障特征集。最后,利用Softmax对特征集进行故障分类,并通过最小化多分类器预测差异损失得到最终分类结果。在凯斯西储大学和青岛理工大学轴承数据集上,该方法的故障分类准确度分别达到99.63%和99.40%。 展开更多
关键词 轴承 故障诊断 多源域自适应 swin-transformer 多尺度特征提取 最大均值差异
在线阅读 下载PDF
基于MCSP和Swin Transformer的转录因子结合位点预测模型
7
作者 李雪 石晋雪 +2 位作者 王会青 闫奥煜 王森 《华东理工大学学报(自然科学版)》 北大核心 2025年第4期552-563,共12页
预测转录因子结合位点(Transcription Factor Binding Sites,TFBS)可以帮助识别特定细胞和组织的特异性调控机制,对于理解基因表达调控机制至关重要。现有方法结合DNA的序列和形状信息进行TFBS的预测,生成的形状信息未考虑长侧翼核苷酸... 预测转录因子结合位点(Transcription Factor Binding Sites,TFBS)可以帮助识别特定细胞和组织的特异性调控机制,对于理解基因表达调控机制至关重要。现有方法结合DNA的序列和形状信息进行TFBS的预测,生成的形状信息未考虑长侧翼核苷酸的影响,在对序列信息进行特征提取时忽略了不同通道间特征的互补性,模型的预测能力有待提高。本文提出了TFBS预测模型MSSW,考虑长侧翼核苷酸来生成形状信息;利用Swin Transformer提取形状信息中长程依赖和局部关联相结合的特性,将分裂注意力融入多尺度卷积神经网络(Multiscale Convolution and Split attention,MCSP)来捕获序列中不同通道间特征的互补性,获得跨通道的多尺度序列特征;结合提取的高级序列和形状特征进行TFBS的预测。结果表明,MSSW模型优于现有TFBS预测模型,可有效预测TFBS。 展开更多
关键词 转录因子结合位点 多尺度卷积 分裂注意力 swin transformer Deep DNAshape
在线阅读 下载PDF
基于Swin Transformer的位移与应变测量
8
作者 但西佐 杨浩 李桂华 《光学精密工程》 北大核心 2025年第15期2455-2467,共13页
为解决传统数字图像相关(DIC)方法依赖固定子集而导致的高频位移捕捉能力不足及对复杂应变适应性差的问题,提出了一种基于Swin Transformer的位移与应变同步预测网络模型。该模型由ST-DIC-d(位移预测)和ST-DIC-s(应变预测)两个子网络组... 为解决传统数字图像相关(DIC)方法依赖固定子集而导致的高频位移捕捉能力不足及对复杂应变适应性差的问题,提出了一种基于Swin Transformer的位移与应变同步预测网络模型。该模型由ST-DIC-d(位移预测)和ST-DIC-s(应变预测)两个子网络组成。首先,利用Swin Transformer的分层编码器-解码器结构进行多尺度特征提取;然后,通过注意力机制与跳跃连接有效捕捉图像的局部和全局特征,从而得到位移场;最后,通过应变计算层从位移场精确计算应变分量。在DIC Challenge数据集上的实验结果表明,ST-DIC相比传统DIC方法和基于CNN的模型,平均绝对误差在垂直位移预测上减少21%。在实际拉伸实验中,ST-DIC在高梯度区域最大应变精度提高8%。本文所提出的方法在测量复杂变形方面具有更高的可靠性与精度。 展开更多
关键词 数字图像相关 swin transformer 高频位移 多尺度特征提取 应变测量
在线阅读 下载PDF
融合Swin Transformer的变速箱中壳检测方法研究
9
作者 杨洋 雷钧 +1 位作者 王伟鸣 徐洪胜 《智能计算机与应用》 2025年第7期168-174,共7页
针对汽车变速箱中壳生产线中存在壳体表面孔系定位效率低,检测样本不均衡等问题,本文提出了一种融合Swin Transformer的变速箱中壳检测方法。首先,Swin Transformer作为骨干网络,并结合多尺度特征融合结构,使输出特征能够同时捕捉浅层... 针对汽车变速箱中壳生产线中存在壳体表面孔系定位效率低,检测样本不均衡等问题,本文提出了一种融合Swin Transformer的变速箱中壳检测方法。首先,Swin Transformer作为骨干网络,并结合多尺度特征融合结构,使输出特征能够同时捕捉浅层和深层语义的信息,从而增强检测方法对特征的提取能力;其次,针对Swin Transformer训练需大量数据问题,采用Affine Transformation的方法来提升模型的鲁棒性;最后,通过引入Huber Loss和Focal Loss优化损失函数,以平衡检测样本不均衡的问题。实验结果表明,融合Swin Transformer的检测方法相较于现阶段主流的目标检测算法,在5%~95%IoU的平均精度AP_(5-95)、50%IoU的平均精度AP_(50)和75%IoU的平均精度AP_(75)指标上提高了0.4%~4.5%。同时通过消融实验,进一步验证了该方法在变速箱中壳检测的有效性。 展开更多
关键词 目标检测 swin transformer 多尺度特征融合 变速箱中壳
在线阅读 下载PDF
基于改进Swin Transformer的玉米植株品种识别方法
10
作者 王慎思 刘成忠 《软件工程》 2025年第8期26-31,共6页
玉米作为中国关键粮食作物,其品种识别技术随深度学习和计算机视觉技术的发展而进步。针对玉米籽粒品种识别技术已有所发展,但植株品种分类研究较少的不足,提出一种改进的Swin Transformer模型;通过多尺度特征融合和改进的CBAM注意力机... 玉米作为中国关键粮食作物,其品种识别技术随深度学习和计算机视觉技术的发展而进步。针对玉米籽粒品种识别技术已有所发展,但植株品种分类研究较少的不足,提出一种改进的Swin Transformer模型;通过多尺度特征融合和改进的CBAM注意力机制增强模型的特征表达,提升了模型性能。在自建数据集上的实验结果显示,该方法识别准确率达93.4%,较原模型提高2.7%,且优于ResNet34、VGGNet、MobileNetV2等模型。以上结果表明,所提方法能够进行高效的玉米植株品种识别。 展开更多
关键词 swintransformer 多尺度特征融合 CBAM 品种识别
在线阅读 下载PDF
基于Swin Transformer的联合信源信道编码算法
11
作者 廖潇 李智 《现代信息科技》 2025年第7期1-4,共4页
联合信源信道编码作为语义通信的关键研究方向,已取得初步研究成果。然而,随着图像分辨率的提升,传统的基于卷积神经网络的联合信源信道编码算法在图像语义特征提取方面表现出局限性。为了解决该问题,文章提出了一种基于Swin Transforme... 联合信源信道编码作为语义通信的关键研究方向,已取得初步研究成果。然而,随着图像分辨率的提升,传统的基于卷积神经网络的联合信源信道编码算法在图像语义特征提取方面表现出局限性。为了解决该问题,文章提出了一种基于Swin Transformer的联合信源信道编码算法。该算法首先利用多尺度大核注意力机制初步捕获图像的局部信息和长距离依赖性,然后通过Swin Transformer进一步对图像语义特征进行分层提取和自适应码率编码。实验结果表明,在AWGN和Rayleigh信道模型下,所提出的算法在PSNR和MS-SSIM指标上均优于传统的算法。 展开更多
关键词 联合信源信道编码 swin transformer 多尺度大核注意力
在线阅读 下载PDF
基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络
12
作者 孙林 薛红科 吕娟 《模式识别与人工智能》 北大核心 2025年第8期684-698,共15页
皮肤病变的准确分割对诊断和治疗皮肤病至关重要.针对现有网络因皮肤病变形态多样、与周围组织相似性较高及边界模糊导致的分割结果不精准的问题,文中提出基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络.首先,针... 皮肤病变的准确分割对诊断和治疗皮肤病至关重要.针对现有网络因皮肤病变形态多样、与周围组织相似性较高及边界模糊导致的分割结果不精准的问题,文中提出基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络.首先,针对普通卷积对全局信息捕捉能力不足的问题,构建基于Swin Transformer V2的骨干网络,通过分层结构设计和自注意力机制,实现多尺度特征融合,建立特征的长距离依赖关系,增强多形态下皮肤病变的语义特征提取能力.然后,为了增强网络的特征表达能力,设计动态代理瓶颈模块,根据输入特征自适应生成代理向量与位置偏置,自适应调整局部感受野的关注焦点,进一步解决现有网络在高相似度皮肤组织干扰下皮肤病变分割偏差的问题.最后,为了提高对皮肤病变边缘的感知能力,设计多尺度空洞注意力融合模块,构建基于多分支并行的多尺度空洞卷积特征提取架构,结合空间通道注意力机制,提升对病变边缘的敏感性.文中网络在ISIC2017、PH2、ISIC2018数据集上的实验均取得较优性能,由此验证其有效性. 展开更多
关键词 皮肤病分割 自注意力机制 多尺度特征 swin transformer 特征融合
在线阅读 下载PDF
MSFSwin:SAR与改进Swin Transformer相结合的多特征融合水体提取方法
13
作者 王雷 刘文宋 +3 位作者 张连蓬 李二珠 郭风成 路琦 《地球信息科学学报》 北大核心 2025年第7期1638-1655,共18页
【目的】精细提取全球地表水对水资源管理及气候监测具有重要意义。合成孔径雷达(SAR)凭借主动微波成像技术,可面向多云多雨地区实现全天时、全天候水体动态变化监测。针对传统方法对河网密布、地形复杂地区水体提取精度低以及由于SAR... 【目的】精细提取全球地表水对水资源管理及气候监测具有重要意义。合成孔径雷达(SAR)凭借主动微波成像技术,可面向多云多雨地区实现全天时、全天候水体动态变化监测。针对传统方法对河网密布、地形复杂地区水体提取精度低以及由于SAR成像特性导致难以精准区分水体、山体阴影、裸地等难题,本文提出了一种顾及SAR多通道信息的多尺度特征融合水体提取MSFSwin(Multi-Scale Feature Fusion Swin)网络模型。【方法】通过融合升、降轨Sentinel-1影像的双极化特征及数字高程模型(DEM)构建多通道遥感水体数据集;并引入空洞空间金字塔池化(ASPP)模块,通过不同感受野的特征聚合增强对多尺度水体区域的感知能力,弥补Swin Transformer在跨窗口特征整合方面的不足;同时,设计多层次解码结构,通过层级特征融合强化跨尺度信息交互,实现水体精细提取。为验证本文提出MSFSwin模型的有效性与鲁棒性,选取青藏高原典型水体覆盖区进行水体提取实验,并定性、定量比较不同水体提取方法(含多种深度学习模型及KNN算法)的精度。【结果】MSFSwin模型在水体提取精度上明显优于Swin Transformer、Segformer、ViT等模型及KNN算法。其中,MSFSwin模型在干流湖泊交汇区的BF-score较原模型Swin Transformer提升了4.15%,在细小水体区IoU提升了3.52%,实现了复杂地形下的水体高精度自动提取。【结论】本文通过MSFSwin模型及多通道融合策略对水体、山体阴影等区分效果明显,有效提升了模型在复杂地形条件下水体提取的鲁棒性与适用性,为全天时、全天候、高精度水体提取提供了可靠技术支持。 展开更多
关键词 青藏高原 水体提取 合成孔径雷达 swin transformer网络 多尺度特征融合 山体阴影 复杂地形
原文传递
语义感知下的多尺度U型Swin Transformer人脸超分辨方法
14
作者 张凯兵 张智启 孟雅蕾 《西安工程大学学报》 2025年第5期135-145,共11页
现有的基于卷积神经网络的人脸超分辨方法在细节恢复方面表现出色,然而卷积处理在保持图像整体结构和捕捉长距离依赖方面存在局限性,导致重建质量达不到人们满意的效果。针对上述问题,提出一种新的人脸图像超分辨方法。该方法采用多尺... 现有的基于卷积神经网络的人脸超分辨方法在细节恢复方面表现出色,然而卷积处理在保持图像整体结构和捕捉长距离依赖方面存在局限性,导致重建质量达不到人们满意的效果。针对上述问题,提出一种新的人脸图像超分辨方法。该方法采用多尺度连接的编码器和解码器结构作为主干,旨在重建出结构完整、细节丰富的高分辨人脸图像。具体而言,该方法首先通过浅层特征提取模块提取浅层特征,然后分别通过语义先验模块提取人脸语义信息和多尺度连接的U型Swin Transformer提取深层细节特征,并且将人脸语义信息融合进U型结构中,最后通过图像重建模块重建出高分辨图像。该研究将语义感知与多尺度连接的Transformer架构结合起来,克服了传统卷积网络在长距离依赖和结构保持方面的不足。实验表明:文中方法重建不仅在视觉效果上更清晰,同时为后续相关研究提供了新的思路,与SPARNet相比,在CelebA数据集和Helen数据集上PSNR分别提高了0.99 dB和0.84 dB,在SSIM和LPIPS指标上也具有一定优势。 展开更多
关键词 人脸超分辨 swin transformer 生成对抗网络(GAN) 多头自注意力(MSA) 多尺度特征融合块
在线阅读 下载PDF
结合Swin Transformer的多尺度遥感图像变化检测研究 被引量:4
15
作者 刘丽 张起凡 +1 位作者 白宇昂 黄凯烨 《图学学报》 CSCD 北大核心 2024年第5期941-956,共16页
由于地物信息的复杂性及变化检测数据的多元性,遥感图像特征提取的充分性和有效性难以得到保证,导致变化检测方法获取的检测结果可靠性较低。虽然卷积神经网络(CNN)凭借有效提取语义特征的优势,被广泛应用于遥感领域的变化检测之中,但... 由于地物信息的复杂性及变化检测数据的多元性,遥感图像特征提取的充分性和有效性难以得到保证,导致变化检测方法获取的检测结果可靠性较低。虽然卷积神经网络(CNN)凭借有效提取语义特征的优势,被广泛应用于遥感领域的变化检测之中,但卷积操作固有的局部性导致感受野受限,无法捕获时空上的全局信息以至于特征空间对中远距离依赖关系的建模受限。为捕获远距离的语义依赖,提取深层全局语义特征,设计了一种基于Swin Transformer的多尺度特征融合网络SwinChangeNet。首先,SwinChangeNet采用孪生的多级Swin Transformer特征编码器进行远距离上下文建模;其次,编码器中引入特征差异提取模块,计算不同尺度下变化前后的多级特征差异,再通过自适应融合层将多尺度特征图进行融合;最后,引入残差连接和通道注意力机制对融合后的特征信息进行解码,从而生成完整准确的变化图。在CDD和CD_Data_GZ 2个公开数据集上分别与7种经典和前沿变化检测方法进行比较,CDD数据集中本文模型的性能最优,相比于性能第二的模型,F1分数提高了1.11%,精确率提高了2.38%。CD_Data_GZ数据集中本文模型的性能最优,相比于性能第二的模型,F1分数、精确率和召回率分别提高了4.78%,4.32%,4.09%,提升幅度较大。对比实验结果证明了该模型具有更好的检测效果。在消融实验中也证实了模型中各个改进模块的稳定性和有效性。本文模型针对遥感图像变化检测任务,引入了Swin Transformer结构,使网络可以对遥感图像的局部特征和全局特征进行更有效地编码,让检测结果更加准确,同时保证网络在地物要素种类繁多的数据集上容易收敛。 展开更多
关键词 变化检测 孪生网络 swin transformer 多尺度特征融合 注意力机制 特征差异提取
在线阅读 下载PDF
一种改进型粘连大米实例分割模型Swin-STR
16
作者 张庆辉 张浩宇 +3 位作者 张梦雅 陈卫东 田国军 武勇 《中国粮油学报》 北大核心 2025年第7期177-186,共10页
现有基于卷积神经网络的图像分割方法虽能有效提取粘连大米图像中相似米粒的特征,但在边界模糊和粘连程度不一的情况下,难以实现理想的分割效果。研究受Swin Transformer启发,设计了更加适合粘连大米分割任务的主干网络STRNet,通过考虑... 现有基于卷积神经网络的图像分割方法虽能有效提取粘连大米图像中相似米粒的特征,但在边界模糊和粘连程度不一的情况下,难以实现理想的分割效果。研究受Swin Transformer启发,设计了更加适合粘连大米分割任务的主干网络STRNet,通过考虑图像全局关系及优化粘连大米边缘的分割合理性,构建了一种改进型粘连大米实例分割模型Swin-STR。STRNet包含特征先验模块(FPM)和特征交互融合模块(FIF)2个重要设计,FPM模块通过结合不同尺度的卷积操作,捕捉从局部到全局的多尺度空间信息,增强粘连区域识别,FIF通过多尺度特征融合提升模型对米粒不同程度粘连的分割能力。为了验证所提出模型的有效性,本文构建了包含4种品种大米、多光照干扰、非单一程度粘连的粘连大米实例分割数据集STR-900。实验结果表明,Swin-STR在粘连大米分割任务上相比多种基于卷积神经网络的实例分割模型有更好的效果。与Swin Transformer相比,Swin-STR在Box AP和Mask AP有4.8%和6.7%的提升,表明所提出模型在随机散落籽粒粘连分割任务上的优势。 展开更多
关键词 粘连大米图像 实例分割 swin transformer 多尺度特征 特征交互融合
在线阅读 下载PDF
基于感知增强Swin Transformer的遥感图像检测 被引量:7
17
作者 祝冰艳 陈志华 盛斌 《计算机工程》 CSCD 北大核心 2024年第1期216-223,共8页
随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本... 随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题,提出一种基于感知增强Swin Transformer的遥感图像检测网络,以提升遥感图像检测性能。在主干网络设计过程中,利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度,同时插入空间局部感知块,加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重,解决了正负样本不平衡的问题,同时结合改进的IoU-aware分类损失消除不同分支之间的差距,降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明,该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度,检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络,并且在各类不同尺度的目标上均具有较好的性能表现。 展开更多
关键词 遥感图像 目标检测 swin transformer 多尺度特征 深度学习
在线阅读 下载PDF
一种融合Transformer的多尺度结构图像去模糊方法
18
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 transformer 卷积神经网络 注意力机制
在线阅读 下载PDF
基于Swin-Transformer改进的目标跟踪算法 被引量:1
19
作者 刘时 朱明 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1569-1580,共12页
基于STARK目标跟踪方法中采用ResNet为骨干网络,其特征提取能力不足,跟踪效果较差。针对此问题,本文基于Swin-Transformer网络,提出了一种改进的目标跟踪算法。首先,对Swin-Transformer内窗口注意力机制进行多尺度改进,设计多尺度窗口模... 基于STARK目标跟踪方法中采用ResNet为骨干网络,其特征提取能力不足,跟踪效果较差。针对此问题,本文基于Swin-Transformer网络,提出了一种改进的目标跟踪算法。首先,对Swin-Transformer内窗口注意力机制进行多尺度改进,设计多尺度窗口模块MW-MSA,旨在提取更为丰富的局部细节信息,与全局上下文信息共同构成多尺度判别性特征。接着,结合Transformer的编码-解码结构作为特征融合网络,采用优化的多层感知机作为更新分数判断网络构成状态感知模块。最后,针对目标消失、重现挑战,提出了一种多跟踪器融合方法。融合多尺度改进的跟踪算法和SuperDiMP跟踪算法,设计消失状态判断模块,综合考虑两种跟踪器的置信度分数及目标在预测框附近的可能性估计。实验结果表明,相较STARK跟踪算法,本文算法在GOT-10K数据集上的平均重叠率(AO)提升2.7%、成功率SR_(0.5)提高3.3%。在L-LaSOT数据集上,相较于STARK算法,成功率(AUC)提升0.8%,在目标消失重现挑战下成功率提升1%。 展开更多
关键词 目标跟踪 多尺度窗口 swin-transformer 模板更新 多模型融合
在线阅读 下载PDF
基于Swin Transformer的多尺度边缘优化膀胱癌磁共振成像分割算法 被引量:1
20
作者 刘力宾 李翔 +1 位作者 魏本征 张魁星 《生物医学工程研究》 2023年第1期43-49,共7页
针对膀胱癌磁共振成像(magnetic resonance imaging, MRI)肿瘤区域小、癌变区域边缘模糊等问题,本研究设计了一种以Swin Transformer为骨干网络的多尺度边缘优化膀胱癌MRI分割算法。首先,设计特征提取模块学习细粒度语义特征信息;然后,... 针对膀胱癌磁共振成像(magnetic resonance imaging, MRI)肿瘤区域小、癌变区域边缘模糊等问题,本研究设计了一种以Swin Transformer为骨干网络的多尺度边缘优化膀胱癌MRI分割算法。首先,设计特征提取模块学习细粒度语义特征信息;然后,采用一种多尺度特征金字塔模块解决肿瘤形状复杂多变的问题;最后,采用边缘细节解码模块对肿瘤分割边缘进行优化,提高分割性能。采用五折交叉实验验证算法性能,结果显示,该算法的交并比(IOU)、骰子系数(DICE)和准确率(ACC)分别达到89.11%、93.73%和93.46%。结果表明,本算法分割性能优良,可实现膀胱癌MRI影像精准分割,为临床医生提供辅助诊断工具。 展开更多
关键词 膀胱癌 磁共振成像 swin transformer 多尺度特征提取 分割边缘优化
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部