基于CNN和视觉状态空间的遥感影像语义分割被引量：1

CNN and visual state space based semantic segmentation of remote sensing images

下载PDF

导出

摘要随着深度学习的发展,基于CNN和Transformer的语义分割在遥感领域得到了广泛应用。然而,这些方法仍存在局限:前者缺乏远程建模能力,后者受制于计算复杂性。最近,Mamba所提出的视觉状态空间(visual state space,VSS)模型展现了其能够对远程关系进行有效线性计算的能力。受此启发,提出了一种基于CNN和视觉状态空间的遥感影像语义分割网络,以克服现有方法的局限。首先,构建一个由CNN和VSS分支组成的架构,并行提取多尺度特征信息,挖掘局部相关性并捕获远程上下文依赖关系,并将VSS代替Transformer应用于解码器;其次,设计了协同调制模块学习空间权重调制特征,以自适应融合双分支语义信息,增强语义信息间的依赖关系;最后,使用额外的辅助头优化网络,通过辅助损失函数引导模型在训练中更多关注关键区域。该方法在LoveDA和Vaihingen数据集上进行实验验证,其mF1指标分别为69.61%和90.53%,mIoU指标分别为53.95%和83.13%。实验结果表明,所提出的模型在这两个公共数据集上表现优于其他分割模型。 With the development of deep learning,CNN and Transformer drive the widespread application of semantic segmentation in the field of remote sensing.However,these methods still face limitations:the former fails to model long-range dependencies effectively,while computational complexity constrains the latter.Recently,Mamba demonstrates that the visual state space(VSS)model efficiently computes long-range dependencies through linear operations.The design introduced a semantic segmentation network for remote sensing images,combining CNN and visual state space to overcome existing limitations.The architecture consisted of a CNN branch and a VSS branch,which extracted multi-scale features,explored local correlations,and captured long-range dependencies.It applied the VSS instead of the Transformer to the decoder.A co-modulation module learned spatial weight modulation features,fused semantic information from both branches,and enhanced dependencies between them.An additional auxiliary header optimized the network,focusing the model on critical regions during training through the auxiliary loss function.The experiments validate the method achieves mF1 scores of 69.61% and 90.53% and mIoU scores of 53.95% and 83.13% on the LoveDA and Vaihingen datasets,respectively.The experimental results show that the proposed model outperforms other segmentation models on these two public datasets.

作者张仕洁张斌赵文豪 Zhang Shijie;Zhang Bin;Zhao Wenhao(Hubei Province Key Laboratory of Intelligent Robot,Wuhan Institute of Technology,Wuhan 430205,China;School of Computer Science&Engineering,Wuhan Institute of Technology,Wuhan 430205,China)

机构地区武汉工程大学智能机器人湖北省重点实验室武汉工程大学计算机科学与工程学院

出处《计算机应用研究》北大核心 2025年第5期1583-1588,共6页 Application Research of Computers

基金湖北省自然科学基金资助项目(2022CFCO31)。

关键词遥感语义分割视觉状态空间 CNN 特征融合 remote sensing semantic segmentation visual state space CNN feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1程擎,范满,李彦冬,赵远,李诚龙.无人机航拍图像语义分割研究综述[J].计算机工程与应用,2021,57(19):57-69. 被引量：22
2Rui Li,Shunyi Zheng,Chenxi Duan,Libo Wang,Ce Zhang.Land cover classification from remote sensing images based on multi-scale fully convolutional network[J].Geo-Spatial Information Science,2022,25(2):278-294. 被引量：18
3肖昌城,吴锡.基于门控卷积残差网络的卫星图像道路提取[J].计算机应用研究,2021,38(12):3820-3825. 被引量：6
4陈运成,郑晨,李晶莹,王雷光.离散ADMM方法下像素与对象基元协同优化的遥感影像无监督语义分割[J].计算机应用研究,2023,40(7):2217-2222. 被引量：5
5郑剑,柴岚康,于祥春.基于局部-全局特征耦合与边界引导的遥感图像建筑物变化检测[J].计算机应用研究,2024,41(6):1888-1892. 被引量：2
6石卫超,宋宝贵,管宗胜,秦道龙,邵攀.TRNet:基于遥感影像的三通道区域增强变化检测网络[J].计算机应用研究,2024,41(11):3484-3489. 被引量：1
7陶惜婷,叶青.融合CNN和Transformer的并行双分支皮肤病灶图像分割[J].计算机应用研究,2024,41(8):2554-2560. 被引量：10

二级参考文献34

1陈彦彤,李雨阳,陈伟楠,张献中,王俊生.基于深度语义分割的遥感图像海面舰船检测研究[J].仪器仪表学报,2020,41(1):233-240. 被引量：31
2孙卓,李冬伟,赵泽宾,张倩倩.卷积神经网络下的高分二号卫星影像道路提取[J].计算机系统应用,2020(11):128-133. 被引量：5
3陈璐,管霜霜.基于深度学习的城市高分遥感图像变化检测方法的研究[J].计算机应用研究,2020,37(S01):320-323. 被引量：14
4罗湾,林伟,张红波.热含量不变量的SAR图像点特征变化检测[J].自动化学报,2014,40(6):1126-1134. 被引量：2
5胡太,杨明.结合目标检测的小目标语义分割算法[J].南京大学学报（自然科学版）,2019,55(1):73-84. 被引量：5
6许妙忠,丛铭,万丽娟,解天鹏,朱晓玲.视觉感受与Markov随机场相结合的高分辨率遥感影像分割法[J].测绘学报,2015,44(2):198-205. 被引量：41
7谢伟,周玉钦,游敏.融合梯度信息的改进引导滤波[J].中国图象图形学报,2016,21(9):1119-1126. 被引量：37
8王嫣然,陈清亮,吴俊君.面向复杂环境的图像语义分割方法综述[J].计算机科学,2019,46(9):36-46. 被引量：53
9邝辉宇,吴俊君.基于深度学习的图像语义分割技术研究综述[J].计算机工程与应用,2019,55(19):12-21. 被引量：56
10王秋生,贺云涛,张晓辉,刘莉.基于无人机航拍图像的车道线检测方法综述[J].无人系统技术,2019,2(5):9-16. 被引量：11

共引文献55

1陈振,陈芸芝,吴婷,李佳优.面向高分遥感影像道路提取的轻量级双注意力和特征补偿残差网络模型[J].地球信息科学学报,2022,24(5):949-961. 被引量：14
2谭路文,哈斯巴干,陈超民,谢璇.基于深度学习的无人机遥感影像车辆检测[J].红外,2022,43(5):41-48. 被引量：1
3余果,刘秋斌,陈方园,刘大召.基于改进残差网络的橡胶林卫星影像语义分割方法[J].农业工程学报,2022,38(15):204-211. 被引量：3
4祝宁华,郑江滨,张阳.无人机航拍野生动物智能检测与统计方法综述[J].航空工程进展,2023,14(1):13-26. 被引量：4
5刘丹,张建杰,徐鸿哲,刘尧兵.改进的神经网络ADD-Unet用于河道图像的分割[J].国外电子测量技术,2022,41(12):120-126. 被引量：1
6王泽华,高岩,陈敏刚.基于遥感图像的虚拟地形仿真建模方法[J].华东师范大学学报（自然科学版）,2023(2):82-94. 被引量：6
7白俊卿,韩柏迅,张丰侠.基于深度学习的无人机图像语义分割算法研究[J].计算机工程,2023,49(4):233-239. 被引量：7
8蔡军,温日强,江伟,严娇,卢丽娟.传统村落航拍图像中民族建筑识别的DeepLabV3+改进算法[J].测绘通报,2023(4):49-53. 被引量：3
9蔡超丽,李纯纯,黄琳,杨铁军.基于多尺度特征融合注意力CNN的遥感图像语义分割方法[J].桂林理工大学学报,2022,42(4):968-976. 被引量：3
10罗嘉琦,帅向华,李继赓.基于深度学习的倾斜摄影建筑物表面损毁信息提取[J].中国地震,2023,39(2):271-281. 被引量：3

同被引文献3

1Jiayi Ma,Linfeng Tang,Fan Fan,Jun Huang,Xiaoguang Mei,Yong Ma.SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer[J].IEEE/CAA Journal of Automatica Sinica,2022,9(7):1200-1217. 被引量：83
2陈慧,彭力.基于全局响应的多级融合监督显著性目标检测[J].计算机工程与应用,2023,59(24):238-247. 被引量：3
3胡宇翔,余长宏,高明.多模态融合的遥感图像语义分割网络[J].计算机工程与应用,2024,60(15):234-242. 被引量：8

引证文献1

1叶志伟,冯青阳,刘明明,王苑,高榕,严灵毓.基于异质图和Mamba的跨模态遥感语义分割[J].计算机应用研究,2026,43(3):917-923.

1凤丽洲,李梦莎,王友卫,杨贵军.基于PPLM模板增强的零样本方面类别情感分析模型[J].计算机科学与探索,2025,19(5):1322-1333.
2张晓莉,张喜珍,林冬梅,陈扶明.基于CNN-BiGRU和多头自注意力机制的自动睡眠分期方法[J].中国医学物理学杂志,2025,42(4):496-504.
3胡祥谢,聂祥论,谢宪源.基于二维灰度图与CNN-GRU的单相接地故障选线方法[J].建模与仿真,2025,14(1):1-10.
4朱彦洁,王瑜晨,熊文,蔡春声.基于桥检领域-任务迁移的检测报告信息提取少样本模型[J].交通运输工程学报,2025,25(1):248-262. 被引量：2
5Xiao MA,Shen-Yi ZHAO,Zhao-Heng YIN,Wu-Jun LI.Clustered Reinforcement Learning[J].Frontiers of Computer Science,2025,19(4):43-57.
6苏春阳,舒宝,郑蕾,田云青,雷体俊,穆雪枫,王利.GPS/BDS实时SSR产品质量评估及其PPP性能分析[J].武汉大学学报(信息科学版),2025,50(4):714-726. 被引量：7
7吕旭东,孙世媛,李亚楠,郭靖,王艳群,付鑫,宁鹏,彭正萍.智能机械化分层施肥对中低产田小麦产量形成和养分利用的影响[J].植物营养与肥料学报,2025,31(4):657-670. 被引量：2
8Xiaofei Liu,Pei Zhang,Hua Xie,Xuegang Lu,Xiangyu Wu,Zhao Liu.Graph Attention Network Based Deep Reinforcement Learning for Voltage/var Control of Topologically Variable Power System[J].Journal of Modern Power Systems and Clean Energy,2025,13(1):215-227.
9杨曜宇.四自由度半车主动悬架控制策略对比研究[J].动力系统与控制,2025,14(2):130-138.

计算机应用研究

2025年第5期

浏览历史

内容加载中请稍等...

基于CNN和视觉状态空间的遥感影像语义分割被引量：1

参考文献7

二级参考文献34

共引文献55

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CNN和视觉状态空间的遥感影像语义分割 被引量：1

参考文献7

二级参考文献34

共引文献55

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CNN和视觉状态空间的遥感影像语义分割被引量：1