期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于改进SegFormer的超声影像分割方法研究
1
作者 王高才 杨满 张晓洁 《现代电子技术》 北大核心 2025年第23期17-24,共8页
针对SegFormer网络分层的Transformer编码器逐级递减图像分辨率,提取图像多尺度特征的特点,文中提出一种边缘提取模块(EEM),该模块能更好地注意到超声影像的边界信息。为了解决超声图像中出现的复杂边界问题,在SegFormer编码层和解码层... 针对SegFormer网络分层的Transformer编码器逐级递减图像分辨率,提取图像多尺度特征的特点,文中提出一种边缘提取模块(EEM),该模块能更好地注意到超声影像的边界信息。为了解决超声图像中出现的复杂边界问题,在SegFormer编码层和解码层之间加入空洞空间卷积金字塔池化(ASPP)模块,确保其在获取较大感受野的同时不会发生网格效应。结合EEM和ASPP模块的SegFormer能够在保持低级边缘细节特征的同时进一步提取抽象特征,使得超声影像分割的精度进一步提升。将EEM连接在SegFormer编码器之前,再和解码器进行特征融合之后,与ASPP模块的输出特征做拼接并预测分割掩码,在甲状腺结节超声影像、乳腺结节超声影像和白细胞数据集上取得了较好的效果。经实验验证,该模型的mIoU分别提高了1.25%、2.2%和0.13%,证明了改进方法的有效性。 展开更多
关键词 图像分割 改进的segformer 超声影像 混合空洞卷积 混合通道注意力 边缘提取模块
在线阅读 下载PDF
基于改进Segformer的光伏组件分割算法 被引量:1
2
作者 曹冠华 党建武 杨景玉 《太阳能学报》 北大核心 2025年第2期425-432,共8页
针对光伏图像中光伏组件与复杂背景的边界特征模糊、难以区分的问题,提出一种基于Segformer的改进算法。在编码阶段,引入全新设计的block5模块用来解析更高级的语义信息;在解码阶段,引入LPCB(边界强化)模型用来识别更精确的边界特征,最... 针对光伏图像中光伏组件与复杂背景的边界特征模糊、难以区分的问题,提出一种基于Segformer的改进算法。在编码阶段,引入全新设计的block5模块用来解析更高级的语义信息;在解码阶段,引入LPCB(边界强化)模型用来识别更精确的边界特征,最终得到精确的分割结果。实验结果表明:改进后的光伏组件分割算法在光伏组件图像数据集上的分割效果优于经典的主流分割算法,可以对光伏组件区域进行有效分割。 展开更多
关键词 光伏组件 segformer 编码 解码 边界特征
原文传递
基于Segformer模型的洪水淹没范围提取与对比
3
作者 张云康 刘懿 +3 位作者 肖婉 覃炀扬 程聪 彭旭 《长江科学院院报》 北大核心 2025年第10期165-173,182,共10页
洪水期间,复杂地形和水域边界的快速变化极大增加了准确提取洪水淹没范围的难度。传统的人工和卫星遥感方法常因云层覆盖、光照变化和传感器限制等因素,导致其精度不足,且效率低下、成本高昂。基于此,利用深度学习与机器视觉技术,构建... 洪水期间,复杂地形和水域边界的快速变化极大增加了准确提取洪水淹没范围的难度。传统的人工和卫星遥感方法常因云层覆盖、光照变化和传感器限制等因素,导致其精度不足,且效率低下、成本高昂。基于此,利用深度学习与机器视觉技术,构建了针对洪水监测的“RiverDataset”数据集,并基于此数据集评估Segformer模型在洪水淹没范围提取中的效果。同时对比分析Segformer模型与基于ResNet50和VGG16的U-Net模型的水体分割性能。研究结果表明:Segformer模型凭借其Transformer结构,有效捕捉了广泛的上下文信息,并通过多尺度特征融合技术,保证了在复杂环境中的分割性能和信息的完整性;在平均交并比(mIoU)、平均像素准确率(mPA)、精确率和召回率等关键性能指标上,Segformer模型显著优于基于ResNet50和VGG16的U-Net模型。综上可知,Segformer模型在处理精确提取边界和有效排除干扰物的复杂分割任务中具有明显优势。 展开更多
关键词 洪水监测 视觉分割 Transformer结构 segformer模型 U-Net模型 精确边界分割
在线阅读 下载PDF
基于ECA-Segformer的多尺度特征煤炭CT图像分割研究
4
作者 石宇含 董良 +3 位作者 薛舸航 苏淑娴 柳建华 王赫 《煤炭工程》 北大核心 2025年第7期185-193,共9页
机器视觉在煤炭加工分选领域得到了广泛的运用,然而在图像分割时,仍存在多尺度特征煤炭颗粒CT图像中背景与前景的分离难题,以及因颗粒尺寸不一致而导致的分割挑战。为了解决上述问题,提出了一种基于改进ECA-Segformer模型的煤炭颗粒CT... 机器视觉在煤炭加工分选领域得到了广泛的运用,然而在图像分割时,仍存在多尺度特征煤炭颗粒CT图像中背景与前景的分离难题,以及因颗粒尺寸不一致而导致的分割挑战。为了解决上述问题,提出了一种基于改进ECA-Segformer模型的煤炭颗粒CT图像语义分割方法。针对颗粒多尺度分布不均易发生的漏检现象,模型引入了ECA-Net注意力机制,有效增强网络的表征能力,旨在提高分割精度。此外,采用Squared ReLU激活函数更好地捕捉前景与背景的不同特征,以提高煤炭颗粒CT图像的分割效率。基于自建煤炭颗粒的CT数据集开展实验,实验结果表明,基于改进的Segformer模型综合检测能力最优,平均交并比达87.78%,平均像素精度达到93.44%,准确率高达93.46%,相较于基础Segformer网络分别提升了2.12、1.30、0.58百分点。针对分割后的数据分析能够研究煤炭颗粒的粒度分布统计,这对煤炭高效智能化分选具有重要意义。 展开更多
关键词 多尺度特征 segformer模型 煤炭颗粒 CT图像 智能化分选
在线阅读 下载PDF
基于改进SegFormer模型的三级淋巴结构在混合型肝癌中的自动识别算法
5
作者 杨晓东 史馨怡 +1 位作者 董伟 刘宝林 《软件工程》 2025年第5期1-4,15,共5页
针对混合型肝癌病理切片中三级淋巴结构人工识别存在耗时费力、准确性不高等问题,基于SegFormer(Segmentation Transformer)模型提出了一种轻量化的识别模型。首先,使用非负矩阵法对病理切片进行标准化处理。其次,增加特征图层级,使模... 针对混合型肝癌病理切片中三级淋巴结构人工识别存在耗时费力、准确性不高等问题,基于SegFormer(Segmentation Transformer)模型提出了一种轻量化的识别模型。首先,使用非负矩阵法对病理切片进行标准化处理。其次,增加特征图层级,使模型能够获得更精细的感受视野。最后,引入SimAM(Similarity-Aware Activation Module)注意力机制,辅助模型定位三级淋巴结构的关键信息。使用374张病理切片进行模型训练和验证,实验结果显示,该模型的平均交并比、平均召回率和准确率分别达到了92.50%、96.08%和96.39%,在三级淋巴结构识别方面表现出色,具有显著优势。 展开更多
关键词 segformer模型 三级淋巴结构 混合型肝癌 图像识别 深度学习
在线阅读 下载PDF
混凝土构件表面裂缝分割的改进SegFormer方法
6
作者 龚玉磊 张亚丽 +1 位作者 章红梅 王爱华 《结构工程师》 2025年第4期31-40,共10页
混凝土结构常常会产生表面裂缝,及时对这些表面裂缝进行检测对结构状况评估有重要意义。本文提出了一种改进SegFormer的方法,用于表面裂缝的分割。该方法利用SegFormer模型的网络架构和创新模块(CA),在解码器部分加入了坐标注意力机制模... 混凝土结构常常会产生表面裂缝,及时对这些表面裂缝进行检测对结构状况评估有重要意义。本文提出了一种改进SegFormer的方法,用于表面裂缝的分割。该方法利用SegFormer模型的网络架构和创新模块(CA),在解码器部分加入了坐标注意力机制模块,其中创新性地引入了沿对角线方向池化,显著提升了模型在像素级预测时对细长形状空间关系的理解能力。通过对公共数据集Concrete3k的实验结果进行对比,改进SegFormer模型展现出最高的IoU值,表明其在裂缝分割任务中表现最佳,在参数量较低的情况下,改进SegFormer模型仍能保持高性能。 展开更多
关键词 混凝土构件 表面裂缝 图像分割 改进segformer模型 深度学习 鲁棒性
在线阅读 下载PDF
基于Segformer的非显著性目标语义分割算法研究
7
作者 朱发汛 孙伟 +1 位作者 汤勃 赵晓柯 《智能计算机与应用》 2025年第10期10-15,共6页
语义分割是计算机视觉领域的重要分支之一,然而在实际工作场景中,非显著性目标由于其尺寸较小和边界模糊的特性,容易被语义分割网络忽略和分割不完整。本文基于Segformer提出了一种针对非显著性目标的语义分割算法。首先,为获取非显著... 语义分割是计算机视觉领域的重要分支之一,然而在实际工作场景中,非显著性目标由于其尺寸较小和边界模糊的特性,容易被语义分割网络忽略和分割不完整。本文基于Segformer提出了一种针对非显著性目标的语义分割算法。首先,为获取非显著性目标更加细致的特征,本文添加了小尺度特征,保证非显著性目标能够被精准识别。然后,为进一步提高算法特征提取能力并缓解计算负担,设计了XM-FFN模块,该模块采用了高效的XSepConv并使用了计算更为简便的ReLU激活函数,进一步减少了算法参数量。最后,实验采用VOC2012数据集,以Segformer为参照,在mIoU、mF1和MPA指标上分别提升了2.58%、2.35%和2.49%,验证了该算法的有效性。 展开更多
关键词 语义分割 segformer 非显著性目标
在线阅读 下载PDF
基于GIS-SegFormer的GIS隔离开关状态监测应用
8
作者 肖中阳 郭旭 +3 位作者 秦若锋 陈卓 冯顶喻 田鑫 《高压电器》 北大核心 2025年第10期71-81,共11页
由于GIS设备内部结构复杂且空间全封闭,图像采集存在不均匀光照和细节模糊等问题,容易在状态监测时引发漏检和误检,为此,提出一种轻量化语义分割模型GIS-SegFormer。首先,采用CGLU模块替换原SegFormer模型前两层Transformer Block中的M... 由于GIS设备内部结构复杂且空间全封闭,图像采集存在不均匀光照和细节模糊等问题,容易在状态监测时引发漏检和误检,为此,提出一种轻量化语义分割模型GIS-SegFormer。首先,采用CGLU模块替换原SegFormer模型前两层Transformer Block中的MSA,解决自注意力机制忽略局部特征问题;其次,引入AFE模块增强光照不足环境下的特征提取能力;此外,通过嵌入DySample模块动态调整上采样核参数,进一步优化了上采样过程。在自制的GIS隔离开关数据集上进行的实验结果表明,相较于原SegFormer模型,GIS-SegFormer的mIoU提升2.82%,mPA提升0.88%,mPrecision提升2.17%,mRecall提升0.88%。同时,GIS-SegFormer模型的参数量仅为5.191×10^(6),便于在实际监测系统中部署应用。改进的GIS-SegFormer模型应用到GIS隔离开关监测系统中,可以精准地识别出隔离开关的状态,提高GIS设备运行的安全性与维护效率。 展开更多
关键词 GIS 语义分割 segformer TRANSFORMER 轻量化 隔离开关
在线阅读 下载PDF
基于改进SegFormer的胰腺图像分割方法
9
作者 梁攀如 辛国江 丁长松 《计算机与现代化》 2025年第6期71-78,共8页
为了解决CT图像中由于胰腺体积小、位置和形状个体差异性较大导致的分割精度不高的问题,本文提出一种基于改进SegFormer模型的胰腺图像分割方法。在模型训练之前,根据胰腺的位置分布来构建候选区域并进行裁剪,从而有效减少背景区域的干... 为了解决CT图像中由于胰腺体积小、位置和形状个体差异性较大导致的分割精度不高的问题,本文提出一种基于改进SegFormer模型的胰腺图像分割方法。在模型训练之前,根据胰腺的位置分布来构建候选区域并进行裁剪,从而有效减少背景区域的干扰,降低输入图像分辨率;接着采用SegFormer网络,并引入增大编码分辨率策略,通过调整下采样的比例来增大编码器输出特征图的尺寸,保留更多的细节信息,使模型能更好地应对胰腺的形态变化;然后引入残差极化自注意力模块对编码特征进行通道和空间注意力计算,以突出胰腺区域的关键特征,抑制无关特征的激活,从而提高模型的分割精度。本文方法在NIH数据集上测试的平均DSC为85.5%,参数量和计算量分别为3.91 M和6.89 G FLOPs,表明了该方法在胰腺分割任务上的有效性及其临床应用的潜力。 展开更多
关键词 胰腺分割 segformer模型 极化自注意力 轻量级 CT
在线阅读 下载PDF
基于SegFormer的传统水表读数区域分割方法
10
作者 卢庆鑫 赵顺毅 厉炯慧 《科技创新与应用》 2025年第29期58-61,共4页
在智慧水务系统升级与老旧水表数字化改造过程中,实现高鲁棒性的读数区域分割是自动化抄表的关键预处理步骤。针对水表安装环境复杂、表盘受玻璃反光及水渍遮挡等干扰因素,该文提出一种基于SegFormer的轻量化分割模型,专注于水表读数区... 在智慧水务系统升级与老旧水表数字化改造过程中,实现高鲁棒性的读数区域分割是自动化抄表的关键预处理步骤。针对水表安装环境复杂、表盘受玻璃反光及水渍遮挡等干扰因素,该文提出一种基于SegFormer的轻量化分割模型,专注于水表读数区域的像素级定位。通过针对水表图像特征优化模型参数,该方法显著提升复杂工况下的分割精度与边缘连续性。在自建水表图像数据集上的实验表明,该方法在测试集上实现98.60%的分割准确率,同时将模型参数量压缩至14.0 M。该方法可为后续水表读数识别模块提供高置信度的区域输入,为传统水表的数字化改造提供一种高效、可靠的分割预处理方案。此外,该技术框架可推广至燃气表、压力表等泛工业检测场景。 展开更多
关键词 智慧水务 segformer 传统水表数字化 读数区域分割 像素级分类
在线阅读 下载PDF
结合Segformer与增强特征金字塔的文本检测方法 被引量:2
11
作者 张铭泉 张泽恩 +1 位作者 曹锦纲 邵绪强 《智能系统学报》 CSCD 北大核心 2024年第5期1111-1125,共15页
针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer(mix Trans-former,MiT)的编码器生成多尺度特征图;... 针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer(mix Trans-former,MiT)的编码器生成多尺度特征图;然后,在具有特征金字塔结构解码器的上采样部分,提出级联融合注意力模块,通过全局平均池化、全局最大池化和Ghost模块获取全局通道信息并保留文本特征;接着,在解码器的特征融合部分提出两级正交融合注意力模块,利用非对称卷积分别从水平和垂直方向进行信息增强;最后,利用可微分二值化对结果进行后处理。将本文方法在ICDAR2015、ShopSign1265和MTWI 3个数据集上进行实验,相比于其他8种方法,本文方法的F值均为最优,分别达到了87.8%、59.1%和74.8%。结果表明,本文方法有效提高了文本检测的准确率。 展开更多
关键词 文本检测 特征金字塔 注意力机制 segformer Ghost模块 多尺度特征融合 平均池化 最大池化
在线阅读 下载PDF
基于改进Segformer的混凝土桥梁表观病害轻量级识别方法 被引量:6
12
作者 蒋仕新 唐椿程 +5 位作者 杨建喜 李昊 熊元俊 李韧 刘新龙 王笛 《中国公路学报》 EI CAS CSCD 北大核心 2024年第2期77-87,共11页
现有基于语义分割的混凝土桥梁表观病害识别方法具有模型参数量较大、特征提取不充分、分割精度不高等缺点。针对上述问题,提出基于改进Segformer的混凝土桥梁表观病害轻量级识别方法——Segformer-SP,该方法选取MiT B0作为编码器,并引... 现有基于语义分割的混凝土桥梁表观病害识别方法具有模型参数量较大、特征提取不充分、分割精度不高等缺点。针对上述问题,提出基于改进Segformer的混凝土桥梁表观病害轻量级识别方法——Segformer-SP,该方法选取MiT B0作为编码器,并引入语义融合模块(Semantic Fusion Module,SFM)和极化自注意力机制(Polarized Self-Attention,PSA)。在Segformer-SP中,SFM模块对低级特征和高级特征进行融合,以提高低级特征的语义信息量;同时,PSA自注意力机制模块可以在分割过程中捕捉全局上下文信息,解决病害特征不够充分的问题,从而进一步提高分割效果。试验结果表明:Segformer-SP的平均交并比(mIoU)和平均F1分数(mF1)相较于Segformer-B0分别提高了2.41%和1.91%;此外,Segformer-SP的mIoU和mF1均优于大部分主流语义分割算法;Segformer-SP的参数量仅为6.09×10^(6),FPS为56.54,更适合应用于终端检测设备。 展开更多
关键词 桥梁工程 桥梁病害识别 segformer 轻量级 特征融合
原文传递
基于改进SegFormer模型的棉田地表残膜图像分割方法 被引量:3
13
作者 牛玉珩 李永可 +1 位作者 陈燕红 蒋平安 《计算机与现代化》 2023年第7期93-98,共6页
为了解决棉花种植过程中残留地膜造成的严重污染问题,提出一种基于改进SegFormer模型的残膜目标快速识别分割的方法。以新疆维吾尔自治区昌吉市棉田(坐标44°23′1″N,87°30′23″E)的收后地表残膜为研究对象,在雪后晴天中午... 为了解决棉花种植过程中残留地膜造成的严重污染问题,提出一种基于改进SegFormer模型的残膜目标快速识别分割的方法。以新疆维吾尔自治区昌吉市棉田(坐标44°23′1″N,87°30′23″E)的收后地表残膜为研究对象,在雪后晴天中午时间段使用无人机采集图像共计1047幅并制作成数据集。对SegFormer模型增加更深的特征图层级,使其能获取更细微的特征以解决残膜形态多变和目标较小的问题。SegFormer原始模型平均交并比已达到83.00%,改进SegFormer模型较原始模型平均交并比提升0.42个百分点,骰子系数提升0.3个百分点,单幅检测时间为51.13 ms。实验结果表明,改进SegFormer模型基本能满足快速分割任务的要求,为棉田残膜污染情况的快速评估提供了理论基础。 展开更多
关键词 棉田残膜 无人机 神经网络 语义分割 segformer 特征图层级
在线阅读 下载PDF
基于SegFormer的超声影像图像分割 被引量:3
14
作者 杨靖怡 李芳 +3 位作者 康晓东 王笑天 刘汉卿 韩俊玲 《计算机科学》 CSCD 北大核心 2023年第S01期404-409,共6页
超声影像分割既是医学影像图像处理的重要环节,也是临床诊断的常用技术手段。文中提出将SegFormer网络模型用于实现医学超声影像图像的精准分割。一方面,将超声标签图转化为单通道形式,并对其进行二值化处理,以完成对数据集图像的预处理... 超声影像分割既是医学影像图像处理的重要环节,也是临床诊断的常用技术手段。文中提出将SegFormer网络模型用于实现医学超声影像图像的精准分割。一方面,将超声标签图转化为单通道形式,并对其进行二值化处理,以完成对数据集图像的预处理;另一方面,采用迁移学习的方式载入预训练模型,用于微调已经训练好的模型参数,并选用带有动量的随机梯度下降优化器来加速收敛速度及减小震荡。与FCN,UNet和DeepLabV3的对比实验结果表明,该模型在乳腺结节超声影像数据集上的各项评估指标均为最优,mIoU,Acc,DSC和Kappa分别为81.32%,96.22%,88.91%和77.85%。实验结果还表明,该模型在不同超声影像数据集中表现出了良好的鲁棒性。 展开更多
关键词 segformer 图像分割 超声影像 TRANSFORMER
在线阅读 下载PDF
基于SegFormer的钛板缺陷涡流C扫描检测图像分割 被引量:2
15
作者 李肇源 叶波 +2 位作者 邹杨坤 包俊 曹弘贵 《化工自动化及仪表》 CAS 2024年第2期181-191,共11页
为了获得涡流检测图像中缺陷的形状与长度信息,对检测图像进行图像分割是其中一种重要的方法。由于边缘效应的影响,TA2钛板涡流C扫描图像中缺陷区域边缘模糊、对比度低,导致通过图像分割后估计的缺陷长度与实际值差别过大,难以通过图像... 为了获得涡流检测图像中缺陷的形状与长度信息,对检测图像进行图像分割是其中一种重要的方法。由于边缘效应的影响,TA2钛板涡流C扫描图像中缺陷区域边缘模糊、对比度低,导致通过图像分割后估计的缺陷长度与实际值差别过大,难以通过图像分割方法对缺陷长度进行准确估计。针对此问题,提出一种基于SegFormer的钛板缺陷涡流检测图像分割方法。首先,利用涡流C扫描成像获得TA2钛板表面裂纹缺陷检测图像数据集;根据SegFormer网络的结构组成,设计基于SegFormer钛板缺陷涡流检测图像的分割框架和分割流程,并进行网络参数的设置。随后,利用钛板表面裂纹缺陷检测图像数据集对4个分割模型分别进行训练和测试,并利用平均交并比、平均精度和训练时间对其分割效果进行评价。实验表明:相比于Deeplabv3+、Swim Transformer和OCRNet,SegFormer具有更好的分割效果,更快的训练速度。可视化和定量化结果表明:与非深度学习方法相比,该方法具有更小的缺陷长度估计误差。 展开更多
关键词 深度学习 segformer 钛板缺陷 电涡流检测 图像分割
在线阅读 下载PDF
边界感知SegFormer网络的阵列目标图像分割方法 被引量:2
16
作者 吕扬 吴静静 +1 位作者 庄祉珊 安聪颖 《计算机工程与应用》 CSCD 北大核心 2024年第24期188-199,共12页
针对工业场景下阵列目标图像存在非均匀背景、缺陷干扰和弱边缘导致目标分割精度低的问题,提出边界感知SegFormer网络的阵列目标图像分割方法。针对固定种子易受背景和缺陷干扰的问题,提出自适应种子搜索策略。该策略利用种子位置与目... 针对工业场景下阵列目标图像存在非均匀背景、缺陷干扰和弱边缘导致目标分割精度低的问题,提出边界感知SegFormer网络的阵列目标图像分割方法。针对固定种子易受背景和缺陷干扰的问题,提出自适应种子搜索策略。该策略利用种子位置与目标定位精度的相关性构建种子分布热力图,并在热力图的引导下自适应搜索理想种子目标,实现阵列目标的高精度全局分割。设计边界感知SegFormer网络进行局部分割,利用递归门控卷积强调特征的长距离和高阶空间交互,改进的门控残差边界细化模块能够学习更丰富的边缘信息,同时引入混合损失函数加强对区域内部和边缘像素的监督,引导网络更好地学习目标边缘特征,提高边界分割精度。在自建晶粒数据集和语义分割数据集Cityscapes上的验证实验表明,提出的分割方法能在背景不均、缺陷污染、边缘对比度低的高分辨率阵列目标图像中完整精确地分割目标,并具有较高的实时性。 展开更多
关键词 图像分割 阵列目标 自适应种子搜索 边界感知 segformer
在线阅读 下载PDF
成都平原彭州地区耕地信息的SegFormer-PAS模型提取
17
作者 谢美琳 刘刚 +2 位作者 何敬 闫航嘉 李典 《宜宾学院学报》 2024年第12期44-50,共7页
以高分二号融合的1m分辨率数据为数据源,采用改进后的SegFormer-PAS模型对成都平原彭州地区耕地进行提取.模型选取Mit-B0作为为编码器,并引入极化自注意力机制以更好地捕获全局上下文信息,解决耕地特征提取不够充分的问题,在编码器的上... 以高分二号融合的1m分辨率数据为数据源,采用改进后的SegFormer-PAS模型对成都平原彭州地区耕地进行提取.模型选取Mit-B0作为为编码器,并引入极化自注意力机制以更好地捕获全局上下文信息,解决耕地特征提取不够充分的问题,在编码器的上采样部分采用反卷积替代简单的双线性插值以减少空间细节上的损失.实验结果表明:SegFormer-PAS模型在实验区域的交并比、召回率、准确率及F1分数分别为90.18%、91.86%、90.86%、91.26%,较基准模型SegFormer-B0均有提升;且SegFormer-PAS在成都平原彭州地区的耕地提取任务的效果均优于SegFormer、U-Net、Unet++、HRNet这4种经典语义分割算法. 展开更多
关键词 耕地提取 深度学习 segformer 极化自注意力机制 高分二号影像
在线阅读 下载PDF
融合注意力机制的SegFormer遥感影像道路识别 被引量:1
18
作者 王晓杰 陈少康 +3 位作者 闫皓炜 杨鹤猛 燕正亮 王森 《计算机系统应用》 2024年第11期186-193,共8页
道路信息在遥感影像中具有重要意义和价值,因此准确提取道路对于许多应用非常关键.然而,在进行道路识别时存在两个主要问题.首先,卫星影像的背景复杂多变,而道路的形态也是复杂多样的,这给道路的自动识别带来了挑战.其次,道路像素只占... 道路信息在遥感影像中具有重要意义和价值,因此准确提取道路对于许多应用非常关键.然而,在进行道路识别时存在两个主要问题.首先,卫星影像的背景复杂多变,而道路的形态也是复杂多样的,这给道路的自动识别带来了挑战.其次,道路像素只占整个影像的很小一部分,导致类别不平衡的问题.为了解决上述问题,本文提出了一种基于改进的SegFormer模型的卫星影像道路自动识别算法.该算法采用了两个主要策略来改进识别效果.第一,在SegFormer编码器的各个阶段的输出端添加了空间注意力模块.这个模块有助于减弱复杂背景的干扰,同时增强对道路区域的关注.通过引入空间注意力机制,模型能够更好地捕捉到道路的特征,从而提高识别准确性.第二,采用了一种混合损失函数,结合了像素对比损失和交叉熵损失.这样的损失函数能够更好地处理类别不平衡的问题,使得模型更加关注道路类别的训练.通过优化训练过程,模型能够更好地学习到道路的特征表示,从而提升识别准确率.通过对比实验分析,改进后的模型在测试集上的mIoU指标提升了约3.3%. 展开更多
关键词 深度学习 道路 segformer 空间注意力 像素对比损失函数
在线阅读 下载PDF
Research on coal-rock identification method and data augmentation algorithm of comprehensive working face based on FL-Segformer
19
作者 Yun Zhang Liang Tong +5 位作者 Xingping Lai Shenggen Cao Baoxu Yan Yanbin Yang Yongzi Liu Wei He 《International Journal of Coal Science & Technology》 CSCD 2024年第4期142-157,共16页
Coal-rock interface identification technology was pivotal in automatically adjusting the shearer's cutting drum during coal mining.However,it also served as a technical bottleneck hindering the advancement of inte... Coal-rock interface identification technology was pivotal in automatically adjusting the shearer's cutting drum during coal mining.However,it also served as a technical bottleneck hindering the advancement of intelligent coal mining.This study aimed to address the poor accuracy of current coal-rock identification technology on comprehensive working faces,coupled with the limited availability of coal-rock datasets.The loss function of the SegFormer model was enhanced,the model's hyperparameters and learning rate were adjusted,and an automatic recognition method was proposed for coal-rock interfaces based on FL-SegFormer.Additionally,an experimental platform was constructed to simulate the dusty environment during coal-rock cutting by the shearer,enabling the collection of coal-rock test image datasets.The morphology-based algorithms were employed to expand the coal-rock image datasets through image rotation,color dithering,and Gaussian noise injection so as to augment the diversity and applicability of the datasets.As a result,a coal-rock image dataset comprising 8424 samples was generated.The findings demonstrated that the FL-SegFormer model achieved a Mean Intersection over Union(MIoU)and mean pixel accuracy(MPA)of 97.72%and 98.83%,respectively.The FLSegFormer model outperformed other models in terms of recognition accuracy,as evidenced by an MloU exceeding 95.70% of the original image.Furthermore,the FL-SegFormer model using original coal-rock images was validated from No.15205 working face of the Yulin test mine in northern Shaanxi.The calculated average error was only 1.77%,and the model operated at a rate of 46.96 frames per second,meeting the practical application and deployment requirements in underground settings.These results provided a theoretical foundation for achieving automatic and efficient mining with coal mining machines and the intelligent development of coal mines. 展开更多
关键词 Coal-rock interface recognition segformer Datasets augmentation Comprehensive working face•Image semantic segmentation
在线阅读 下载PDF
基于级联注意力和边界预测改进的轻量Segformer语义分割
20
作者 高延海 刘永帅 《无线电工程》 2024年第11期2585-2593,共9页
针对Segformer网络中无法有效聚合和使用多尺度信息并且边界模糊的问题,提出了基于级联注意力和边界预测的语义分割网络。在Segformer的解码器部分,通过使用级联注意力,有效聚合了多尺度特征信息并通过聚合多尺度特征进行边界预测,对语... 针对Segformer网络中无法有效聚合和使用多尺度信息并且边界模糊的问题,提出了基于级联注意力和边界预测的语义分割网络。在Segformer的解码器部分,通过使用级联注意力,有效聚合了多尺度特征信息并通过聚合多尺度特征进行边界预测,对语义分割任务进行辅助。在梯度更新部分,加入梯度手术,减少因添加辅助任务导致的任务之间出现的梯度冲突对训练的干扰问题,加快模型收敛速度。在ADE20k数据集和Cityscapes数据集上进行实验,通过增加了2.69 M参数和24.67 G的计算量,提高了网络2.38%的平均交并比,证明了所提方法的有效性。 展开更多
关键词 segformer 级联注意力 辅助任务 边界预测 梯度手术
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部