期刊文献+
共找到3,581篇文章
< 1 2 180 >
每页显示 20 50 100
基于语义分割模型的城市街景空间评价与资本化效应研究——以杭州市主城区为例
1
作者 张凌 陈庚 张钊 《浙江大学学报(理学版)》 北大核心 2026年第1期13-26,共14页
对居住环境品质的追求体现了新时代居民对美好生活的向往,住宅周边的街景逐渐成为购房者关注的重点。当前,针对住宅邻域环境资本化效应的研究大多专注于讨论公共服务设施的配置,为进一步研究住宅邻域街景视觉特征对住宅价格的影响,采用... 对居住环境品质的追求体现了新时代居民对美好生活的向往,住宅周边的街景逐渐成为购房者关注的重点。当前,针对住宅邻域环境资本化效应的研究大多专注于讨论公共服务设施的配置,为进一步研究住宅邻域街景视觉特征对住宅价格的影响,采用基于深度学习的语义分割模型(segment anything model,SAM),提取住宅周边街道空间的视觉特征,并基于特征价格模型,从多个维度分析街景视觉特征对住宅价格的影响。结果表明:(1)街景视觉特征对住宅价格具有显著影响,且不同购买力、不同城市区域的购房者对城市街景的支付意愿存在差异;(2)街景视觉特征指标与住宅价格呈非线性关系,除天空开阔程度外,其他街景特征均存在阈值,在阈值附近居民表现出强烈的支付意愿;(3)街景视觉特征指标与传统住宅特征存在交互资本化效应,街景视觉特征指标对传统住宅特征起补偿作用。 展开更多
关键词 街景图像 语义分割 邻域视觉环境 住宅价格 资本化效应
在线阅读 下载PDF
基于WSS-Pointnet的变电站点云弱监督语义分割方法
2
作者 裴少通 孙海超 +2 位作者 胡晨龙 王玮琦 兰博 《电工技术学报》 北大核心 2026年第1期234-245,共12页
现有的变电站点云语义分割算法均采用完全监督学习,需要大量人工标注点云数据,导致分割任务耗时长且成本高昂。为解决这一问题,该文提出一种基于PointNet改进的弱监督语义分割PointNet(WSS-PointNet)算法。首先,通过构建多层降采样结构... 现有的变电站点云语义分割算法均采用完全监督学习,需要大量人工标注点云数据,导致分割任务耗时长且成本高昂。为解决这一问题,该文提出一种基于PointNet改进的弱监督语义分割PointNet(WSS-PointNet)算法。首先,通过构建多层降采样结构,结合采样层与分组层对输入点云数据进行多尺度特征提取,从而捕捉点云在不同尺度上的几何和拓扑信息。在此基础上,引入PointNet结构以进一步提取区域特征,优化局部特征整合与全局特征表示;针对粗粒度语义特征的优化,提出膨胀式语义信息嵌入与浸染式语义信息嵌入两种模块,分别采用“由内而外”和“由外而内”的信息传递策略对点云语义信息进行细致处理,两种嵌入机制均基于图卷积神经网络,通过捕捉局部连接模式与信息共享实现语义特征的高效传播。其次,构建变电站点云数据集,并对WSS-PointNet算法进行消融实验,同时与主流的完全监督学习算法和弱监督学习算法进行对比。经实验验证,WSS-PointNet相比于改进前将变电站点云分割的总体精度(OA)提高了10.3个百分点,平均交并比(mIoU)提高了10.1个百分点,平均准确率(mAcc)提高了10.5个百分点,同时在标注所需时间方面缩短了90%,接近完全监督算法中最好的分割效果。该模型可显著降低处理变电站点云数据的时间与成本,同时保持点云分割的高精度。 展开更多
关键词 点云语义分割 弱监督方法 膨胀式语义信息嵌入 浸染式语义信息嵌入 变电站
在线阅读 下载PDF
水稻田间收割场景语义分割方法——基于改进DeepLabV3+
3
作者 边铭 纪爱敏 +2 位作者 沈成 蔺秋雨 韩宇飞 《农机化研究》 北大核心 2026年第1期159-166,共8页
针对稻田环境中光照变化大、地表类别复杂,以及现有分割模型参数量大导致智能农机作业时场景信息提取精度下降和推理速度较慢的问题,提出了一种基于改进DeepLabV3+的图像分割方法。编码阶段采用轻量化的MobileNetV3作为主干网络提取图... 针对稻田环境中光照变化大、地表类别复杂,以及现有分割模型参数量大导致智能农机作业时场景信息提取精度下降和推理速度较慢的问题,提出了一种基于改进DeepLabV3+的图像分割方法。编码阶段采用轻量化的MobileNetV3作为主干网络提取图像特征,并引入深度可分离卷积(DSC)和混合池化模块(MPM)对空洞空间金字塔池化模块(ASPP)进行改进,以降低计算复杂度并增强多尺度特征表达能力;解码阶段结合ECA-Net注意力机制优化浅层特征并融合深层语义信息,损失函数则采用交叉熵与Dice系数损失组合形式。在自制田间场景图像数据集上进行验证实验,结果表明,所提模型的参数量为3.725×10^(6),相较原模型减少93.05%,平均交并比(MIoU)和平均像素准确率(mPA)分别达到88.41%和94.54%,优于UNet、FCN、DeepLabV3+和PSPNet等主流语义分割网络;在NVIDIA RTX 3060 GPU平台上进行图像推理,改进模型的检测速度可达117.05帧/s,远快于对比网络。改进后的模型在实现显著轻量化的同时还提升了分割精度,满足智能农机作业实时精确性的信息提取需求。 展开更多
关键词 稻田收割 场景识别 语义分割 神经网络 轻量化 分割精度
在线阅读 下载PDF
基于改进双分支网络的道路场景实时语义分割
4
作者 林雨晨 郑莉 《测绘工程》 2026年第1期1-7,共7页
目前语义分割领域的方法总是会在加快推理速度的同时忽略图片中的细节特征,从而导致精度的下降。提出一种改进的双分支网络,针对传统语义分割方法在提升推理速度时忽略细节特征的问题,进行优化。文中方法基于深度双分辨率网络(DDRNet),... 目前语义分割领域的方法总是会在加快推理速度的同时忽略图片中的细节特征,从而导致精度的下降。提出一种改进的双分支网络,针对传统语义分割方法在提升推理速度时忽略细节特征的问题,进行优化。文中方法基于深度双分辨率网络(DDRNet),设计自适应特征增强模块(AFEM),通过引入该模块,显著提升高分辨率分支的细节特征及多尺度特征的提取能力。实验结果表明,文中方法在Cityscapes数据集上达到78.41%的平均并交比(MIoU),不仅性能超过当前最新的一系列网络,同时运行效率也与最先进的实时分割网络相当,展现出卓越的性能与效率平衡。 展开更多
关键词 自动驾驶 语义分割 深度学习 实时处理
在线阅读 下载PDF
基于集成学习的神经母细胞瘤语义分割及半透明可视化
5
作者 潘姣 季申予 +2 位作者 李亮 田中觉 王笑琨 《工程科学学报》 北大核心 2026年第2期360-369,共10页
神经母细胞瘤是一种形态复杂多变的肿瘤,肿瘤的位置、形状和大小差异显著,且常伴随重要解剖结构的包绕,肿瘤与周围组织的边界模糊,导致术前评估与手术规划面临巨大挑战.为提升术前诊疗的智能化与可视化水平,本文提出了一种基于集成学习... 神经母细胞瘤是一种形态复杂多变的肿瘤,肿瘤的位置、形状和大小差异显著,且常伴随重要解剖结构的包绕,肿瘤与周围组织的边界模糊,导致术前评估与手术规划面临巨大挑战.为提升术前诊疗的智能化与可视化水平,本文提出了一种基于集成学习的神经母细胞瘤语义分割及半透明三维可视化方法.在语义分割部分,本文基于预训练的nnU-Net架构构建了能够使用多模态医学图像作为输入的分割框架,并在推理阶段引入了一种基于验证集Dice分数的加权投票集成策略.与nnU-Net默认的等权平均集成不同,该策略根据模型性能分配融合权重,使表现更优的模型在最终预测中占据更大权重,从而在保持整体稳定性的同时提升了分割精度.本方法在SPPIN 2023挑战赛提供的儿童神经母细胞瘤数据集上开展了对比实验,该方法在Dice系数、Hausdorff距离与体积相似性等指标上均优于主流方法.此外,为进一步验证投票集成策略的有效性,我们在BraTS2021给出的脑肿瘤数据集上进行了消融实验,证明了投票策略确实有效.在肿瘤可视化部分,本文使用了一种基于随机点采样的半透明三维可视化方法,通过将分割后的结果进行点云化,并进行多子集点云的统计融合,在无需深度排序的条件下实现快速渲染,实现了肿瘤和周围器官的半透明可视化.本文提出的可视化方案可以提升术前空间理解效率,为复杂病例的术前辅助决策提供直观、精准的视觉支持,具备良好的临床应用前景. 展开更多
关键词 语义分割 半透明可视化 神经母细胞瘤 集成学习 多模态核磁共振
在线阅读 下载PDF
跨模态多层特征融合的遥感影像语义分割 被引量:3
6
作者 李智杰 程鑫 +3 位作者 李昌华 高元 薛靖裕 介军 《计算机科学与探索》 北大核心 2025年第4期989-1000,共12页
多模态语义分割网络能够利用不同模态中的互补信息来提高分割精度,在地物分类领域具有广泛的应用潜力。然而,现有的多模态遥感影像语义分割模型大多忽略了深度特征的几何形状信息,未将多层特征充分利用就进行融合,导致跨模态特征提取不... 多模态语义分割网络能够利用不同模态中的互补信息来提高分割精度,在地物分类领域具有广泛的应用潜力。然而,现有的多模态遥感影像语义分割模型大多忽略了深度特征的几何形状信息,未将多层特征充分利用就进行融合,导致跨模态特征提取不充分,融合效果不理想。针对这些问题,提出了一种基于多模态特征提取和多层特征融合的遥感影像语义分割模型。通过构建双分支编码器,模型能够分别提取遥感影像的光谱信息和归一化数字表面模型(nDSM)的高程信息,并深入挖掘nDSM的几何形状信息。引入跨层丰富模块细化完善每层特征,从深层到浅层充分利用多层的特征信息。完善后的特征通过注意力特征融合模块,对特征进行差异性互补和交叉融合,以减轻分支结构之间的差异,充分发挥多模态特征的优势,从而提高遥感影像分割精度。在ISPRS Vaihingen和Potsdam数据集上进行实验,mF1分数分别达到了90.88%和93.41%,平均交互比(mIoU)分别达到了83.49%和87.85%,相较于当前主流算法,该算法实现了更准确的遥感影像语义分割。 展开更多
关键词 遥感影像 归一化数字表面模型(nDSM) 语义分割 特征提取 特征融合
在线阅读 下载PDF
激光三维点云在岩性语义分割中的应用综述 被引量:2
7
作者 邵燕林 刘浪 +4 位作者 曾齐红 胡忠贵 魏薇 邓帆 王庆 《科学技术与工程》 北大核心 2025年第4期1313-1324,共12页
激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示... 激光三维扫描技术可快速获取扫描目标表面的点云数据,包括用于描述目标几何特征的空间点坐标和刻画目标材质反射率信息的激光反射强度。将激光三维点云的自动语义分割技术应用于地质勘探研究中,能为区域地质特征描绘奠定基础。为了展示激光三维扫描技术在地质场景大规模语义分割领域的最新进展,首先对摄影测量和激光雷达两种三维点云获取方式进行了比较,得到激光雷达在精度、泛用性、不易受光照条件影响等方面具有优势。通过阐述岩性语义分割的原理,将近年来基于几何特征或强度特征的岩性点云分割方法进行了全面的归纳和总结;介绍了常用大规模点云数据集和评价指标,并比较不同算法分割性能;最后总结了现有方法的局限性,并指出岩性语义分割任务未来研究方向进行展望。 展开更多
关键词 三维激光雷达 数字模型 点云语义分割 岩性分类
在线阅读 下载PDF
基于互引导条件耦合的小样本语义分割 被引量:1
8
作者 刘胜男 姜璐璐 +2 位作者 郑宛露 王少荣 汪国平 《计算机辅助设计与图形学学报》 北大核心 2025年第6期973-982,共10页
针对现有的小样本语义分割方法普遍采用简单的融合策略来实现跨分支信息传递,难以捕获复杂的特征交互信息的问题,提出一个实现支持-查询分支高效融合的互引导条件耦合网络.所提网络设计了一个耦合信息生成模块,该模块聚焦于支持特征中... 针对现有的小样本语义分割方法普遍采用简单的融合策略来实现跨分支信息传递,难以捕获复杂的特征交互信息的问题,提出一个实现支持-查询分支高效融合的互引导条件耦合网络.所提网络设计了一个耦合信息生成模块,该模块聚焦于支持特征中与查询特征高度相似的区域,以使查询特征中的每个像素能够自适应地融合支持特征的像素级信息.同时,为了减少查询图像背景对融合效果的负面影响,设计了一个条件耦合模块.在该模块中,生成的条件可用于抑制查询图像背景区域的信息吸收,从而有效地避免了背景信息对结果的干扰.在PASCAL-5i以及COCO-20i的实验结果表明,所提网络在多数任务上,其mIoU和FBIoU指标优于或接近相关方法的最佳性能. 展开更多
关键词 语义分割 小样本学习 小样本语义分割 特征融合
在线阅读 下载PDF
基于交叉融合自注意力的点云语义分割 被引量:1
9
作者 舒军 王帅 +1 位作者 杨莉 陈宇 《中南民族大学学报(自然科学版)》 CAS 2025年第1期96-106,共11页
针对目前点云语义分割算法通常采用简单的串联三维原始坐标信息方式建模几何信息,导致建模不完整问题.提出了交叉融合自注意力网络,在该网络的编码层中设计了交叉融合自注意力机制模块,通过交互学习坐标和特征信息,提高局部细粒度特征... 针对目前点云语义分割算法通常采用简单的串联三维原始坐标信息方式建模几何信息,导致建模不完整问题.提出了交叉融合自注意力网络,在该网络的编码层中设计了交叉融合自注意力机制模块,通过交互学习坐标和特征信息,提高局部细粒度特征描述能力,使得几何信息建模更加完整.同时为了更好地结合浅层与高层特征,提出了一种层级特征融合模块,通过自适应地连接网络不同层,实现不同层的特征整合.在S3DIS、Semantic3D和SemanticKITTI数据集上实验表明:该算法优于RandLA-Net等先进算法. 展开更多
关键词 点云 语义分割 交叉融合自注意力 层级特征融合
在线阅读 下载PDF
基于调制-全局推理的弱监督语义分割算法研究 被引量:1
10
作者 刘洲峰 李冰芮 +3 位作者 杨瑞敏 李春雷 何媛 丁淑敏 《计算机工程》 北大核心 2025年第2期344-355,共12页
基于图像级标签的弱监督语义分割方法可利用少量带有图像级标签的注释对网络进行训练,从而减轻注释负担。然而,现有基于类激活映射的方法存在分割区域不完整的问题。为使最终分割预测结果包含更多前景目标,提出一种基于调制-全局推理的... 基于图像级标签的弱监督语义分割方法可利用少量带有图像级标签的注释对网络进行训练,从而减轻注释负担。然而,现有基于类激活映射的方法存在分割区域不完整的问题。为使最终分割预测结果包含更多前景目标,提出一种基于调制-全局推理的弱监督语义分割方法。在分类网络中,首先设计空间-通道激活调制模块以提取更完整的目标对象特征,从而避免类激活图过度关注显著性区域;其次提出全局推理单元模块,利用该模块捕获特征图中不相交区域和较远区域之间的全局关系以便选出包含更完整的目标对象,从而进一步增强非显著区域的特征;最后通过设计潜在目标挖掘模块以降低伪标签中的假阴性率,进而提取其中的丢失信息,从而有效缓解初始伪标签中目标区域不完整的问题。在分割网络中,将分类网络生成的初始预测和伪标签相结合,并通过非显著区域挖掘模块进一步生成掩蔽伪标签从而提升分割效果。实验结果表明,该方法在仅使用图像级标签的情况下,在Pascal VOC 2012验证集和测试集上的精度分别为69.5%和69.8%,在MS COCO 2014验证集上的精度为32.8%,同时可有效解决分割区域不完整的问题,优于已有方法。 展开更多
关键词 语义分割 弱监督 非显著区域 激活调制 全局推理单元
在线阅读 下载PDF
基于双路径监督的遥感图像语义分割网络 被引量:1
11
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《北京航空航天大学学报》 北大核心 2025年第3期732-741,共10页
为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过... 为解决遥感图像语义分割任务中目标物体边界分类模糊的问题,提出双路径监督与注意力筛选网络。引入可监督的边界提取模块来增加边界信息通道,提高边界信息在语义分割中的权重,增强对目标物体边界像素的注意力;引入注意力筛选模块,通过注意力图筛选出浅层网络中的空间细节信息和深层网络中的抽象语义信息,舍弃网络中的冗余信息,防止过拟合。双路径监督与注意力筛选网络在Potsdam数据集和Jiage数据集上的平均交并比分别为85.44%和86.07%,比次优网络MagNet和SAPNet分别提升了1.24%和1.28%、1.54%和1.27%。实验结果表明,所提网络能更精准地分割目标物体的边界。 展开更多
关键词 遥感图像 语义分割 可监督 边界信息 注意力筛选
原文传递
基于语义分割与层次分析耦合的城市历史街区步行舒适度评价研究--以济南将军庙历史街区为例 被引量:4
12
作者 高晓明 王航 +1 位作者 李超先 王月涛 《新建筑》 2025年第2期116-121,共6页
城市历史街区作为城市物质文化遗产的重要组成部分,其步行舒适度对城市历史文脉的延续、空间品质的改善以及生活活力的提升具有重要意义。文章选取城市历史街区作为研究对象,基于语义分割与层次分析的耦合,通过整合街景照片爬取、视觉... 城市历史街区作为城市物质文化遗产的重要组成部分,其步行舒适度对城市历史文脉的延续、空间品质的改善以及生活活力的提升具有重要意义。文章选取城市历史街区作为研究对象,基于语义分割与层次分析的耦合,通过整合街景照片爬取、视觉感知分析和肯德尔相关性分析等技术方法,从客观的机器算分与主观的人工打分两方面构建城市历史街区步行舒适度评价框架;并以济南将军庙历史街区为例,结合视觉感知分析对步行舒适度的人工打分与机器算分进行差异比对和肯德尔相关性分析,从而揭示影响城市历史街区步行舒适度的关键因素。研究定量分析了城市历史街区步行空间的环境特征及其使用者的主观感受偏好,为城市历史街区保护和改善工作提供了新的理论视角和方法策略。 展开更多
关键词 城市历史街区 步行舒适度 语义分割 层次分析 将军庙历史街区
在线阅读 下载PDF
基于DI-PointNet的变电站主设备点云高精度语义分割方法 被引量:2
13
作者 裴少通 孙海超 +2 位作者 孙志周 胡晨龙 祝雨馨 《电工技术学报》 北大核心 2025年第9期2917-2930,共14页
在变电站机器人巡检任务中,三维点云数据的高精度语义分割是关键技术之一,有助于机器人理解电力设备、障碍物和其他物体的空间布局。然而,现有的点云分割算法在变电站场景中的应用效果有限,准确度较低、计算复杂度高,难以实现对变电站... 在变电站机器人巡检任务中,三维点云数据的高精度语义分割是关键技术之一,有助于机器人理解电力设备、障碍物和其他物体的空间布局。然而,现有的点云分割算法在变电站场景中的应用效果有限,准确度较低、计算复杂度高,难以实现对变电站主设备点云的准确分割。为了解决这一问题,该文提出了一种基于PointNet++的DI-PointNet算法。首先,采用双层连续变换器模块增强点云之间的信息交互,有效地聚合长距离上下文,增大网络有效感受野;其次,通过分层键采样策略生成自注意力机制所需的键值,降低算法复杂度;最后,使用倒置残差模块,通过倒置瓶颈设计和残差连接缓解梯度消失,有效地增加模型的深度,同时降低计算复杂度。此外,该文构建了变电站点云数据集,对DI-PointNet算法进行详细的消融实验,并与主流深度学习算法和电力领域典型点云分割算法进行对比。实验验证结果表明,DI-PointNet算法对变电站主设备点云分割的平均交并比达到82.5%,相比PointNet++算法提高了2.1个百分点,且总体精度提高了3.4个百分点,达到90.1%。DI-PointNet算法为智能电力设备巡检和维护提供了有效的解决方案。 展开更多
关键词 点云语义分割 双层连续变换器 分层键采样 倒置残差 变电站
在线阅读 下载PDF
用于铁路场景语义分割的改进动态图卷积神经网络 被引量:2
14
作者 王卫东 刘延 +3 位作者 邱实 刘贤华 魏晓 王劲 《计算机辅助设计与图形学学报》 北大核心 2025年第1期139-147,共9页
针对目前在铁路场景语义分割中存在的数据获取成本高、分割精度低、泛化能力差等问题,提出了一种基于改进动态图卷积神经网络的铁路场景语义分割方法.首先利用高分辨率的无人机采集铁路场景的多视角图像,并通过结构运动恢复与基于面片... 针对目前在铁路场景语义分割中存在的数据获取成本高、分割精度低、泛化能力差等问题,提出了一种基于改进动态图卷积神经网络的铁路场景语义分割方法.首先利用高分辨率的无人机采集铁路场景的多视角图像,并通过结构运动恢复与基于面片的多视角立体视觉算法生成铁路场景的三维点云;然后在动态图卷积神经网络中引入空间注意力模块,增强网络结构的分割精度与泛化性;最后通过改进后的图卷积神经网络对预处理后的铁路场景点云完成高精度的语义分割.实验阶段采用的铁路场景包括桥梁段、路基段与联络线,共计11个区域.以平均交并比为评价指标,与动态图卷积神经网络、PointNet++进行对比,研究结果表明,基于图像点云训练的改进动态图卷积神经网络对于铁路场景语义分割具有更高的精度,与动态图卷积神经网络、PointNet++相比,分割精度分别提高3.3个百分点与6.0个百分点,且具有更好的泛化能力. 展开更多
关键词 铁道工程 点云语义分割 无人机点云 卷积神经网络
在线阅读 下载PDF
基于自注意力机制的高分遥感影像语义分割 被引量:2
15
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
以语言为媒介的遥感图像跨时空领域自适应语义分割 被引量:1
16
作者 陶超 郭鑫 +2 位作者 胡柯彦 沈羽翔 王昊 《中国图象图形学报》 北大核心 2025年第9期3153-3170,共18页
目的随着视觉大模型的发展,利用多源无标注遥感影像预训练学习全局视觉特征,并在局部目标任务上进行迁移微调,已成为遥感影像领域自适应的一种新范式。然而,现有的全局预训练策略主要聚焦于学习低级的通用视觉特征,难以捕捉复杂、高层... 目的随着视觉大模型的发展,利用多源无标注遥感影像预训练学习全局视觉特征,并在局部目标任务上进行迁移微调,已成为遥感影像领域自适应的一种新范式。然而,现有的全局预训练策略主要聚焦于学习低级的通用视觉特征,难以捕捉复杂、高层次的语义关联。此外,微调过程中使用的少量标注样本往往只反映目标域的特定场景,无法充分激活全局模型中与目标域匹配的领域知识。因此,面对复杂多变的遥感影像跨时空领域偏移,现有方法得到的全局模型与目标任务之间仍然存在巨大的语义鸿沟。为应对这一挑战,本文提出一种语言文本引导的“全局模型预训练—局部模型微调”的领域自适应框架。方法提出框架针对遥感数据的时空异质性特点,借助大型视觉语言助手LLaVA(large language and vision assistant)生成包含季节、地理区域及地物分布等时空信息的遥感影像文本描述。通过语言文本引导的学习帮助全局模型挖掘地物的时空分布规律,增强局部任务微调时相关领域知识的激活。结果在对比判别式、掩码生成式和扩散生成式3种不同全局预训练策略上设置了3组“全局—局部”跨时空领域自适应语义分割实验来验证提出框架的有效性。以全局→局部(长沙)为例,使用语言文本引导相比于无文本引导在3种不同预训练策略上分别提升了8.7%、4.4%和2.9%。同样地,提出框架在全局→局部(湘潭)和全局→局部(武汉)上也都有性能提升。结论证明了语言文本对准确理解跨时空遥感影像中的语义内容具有积极影响。与无文本引导的学习方法相比,提出框架显著提升了模型的迁移性能。 展开更多
关键词 遥感影像 语义分割 领域自适应 视觉语言模型 时空异质性
原文传递
RS-SegDif:基于扩散模型的遥感语义分割样本合成方法 被引量:1
17
作者 龚健雅 刘青瑀 +3 位作者 张觅 聂福 李依聪 邵远征 《城市勘测》 2025年第1期1-7,共7页
当前深度学习在遥感领域已经取得了显著的发展,而大规模,高质量标注的训练数据集对深度学习的突破起着至关重要的作用。尽管遥感训练样本量在不断增加,但多样性的遥感语义分割样本仍然缺乏。针对该问题,本文提出了RS-SegDif方法,通过生... 当前深度学习在遥感领域已经取得了显著的发展,而大规模,高质量标注的训练数据集对深度学习的突破起着至关重要的作用。尽管遥感训练样本量在不断增加,但多样性的遥感语义分割样本仍然缺乏。针对该问题,本文提出了RS-SegDif方法,通过生成式扩散模型生成遥感影像来有效扩充遥感语义分割样本多样性,这将改变传统的数据生成过程。本方法首先根据遥感影像的文字提示,通过扩散模型生成了满足真实世界的数据分布多样化的语义标签,然后以语义分割标签为条件,通过扩散模型生成遥感影像的方式,充分地扩充了遥感语义分割样本多样性。此外,为了大幅提升生成样本的多样性,RS-SegDif整合了两个遥感数据生成策略,即通过文本生成标签再生成影像的策略以及直接通过文本和真实标签生成影像的策略。针对下游任务,对比了多种语义分割模型,当使用合成遥感数据进行训练时,本文的合成数据的高质量在下游语义分割任务中提升了模型精度约+3.25 mIoU,有效扩充了遥感样本的多样性。 展开更多
关键词 扩散模型 语义分割 遥感样本生成 深度学习
在线阅读 下载PDF
基于对抗学习和一致性正则的半监督语义分割方法 被引量:1
18
作者 冯兴杰 南博公 《计算机应用与软件》 北大核心 2025年第1期182-188,共7页
为了降低语义分割任务对像素级标签的需求,提出一种基于对抗学习和Mean teachers模型的半监督语义分割方法。该方法训练过程分为两个阶段,第一阶段在分割网络之后连接判别网络,通过对抗学习使分割网络预测结果逐渐接近真实标签;第二阶... 为了降低语义分割任务对像素级标签的需求,提出一种基于对抗学习和Mean teachers模型的半监督语义分割方法。该方法训练过程分为两个阶段,第一阶段在分割网络之后连接判别网络,通过对抗学习使分割网络预测结果逐渐接近真实标签;第二阶利用第一阶段的网络参数做指数移动平均得到教师网络,与分割网络做一致性训练,使模型性能进一步提升。使用PASCAL VOC 2012数据集进行实验,结果表明在使用相同数量的标签训练下,该方法的分割图的质量和评价指标mIoU优于现有半监督语义分割方法。 展开更多
关键词 语义分割 半监督学习 对抗学习 一致性正则
在线阅读 下载PDF
基于样本迭代优化策略的密集连接多尺度土地覆盖语义分割 被引量:1
19
作者 郑宗生 高萌 +3 位作者 周文睆 王政翰 霍志俊 张月维 《自然资源遥感》 北大核心 2025年第2期11-18,共8页
针对分割结果小尺度地物遗漏、连续地物缺乏完整性问题,提出密集连接多尺度语义分割模型(densely connected multi-scale semantic segmentation network, DMS-Net),实现土地覆盖分割。通过多尺度密集连接空洞空间卷积金字塔池化(multi-... 针对分割结果小尺度地物遗漏、连续地物缺乏完整性问题,提出密集连接多尺度语义分割模型(densely connected multi-scale semantic segmentation network, DMS-Net),实现土地覆盖分割。通过多尺度密集连接空洞空间卷积金字塔池化(multi-scale dense connected atrous spatial convolution pyramid pooling module, MDCA)和条形池化(spatial pyramid pooling, SP)提取多尺度和空间连续性地物;利用特征增强双注意力并联模块(position paralleling channel attention module, PPCA)衡量特征权重,实现高效表达;采用浅层特征级联模块(cascade low-level feature fusion, CLFF)捕捉被忽略的浅层特征,进一步补充细节。实验结果表明:DMS-Net模型在迭代扩充数据集上的总体精度(overall accuracy, OA)达到89.97%,平均交并比(mean intersection over union, mIoU)达到75.59%,高于传统机器学习方法及U-Net, PSPNet, Deeplabv3+等深度学习模型。分割结果显示,地物结构完整且边缘分割明晰,在实现多尺度的土地覆盖遥感信息提取分析中具有较好的实用价值。 展开更多
关键词 深度学习 全卷积神经网络 多尺度 语义分割 土地覆盖
在线阅读 下载PDF
联合边缘检测强化空间细节的语义分割方法 被引量:1
20
作者 刘伯红 蒋佳跞 《重庆邮电大学学报(自然科学版)》 北大核心 2025年第1期57-66,共10页
针对图像语义分割中存在的边缘模糊和准确度较低的问题,提出一种基于边缘感知强化空间细节的图像语义分割方法,在语义分割网络中引入边缘检测模块,以捕获更加精细的空间细节。模型采用编码器-解码器结构,使用空间金字塔池化模块(atrous ... 针对图像语义分割中存在的边缘模糊和准确度较低的问题,提出一种基于边缘感知强化空间细节的图像语义分割方法,在语义分割网络中引入边缘检测模块,以捕获更加精细的空间细节。模型采用编码器-解码器结构,使用空间金字塔池化模块(atrous spatial pyramid pooling,ASPP)提取语义信息;提出双向多级聚合模块(bi-directional multi-level aggregation,BMLA)生成边缘特征,并使其强化空间细节;设计一种新型的基于注意力机制的特征融合模块(attention feature fusion module,AFFM),将强化后的空间特征与语义特征融合。采用Cityscapes和ADE20K数据集进行实验,对比其他主流语义分割算法,该方法在分割性能上具有不错的竞争力。 展开更多
关键词 语义分割 边缘检测 编码器-解码器 注意力机制
在线阅读 下载PDF
上一页 1 2 180 下一页 到第
使用帮助 返回顶部