期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
Leci:Learnable Evolutionary Category Intermediates for Unsupervised Domain Adaptive Segmentation
1
作者 Qiming ZHANG Yufei XU +1 位作者 Jing ZHANG Dacheng TAO 《Artificial Intelligence Science and Engineering》 2025年第1期37-51,共15页
To avoid the laborious annotation process for dense prediction tasks like semantic segmentation,unsupervised domain adaptation(UDA)methods have been proposed to leverage the abundant annotations from a source domain,s... To avoid the laborious annotation process for dense prediction tasks like semantic segmentation,unsupervised domain adaptation(UDA)methods have been proposed to leverage the abundant annotations from a source domain,such as virtual world(e.g.,3D games),and adapt models to the target domain(the real world)by narrowing the domain discrepancies.However,because of the large domain gap,directly aligning two distinct domains without considering the intermediates leads to inefficient alignment and inferior adaptation.To address this issue,we propose a novel learnable evolutionary Category Intermediates(CIs)guided UDA model named Leci,which enables the information transfer between the two domains via two processes,i.e.,Distilling and Blending.Starting from a random initialization,the CIs learn shared category-wise semantics automatically from two domains in the Distilling process.Then,the learned semantics in the CIs are sent back to blend the domain features through a residual attentive fusion(RAF)module,such that the categorywise features of both domains shift towards each other.As the CIs progressively and consistently learn from the varying feature distributions during training,they are evolutionary to guide the model to achieve category-wise feature alignment.Experiments on both GTA5 and SYNTHIA datasets demonstrate Leci's superiority over prior representative methods. 展开更多
关键词 unsupervised domain adaptation semantic segmentation deep learning
在线阅读 下载PDF
CFSA-Net:Efficient Large-Scale Point Cloud Semantic Segmentation Based on Cross-Fusion Self-Attention 被引量:2
2
作者 Jun Shu Shuai Wang +1 位作者 Shiqi Yu Jie Zhang 《Computers, Materials & Continua》 SCIE EI 2023年第12期2677-2697,共21页
Traditional models for semantic segmentation in point clouds primarily focus on smaller scales.However,in real-world applications,point clouds often exhibit larger scales,leading to heavy computational and memory requ... Traditional models for semantic segmentation in point clouds primarily focus on smaller scales.However,in real-world applications,point clouds often exhibit larger scales,leading to heavy computational and memory requirements.The key to handling large-scale point clouds lies in leveraging random sampling,which offers higher computational efficiency and lower memory consumption compared to other sampling methods.Nevertheless,the use of random sampling can potentially result in the loss of crucial points during the encoding stage.To address these issues,this paper proposes cross-fusion self-attention network(CFSA-Net),a lightweight and efficient network architecture specifically designed for directly processing large-scale point clouds.At the core of this network is the incorporation of random sampling alongside a local feature extraction module based on cross-fusion self-attention(CFSA).This module effectively integrates long-range contextual dependencies between points by employing hierarchical position encoding(HPC).Furthermore,it enhances the interaction between each point’s coordinates and feature information through cross-fusion self-attention pooling,enabling the acquisition of more comprehensive geometric information.Finally,a residual optimization(RO)structure is introduced to extend the receptive field of individual points by stacking hierarchical position encoding and cross-fusion self-attention pooling,thereby reducing the impact of information loss caused by random sampling.Experimental results on the Stanford Large-Scale 3D Indoor Spaces(S3DIS),Semantic3D,and SemanticKITTI datasets demonstrate the superiority of this algorithm over advanced approaches such as RandLA-Net and KPConv.These findings underscore the excellent performance of CFSA-Net in large-scale 3D semantic segmentation. 展开更多
关键词 semantic segmentation large-scale point cloud random sampling cross-fusion self-attention
在线阅读 下载PDF
PASS-SAM:Integration of Segment Anything Model for Large-Scale Unsupervised Semantic Segmentation
3
作者 Yin Tang Rui Chen +1 位作者 Gensheng Pei Qiong Wang 《Computational Visual Media》 2025年第3期669-674,共6页
Large-scale unsupervised semantic segmentation(LUSS)is a sophisticated process that aims to segment similar areas within an image without relying on labeled training data.While existing methodologies have made substan... Large-scale unsupervised semantic segmentation(LUSS)is a sophisticated process that aims to segment similar areas within an image without relying on labeled training data.While existing methodologies have made substantial progress in this area,there is ample scope for enhancement.We thus introduce the PASS-SAM model,a comprehensive solution that amalgamates the benefits of various models to improve segmentation performance. 展开更多
关键词 segmentation performance amalgamates benefits various models segment anything model pass sam model segment similar areas large scale unsupervised semantic segmentation
原文传递
Boosting Unsupervised Monocular Depth Estimation with Auxiliary Semantic Information
4
作者 Hui Ren Nan Gao Jia Li 《China Communications》 SCIE CSCD 2021年第6期228-243,共16页
Learning-based multi-task models have been widely used in various scene understanding tasks,and complement each other,i.e.,they allow us to consider prior semantic information to better infer depth.We boost the unsupe... Learning-based multi-task models have been widely used in various scene understanding tasks,and complement each other,i.e.,they allow us to consider prior semantic information to better infer depth.We boost the unsupervised monocular depth estimation using semantic segmentation as an auxiliary task.To address the lack of cross-domain datasets and catastrophic forgetting problems encountered in multi-task training,we utilize existing methodology to obtain redundant segmentation maps to build our cross-domain dataset,which not only provides a new way to conduct multi-task training,but also helps us to evaluate results compared with those of other algorithms.In addition,in order to comprehensively use the extracted features of the two tasks in the early perception stage,we use a strategy of sharing weights in the network to fuse cross-domain features,and introduce a novel multi-task loss function to further smooth the depth values.Extensive experiments on KITTI and Cityscapes datasets show that our method has achieved state-of-the-art performance in the depth estimation task,as well improved semantic segmentation. 展开更多
关键词 unsupervised monocular depth estimation semantic segmentation multi-task model
在线阅读 下载PDF
Domain adaptive semantic segmentation by optimal transport 被引量:1
5
作者 Yaqian Guo Xin Wang +1 位作者 Ce Li Shihui Ying 《Fundamental Research》 CAS CSCD 2024年第5期981-991,共11页
Scene segmentation is widely used in autonomous driving for environmental perception.Semantic scene segmentation has gained considerable attention owing to its rich semantic information.It assigns labels to the pixels... Scene segmentation is widely used in autonomous driving for environmental perception.Semantic scene segmentation has gained considerable attention owing to its rich semantic information.It assigns labels to the pixels in an image,thereby enabling automatic image labeling.Current approaches are based mainly on convolutional neural networks(CNN),however,they rely on numerous labels.Therefore,the use of a small amount of labeled data to achieve semantic segmentation has become increasingly important.In this study,we developed a domain adaptation framework based on optimal transport(OT)and an attention mechanism to address this issue.Specifically,we first generated the output space via a CNN owing to its superior of feature representation.Second,we utilized OT to achieve a more robust alignment of the source and target domains in the output space,where the OT plan defined a well attention mechanism to improve the adaptation of the model.In particular,the OT reduced the number of network parameters and made the network more interpretable.Third,to better describe the multiscale properties of the features,we constructed a multiscale segmentation network to perform domain adaptation.Finally,to verify the performance of the proposed method,we conducted an experiment to compare the proposed method with three benchmark and four SOTA methods using three scene datasets.The mean intersection-over-union(mIOU)was significantly improved,and visualization results under multiple domain adaptation scenarios also show that the proposed method performed better than semantic segmentation methods. 展开更多
关键词 semantic scene segmentation unsupervised domain adaptation Optimal transport Deep learning Multiscale network
原文传递
自训练驱动的高分辨率遥感域自适应语义分割
6
作者 龙杰 任彦 +2 位作者 刘尚原 高晓文 刘国庆 《遥感信息》 北大核心 2025年第2期115-123,共9页
针对现有分割模型在复杂遥感场景中的跨域分割性能衰退和标注数据匮乏的问题,提出一种用于高分辨率遥感影像语义分割的域自适应框架IRRST。首先,根据样本实例特性,设计了一种精细化自适应校正的伪标签选择策略,以取代传统自训练策略中... 针对现有分割模型在复杂遥感场景中的跨域分割性能衰退和标注数据匮乏的问题,提出一种用于高分辨率遥感影像语义分割的域自适应框架IRRST。首先,根据样本实例特性,设计了一种精细化自适应校正的伪标签选择策略,以取代传统自训练策略中固定的伪标签选择机制,丰富伪标签同时有效地抑制了噪声干扰。其次,分别从模型预测和标签平滑的角度引入置信度正则,对过度预测和标签噪声加以约束。最后,在主干网络中嵌入空间重构单元进行特征重组,减少冗余信息并加快模型收敛。实验结果表明,IRRST针对LoveDA、Potsdam和Vaihingen 3种公开数据集在不同的跨域场景下均具有良好的泛化性能,在rural到urban、urban到rural和Potsdam到Vaihingen跨域场景下,准确率分别提升了10.69、11.19和11.72个百分点。相同实验条件下超越了同类型的其他方法。 展开更多
关键词 无监督域自适应 语义分割 自训练 伪标签 正则化
在线阅读 下载PDF
伪标签动态生成的域自适应语义分割算法
7
作者 范帅坤 颜西平 +4 位作者 马春梅 裴丽君 朱金奇 陈家林 石锐 《天津师范大学学报(自然科学版)》 北大核心 2025年第4期68-74,共7页
自训练是解决域自适应语义分割的一种有效方法,针对现有工作中基于固定阈值选择的伪标签存在大量噪声的问题,提出一种伪标签动态生成的域自适应语义分割算法.首先,利用傅里叶变换对目标域图像进行风格转换预处理,使其在灰度、结构以及... 自训练是解决域自适应语义分割的一种有效方法,针对现有工作中基于固定阈值选择的伪标签存在大量噪声的问题,提出一种伪标签动态生成的域自适应语义分割算法.首先,利用傅里叶变换对目标域图像进行风格转换预处理,使其在灰度、结构以及边缘等信息与源域图像接近,降低域之间的差异;然后,提出一种基于移动阈值的伪标签动态生成方法,提升目标域图像伪标签的置信度.在2个典型城市道路数据集GTA5和SYNTHIA上进行实验,结果表明,相比典型的基于对抗学习的AdaptSegNet模型和较先进的RPT模型,本文算法的平均交并比(mIoU)均有一定提升,验证了本文算法的有效性. 展开更多
关键词 语义分割 域自适应 无监督 生成网络 伪标签 移动阈值
在线阅读 下载PDF
面向对象语义线索的无监督语义分割研究
8
作者 贺祺祥 郭红钰 +1 位作者 陈启志 刘玉龙 《计算机工程与应用》 北大核心 2025年第20期218-227,共10页
在传统的语义分割任务中,广泛依赖像素级标注数据,促使无监督方法逐渐受到关注。近年来,自监督视觉Transformer的深层特征被广泛应用,推动了无监督语义分割的研究进展。然而,由于局部特征编码缺乏显式的对象级语义表示,复杂结构物体的... 在传统的语义分割任务中,广泛依赖像素级标注数据,促使无监督方法逐渐受到关注。近年来,自监督视觉Transformer的深层特征被广泛应用,推动了无监督语义分割的研究进展。然而,由于局部特征编码缺乏显式的对象级语义表示,复杂结构物体的分割仍面临挑战,常导致分割效果不理想。为解决这一问题,提出了一种名为OASES(object-aware segmentation system)的新型无监督语义分割框架,旨在强化面向对象的表示学习。该方法融合了谱分析过程,通过分析深度图像特征的语义相似性矩阵和图像颜色亲和性中提取的特征值,获取语义和结构线索。此外,结合面向对象的对比损失,引导模型学习在图像内外保持一致的对象级语义表示,从而提升语义分割的准确性。在COCO-Stuff和Cityscapes数据集上的大量实验表明,OASES在复杂场景中实现了准确且一致的分割效果,达到了当前领先的无监督语义分割性能。 展开更多
关键词 无监督语义分割(USS) 对象级语义结构线索 谱分析 对比学习
在线阅读 下载PDF
基于伪标签去噪和SAM优化的大规模无监督语义分割
9
作者 杨维静 徐瑞 +3 位作者 顾浩文 陈涛 舒祥波 姚亚洲 《电子学报》 北大核心 2025年第3期716-727,共12页
语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,... 语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S_(50)、ImageNet-S_(300)和ImageNet-S_(919)的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度. 展开更多
关键词 大规模无监督语义分割 图像级去噪 分割一切模型 伪标签 聚类
在线阅读 下载PDF
基于强弱一致性的无监督领域自适应语义分割方法
10
作者 田晓敏 郭仁春 +2 位作者 赵怀慈 刘鹏飞 房建 《微电子学与计算机》 2025年第4期114-123,共10页
在图像语义分割领域,无监督领域自适应技术的发展有效降低了模型对标注数据的依赖,提升了自动驾驶等智能系统的效率和广泛适用性。针对无监督领域自适应技术在新场景泛化能力有限及在稀有类别中分割效果差的问题,文章提出了一种基于强... 在图像语义分割领域,无监督领域自适应技术的发展有效降低了模型对标注数据的依赖,提升了自动驾驶等智能系统的效率和广泛适用性。针对无监督领域自适应技术在新场景泛化能力有限及在稀有类别中分割效果差的问题,文章提出了一种基于强弱一致性的无监督领域自适应语义分割算法。算法首先通过增加特征级别的增强,拓展图像增强空间的维度,改善了只利用图像级增强局限性。其次,采用基于能量分数的伪标签筛选方法,筛选出足够接近当前训练数据的样本赋予伪标签,避免了使用Softmax置信度方法在稀有类别中存在局限性,使模型更新更加稳健。最后,构建结合图像级别增强和特征级别增强的双重一致性框架,更充分的利用一致性训练,进一步提高模型的泛化能力。实验结果证明,提出的方法在GTA5-to-Cityscapes公开数据集中平均交并比指标(mean Intersection over Union,mIoU)可提升至52.6%,较PixMatch算法,性能提升了4.3%。 展开更多
关键词 语义分割 无监督领域自适应 强弱一致性 伪标签
在线阅读 下载PDF
一种语义分割辅助的单教师-多学生无监督异常检测方法
11
作者 焦震 索浩银 +3 位作者 董翔宇 朱涛 李腾 王子磊 《计算机应用与软件》 北大核心 2025年第3期76-83,共8页
为了改善目前常见的异常检测算法受到的异常数据难以获取以及繁多的异常类别之间数据不均衡的制约,提出一种语义分割辅助的单教师-多学生无监督异常检测算法。在知识蒸馏模型中使用多个学生网络参与预测,根据多个学生网络的均值、方差... 为了改善目前常见的异常检测算法受到的异常数据难以获取以及繁多的异常类别之间数据不均衡的制约,提出一种语义分割辅助的单教师-多学生无监督异常检测算法。在知识蒸馏模型中使用多个学生网络参与预测,根据多个学生网络的均值、方差等统计信息生成特征图,增强预测结果的稳定性与准确性;利用特征金字塔的思想,提取多个尺度的视觉特征以提升模型检测不同尺度异常区域的能力;利用语义分割模型良好的边界提取能力,引入语义分割网络对异常检测结果辅助修正。与现有的无监督异常检测算法相比,该方法能够更好地定位与检测工业场景下的物体表面异常。 展开更多
关键词 异常检测 无监督学习 语义分割 计算机视觉
在线阅读 下载PDF
基于多层级领域自适应网络和置信度约束的道路场景语义分割方法
12
作者 万才路 堵威 《华东理工大学学报(自然科学版)》 北大核心 2025年第3期363-370,共8页
语义分割旨在为图像中的每个像素分配一个类别标签,在自动驾驶领域具有广泛的应用。在实际应用中,在某个场景训练的语义分割模型无法有效地应用到其他场景,这成为实际应用中的一个关键问题,像素级域内自适应方法已被证明是一种解决此问... 语义分割旨在为图像中的每个像素分配一个类别标签,在自动驾驶领域具有广泛的应用。在实际应用中,在某个场景训练的语义分割模型无法有效地应用到其他场景,这成为实际应用中的一个关键问题,像素级域内自适应方法已被证明是一种解决此问题的有效方法。然而,这种方法不能有效地利用空间位置信息,并且容易受到噪声伪标签的影响。为了解决这些问题,本文首先提出了多层级领域自适应网络和置信度约束的方法,同时利用空间先验知识提出了阈值方法,提高了在域内自适应中使用伪标签的质量。在“GTA5到Cityscapes”和“SYNTHIA到Cityscapes”任务中,相较于基准方法本文所提方法分别实现了6.5%和2.8%的性能提升。 展开更多
关键词 道路场景 语义分割 领域自适应 自训练 对抗学习
在线阅读 下载PDF
遥感图像语义分割的无监督对比学习方法
13
作者 沈超逸 倪欢 《遥感信息》 北大核心 2025年第3期138-146,共9页
针对遥感图像语义分割深度学习对大量人工标注的依赖的问题,基于对比学习和自监督学习思想,提出了一种全新的、面向遥感图像语义分割任务的无监督学习框架。该框架仅需已知待分类类别总数,即可以实现模型训练与预测。具体而言,该框架构... 针对遥感图像语义分割深度学习对大量人工标注的依赖的问题,基于对比学习和自监督学习思想,提出了一种全新的、面向遥感图像语义分割任务的无监督学习框架。该框架仅需已知待分类类别总数,即可以实现模型训练与预测。具体而言,该框架构造了两种特征集合,在不同阶段对特征进行相似度计算,以选取正样本。接着,利用Vision-Transformer的注意力分数按比例传播梯度,以更好地选取重要像元并关注关键区域。最后,将置信度较高的预测像元作为伪标签进行自监督学习,进一步提升精度。实验采用GID和Potsdam数据集验证该方法性能,并与现有无监督语义分割方法对比,证明了该方法的优越性。 展开更多
关键词 遥感图像 语义分割 对比学习 无监督学习 自监督优化
在线阅读 下载PDF
基于原型引导与自适应特征融合的域适应语义分割
14
作者 杨宇宇 杨霄 +1 位作者 潘在宇 王军 《智能系统学报》 北大核心 2025年第1期150-161,共12页
无监督域自适应技术对于减少计算机视觉任务中的数据标注工作量具有重要意义,尤其在像素级的语义分割中。然而,目标域的特征分布离散和类别不平衡问题,如模糊的类边界和某些类别的样本过少,对无监督域自适应技术构成了挑战。针对上述挑... 无监督域自适应技术对于减少计算机视觉任务中的数据标注工作量具有重要意义,尤其在像素级的语义分割中。然而,目标域的特征分布离散和类别不平衡问题,如模糊的类边界和某些类别的样本过少,对无监督域自适应技术构成了挑战。针对上述挑战,本文提出了一种原型引导的自适应特征融合模型。其中,通过引入原型引导的双重注意力网络融合空间和通道注意力特征,增强类内紧凑性。此外,本文提出自适应特征融合模块,灵活调整各特征的重要性,使网络能够在不同的空间位置和通道上捕捉到更加具有类别区分性的特征,进一步提升语义分割性能。在两个具有挑战性的合成-真实基准GTA5-to-Cityscape和SYNTHIA-to-Cityscape上的实验结果证明了本文方法的有效性,展现出模型对复杂场景和不平衡数据的处理应对能力。 展开更多
关键词 深度学习 无监督学习 域适应 语义分割 注意力机制 自训练学习 自适应 迁移学习 原型引导
在线阅读 下载PDF
基于无监督域自适应和Transformer的视网膜图像语义分割
15
作者 孙成富 李敏 +3 位作者 邹佳辰 秦思奇 季嘉杰 孔维龙 《南京师范大学学报(工程技术版)》 2025年第2期79-87,共9页
针对视网膜图像背景复杂、血管结构变化显著、边缘信息丢失导致语义分割困难的问题,提出一种改进的Transformer-无监督域自适应(TUDA)方法.首先,模型由改进的Transformer编码器和上下文感知特征融合的解码器组成,编码器部分通过融合局... 针对视网膜图像背景复杂、血管结构变化显著、边缘信息丢失导致语义分割困难的问题,提出一种改进的Transformer-无监督域自适应(TUDA)方法.首先,模型由改进的Transformer编码器和上下文感知特征融合的解码器组成,编码器部分通过融合局部信息,有效处理视网膜图像中不同位置之间的复杂交互.其次,为了减少域间隙,在源域和目标域之间引入中间域,并采用双教师网络交替训练.最后,通过引入高分辨率网络(HRNet)产生高分辨率特征,从而保留更多的视网膜图像边缘信息.与常用的医疗图像语义分割方法相比,所提方法在CHASE_DB1和DRIVE数据集上交并比达到65.36%和69.79%,灵敏度为82.51%和85.56%,具有较好的分割效果. 展开更多
关键词 语义分割 中间域 无监督域自适应 医学图像
在线阅读 下载PDF
深度学习语义分割下太阳能电池片热斑检测
16
作者 李致毅 《电子设计工程》 2025年第11期50-53,58,共5页
太阳能电池片热斑检测因复杂背景和光照条件而难以精准识别和定位,因此,提出了深度学习语义分割下的热斑检测方法。采用Canny边缘检测算法计算图像梯度,结合深度学习提取边缘轮廓,通过全连通聚类得到轮廓信息。利用非监督学习增强图像,... 太阳能电池片热斑检测因复杂背景和光照条件而难以精准识别和定位,因此,提出了深度学习语义分割下的热斑检测方法。采用Canny边缘检测算法计算图像梯度,结合深度学习提取边缘轮廓,通过全连通聚类得到轮廓信息。利用非监督学习增强图像,构建深度学习模型进行语义分割,优化热斑检测。比较输出概率与阈值,识别并定位热斑。由实验结果可知,该方法标注的N1、N2、N3、N4点与实际相符,标注温度与实际温度最大误差仅为2℃。 展开更多
关键词 深度学习 语义分割 太阳能电池片 热斑检测 非监督学习
在线阅读 下载PDF
分组无监督域适应的遥感影像道路提取 被引量:1
17
作者 周天舒 周绍光 《测绘科学》 CSCD 北大核心 2024年第9期115-124,共10页
针对跨域使用道路语义分割模型时,道路提取精度往往会大幅度下降的问题,采用针对性策略研究了一种分组迁移的跨域遥感影像道路提取算法:基于语义一致性对源域影像和目标域影像进行聚类生成跨域影像组,增强用于风格迁移的组内影像的语义... 针对跨域使用道路语义分割模型时,道路提取精度往往会大幅度下降的问题,采用针对性策略研究了一种分组迁移的跨域遥感影像道路提取算法:基于语义一致性对源域影像和目标域影像进行聚类生成跨域影像组,增强用于风格迁移的组内影像的语义相似性;采用循环对抗生成网络对组内影像进行风格迁移,降低影像迁移难度并提高迁移的有效性;利用改进的跨域伪标签交叉监督算法进一步提高源域模型对目标域影像的道路提取精度。实验结果表明,该文算法能够更加准确的提取目标域影像中的道路信息,在DeepGlobe数据集上训练的模型在Massachusetts测试集上的交并比达到了56.96%,优于其他几种同类无监督域适应算法。 展开更多
关键词 道路提取 语义分割 无监督域适应
原文传递
基于目标域增强表示的医学图像无监督跨域分割方法 被引量:1
18
作者 刘凯 卢汝诺 +1 位作者 郑潇柔 董守斌 《模式识别与人工智能》 EI CSCD 北大核心 2024年第9期755-769,共15页
不同成像模式设备采集的医学图像存在不同程度的分布差异,无监督域自适应方法为了将源域训练的模型泛化到无标注的目标域,通常是将差异分布最小化,使用源域和目标域的共有特征进行结果预测,但会忽略目标域的私有特征.为了解决该问题,文... 不同成像模式设备采集的医学图像存在不同程度的分布差异,无监督域自适应方法为了将源域训练的模型泛化到无标注的目标域,通常是将差异分布最小化,使用源域和目标域的共有特征进行结果预测,但会忽略目标域的私有特征.为了解决该问题,文中提出基于目标域增强表示的医学图像无监督跨域分割方法(Enhanced Target Domain Representation Based Unsupervised Cross-Domain Medical Image Segmentation,TreUCMIS).首先,通过共有特征学习获取源域和目标域的共有特征,通过图像重构训练目标域特征编码器,提取目标域完整特征.然后,通过目标域的无监督自学习方式,加强深层特征和浅层特征的共有性.最后,对齐使用共有特征和完整特征得到的预测结果,利用目标域的完整特征分割目标,提高模型在目标域的泛化性.在两个具有CT和MRI双向域自适应任务的医学图像分割数据集(腹部、心脏)上的实验表明TreUCMIS的有效性与优越性. 展开更多
关键词 无监督域自适应(UDA) 医学图像 语义分割 对抗学习 一致性正则化
在线阅读 下载PDF
基于预训练模型的单帧航拍图像无监督语义分割 被引量:2
19
作者 任月冬 游新冬 +1 位作者 滕尚志 吕学强 《北京信息科技大学学报(自然科学版)》 2024年第2期21-28,共8页
针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,... 针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,使用对比语言-图像预训练(contrastive language-image pretraining, CLIP)模型生成航拍图像的粗粒度语义标签,然后进行网络的预热训练。其次,在第一阶段的基础上,采用分割一切模型(segment anything model, SAM)对航拍图像进行细粒度类别预测,生成精细化类别掩码伪标签;然后迭代优化网络,得到最终语义分割结果。实验结果显示,相较于现有无监督语义分割方法,算法显著提高了航拍图像的分割精度,同时提供了准确的语义信息。 展开更多
关键词 预训练模型 航拍图像 语义分割 无监督算法 聚类效果估计 深度学习
在线阅读 下载PDF
深度指导的无监督领域自适应语义分割 被引量:3
20
作者 卢加文 史金龙 +2 位作者 诸皓伟 孙蕴瀚 成志刚 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第1期133-141,共9页
为了提高语义分割精度,解决模型在不同数据域上泛化性差的问题,提出基于深度信息的无监督领域自适应语义分割方法.首先,深度感知自适应框架通过捕捉深度信息和语义信息的内在联系,减小不同域之间的差异;然后,设计了一个轻量级深度估计... 为了提高语义分割精度,解决模型在不同数据域上泛化性差的问题,提出基于深度信息的无监督领域自适应语义分割方法.首先,深度感知自适应框架通过捕捉深度信息和语义信息的内在联系,减小不同域之间的差异;然后,设计了一个轻量级深度估计网络来提供深度信息,通过跨任务交互策略融合深度和语义信息,并在深度感知空间对齐源域和目标域的分布差距;最后,提出基于深度信息的域内自适应策略弥合目标域内部的分布差异,将目标域分为子源域和子目标域,并缩小子源域和子目标域分布差距.实验结果表明,所提方法在SYNTHIA-2-Cityscapes和SYNTHIA-2-Mapillary跨域任务上的平均交并比分别为46.7%和73.3%,与同类方法相比,该方法在语义分割和深度估计精度上均有显著提升. 展开更多
关键词 无监督领域自适应 语义分割 多任务学习 深度估计
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部