期刊文献+
共找到707篇文章
< 1 2 36 >
每页显示 20 50 100
CoLM^(2)S:Contrastive self‐supervised learning on attributed multiplex graph network with multi‐scale information
1
作者 Beibei Han Yingmei Wei +1 位作者 Qingyong Wang Shanshan Wan 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第4期1464-1479,共16页
Contrastive self‐supervised representation learning on attributed graph networks with Graph Neural Networks has attracted considerable research interest recently.However,there are still two challenges.First,most of t... Contrastive self‐supervised representation learning on attributed graph networks with Graph Neural Networks has attracted considerable research interest recently.However,there are still two challenges.First,most of the real‐word system are multiple relations,where entities are linked by different types of relations,and each relation is a view of the graph network.Second,the rich multi‐scale information(structure‐level and feature‐level)of the graph network can be seen as self‐supervised signals,which are not fully exploited.A novel contrastive self‐supervised representation learning framework on attributed multiplex graph networks with multi‐scale(named CoLM^(2)S)information is presented in this study.It mainly contains two components:intra‐relation contrast learning and interrelation contrastive learning.Specifically,the contrastive self‐supervised representation learning framework on attributed single‐layer graph networks with multi‐scale information(CoLMS)framework with the graph convolutional network as encoder to capture the intra‐relation information with multi‐scale structure‐level and feature‐level selfsupervised signals is introduced first.The structure‐level information includes the edge structure and sub‐graph structure,and the feature‐level information represents the output of different graph convolutional layer.Second,according to the consensus assumption among inter‐relations,the CoLM^(2)S framework is proposed to jointly learn various graph relations in attributed multiplex graph network to achieve global consensus node embedding.The proposed method can fully distil the graph information.Extensive experiments on unsupervised node clustering and graph visualisation tasks demonstrate the effectiveness of our methods,and it outperforms existing competitive baselines. 展开更多
关键词 attributed multiplex graph network contrastive selfsupervised learning graph representation learning multiscale information
在线阅读 下载PDF
Self-supervised denoising for enhanced volumetric reconstruction and signal interpretation in two-photon microscopy
2
作者 JIE LI LIANGPENG WEI XIN ZHAO 《Photonics Research》 2025年第8期2418-2431,共14页
Volumetric imaging is increasingly in demand for its precision in statistically visualizing and analyzing the intricacies of biological phenomena.To visualize the intricate details of these minute structures and facil... Volumetric imaging is increasingly in demand for its precision in statistically visualizing and analyzing the intricacies of biological phenomena.To visualize the intricate details of these minute structures and facilitate the analysis in biomedical research,high-signal-to-noise ratio(SNR)images are indispensable.However,the inevitable noise presents a significant barrier to imaging qualities.Here,we propose SelfMirror,a self-supervised deep-learning denoising method for volumetric image reconstruction.SelfMirror is developed based on the insight that the variation of biological structure is continuous and smooth;when the sampling interval in volumetric imaging is sufficiently small,the similarity of neighboring slices in terms of the spatial structure becomes apparent.Such similarity can be used to train our proposed network to revive the signals and suppress the noise accurately.The denoising performance of SelfMirror exhibits remarkable robustness and fidelity even in extremely low-SNR conditions.We demonstrate the broad applicability of SelfMirror on multiple imaging modalities,including two-photon microscopy,confocal microscopy,expansion microscopy,computed tomography,and 3D electron microscopy.This versatility extends from single neuron cells to tissues and organs,highlighting SelfMirror's potential for integration into diverse imaging and analysis pipelines. 展开更多
关键词 biomedical researchhigh signal noise statistically visualizing DENOISING volumetric reconstruction volumetric imaging analyzing intricacies biological phenomenato volumetric image reconstructionselfmi self supervised learning
原文传递
从地理信息系统到地理智能体 被引量:6
3
作者 罗斌 刘文豪 +3 位作者 吴进 韩嘉福 吴文周 李洪省 《地球信息科学学报》 北大核心 2025年第1期83-99,共17页
【目的】地理系统是涵盖地球表层自然与人文现象及其相互关系的综合系统,而现有地理信息系统(GIS)虽能数字化处理这些地理要素,但其局限性在于缺乏物理与信息空间的双向交互,并且其模型通常依赖于预设规则和历史数据,难以应对快速变化... 【目的】地理系统是涵盖地球表层自然与人文现象及其相互关系的综合系统,而现有地理信息系统(GIS)虽能数字化处理这些地理要素,但其局限性在于缺乏物理与信息空间的双向交互,并且其模型通常依赖于预设规则和历史数据,难以应对快速变化和三维结构复杂的地理情境。为此,本文提出了“地理智能体”,作为地理信息系统的进阶形式,融合了具身智能、自监督学习和多模态语言模型,旨在提升环境感知、空间理解和自主决策能力。【方法】本文设计的地理智能体架构包含多模态感知、智能中枢和行动操控模块,分别通过传感器网络获取全方位环境信息、利用知识图谱和生成模型进行复杂情境推理,并最终实现对物理环境的实时调控和多层次规划。此外,地理智能体将通过地球模拟器和试验场平台测试,以适应虚拟和真实环境的差异,从而在复杂、动态地理情境中具备更强的自主应对能力。【结果】本文以虚拟数字人“地球通”为例,初步展示地理智能体在空间智能化应用中的具体实现。【结论】“地球通”作为地理智能体的原型机,集成了时空知识图谱(GeoKG)和认知地图生成大模型(GeoGPT)等模块,能够辅助用户在应急管理、城市规划和生态监测等领域中快速获取智能化的空间决策支持,充分体现了地理信息系统从信息处理工具向自主空间智能体的发展演化。 展开更多
关键词 智能地理系统 地理智能体 具身智能 自监督学习 多模态感知 知识图谱 大模型 空间智能
原文传递
自监督的两阶段广义小样本目标检测算法 被引量:1
4
作者 段立娟 张子晨 张广勇 《信号处理》 北大核心 2025年第2期370-381,共12页
深度学习技术在目标检测领域取得了巨大进展,但其优异的性能建立在大量精确标注的数据集之上。在样本稀缺的特定领域,如国防海上安全和医学等领域,获取具有标注的数据尤为困难。因此,小样本目标检测领域因其能够应对样本稀疏性所带来的... 深度学习技术在目标检测领域取得了巨大进展,但其优异的性能建立在大量精确标注的数据集之上。在样本稀缺的特定领域,如国防海上安全和医学等领域,获取具有标注的数据尤为困难。因此,小样本目标检测领域因其能够应对样本稀疏性所带来的挑战而得到学术界的广泛研究。该领域的研究目标是得到能够从极其有限的样本中提取知识并实现高效目标检测的算法框架。然而,由于新类样本的稀缺性,其与基类之间存在着显著的分布差异,导致了小样本目标检测任务的准确度受限。此外,在对模型应用新类进行微调的过程中,由于新类与基类的不重叠性,模型学习新类的特征知识的过程中会存在大量的梯度更新,导致基类的特征知识被遗忘的问题,从而降低模型的整体性能。针对新类别样本稀缺的问题,本研究采用自监督学习策略。自监督学习,无须依赖标注信息,便于构建代理任务以进行模型训练,是缓解小样本目标检测样本稀缺问题的有效方案。为了避免模型在学习新类特征知识后出现基类灾难性遗忘的问题,本文将自监督学习与两阶段的目标检测器相结合。通过在类别域应用潜在特征来表示各个类别的特征信息,通过动态更新策略在学习新类别的过程中进一步优化特征,并借助检测框域构建良好的代理任务提升回归框的精准度。本研究在PASCAL VOC数据集和MS COCO数据集上进行大量的实验验证,实验结果表明,无论是在新类性能方面还是总体性能方面,本研究所提出的方法相较于其他多个小样本目标检测模型均展现出更加优越的性能表现。 展开更多
关键词 深度学习 自监督学习 小样本目标检测 广义小样本目标检测
在线阅读 下载PDF
基于个性化数据增强的自监督序列推荐算法 被引量:1
5
作者 王帅 史艳翠 《计算机工程》 北大核心 2025年第8期190-202,共13页
序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题... 序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题,提出融合用户偏好的个性化数据增强方法,通过用户评分引导增强过程,同时对长、短序列使用不同的增强方法组合,生成符合用户偏好的增强序列;其次,为了缓解训练中出现的数据特征学习不平衡问题,设计一种混合增强训练法,在训练前期,通过随机选择增强方法生成增强序列,提高模型的性能和泛化能力,在训练后期,选择与原始序列相似度较高的增强序列,使模型全面学习用户的实际偏好和行为模式;最后,将传统的序列预测目标与SSL目标相结合,推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证,结果表明,相较于基线模型中的最优结果,所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%,NDCG@5指标分别提升了11.40%、3.50%和2.16%,上述实验结果验证了该方法的合理性和有效性。 展开更多
关键词 序列推荐 自监督学习 数据增强 推荐系统 数据特征
在线阅读 下载PDF
基于自适应结构增强的对比协同多视图属性图聚类
6
作者 王静红 陈潇 +3 位作者 王熙照 王旭 杨宏博 王威 《模式识别与人工智能》 北大核心 2025年第9期809-819,共11页
目前多数聚类方法主要关注单视图数据,对于多视图聚类的研究相对不足,而现有的多视图聚类方法往往侧重于视图间的信息学习,忽略视图内信息的充分挖掘.对此,文中提出基于自适应结构增强的对比协同多视图属性图聚类(Contrastive Collabora... 目前多数聚类方法主要关注单视图数据,对于多视图聚类的研究相对不足,而现有的多视图聚类方法往往侧重于视图间的信息学习,忽略视图内信息的充分挖掘.对此,文中提出基于自适应结构增强的对比协同多视图属性图聚类(Contrastive Collaborative Multi-view Attribute Graph Clustering Based on Adaptive Structure Enhancement,ACCMVC).首先,设计自适应结构增强策略,结合节点重要性和节点特征复杂关系生成边权重,用于生成视图的新邻接矩阵,进而生成结构增强图.然后,将边权重引入邻域对比学习,对视图及其结构增强图使用视图内加强邻域对比学习,在多个视图间使用视图间加强邻域对比学习.最后,考虑到多视图中视图的重要性存在差别,引入注意力机制,计算每个视图的权重并进行融合.在数据集上的实验表明,ACCMVC的聚类性能较优. 展开更多
关键词 多视图学习 属性图聚类 图表示学习 对比学习 自监督聚类
在线阅读 下载PDF
基于双流孪生对比网络的脑电情绪识别
7
作者 马玉良 谢昀臻 +2 位作者 孟明 高云园 佘青山 《中国生物医学工程学报》 北大核心 2025年第4期385-392,共8页
近年来基于脑电信号的情绪识别研究取得了显著的进展,然而标签的标注需要大量的人力,实际应用中难以快速获取大量带标签的数据。高效利用有限的标签进行情绪识别研究逐渐成为了一个新的应用瓶颈。为了解决这个问题,本研究提出了一种基... 近年来基于脑电信号的情绪识别研究取得了显著的进展,然而标签的标注需要大量的人力,实际应用中难以快速获取大量带标签的数据。高效利用有限的标签进行情绪识别研究逐渐成为了一个新的应用瓶颈。为了解决这个问题,本研究提出了一种基于双流孪生网络的模型架构,由两个相互作用、相互学习的卷积神经网络分支组成。首先,将模型进行预训练,将输入信号的扩增视图分别输入到孪生网络的两个分支,在分别经过分支中的卷积模块和全连接模块提取特征后进行对比学习,使模型在过程中学习到脑电信号的通用表征;然后,保留训练分支的编码器部分,对模型进行微调,得到分类结果。使用公开数据集SEED和SEED-IV中的数据样本进行模型分类效果的验证评估,在全标签数据下,分别实现了93.92%和89.71%的分类准确率。在50%的标签使用率下,实现了三分类92.68%的平均准确率,比使用全部标签只减少了1.24%准确率。所提出的模型能够有效提取脑电数据的通用表征,并在使用少量标签的情况下达到较高的识别准确率。 展开更多
关键词 情绪识别 自监督学习 脑机接口 双流网络
暂未订购
面向时间序列预测任务的异构联邦语义通信
8
作者 邢焕来 赵博文 +3 位作者 宋富洪 徐乐西 类先富 冯力 《计算机学报》 北大核心 2025年第9期2207-2225,共19页
时间序列数据广泛存在于工业、医疗、交通等诸多物联网相关领域,蕴含着用户行为模式、系统运行状态、未来发展趋势等重要信息。传统的数据处理方法通常将终端设备采集的时间序列数据完整传输至数据中心,并通过集中分析实现智能决策。然... 时间序列数据广泛存在于工业、医疗、交通等诸多物联网相关领域,蕴含着用户行为模式、系统运行状态、未来发展趋势等重要信息。传统的数据处理方法通常将终端设备采集的时间序列数据完整传输至数据中心,并通过集中分析实现智能决策。然而,随着时序数据的不断增多,海量数据传输将为传统通信网络带来巨大带宽压力,难以满足智能制造、智慧交通等场景的低时延、高可靠性等需求。为此,本文构建面向时序预测任务的异构联邦语义通信系统,通过提取并传输任务相关语义信息,提高时序数据传输效率。针对时序数据语义信息难以提取的问题,本文提出一种面向资源受限设备的多头混合线性注意力语义编解码算法,实现对全局-局部时序依赖关系的轻量化建模。针对异构设备间计算能力和数据分布差异导致的知识稀缺问题,本文提出一种联邦嵌入(Federated Embedding,FedEmb)算法,通过在系统内引入通用知识,促进异构编码模型高效训练和联合推理,提高语义通信系统的泛化性和鲁棒性。为进一步提高语义通信系统任务性能,本文提出基于自监督学习的二阶段预训练方案,通过依次对时序语义编码器、信道编码器进行生成式预训练,并对整个系统进行联合训练,充分挖掘传输数据中的任务相关语义信息。通过在五个真实世界时间序列数据集上开展仿真实验,结果表明,FedEmb在面向时序预测任务的语义通信系统中相比四种异构联邦学习算法具有更好的知识共享效率和更低的均方误差。此外,与六种前沿的通信系统相比,本文提出的联邦嵌入语义通信(Federated Embedding based Semantic Communication,SC-FedEmb)系统具有鲁棒且高效的时序数据传输能力和最高的预测准确度,能够有效满足异构物联网环境中的实时预测需求。 展开更多
关键词 语义通信 时间序列预测 异构联邦学习 注意力机制 自监督学习
在线阅读 下载PDF
自监督流形结构的第一视角视频时序分割算法
9
作者 张明明 闫小强 +2 位作者 孙中川 胡世哲 叶阳东 《计算机学报》 北大核心 2025年第2期266-283,共18页
随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难... 随着可穿戴设备和智能存储技术的普及,第一视角视频的使用量高速增长。将这类视频划分成独立的视频片段以提取关键的内容信息,成为了视频理解领域的重要研究方向。这类视频数据规模大、维度高、内容多样,基于欧氏空间的特征学习方法难以有效地处理复杂高维的视频数据。现有时序分割算法在处理第一视角长视频时,很难应对因手部遮挡和运动模糊而导致的帧信息丢失问题。针对上述问题,本文提出了一种自监督流形结构的第一视角视频时序分割算法(Self-Supervised Manifold Structure,SSMS)。受高维视频数据在低维流形空间中具有相似语义聚集现象的启发,该算法将包含时序信息的帧特征进行低维嵌入,使得语义相似的帧特征映射到流形空间中相近位置。首先,本文提出了一种改进的局部流形结构特征学习策略,提取帧数据的局部流形结构。其次,SSMS算法构建了动态时序网络,基于最大相似关系来获得具有不变性的特征表示。然后,将帧数据的流形结构特征作为监督信号进行自监督学习。经过不断迭代优化,得到低维高质量的帧数据特征。最后,通过聚类过程实现第一视角视频的无监督时序分割,避免了标注数据的限制和成本。相比于现有的无监督时序分割算法,本文方法在五个第一视角数据集上平均提高了3.37%的准确度。 展开更多
关键词 第一视角视频 流形结构 自监督学习 时序分割 特征表示
在线阅读 下载PDF
面向实景三维的点云跨模态对比掩码自编码预训练方法
10
作者 王庆栋 王腾飞 张力 《测绘学报》 北大核心 2025年第4期675-687,共13页
现有单模态预训练模型仍然易受点云无序性和稀疏性的影响,难以满足实景三维建设中多种下游任务需求。为了进一步提升预训练模型性能,本文基于多模态、对比学习和掩码自编码等理论,提出一种利用二维图像模态辅助三维点云模态的跨模态对... 现有单模态预训练模型仍然易受点云无序性和稀疏性的影响,难以满足实景三维建设中多种下游任务需求。为了进一步提升预训练模型性能,本文基于多模态、对比学习和掩码自编码等理论,提出一种利用二维图像模态辅助三维点云模态的跨模态对比掩码自编码学习方法。该方法由模态内自监督分支和2D/3D跨模态自监督分支两部分组成。对于模态内分支,本文提出一种融合掩码自编码和对比学习的自监督学习方法,以学习更全面的特征信息。对于跨模态分支,本文提出了一种基于2D/3D跨模态对比学习方法,将二维图像模态信息融入三维点云模态中,从而提升模型对点云稀疏性和无序性的稳健性。为验证本文方法的有效性,本文在ShapeNet、ModelNet40、ScanObjectNN等数据集上进行了点云重建、分类、少样本分类和分割等多项下游任务的测试。结果表明,本文方法相较于现有方法展现出更好的迁移性。 展开更多
关键词 点云 自监督学习 掩码自编码 对比学习 预训练 实景三维
在线阅读 下载PDF
基于不同学习范式的深度图聚类方法综述
11
作者 周丽娟 吴梦琪 +1 位作者 李欣冉 牛常勇 《模式识别与人工智能》 北大核心 2025年第3期233-251,共19页
图聚类方法旨在使用无监督方式将图节点划分到不同类别中,用于发现复杂系统中的隐藏模式、社区结构和组织关系.现有方法通过不同的学习范式构建自监督模式,指导图表示学习并实现聚类,因此学习范式是图聚类方法的关键,但现有综述少有从... 图聚类方法旨在使用无监督方式将图节点划分到不同类别中,用于发现复杂系统中的隐藏模式、社区结构和组织关系.现有方法通过不同的学习范式构建自监督模式,指导图表示学习并实现聚类,因此学习范式是图聚类方法的关键,但现有综述少有从学习范式的角度讨论图聚类方法.因此,文中基于不同学习范式总结图聚类方法的研究进展,将图聚类方法分类为重构式图聚类、对比式图聚类、对抗式图聚类和混合式图聚类.基于研究范围和聚类效果,重点探讨重构式图聚类和对比式图聚类.在单关系数据集和多关系数据集上的聚类结果表明,对比式图聚类在单关系数据集上表现较优,而重构式图聚类在多关系数据集上表现较优.最后,总结图聚类领域面临的挑战,展望未来的研究方向,并介绍深度图聚类方法在各个领域的应用. 展开更多
关键词 图聚类 自监督训练 图神经网络 图对比学习 图重构学习
在线阅读 下载PDF
基于多尺度掩码自编码的自监督点云场景流估计
12
作者 项学智 王茜 +2 位作者 王路 贲晛烨 乔玉龙 《实验技术与管理》 北大核心 2025年第9期27-33,共7页
点云场景流在自动驾驶领域发挥着重要的作用,但点云数据具有无序性和密度分布不均匀等特性,以及在真实场景中可能受遮挡影响,导致其估计的准确性难以得到提升。针对这些问题,该文提出了一种基于多尺度掩码学习的场景流估计方法,将输入... 点云场景流在自动驾驶领域发挥着重要的作用,但点云数据具有无序性和密度分布不均匀等特性,以及在真实场景中可能受遮挡影响,导致其估计的准确性难以得到提升。针对这些问题,该文提出了一种基于多尺度掩码学习的场景流估计方法,将输入点云划分为不规则点块并嵌入随机掩码和标记,通过不对称的编码器-解码器架构对点云的空间几何进行建模。在编码阶段,该文建立的模型从未掩码的点云中学习高级潜在特征;在解码阶段,利用学习到的潜在特征及掩码标记来重建原始点云。此外,该文所提方法还采用多尺度掩码策略来确保提取不同尺度特征的过程中可见区域的一致性。在FlyingThings3D和KITTI数据集上的实验结果表明,该文所提方法与基线网络相比在所有评价指标上均取得了显著提升,并且采用自监督的方式,性能优于当前主流的全监督和自监督方法。 展开更多
关键词 点云 场景流 掩码自编码 特征金字塔 自监督学习
在线阅读 下载PDF
基于单图像双支联合映射的轻量级去雾网络
13
作者 蓝章礼 唐若瀚 +2 位作者 范亮 徐元通 张洪 《激光杂志》 北大核心 2025年第4期171-179,共9页
针对部分场景需要对图像快速去雾的需求,提出一种联合全局和局部关系的单图像双支联合映射范式及相应的轻量级去雾网络,以提升去雾速度并改善图像质量。采用密集残差块结构(Residual double block,RDB)在多尺度的特征图之间进行跳跃连... 针对部分场景需要对图像快速去雾的需求,提出一种联合全局和局部关系的单图像双支联合映射范式及相应的轻量级去雾网络,以提升去雾速度并改善图像质量。采用密集残差块结构(Residual double block,RDB)在多尺度的特征图之间进行跳跃连接融合特征,设计动态选择范围的大核选择注意力机制(Large select keys,LSK)获取其中有用的空间先验知识,并与各分支尾部的高级语义信息拼接获得高分辨率特征图。同时,将网络中普通卷积替换为深度可分离卷积(Depthwise separable convolution,Dep)以减少模型计算开销。训练得到有雾和无雾图像之间全局和局部的关系映射后,联合两部分映射信息进行无雾图像重构。所提出的方法在公开的室内和室外基准数据集上结构相似度分别为0.913和0.917,参数量约为1.7 M,在吞吐量为502 images/sec的服务器中图像推理速度约为2 ms,对比相近去雾效果的模型,本方法提升了更好轻量级别。 展开更多
关键词 双支去雾范式 单图像去雾 自监督对比学习 轻量级 大核选择注意力
原文传递
自监督短期兴趣特征增强的短视频推荐方法研究
14
作者 刘芳 王晓晖 +3 位作者 田枫 赵玲 黄美晨 孙嘉伟 《重庆理工大学学报(自然科学)》 北大核心 2025年第6期91-99,共9页
现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term in... 现有短视频推荐方法存在用户短期兴趣表示和短期兴趣代理提取不完全,导致长短期兴趣解纠缠不充分的问题。提出了一种自监督短期兴趣特征增强的短视频推荐模型(short video recommendation model based on self-supervised short-term interest feature enhancement,SSER)。该模型采用自监督的对比学习方法对用户长短期兴趣进行解纠缠,针对短期兴趣表示提取不完全的问题,提出采用扩展循环神经网络(dilated RNN)从非线性的用户交互序列中有效捕捉用户短期兴趣表示;针对短期兴趣代理提取不完全的问题,提出一种多头自注意力机制的短期兴趣代理增强方式,该方式首先使用自注意力机制对短期交互序列嵌入数据进行噪声消除,随后融合从用户序列中提取的短期兴趣普遍特征和突出特征形成融合向量,采用多头自注意力机制从融合向量中提取短期兴趣代理,从而有效增强短期兴趣代理的提取。在KuaiRec短视频数据集上进行了多项实验,结果表明该模型在多个评价指标上优于其他主流方法。 展开更多
关键词 自监督对比学习 短期兴趣特征增强 短视频推荐 扩展循环神经网络 多头自注意力机制
在线阅读 下载PDF
基于改进自训练的半监督学习算法研究
15
作者 姚明海 赵彦涛 +1 位作者 项圣 顾勤龙 《高技术通讯》 北大核心 2025年第3期330-338,共9页
本文针对半监督方法中存在的标注及未标注数据利用率不高、训练时间长等问题,提出了一种基于改进自训练的半监督语义分割方法。首先,针对网络训练时间成本较高的问题,提出一个稳定教师网络选取策略,可以根据网络训练中稳定性自动选择网... 本文针对半监督方法中存在的标注及未标注数据利用率不高、训练时间长等问题,提出了一种基于改进自训练的半监督语义分割方法。首先,针对网络训练时间成本较高的问题,提出一个稳定教师网络选取策略,可以根据网络训练中稳定性自动选择网络训练的停止时间,有效提高训练效率;其次,对未标注数据采取多重随机数据增强方法,扩充数据集,有效防止训练过程中过拟合现象;最后,对网络生成的伪标签采取筛选策略,为重训练阶段筛选高质量伪标签,提高模型的分割效果。实验对比结果表明,使用本方法在Pascal VOC 2012 SBD数据集上进行验证时,在比例分别为1/16、1/8、1/4的有标注数据集下相应的平均交并比(mean intersection over union,mIOU)达到了72.7%、74.3%、75.4%,而且在保证分割精度的情况下,网络训练效率提升了近30.0%。 展开更多
关键词 半监督学习 自训练 伪标签筛选 稳定教师网络
在线阅读 下载PDF
自步学习指导下的半监督目标检测框架
16
作者 谢斌红 剌颖坤 +1 位作者 张英俊 张睿 《计算机应用》 北大核心 2025年第8期2546-2554,共9页
为了提高伪标签质量并解决半监督目标检测(SSOD)中的确认偏差问题,提出一种基于动态参数的自步学习(SPL)指导下的SSOD框架。在该框架中设计动态自步参数和连续权重变量,以优化SSOD的效果。具体地,动态自步参数根据模型在训练过程中的实... 为了提高伪标签质量并解决半监督目标检测(SSOD)中的确认偏差问题,提出一种基于动态参数的自步学习(SPL)指导下的SSOD框架。在该框架中设计动态自步参数和连续权重变量,以优化SSOD的效果。具体地,动态自步参数根据模型在训练过程中的实时表现评估样本的难易程度,而连续权重变量则通过比较样本损失与动态自步参数的关系精确评估每个样本在训练中的重要性和可靠性,并对样本中的每个物体都进行精细化权重设计。此外,该框架采用单一模型迭代训练,并引入一致性正则化策略评估模型预测的一致性。这种设计不仅能为模型提供更有针对性的权重信息,还可使模型通过权重信息的动态调整自适应地优化训练过程。在PASCAL VOC和MS-COCO数据集上的广泛对比实验结果不仅显示所提框架显著提升了模型的检测精度,还验证了所提框架良好的通用性和高效的收敛性能。特别在PASCAL VOC数据集上,所提框架相较于LabelMatch、Unbiased Teacher V2和MixTeacher在检测精度上分别提升了0.65、4.84和0.28个百分点。 展开更多
关键词 半监督目标检测 自步学习 一致性正则化 动态自步参数 连续权重变量
在线阅读 下载PDF
分割图像辅助的自监督医学图像配准
17
作者 李宗民 王群 +1 位作者 李泫廷 杨超智 《计算机工程与设计》 北大核心 2025年第3期857-863,共7页
为解决可形变医学图像配准工作更关注于像素/体素层级的配准,忽略了扫描图像中的结构信息的问题,采用多结构特征提取模块(multi-structure feature extraction,MSFE)。以形变图像的分割图像和固定图像的分割图像作为输入,提取结构信息... 为解决可形变医学图像配准工作更关注于像素/体素层级的配准,忽略了扫描图像中的结构信息的问题,采用多结构特征提取模块(multi-structure feature extraction,MSFE)。以形变图像的分割图像和固定图像的分割图像作为输入,提取结构信息并反馈给配准神经网络。在此基础上,在配准任务常用的损失函数中加入与MSFE模块搭配的损失函数与分割任务中常用的损失函数以辅助配准。所提方法只参与配准网络的训练阶段,不参与测试阶段,不会增加实际配准时所需的时间。在OASIS Sample Data数据集上的实验验证了方法的有效性。 展开更多
关键词 深度学习 自监督 单模态 可形变配准 医学图像 医学图像配准 分割图像
在线阅读 下载PDF
基于Transformer的乳腺组织病理图像自监督分类方法
18
作者 丁维龙 刘津龙 朱峰龙 《计算机辅助设计与图形学学报》 北大核心 2025年第8期1346-1358,共13页
基于自监督学习的乳腺组织病理图像分类可以辅助病理医生对乳腺癌患者进行筛查.当前的自监督学习方法通过构造辅助任务学习图像的特征表示,但这种方式提取到的特征偏向于解决辅助任务,难以挖掘病理图像自身的特征信息,影响模型在下游任... 基于自监督学习的乳腺组织病理图像分类可以辅助病理医生对乳腺癌患者进行筛查.当前的自监督学习方法通过构造辅助任务学习图像的特征表示,但这种方式提取到的特征偏向于解决辅助任务,难以挖掘病理图像自身的特征信息,影响模型在下游任务中的性能表现.为此,提出一种基于Transformer的乳腺组织病理图像自监督分类方法.首先借助卷积神经网络和视觉Transformer,对病理图像的局部和全局信息的感知能力设计DenseSwinNet特征提取网络;然后构建一种基于聚类和自注意力的多示例学习分类器CSA-MIL,用于将乳腺组织病理图像的局部和全局特征进行聚合,预测其是否发生癌变.在面向乳腺组织病理图像分类任务的公开数据集Camelyon16上的实验结果表明,所提方法的准确率、F_(1)-Score和AUC分别达到0.9016,0.857和0.9247,证明该方法可有效地提升分类性能;此外,通过对模型关注区域进行可视化分析,证明了模型具有良好的可解释性. 展开更多
关键词 对比学习 自监督学习 组织病理图像
在线阅读 下载PDF
对偶结构下的多标签半监督课程学习
19
作者 谢晓兰 谭舒孺 王楠 《科学技术与工程》 北大核心 2025年第5期1980-1987,共8页
多标签学习是现实应用场景中的一个常见问题。大规模多标签数据集的构建往往意味着高昂的成本,因此出现了半监督学习技术。目前,大多数半监督学习主要用于单标签分类领域,尽管半监督学习在多标签分类领域取得了一些进展,但在训练时间消... 多标签学习是现实应用场景中的一个常见问题。大规模多标签数据集的构建往往意味着高昂的成本,因此出现了半监督学习技术。目前,大多数半监督学习主要用于单标签分类领域,尽管半监督学习在多标签分类领域取得了一些进展,但在训练时间消耗、训练效果和标签之间潜在关系的利用方面仍有很大的改进空间。针对上述问题,提出了一种二元结构下的多标签半监督课程学习模式(semi-supervised course learning under dual structure,SSCD)。首先,设计了一种基于对偶差分的课程学习方案,大大减少了训练时间,提高了模型的稳健性;其次,设计了一个单一注意力机制来探索标签之间的潜在相关性。在3个开放测试数据集上评估了SSCD在预测任务中的性能,并与4个基准模型进行了比较,结果表明SSCD的综合指标在各个方面都是最优的;最后,通过结构消融实验验证了所提出的单注意力机制的有效性。 展开更多
关键词 多标签学习 半监督学习 自注意力机制 课程学习
在线阅读 下载PDF
视觉智能发展综述
20
作者 魏云超 任中伟 方岩 《北京交通大学学报》 北大核心 2025年第5期66-81,共16页
视觉智能作为人工智能的核心分支,旨在赋予机器类人视觉的理解与交互能力.本文首先系统性地梳理了自2012年深度学习在计算机视觉领域取得重大突破以来,现代视觉智能所经历的4个环环相扣、层层递进的演进阶段:第一阶段,以AlexNet、VGGNet... 视觉智能作为人工智能的核心分支,旨在赋予机器类人视觉的理解与交互能力.本文首先系统性地梳理了自2012年深度学习在计算机视觉领域取得重大突破以来,现代视觉智能所经历的4个环环相扣、层层递进的演进阶段:第一阶段,以AlexNet、VGGNet、ResNet为代表的监督学习范式,在ImageNet规模标注数据集的驱动下,神经网络于封闭域特定任务(如图像分类、目标检测)上取得了突破性进展,但其对标注数据的严重依赖催生了后续变革;第二阶段,以MoCo、DINO、MAE等模型代表的自监督学习兴起,通过对比、蒸馏、掩码重构等方法,从海量无标签数据中学习到了强大的通用视觉表征;第三阶段,基于强大的视觉基础,视觉智能与自然语言处理深度融合,以CLIP、GPT-4V为代表的多模态模型实现了从“识别”到“理解”的飞跃,能够处理开放词汇的视觉概念,并向像素级、意图导向的精细化推理演进;第四阶段,即当前的前沿领域——世界模型,其目标不再局限于理解与描述,而是构建能够模拟、预测物理世界的内部生成模型(如Sora),为实现与真实世界交互的具身智能奠定基础.预测物理世界的内部生成模型(如Sora),为实现与真实世界交互的具身智能奠定基础.这一从对世界的判别式理解到生成式模拟的深刻转变,标志着一个新的领域共识正在形成:生成式建模正成为新的深度学习.然后遵循此发展脉络,深入剖析各阶段核心思想、关键模型与技术范式,揭示其内在的演进逻辑.最后深入探讨视觉智能面临的鲁棒性、推理能力、泛化性等挑战. 展开更多
关键词 视觉智能 深度学习 自监督学习 多模态AI 世界模型
在线阅读 下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部