期刊文献+
共找到248篇文章
< 1 2 13 >
每页显示 20 50 100
基于反向投影的zero-shot learning目标分类算法研究 被引量:1
1
作者 冯鹏 庹红娅 +2 位作者 乔凌峰 王洁欣 敬忠良 《计算机应用研究》 CSCD 北大核心 2017年第11期3291-3294,共4页
Zero-shot learning(ZSL)是针对没有训练样本的类别进行分类的问题。传统回归方法的核心是将视觉特征投影到语义空间,没有充分利用视觉特征自身包含的样本信息,同时训练计算量大。提出基于反向投影的ZSL目标分类方法,将类别原型投影到... Zero-shot learning(ZSL)是针对没有训练样本的类别进行分类的问题。传统回归方法的核心是将视觉特征投影到语义空间,没有充分利用视觉特征自身包含的样本信息,同时训练计算量大。提出基于反向投影的ZSL目标分类方法,将类别原型投影到视觉空间,利用视觉特征的语义性学习出映射函数,参数优化过程仅通过解析解就可以获得。在两个基准数据集的实验结果表明,提出的反向投影方法分类结果较传统回归方法和其他现有方法有大幅提升,并且训练时间大大减少,可以更好地推广到未知类别的分类问题上。 展开更多
关键词 zero-shot LEARNING 目标分类 反向投影 解析解
在线阅读 下载PDF
Zero-shot Fine-grained Classification by Deep Feature Learning with Semantics 被引量:8
2
作者 Ao-Xue Li Ke-Xin Zhang Li-Wei Wang 《International Journal of Automation and computing》 EI CSCD 2019年第5期563-574,共12页
Fine-grained image classification, which aims to distinguish images with subtle distinctions, is a challenging task for two main reasons: lack of sufficient training data for every class and difficulty in learning dis... Fine-grained image classification, which aims to distinguish images with subtle distinctions, is a challenging task for two main reasons: lack of sufficient training data for every class and difficulty in learning discriminative features for representation. In this paper, to address the two issues, we propose a two-phase framework for recognizing images from unseen fine-grained classes, i.e., zeroshot fine-grained classification. In the first feature learning phase, we finetune deep convolutional neural networks using hierarchical semantic structure among fine-grained classes to extract discriminative deep visual features. Meanwhile, a domain adaptation structure is induced into deep convolutional neural networks to avoid domain shift from training data to test data. In the second label inference phase, a semantic directed graph is constructed over attributes of fine-grained classes. Based on this graph, we develop a label propagation algorithm to infer the labels of images in the unseen classes. Experimental results on two benchmark datasets demonstrate that our model outperforms the state-of-the-art zero-shot learning models. In addition, the features obtained by our feature learning model also yield significant gains when they are used by other zero-shot learning models, which shows the flexility of our model in zero-shot finegrained classification. 展开更多
关键词 FINE-GRAINED image CLASSIFICATION zero-shot LEARNING DEEP FEATURE LEARNING domain adaptation semantic graph
原文传递
Explanatory Multi-Scale Adversarial Semantic Embedding Space Learning for Zero-Shot Recognition
3
作者 Huiting Li 《Open Journal of Applied Sciences》 2022年第3期317-335,共19页
The goal of zero-shot recognition is to classify classes it has never seen before, which needs to build a bridge between seen and unseen classes through semantic embedding space. Therefore, semantic embedding space le... The goal of zero-shot recognition is to classify classes it has never seen before, which needs to build a bridge between seen and unseen classes through semantic embedding space. Therefore, semantic embedding space learning plays an important role in zero-shot recognition. Among existing works, semantic embedding space is mainly taken by user-defined attribute vectors. However, the discriminative information included in the user-defined attribute vector is limited. In this paper, we propose to learn an extra latent attribute space automatically to produce a more generalized and discriminative semantic embedded space. To prevent the bias problem, both user-defined attribute vector and latent attribute space are optimized by adversarial learning with auto-encoders. We also propose to reconstruct semantic patterns produced by explanatory graphs, which can make semantic embedding space more sensitive to usefully semantic information and less sensitive to useless information. The proposed method is evaluated on the AwA2 and CUB dataset. These results show that our proposed method achieves superior performance. 展开更多
关键词 zero-shot Recognition Semantic Embedding Space Adversarial Learning Explanatory Graph
在线阅读 下载PDF
生成式零样本深度学习模型的轴承故障诊断方法
4
作者 刘月文 刘文淼 +2 位作者 李永亭 齐咏生 刘慧文 《中国农机化学报》 北大核心 2026年第1期201-209,共9页
基于深度学习的故障诊断模型需要大量数据进行训练,然而在实际工况中环境恶劣,完备故障数据的获取困难,导致模型训练精度差甚至无法训练。为此,引入生成式零样本学习模型,然而生成式模型也存在一些局限性,如生成的特征质量可能比较差,... 基于深度学习的故障诊断模型需要大量数据进行训练,然而在实际工况中环境恶劣,完备故障数据的获取困难,导致模型训练精度差甚至无法训练。为此,引入生成式零样本学习模型,然而生成式模型也存在一些局限性,如生成的特征质量可能比较差,与真实特征之间存在较大差距,限制模型性能。针对此问题,提出一种结合互补属性和回归模块生成式零样本学习(CARMGZSL)方法并应用于轴承故障诊断。首先采用连续小波变换将一维故障信号转换为时频图,使用CNN提取故障特征;然后设计一种语义属性模块,依据不同故障定义不同语义属性,通过生成对抗模块将可见类故障的语义属性和故障特征进行对抗性训练,生成不可见类故障特征并送入判别器,和真实故障样本特征进行判别;再构造一类回归模块,将生成样本特征通过回归模块重构为语义属性送入生成器,使生成样本特征更加逼真;最后通过相似性度量实现对不可见类故障与生成式不可见类故障的距离判别,完成故障识别。通过凯斯西储大学轴承数据集进行算法验证,结果表明,在零样本情况下,该方法可实现滚动轴承零样本故障诊断,相比于其他经典的零样本诊断算法,所提方法平均准确率达到92.32%,具有更好的诊断性能。 展开更多
关键词 滚动轴承 零样本学习 故障诊断 生成对抗网络 语义特征
在线阅读 下载PDF
面向无人驾驶的零样本记忆感知选择视觉跟踪模型
5
作者 李杰 汪诗敏 +7 位作者 王长城 崔亚峰 汪俊杰 周惟嘉 胡铮 兰海 杜玲 高猛 《浙江大学学报(工学版)》 北大核心 2026年第1期61-70,共10页
为了保证无人驾驶车辆在遇到目标变形、被部分或完全遮挡等情况时仍然具有较高的跟踪准确性,构建零样本视觉跟踪模型.以经典卡尔曼滤波为基础,在掩码预测阶段加入运动建模模块,考虑时间和空间的一致性并结合运动线索,对预测掩码进行循... 为了保证无人驾驶车辆在遇到目标变形、被部分或完全遮挡等情况时仍然具有较高的跟踪准确性,构建零样本视觉跟踪模型.以经典卡尔曼滤波为基础,在掩码预测阶段加入运动建模模块,考虑时间和空间的一致性并结合运动线索,对预测掩码进行循环校正.采用混合评分系统,从预测掩码中选择最优掩码.对于历史最优掩码,设计记忆感知选择模块,创建理想掩码候选库,并结合历史特征和信息线索,动态选择最合适的掩码.在LaSOT、GOT-10k和OTB100数据集上对所提模型与HIPTrack-B384等多个经典视觉跟踪模型的性能进行评估和对比,结果表明,所提模型的ROC曲线下面积(AUC)、精度、平均重叠度、交并比阈值0.50和0.75对应的重叠精度和成功率相比于对比方法中各指标的最优值分别提升了2.87%、2.73%、2.84%、3.18%、5.46%和1.62%,表明算法在多个指标上具有较好的性能. 展开更多
关键词 无人汽车 视觉跟踪 运动建模 混合评分 记忆感知选择 零样本跟踪
在线阅读 下载PDF
基于图像-文本大模型CLIP微调的零样本参考图像分割 被引量:3
6
作者 刘杰 乔文昇 +2 位作者 朱佩佩 雷印杰 王紫轩 《计算机应用研究》 北大核心 2025年第4期1248-1254,共7页
近年来,以CLIP为代表的视觉-语言大模型在众多下游场景中显示出了出色的零样本推理能力,然而将CLIP模型迁移至需要像素水平图-文理解的参考图像分割中非常困难,其根本原因在于CLIP关注图像-文本整体上的对齐情况,却丢弃了图像中像素点... 近年来,以CLIP为代表的视觉-语言大模型在众多下游场景中显示出了出色的零样本推理能力,然而将CLIP模型迁移至需要像素水平图-文理解的参考图像分割中非常困难,其根本原因在于CLIP关注图像-文本整体上的对齐情况,却丢弃了图像中像素点的空间位置信息。鉴于此,以CLIP为基础模型,提出了一种单阶段、细粒度、多层次的零样本参考图像分割模型PixelCLIP。具体地,采取了多尺度的图像特征融合,既聚集CLIP中不同视觉编码器提取的图像像素级特征,同时又考虑CLIP中固有的图像整体语义特征。在文本信息表征上,不但依靠CLIP-BERT来保持物体种类信息,还引入LLaVA大语言模型进一步注入上下文背景知识。最后,PixelCLIP通过细粒度跨模态关联匹配,实现像素水平的参考图像分割。充分的数值分析结果验证了该方法的有效性。 展开更多
关键词 零样本 CLIP 像素级 单阶段 参考图像分割
在线阅读 下载PDF
基于多模态融合Transformer的视听广义零次学习方法 被引量:1
7
作者 杨静 李小勇 +3 位作者 阮小利 李少波 唐向红 徐计 《电子与信息学报》 北大核心 2025年第7期2375-2384,共10页
视听零次学习需要理解音频和视觉信息之间的关系,以便能够推理未见过的类别。尽管领域做出了许多努力并取得了重大进展,但往往专注于学习强大的表征,从而忽视了音频和视频之间的依赖关系和输出分布与目标分布不一致的问题。因此,该文提... 视听零次学习需要理解音频和视觉信息之间的关系,以便能够推理未见过的类别。尽管领域做出了许多努力并取得了重大进展,但往往专注于学习强大的表征,从而忽视了音频和视频之间的依赖关系和输出分布与目标分布不一致的问题。因此,该文提出了基于Transformer的视听广义零次学习方法。具体来说,使用注意力机制来学习数据的内部信息,增强不同模态的信息交互,以捕捉视听数据之间的语义一致性;为了度量不同概率分布之间的差异和类别之间的一致性,引入了Kullback-Leibler(KL)散度和余弦相似度损失。为了评估所提方法,在VGGSound-GZSL^(cls),UCF-GZSL^(cls)和ActivityNet-GZSL^(cls)3个基准数据集上进行测试。大量的实验结果表明,所提方法在3个数据集上都取得了最先进的性能。 展开更多
关键词 视听零次学习 视频分类 注意力机制 KL散度
在线阅读 下载PDF
面向零样本图像分类的交互式类属性构建方法 被引量:1
8
作者 刘真 徐景胜 +2 位作者 颜菁 徐润森 吴向阳 《计算机辅助设计与图形学学报》 北大核心 2025年第2期243-253,共11页
零样本图像分类解决了训练和测试数据类别不相交的问题,人类标注属性是一种常用的实现零样本图像分类的辅助知识.为协助专家设计类属性矩阵,提出了一种交互式构建方法,简化了烦琐且缺乏指导的流程.首先,通过一种基于概念的深度学习可解... 零样本图像分类解决了训练和测试数据类别不相交的问题,人类标注属性是一种常用的实现零样本图像分类的辅助知识.为协助专家设计类属性矩阵,提出了一种交互式构建方法,简化了烦琐且缺乏指导的流程.首先,通过一种基于概念的深度学习可解释性方法,在训练集图像数据中提取出可理解的属性信息;然后,采用多视图协作的交互方式,探索和分析已提取属性的重要性.系统提供了全局和局部2种方式,辅助用户设计测试集数据类别的属性值;最后,通过在数据集Animals with Attributes2上进行的案例分析,以及采用李克特量表的用户评估实验,验证了设计方法的有效性和实用性,可以帮助专家用户高效且便捷地完成类属性构建工作. 展开更多
关键词 零样本学习 零样本图像分类 可视分析 可解释人工智能 人机协作
在线阅读 下载PDF
CGR-BERT-ZESHEL:基于中文特征的零样本实体链接模型 被引量:1
9
作者 潘建 吴志伟 李燕君 《计算机科学》 北大核心 2025年第4期262-270,共9页
目前,在实体链接任务的研究中,对中文实体链接、新兴实体与不知名实体链接的研究较少。此外,传统的BERT模型忽略了中文的两个关键方面,即字形和部首,这两者为语言理解提供了重要的语法和语义信息。针对以上问题,提出了一种基于中文特征... 目前,在实体链接任务的研究中,对中文实体链接、新兴实体与不知名实体链接的研究较少。此外,传统的BERT模型忽略了中文的两个关键方面,即字形和部首,这两者为语言理解提供了重要的语法和语义信息。针对以上问题,提出了一种基于中文特征的零样本实体链接模型CGR-BERT-ZESHEL。该模型首先通过引入视觉图像嵌入和传统字符嵌入,分别将字形特征和部首特征输入模型,从而增强词向量特征并缓解未登录词对模型性能的影响;然后采用候选实体生成和候选实体排序两阶段的方法得到实体链接的结果。在Hansel和CLEEK两个数据集上进行实验,结果表明,与基线模型相比,CGR-BERT-ZESHEL模型在候选实体生成阶段的性能指标Recall@100提高了17.49%和7.34%,在候选实体排序阶段的性能指标Accuracy提高了3.02%和3.11%;同时,在Recall@100和Accuracy指标上的性能均优于其他对比模型。 展开更多
关键词 实体链接 中文零样本 BERT 候选实体生成 候选实体排序
在线阅读 下载PDF
基于双专家的巡检影像多模态零样本缺陷检测 被引量:1
10
作者 吴华 贾栋豪 +3 位作者 张婷婷 白晓静 孙笠 蒲梦杨 《中国图象图形学报》 北大核心 2025年第3期672-682,共11页
目的电力设备巡检影像缺陷检测对于提高电力传输的安全性和电网运行的可靠性具有重要作用。但由于相应训练数据集的构造成本高昂,传统的监督学习方法难以适应电力设备巡检影像缺陷检测。同时电力设备巡检影像中通常含有复杂多样的背景,... 目的电力设备巡检影像缺陷检测对于提高电力传输的安全性和电网运行的可靠性具有重要作用。但由于相应训练数据集的构造成本高昂,传统的监督学习方法难以适应电力设备巡检影像缺陷检测。同时电力设备巡检影像中通常含有复杂多样的背景,严重干扰了模型对缺陷的检测。方法基于视觉语言模型并结合文本提示,提出了电力设备巡检影像零样本缺陷检测模型。模型中含有多个双专家模块,在由视觉语言模型获得文本特征和视觉特征后,经多个双专家模块处理并融合,得到像素级的缺陷检测结果。同时,构建了具有像素级掩码标注的电力设备巡检影像数据集对模型性能进行全面评测。结果在本文构建的电力设备巡检影像测试数据集上与SAA+(segment any anomaly+)、AnomalyGPT、WinCLIP(window-based CLIP)、PaDiM(patch distribution modeling)和PatchCore进行比较,在像素级的缺陷分割性能表现上,AUROC(area under the receiver operating characteristic curve)平均提升18.1%,F1-max(F1 score at optimal threshold)平均提升26.1%;在图像级的缺陷分类性能表现上,AUROC平均提升20.2%,AP(average precision)平均提升10.0%。具体到数据集中的各个电力设备,模型在像素级缺陷分割性能表现上,均获得最好结果。同时进行了消融实验,证明了双专家模块对提升模型缺陷检测精度的显著效果。结论本文模型以零样本的方式,避免了构造电力设备巡检影像数据集的高昂成本。同时提出的双专家模块,使模型减少了受巡检影像复杂背景区域的干扰。 展开更多
关键词 零样本缺陷检测 双专家 视觉语言模型 多模态 电力设备巡检影像
原文传递
提升零样本工业异常检测方法泛化性的属性无关提示学习分析 被引量:2
11
作者 刘桂雄 闫奕樸 +1 位作者 陈贵龙 邢星奥 《激光杂志》 北大核心 2025年第5期64-70,共7页
工业异常检测是制造过程质量控制核心环节,零样本工业异常检测属性无关提示学习是提升泛化性有效途径。本文面向工业生产应用,针对零样本工业异常检测属性无关提示学习,从可学习文本提示、物体解耦文本提示两个方面的基本原理、框架、... 工业异常检测是制造过程质量控制核心环节,零样本工业异常检测属性无关提示学习是提升泛化性有效途径。本文面向工业生产应用,针对零样本工业异常检测属性无关提示学习,从可学习文本提示、物体解耦文本提示两个方面的基本原理、框架、流程与应用性能等内容,系统分析比较各方法应用特点,指出图像与文本共同优化提示,以及细化异常特征描述是该领域值得关注方向,对工业异常检测技术研究人员具有指导参考价值。 展开更多
关键词 工业异常检测 属性无关提示学习 大模型 零样本
原文传递
融合CLIP和3D高斯的多模态场景编辑算法
12
作者 曹仰杰 王伟平 +2 位作者 李振强 谢俊 吕润峰 《郑州大学学报(工学版)》 北大核心 2025年第5期35-42,共8页
针对3D场景编辑算法对标注数据过度依赖和计算复杂度高的问题,提出了一种融合CLIP与3D高斯的多模态场景编辑算法(CLIP2Gaussian)。首先,利用SAM从多视角图像中提取目标掩码,并引入双向传播策略实现不同视角之间的掩码一致性;其次,将提... 针对3D场景编辑算法对标注数据过度依赖和计算复杂度高的问题,提出了一种融合CLIP与3D高斯的多模态场景编辑算法(CLIP2Gaussian)。首先,利用SAM从多视角图像中提取目标掩码,并引入双向传播策略实现不同视角之间的掩码一致性;其次,将提取的掩码通过CLIP进行语义标签分配,并映射到3D高斯点,实现3D场景的语义嵌入;最后,采用可微分渲染机制对3D高斯参数进行优化,同时引入空间一致性正则化策略,通过聚类增强语义标签在3D空间中的一致性与稳定性。实验结果表明:CLIP2Gaussian在LERF数据集上IoU达到61.23%,语义分割任务中单次文本查询响应时间为0.57 s,准确率和效率均优于LERF。消融实验进一步验证了所提算法在最小扰动原始场景的前提下对目标区域的精准编辑。 展开更多
关键词 3D重建 零样本学习 场景理解 场景编辑 3D高斯
在线阅读 下载PDF
基于注意力机制和能量函数的动作识别算法
13
作者 王丽芳 吴荆双 +1 位作者 尹鹏亮 胡立华 《计算机应用》 北大核心 2025年第1期234-239,共6页
针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而... 针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而达到空间去冗余的效果;其次,将视觉Transformer(ViT)用于视觉特征的提取以减少时间冗余,同时利用ViT配合光流加C3D架构的组合以减少空间冗余,从而获得非冗余视觉空间;最后,为度量视觉空间和语义空间的相关性,实现能量评分评估机制,设计联合损失函数来进行优化实验。采用6个经典ZSAR算法及近年文献里的算法在两个数据集HMDB51和UCF101进行实验的结果表明:相较于CAGE(Coupling Adversarial Graph Embedding)、Bi-dir GAN(Bi-directional Generative Adversarial Network)和ETSAN(Energy-based Temporal Summarized Attentive Network)等算法,在平均分组的HMDB51数据集上,ARAAE平均识别准确率提升至(22.1±1.8)%,均明显优于对比算法;在平均分组的UCF101数据集上,ARAAE的平均识别准确率提升至(22.4±1.6)%,略优于对比算法;在以81/20为分割方式的UCF101数据集上,ARAAE的平均识别准确率提升至(40.2±2.6)%,均大于对比算法。可见,ARAAE在ZSAR中能有效提高识别性能。 展开更多
关键词 零样本动作识别 能量函数 注意力机制 光流法 视觉特征
在线阅读 下载PDF
结合双重对比嵌入学习的生成式零样本图像识别
14
作者 张桂梅 闫文尚 黄军阳 《中国图象图形学报》 北大核心 2025年第5期1389-1403,共15页
目的零样本学习(zero-shot learning,ZSL)是解决样本数据缺失情况下目标识别的有效方法。传统的零样本识别是通过对带标签的可见类数据训练,实现对无标签的未见类新数据的识别。根据任务设置的不同,分为传统零样本学习(conventional zer... 目的零样本学习(zero-shot learning,ZSL)是解决样本数据缺失情况下目标识别的有效方法。传统的零样本识别是通过对带标签的可见类数据训练,实现对无标签的未见类新数据的识别。根据任务设置的不同,分为传统零样本学习(conventional zero-shot learning,CZSL)和广义零样本学习(generalized zero-shot learning,GZSL)。生成式零样本识别方法由于可以生成未见类的视觉特征,从而将零样本学习问题转换为常规监督学习问题。但是生成式零样本识别存在特征判别性信息不足、伪视觉特征与语义信息不一致以及域偏移等问题。针对上述问题,提出结合双重对比嵌入学习的生成式零样本图像识别方法。方法首先,针对生成的特征判别性不足问题,基于VAE-GAN(variational autoencoder-generative adversarial network)生成框架,集成对比嵌入模块,多个网络协同训练,提高零样本图像识别精度;其次,以条件VAE-GAN为生成网络,提出双重对比学习策略。一方面,在现有可见类对比学习的基础上,引入未见类伪样本实例—原型域内对比学习,使生成的伪视觉特征与语义信息对齐,缓解可见类和未见类的语义混淆;另一方面,提出跨域中心—原型对比学习,缓解模型过于偏向于可见类,一定程度上减轻域偏移。结果在AWA1(animals with attributes1)、AWA2、CUB(Caltech-UCSD birds-200-2011)和SUN(SUNattribute)数据集上进行零样本和广义零样本识别实验,并与最新相关方法进行比较。在零样本识别任务中,提出的方法在AWA1和CUB数据集取得最优值,相比性能次优的模型,T1值分别提高2.2%和2.7%;在AWA2和SUN数据集均取得次优值。在广义零样本识别中,在AWA1、AWA2和CUB数据集H值均取得最优,相比次优值分别提升0.6%、0.8%和2.8%;在SUN数据集取得次优值。消融实验验证了提出算法的有效性。结论实验结果表明,提出的方法可提高零样本和广义零样本图像识别的精度,并具有较好的泛化性能。 展开更多
关键词 零样本学习(ZSL) 广义零样本学习(GZSL) 生成对抗网络(GAN) 嵌入空间 对比学习
原文传递
融合扩散模型的生成式零样本钢表面缺陷检测
15
作者 季瑞瑞 杨思凡 +2 位作者 华羽垚 耿屹 白晨羲 《计算机工程与应用》 北大核心 2025年第12期333-343,共11页
针对生成式零样本目标检测模型难以应对复杂场景下的钢材表面缺陷检测,存在语义混淆和鲁棒性低的问题,提出一种融合扩散模型的生成式零样本钢材表面缺陷检测模型。设计多模态缺陷特征对齐模块,通过监督对比学习、缺陷特征对齐和语义一... 针对生成式零样本目标检测模型难以应对复杂场景下的钢材表面缺陷检测,存在语义混淆和鲁棒性低的问题,提出一种融合扩散模型的生成式零样本钢材表面缺陷检测模型。设计多模态缺陷特征对齐模块,通过监督对比学习、缺陷特征对齐和语义一致性重建,使生成器生成的缺陷特征与原始语义信息充分对齐,提高生成模型的鲁棒性;引入缺陷特征去噪扩散模块,通过逐步添加、去除噪声来生成多样化的特征表征,并筛选出具有代表性的生成缺陷特征。将得到的生成缺陷特征用于更新缺陷检测网络的分类器,实现零样本钢材表面缺陷检测。通过在NEU和GC10两个钢材表面缺陷数据集上的实验结果显示,零样本检测设置下,检测精度相较于基线模型分别提升11.5和17.4个百分点;广义零样本检测设置下,调和平均值分别提升3.0和9.8个百分点,有效提升了模型在复杂场景下的钢材表面缺陷检测能力;可视化结果表明,模型能够生成分离特征明显的未见缺陷特征,缓解了语义混淆问题;此外,与目前先进的零样本目标检测模型相比,该模型在钢材表面缺陷检测中表现出了更高的准确率和鲁棒性。 展开更多
关键词 缺陷检测 零样本学习 生成式模型 语义对齐 扩散模型
在线阅读 下载PDF
基于特征增强和对比嵌入的零样本图像分类算法
16
作者 刘颖 冯小东 何敬鲁 《计算机科学与探索》 北大核心 2025年第8期2123-2134,共12页
零样本图像分类旨在利用训练过程中可见类的信息实现未见类的预测。特征生成的方法在语义特征的指导下,利用生成模型合成未见类的视觉特征,并在视觉特征空间训练一个有监督学习模型完成预测。但是,视觉特征空间缺乏足够的判别性信息,得... 零样本图像分类旨在利用训练过程中可见类的信息实现未见类的预测。特征生成的方法在语义特征的指导下,利用生成模型合成未见类的视觉特征,并在视觉特征空间训练一个有监督学习模型完成预测。但是,视觉特征空间缺乏足够的判别性信息,得到的分类结果不是最优的。为此,构建一个基于对比学习的对比嵌入模块,将生成的特征与真实的特征映射至对比嵌入空间,在对比嵌入空间分别进行实例嵌入与类嵌入,利用对比学习更好地学习实例之间的差异以及类之间的区别,获得更具判别性信息的特征,并最终在对比嵌入空间训练一个有监督学习模型完成预测。此外,为了充分利用视觉特征的数据分布,获得更接近真实特征及其语义信息的生成特征,利用Vision Transformer提取图像的视觉特征,并在特征生成的过程中加入双原型约束策略,利用聚类原型和类别原型帮助生成模型更好地学习数据分布。该策略分别约束生成特征接近真实特征的聚类原型以及生成特征的类别原型接近真实特征的聚类原型。在三个公共数据集上的实验结果验证了提出算法的有效性。 展开更多
关键词 零样本图像分类 生成模型 对比学习 聚类原型 类别原型
在线阅读 下载PDF
使用SGA软件检验Shot-Pro遥爆系统的同步性能 被引量:1
17
作者 葛华 张留争 夏颖 《物探装备》 2006年第1期45-48,共4页
本文分析了Shot-Pro遥爆系统的工作过程、编码器零时间校准和电台延迟校准原理,介绍了SGA软件的使用及应用SGA软件检验Shot-Pro遥爆系统同步性能的方法,并研究了这种方法的测试精度和应用范围。
关键词 shot-Pro遥爆系统 同步性能 SGA软件 零时间校准
在线阅读 下载PDF
基于融合曲线的零样本红外与可见光图像融合方法 被引量:1
18
作者 刘铎 张国印 +2 位作者 史一岐 田野 张立国 《模式识别与人工智能》 北大核心 2025年第3期268-279,共12页
针对红外与可见光图像融合中的颜色失真和热目标细节丢失问题,提出基于融合曲线的零样本红外与可见光图像融合方法(Zero-Shot Infrared and Visible Image Fusion Based on Fusion Curve,ZSFuCu).首先,将融合任务转化为基于深度网络的... 针对红外与可见光图像融合中的颜色失真和热目标细节丢失问题,提出基于融合曲线的零样本红外与可见光图像融合方法(Zero-Shot Infrared and Visible Image Fusion Based on Fusion Curve,ZSFuCu).首先,将融合任务转化为基于深度网络的图像特定曲线估计过程,通过像素级非线性映射实现热目标纹理的增强与色彩特征的保留.然后,设计多维度视觉感知损失函数,从对比度增强、颜色保持及空间连续性三个维度构建约束机制,协同优化融合图像的高频信息与色彩分布,保留结构特征和关键信息.最后,采用零样本训练策略,仅需单个红外与可见光图像对即可完成参数的自适应优化,具备在不同照明条件下融合的强鲁棒性.实验表明,ZSFuCu在目标突出性、细节丰富度及颜色自然度方面具有显著优势,兼具有效性与实用性. 展开更多
关键词 红外与可见光图像融合(IVIF) 深度学习 多维度视觉感知 零样本学习
在线阅读 下载PDF
VALL-E R:利用单调对齐策略的鲁棒且高效零样本语音合成 被引量:1
19
作者 韩冰 钱彦旻 《信号处理》 北大核心 2025年第9期1537-1546,共10页
借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错... 借助离散神经音频编解码器的能力,大型语言模型(Large language model,LLM)已被广泛认为是一种零样本语音合成(Text-to-Speech,TTS)的潜在方法。然而,基于采样的解码策略虽然能够为语音生成带来丰富的多样性,但同时也引入了诸如拼写错误、遗漏和重复等鲁棒性问题。为了解决上述问题,我们提出了VALL-E R,一个鲁棒且高效的零样本TTS系统,并以VALL-E为基础进行构建。具体而言,我们引入了一种音素单调对齐策略,通过约束声学标记与其对应的音素严格匹配,增强了音素与声学序列之间的映射关系,从而确保更精确的对齐。此外,我们采用编解码器合并的方法,在浅层量化层对离散码进行降采样,以减少解码计算量,同时保持语音输出的高质量。受益于这些策略,VALL-E R在音素可控性方面取得了显著提升,并通过逼近真实语音的词错误率展现了卓越的鲁棒性。此外,该系统仅需较少的自回归推理步骤,推理时间降低超过60%,极大提升了推理效率。 展开更多
关键词 零样本语音合成 单调对齐 合并编码 鲁棒性 高效性
在线阅读 下载PDF
DeepSeek赋能领域知识图谱低成本构建研究 被引量:4
20
作者 史忠艳 雷洁 +4 位作者 孙坦 赵瑞雪 李娇 黄永文 鲜国建 《农业图书情报学报》 2025年第3期4-17,共14页
[目的/意义]在以DeepSeek为代表的开源大语言模型驱动知识工程范式变革的背景下,本研究针对传统领域知识图谱构建中存在的专家规则依赖度高、人工标注成本大、多源数据处理效率低等瓶颈问题,提出基于DeepSeek的领域知识图谱低成本构建... [目的/意义]在以DeepSeek为代表的开源大语言模型驱动知识工程范式变革的背景下,本研究针对传统领域知识图谱构建中存在的专家规则依赖度高、人工标注成本大、多源数据处理效率低等瓶颈问题,提出基于DeepSeek的领域知识图谱低成本构建方法。[方法/过程]通过构建本体建模、数据融合、智能抽取的方法框架,基于领域认知特征设计本体模型,构建多源异构数据融合方法实现数据结构统一表征,创新性地将DeepSeek与知识抽取相结合,提出语义理解增强、提示工程的领域知识抽取技术体系。[结果/结论]以生猪全产业链领域知识图谱构建为实证对象,定义产业链结构、21类核心实体及其属性关系,实现面向智慧养殖的生猪产业知识建模。实验表明,DeepSeek-R1在零样本学习条件下,对生猪疫病防治场景的实体识别F1值达0.92。本研究为领域知识图谱构建提供了“机器初筛——人工精校”协同范式,验证了大语言模型在垂直领域的知识抽取潜力,对推动DeepSeek赋能知识图谱低成本构建具有研究价值与实践参考。 展开更多
关键词 DeepSeek 知识抽取 知识图谱 零样本 知识底座 生猪 全产业链
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部