期刊文献+
共找到569篇文章
< 1 2 29 >
每页显示 20 50 100
Human Nail Clippings as a Source of DNA for Genetic Studies 被引量:2
1
作者 Le Truong Hannah Lui Park +5 位作者 Seong Sil Chang Argyrios Ziogas Susan L. Neuhausen Sophia S. Wang Leslie Bernstein Hoda Anton-Culver 《Open Journal of Epidemiology》 2015年第1期41-50,共10页
Blood samples have traditionally been used as the main source of DNA for genetic analysis. How-ever, this source can be difficult in terms of collection, transportation, and long-term storage. In this study, we invest... Blood samples have traditionally been used as the main source of DNA for genetic analysis. How-ever, this source can be difficult in terms of collection, transportation, and long-term storage. In this study, we investigated whether human nail clippings could be used as a source of DNA for SNP genotyping, null-allele detection, and whole-genome amplification. From extracted nail DNA, we achieved amplicons up to a length of ~400 bp and >96% concordance for SNP genotyping and 100% concordance for null-allele detection compared to DNA derived from matched blood sam-ples. For whole-genome amplification, OmniPlex performed better than Multiple Displacement Amplification with a success rate of 89.3% and 76.8% for SNP genotyping and null-allele detection, respectively. Concordance was ~98% for both methods. When combined with OmniPlex whole-genome amplification, human nail clippings could potentially be used as an alternative to whole blood as a less invasive and more convenient source of DNA for genotyping studies. 展开更多
关键词 Single NUCLEOTIDE POLYMORPHISM (SNP) NAIL clippings GENOTYPING WHOLE Genome Amplification (WGA)
暂未订购
融合提示学习与分类确定性最大化的领域自适应
2
作者 丁美荣 卓金鑫 +1 位作者 刘庆龙 郎济聪 《郑州大学学报(理学版)》 北大核心 2026年第2期25-32,共8页
领域自适应面临现实场景复杂多变的问题,且现有的方法大多注重优化分类的一致性,而忽略了分类的确定性。针对上述问题,提出一种结合对比语言-图像预训练(constrastive language-image pre-training,CLIP)与分类确定性最大化的网络模型。... 领域自适应面临现实场景复杂多变的问题,且现有的方法大多注重优化分类的一致性,而忽略了分类的确定性。针对上述问题,提出一种结合对比语言-图像预训练(constrastive language-image pre-training,CLIP)与分类确定性最大化的网络模型。CLIP作为一个多模态预训练模型,通过对大规模的图像-文本对进行预训练,具有强大的跨域泛化能力。通过提示学习和对比学习获取CLIP模型的知识,使模型适应更多的复杂现实场景。通过分类确定性最大化的方法,采用双分类器评估分类的一致性,减少模型在推理过程中的混淆。在Office-31、Office-Home和MiniDomainNet三个领域自适应基准数据集上进行实验,结果表明,与现有的先进方法相比,所提模型在三个数据集上的图像分类精确度均有提升。 展开更多
关键词 迁移学习 图像分类 CLIP模型 提示学习 领域自适应 分类确定性
在线阅读 下载PDF
基于CLIP与注意力机制优化的多阶段人脸图像修复方法
3
作者 赵阳 丁建伟 《科学技术与工程》 北大核心 2026年第4期1575-1585,共11页
现有的人脸图像修复方法在处理大面积遮挡时生成的图像往往会出现结构不协调和上下文语义不连贯的问题,无法准确恢复面部细节。针对此问题,提出一种基于CLIP(contrastive language-image pre-training)与注意力机制优化的多阶段人脸图... 现有的人脸图像修复方法在处理大面积遮挡时生成的图像往往会出现结构不协调和上下文语义不连贯的问题,无法准确恢复面部细节。针对此问题,提出一种基于CLIP(contrastive language-image pre-training)与注意力机制优化的多阶段人脸图像修复算法。首先,通过编解码器结构进行初步的面部恢复。然后,针对口罩遮挡区域进行局部特征处理,在局部细节网络中引入AOT(aggregated contextual transformations)block,增强面部边缘和遮挡区域的细节重建效果。最后,将预训练好的CLIP模型嵌入到全局编码器中捕捉图像的整体细粒度细节,并通过注意力机制整合面部全局信息,确保修复后的图像在全局一致性和局部细节上都达到高质量复原的要求。在多个数据集上将该方法与多种算法进行比较,实验结果表明,所提方法在主观评价和客观评价方面均表现突出,在融合计算效率和提高修复质量之间实现了更好的平衡。 展开更多
关键词 注意力机制 人脸图像修复 CLIP 多阶段修复网络 生成式对抗网络
在线阅读 下载PDF
MF-cache:用于玉米病害识别的CLIP多模态缓存模型
4
作者 孙伟 陈俊杰 《计算机工程》 北大核心 2026年第3期420-428,共9页
玉米是重要的经济作物,广泛应用于工业、畜牧业及粮油加工等领域,病害的及时识别对保障产量具有重要意义。当前,卷积神经网络(CNN)等深度学习方法已广泛应用于病害识别,但多数方法仅依赖图像信息,忽略其他模态特征,且模型参数规模较大,... 玉米是重要的经济作物,广泛应用于工业、畜牧业及粮油加工等领域,病害的及时识别对保障产量具有重要意义。当前,卷积神经网络(CNN)等深度学习方法已广泛应用于病害识别,但多数方法仅依赖图像信息,忽略其他模态特征,且模型参数规模较大,部署成本较高,限制了实际应用。为解决上述问题,提出一种基于图像-文本多模态的轻量级缓存模型MF-cache,模型参数量仅为61 000个,兼具低计算开销与较高识别精度。该模型借助多模态预训练模型CLIP提取图像与文本特征,通过并行融合策略获取融合特征,用于构建含领域知识的可学习key-value缓存结构。此外,采用加权的两阶段融合机制,用于动态调整不同模态对分类结果的贡献比例,提高分类稳定性与合理性。为增强鲁棒性,引入多种数据增强策略,提升样本多样性,缓解小样本带来的过拟合问题。在自建数据集CornI&T与公开数据集PlantVillage上的实验结果表明,该方法准确率分别达到99.72%与98.80%,具备良好的泛化性能。所提方法在保持低计算开销的同时,具备良好的识别性能,为作物病害检测提供了一种高效可行的解决方案,并展示了多模态预训练模型与小样本学习在农业智能识别领域的应用潜力。 展开更多
关键词 玉米病害识别 多模态缓存 预训练模型 CLIP模型 小样本
在线阅读 下载PDF
基于多模态交叉对齐网络的小样本图像语义分割
5
作者 周莹 赵国栋 《燕山大学学报》 北大核心 2026年第1期76-84,94,共10页
针对现有小样本图像语义分割方法对未知图片中目标定位不精确的问题,提出一种基于多模态交叉对齐网络的小样本图像语义分割方法。首先,利用一组共享权重的主干网络将支持图片和查询图片映射到深度特征空间,提取图片在视觉维度的编码特... 针对现有小样本图像语义分割方法对未知图片中目标定位不精确的问题,提出一种基于多模态交叉对齐网络的小样本图像语义分割方法。首先,利用一组共享权重的主干网络将支持图片和查询图片映射到深度特征空间,提取图片在视觉维度的编码特征。其次,利用预训练的CLIP文本编码器将支持图片中的目标类信息编码到文本空间中,捕获目标类对应的文本语义。再次,利用交叉注意力机制建立文本和视觉空间的特征交互,促进不同模态间的语义对齐。最后,利用临时预测的查询掩码建立反向交叉指导策略,指导原始支持图片中已知目标的掩码预测。在开源的PASCAL和COCO数据集上进行了对比实验和消融实验,实验结果验证了所设计方法在处理查询图片中未知目标时的优越性。 展开更多
关键词 图像语义分割 小样本学习 多模态交叉对齐 反向交叉指导 CLIP
在线阅读 下载PDF
一种基于CLIP和动态语义优化的文本到3D形状生成方法
6
作者 袁康 王旭智 +2 位作者 万旺根 孙学涛 张振 《工业控制计算机》 2026年第1期47-48,54,共3页
文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而,由于文本与3D形状在模态上的显著差异,以及高质量3D形状生成中存在的语义一致性和多样性挑战,目前的方法往往难以在生成质量与文本一... 文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而,由于文本与3D形状在模态上的显著差异,以及高质量3D形状生成中存在的语义一致性和多样性挑战,目前的方法往往难以在生成质量与文本一致性之间取得平衡。提出了一种基于CLIP和动态语义优化的文本到3D形状生成方法。该方法通过构建动态语义优化模块,实时分解并调整文本特征的语义权重,使生成的3D形状更符合输入文本的描述。将动态语义优化嵌入现有的两阶段特征空间对齐框架中,显著提升了文本到3D形状生成的精度和质量。实验结果表明,与现有方法相比,该方法在生成质量、一致性方面得到了提升。 展开更多
关键词 文本到3D形状生成 CLIP 动态语义优化 特征空间对齐 生成一致性
在线阅读 下载PDF
面向草分类的粗细粒度结合模型——基于CLIP的实现
7
作者 李鹏飞 杨文淞 +1 位作者 裴生雷 罗涛 《河北师范大学学报(自然科学版)》 2026年第2期109-116,共8页
计算机视觉技术在智慧农业的应用中,经常面临开放环境下的分布外(out-of-distribution,OOD)样本识别差、细粒度分类能力不足等问题,比如草的图像分类问题.然而,传统基于CNN架构在开放场景下表现不佳,遇到与训练分布偏离的样本,不能够识... 计算机视觉技术在智慧农业的应用中,经常面临开放环境下的分布外(out-of-distribution,OOD)样本识别差、细粒度分类能力不足等问题,比如草的图像分类问题.然而,传统基于CNN架构在开放场景下表现不佳,遇到与训练分布偏离的样本,不能够识别出OOD样本,并将其分配给类内标签,这会显著降低模型的稳定性.为此,提出一种基于视觉语言模型的分类方法,利用预训练好的CLIP(contrastive language-image pretraining)模型中的视觉编码器与文本编码器提取图像与文本的特征嵌入向量结合,通过特征相似度对比实现跨模态,匹配提升分类效果.首先,基于提示词引导粗粒度判别,快速区分已知类别与OOD类别图像;其次,对判定为已知类别的图像引入CUM-CLIP(custom adapter-CLIP)模块,执行细粒度识别,进一步区分具体子类别,从而实现精细化、层次化分类.该方法在小样本条件下显着提升了训练效率与模型泛化能力.实验结果表明,CUM-CLIP与传统模型相比,该方法在训练时间、计算成本和分类精度方面均表现出显著优势,验证了其在开放场景下的鲁棒性和实用性.本研究为智慧农业领域的图像分类任务提供了一种高效、低成本的解决方案,可为相关研究提供有价值的参考. 展开更多
关键词 粗细粒度分类策略 CLIP 特征适配器 小样本训练
在线阅读 下载PDF
联合视觉-文本特征的复合型触发器后门攻击
8
作者 黄荣 唐迎春 +1 位作者 周树波 蒋学芹 《计算机科学》 北大核心 2026年第1期382-394,共13页
后门攻击指攻击者通过毒化数据集,隐蔽地诱导受害模型关联中毒数据和目标标签,对人工智能技术的可信和安全产生威胁。现有后门攻击方法普遍存在着有效性和隐蔽性之间顾此失彼的矛盾,有效性强的触发器隐蔽性差,反之,隐蔽性好的触发器有... 后门攻击指攻击者通过毒化数据集,隐蔽地诱导受害模型关联中毒数据和目标标签,对人工智能技术的可信和安全产生威胁。现有后门攻击方法普遍存在着有效性和隐蔽性之间顾此失彼的矛盾,有效性强的触发器隐蔽性差,反之,隐蔽性好的触发器有效性弱。针对该问题,提出一种联合视觉-文本特征的复合型触发器净标签后门攻击。复合型触发器由通用型和个性化两部分可学习的触发器叠加而成。复合型触发器的设计和优化均以块内像素值的同余为约束,旨在诱导受害模型捕捉同余规律,建立起触发器和目标标签的关联,形成后门。通用型触发器使得中毒图像的块内像素值对位权2同余,其信号形态对于所有的中毒图像单一固定;个性化触发器使得中毒图像的边缘像素值对LoSB(Lower Significant Bit)的位权同余,其信号特定于图像的边缘位置。两部分触发器相叠加,有利于兼顾有效性和隐蔽性。在此基础上,引入CLIP(Contrastive Language-Image Pre-training)模型,联合视觉和文本特征构建驱动复合型触发器训练的监督信号。预训练的CLIP模型具有较强的泛化能力,能够引导复合型触发器吸收异类的文本特征,起到弱化图像内容特征的作用,进一步增强触发器的有效性。在CIFAR-10,ImageNet,GTSRB这3个数据集上开展了实验。结果表明,所提方法能够抵御后门防御技术的侦测,在攻击成功率指标上平均超越次优方法2.48个百分点;在峰值信噪比、结构相似性度量、梯度幅度相似性偏差和学习感知图像块相似度4项指标上分别平均超越次优方法10.61%,0.31%,68.44%和46.38%。消融实验的结果验证了联合视觉和本文特征引导复合型触发器训练的优势,还验证了通用型和个性化两部分触发器对后门攻击的有效性和隐蔽性。 展开更多
关键词 后门攻击 复合型触发器 同余规律 CLIP模型
在线阅读 下载PDF
基于单步扩散和量化语义的极端图像压缩方法
9
作者 张洲弘 乔欣 +3 位作者 李智远 安宁 孔贺 摘要 《模式识别与人工智能》 北大核心 2026年第2期157-169,共13页
近年来,基于扩散模型的极端图像压缩方法在极低码率场景中性能显著优于传统方法.然而,这类方法依赖扩散模型的逐步去噪策略,通常需要多次采样才能完成解码,在重建保真度与推理效率之间存在一定的局限性,并且现有方法难以精准保留航拍场... 近年来,基于扩散模型的极端图像压缩方法在极低码率场景中性能显著优于传统方法.然而,这类方法依赖扩散模型的逐步去噪策略,通常需要多次采样才能完成解码,在重建保真度与推理效率之间存在一定的局限性,并且现有方法难以精准保留航拍场景中的地形结构与细节特征.因此,文中提出基于单步扩散和量化语义的极端图像压缩方法.设计单步扩散策略,从压缩特征而非纯噪声出发,仅通过一次采样即可实现高质量的图像重建.同时,引入量化CLIP特征替代文本条件,兼顾语义表达与传输效率,为重建过程提供精细稳定的语义约束.此外,在训练中融合像素级损失,结合潜在特征空间优化与像素域监督,缓解分布差异问题,进一步提升重建质量.大量实验表明,文中方法在仅使用一次采样的情况下即可达到较优的重建效果. 展开更多
关键词 图像压缩 图像重建 极低码率 量化CLIP语义特征
在线阅读 下载PDF
基于CLIP的无监督域适应图像分类
10
作者 丁华玲 杨欢 《计算机系统应用》 2026年第1期141-151,共11页
无监督域适应(unsupervised domain adaptation,UDA)旨在将源域中训练好的模型应用于仅有未标记数据的目标域.当前的无监督域适应方法主要通过统计差异最小化或对抗学习来对齐源域和目标域特征空间,从而学习域不变特征.然而,这些约束可... 无监督域适应(unsupervised domain adaptation,UDA)旨在将源域中训练好的模型应用于仅有未标记数据的目标域.当前的无监督域适应方法主要通过统计差异最小化或对抗学习来对齐源域和目标域特征空间,从而学习域不变特征.然而,这些约束可能导致语义特征结构的扭曲和类可辨别性的丧失.针对上述问题,本文提出一种名为DAMPL的方法.该方法利用CLIP模型注入文本描述信息,深入挖掘图像语义内容,采用针对领域特性的提示学习范式,有效保留不同域的特有信息,避免了信息丢失.此外,通过语义引导机制对目标域的伪标签进行校正,以缩小域间差异,增强模型的泛化能力.最后还引入互信息最大化损失(mutual information maximization loss,IML),以保留目标域的特征可区分性.最终DAMPL方法在Office-Home、miniDomainNet和VisDA-2017数据集上分别达到83.8%、79.7%、89.8%的分类准确率,展现了最佳的性能. 展开更多
关键词 无监督域适应 CLIP模型 提示学习 伪标签 互信息最大化损失
在线阅读 下载PDF
基于身份与属性感知对齐的文本行人重识别
11
作者 詹光辉 《计算机科学与应用》 2026年第2期348-357,共10页
文本行人重识别(Text-based Person Re-Identification, TextReID)旨在根据自然语言描述在大规模行人图像库中检索对应个体,在智能安防等场景中具有重要应用价值。近年来,大规模的图文预训练模型(如:Contrastive Language-Image Pre-Tra... 文本行人重识别(Text-based Person Re-Identification, TextReID)旨在根据自然语言描述在大规模行人图像库中检索对应个体,在智能安防等场景中具有重要应用价值。近年来,大规模的图文预训练模型(如:Contrastive Language-Image Pre-Training, CLIP)被广泛迁移到该任务中,然而CLIP默认采用的实例级对比学习目标与行人重识别数据的真实分布存在结构性错配,同时文本侧对行人属性语义建模不足,导致检索性能不稳定、泛化能力受限。针对上述问题,本文提出一种结构感知CLIP适配框架,从目标空间与语义空间两个层面对CLIP进行结构性修正。具体地,提出身份感知对齐损失(Identity-Aware Alignment, IAA),将实例级图文对齐提升为身份级分布对齐,避免同一身份样本被误判为负样本;同时提出属性感知掩码建模(Attribute-Aware Masked Modeling, AAMM),在文本编码阶段重点建模与行人属性相关的词汇语义,增强判别性文本表征。在多个公开数据集上的实验结果表明,我们的方法在Rank-1、mAP等指标上均显著优于现有方法,验证了所提框架的有效性与泛化能力。 展开更多
关键词 文本行人重识别 CLIP 结构感知对齐 身份感知损失 属性感知掩码建模
在线阅读 下载PDF
NEWSPAPER CLIPPINGS: AN EXCELLENT SUPPLEMENT TO EXTENSIVE READING IN LANGUAGE LEARNING
12
《Chinese Journal of Applied Linguistics》 1998年第2期56-57,共2页
Introduction Extensive Reading, as the name indicates, is a guide for students into the vast sea of knowledge. Reading demonstrates to students that there is no end in learning knowledge. However, reading and language... Introduction Extensive Reading, as the name indicates, is a guide for students into the vast sea of knowledge. Reading demonstrates to students that there is no end in learning knowledge. However, reading and language learning based on textbooks is far from enough because the knowledge from them is too narrow, the vocabulary is too limited and the contents are not current enough in these times of information exchange. Throughout my teaching experiments, I have found that newspaper clippings can become a very good way to bring more benefits to students’ learning than I expected. It can broaden the students’ horizons, 展开更多
关键词 AN EXCELLENT SUPPLEMENT TO EXTENSIVE READING IN LANGUAGE LEARNING NEWSPAPER clippings
原文传递
基于图像-文本大模型CLIP微调的零样本参考图像分割 被引量:4
13
作者 刘杰 乔文昇 +2 位作者 朱佩佩 雷印杰 王紫轩 《计算机应用研究》 北大核心 2025年第4期1248-1254,共7页
近年来,以CLIP为代表的视觉-语言大模型在众多下游场景中显示出了出色的零样本推理能力,然而将CLIP模型迁移至需要像素水平图-文理解的参考图像分割中非常困难,其根本原因在于CLIP关注图像-文本整体上的对齐情况,却丢弃了图像中像素点... 近年来,以CLIP为代表的视觉-语言大模型在众多下游场景中显示出了出色的零样本推理能力,然而将CLIP模型迁移至需要像素水平图-文理解的参考图像分割中非常困难,其根本原因在于CLIP关注图像-文本整体上的对齐情况,却丢弃了图像中像素点的空间位置信息。鉴于此,以CLIP为基础模型,提出了一种单阶段、细粒度、多层次的零样本参考图像分割模型PixelCLIP。具体地,采取了多尺度的图像特征融合,既聚集CLIP中不同视觉编码器提取的图像像素级特征,同时又考虑CLIP中固有的图像整体语义特征。在文本信息表征上,不但依靠CLIP-BERT来保持物体种类信息,还引入LLaVA大语言模型进一步注入上下文背景知识。最后,PixelCLIP通过细粒度跨模态关联匹配,实现像素水平的参考图像分割。充分的数值分析结果验证了该方法的有效性。 展开更多
关键词 零样本 CLIP 像素级 单阶段 参考图像分割
在线阅读 下载PDF
多芯片整体式Clip互连碳化硅功率模块反向耦合低感封装方法 被引量:1
14
作者 张彤宇 王来利 +2 位作者 苗昱 裴云庆 甘永梅 《电工技术学报》 北大核心 2025年第16期5106-5118,共13页
碳化硅功率器件凭借其优异的性能,成为传统硅器件有力的竞争者。然而,在封装过程中,因键合线以及引出端子等引入的额外寄生电感,致使封装后的碳化硅功率模块会产生较大的开关过冲与振荡,进而难以体现其理论上的优越性。为此,该文提出一... 碳化硅功率器件凭借其优异的性能,成为传统硅器件有力的竞争者。然而,在封装过程中,因键合线以及引出端子等引入的额外寄生电感,致使封装后的碳化硅功率模块会产生较大的开关过冲与振荡,进而难以体现其理论上的优越性。为此,该文提出一种具有极低电感的多芯片整体式Clip互连碳化硅功率模块封装方法,将功率模块内部键合铝线替换成Clip互连,并通过规划陶瓷基板布局,使Clip电流流向与陶瓷基板线路电流相反,利用电流反向耦合效应降低功率模块内部寄生电感。同时,利用电容直连结构消除外部回路寄生电感。经仿真得到的功率模块内部寄生电感为3.8 nH,功率回路电感为5.0 nH。实验测试得到1 200 V/600 A样机功率回路电感为4.53 nH,换流回路总电感5.87 nH,与传统布局功率模块相比电感降低了44.6%。 展开更多
关键词 碳化硅功率模块 寄生电感 整体式Clip互连 反向耦合 换流回路
在线阅读 下载PDF
基于跨模态对比学习的常识问答模型
15
作者 王元龙 刘亭华 张虎 《计算机应用》 北大核心 2025年第3期732-738,共7页
常识问答(CQA)是利用常识知识对自然语言问句进行自动求解以得到准确答案的任务,属于智能问答领域。该任务通常需要背景常识知识提升模型的求解能力,现有的大多数相关方法依赖于从文本数据中提取和利用常识。然而,常识通常具有隐含性,... 常识问答(CQA)是利用常识知识对自然语言问句进行自动求解以得到准确答案的任务,属于智能问答领域。该任务通常需要背景常识知识提升模型的求解能力,现有的大多数相关方法依赖于从文本数据中提取和利用常识。然而,常识通常具有隐含性,并不总是直接体现在文本内容中,影响了这些方法的应用范围和效果。因此,提出基于跨模态对比学习的CQA模型,以充分利用跨模态信息丰富常识的表达。首先,设计一个跨模态常识表示模块,以融合常识库和跨模态大模型,从而获取跨模态的常识表示;其次,对问题和选项的跨模态表示进行对比学习,从而增强模型对不同选项之间的区分能力;最后,利用softmax层为问题选项对生成相关性分数,并根据分数的高低确定最终的预测答案。在公开数据集CSQA(CommonSenseQA)和OBQA(OpenBookQA)上进行的实验结果表明,与DEKCOR(DEscriptive Knowledge for COmmonsense question answeRing)相比,所提模型的准确率分别提高了1.46和0.71个百分点。 展开更多
关键词 智能问答 常识问答 对比学习 跨模态常识 CLIP
在线阅读 下载PDF
多尺度感知的单文本条件图像风格迁移
16
作者 贵向泉 李琪 +2 位作者 李立 张继续 张斌轩 《计算机技术与发展》 2025年第9期46-54,共9页
针对现有图像风格迁移方法生成图像质量不均匀、风格化效果不平衡等问题,提出一种基于CLIP的多尺度感知单文本条件融合的图像风格迁移模型─CLIP-TextFusion。该模型充分利用CLIP的文本─图像对齐能力,无需依赖目标风格图像,仅通过文本... 针对现有图像风格迁移方法生成图像质量不均匀、风格化效果不平衡等问题,提出一种基于CLIP的多尺度感知单文本条件融合的图像风格迁移模型─CLIP-TextFusion。该模型充分利用CLIP的文本─图像对齐能力,无需依赖目标风格图像,仅通过文本描述即可生成与目标风格匹配的图像。模型设计了特征提取与增强网络FENet,结合编码器、多尺度感知解码器以及通道注意力和空间注意力机制,动态调整特征权重和多尺度特征融合,实现内容图像细节的高效保留与风格纹理的精准传递。为进一步优化风格迁移效果,模型引入定向CLIP损失、多尺度感知损失、风格特征提取损失及对抗性损失,分别约束生成图像与文本描述的全局风格一致性、局部细节匹配度以及视觉真实性。实验结果表明,CLIP-TextFusion生成的图像风格鲜明、纹理细腻,在视觉效果和风格一致性上优于现有方法,能够广泛应用于艺术创作和个性化图像生成等领域。 展开更多
关键词 文本引导 图像风格迁移 CLIP模型 多尺度感知 特征提取与增强
在线阅读 下载PDF
基于目标语义提示与双注意力感知的遥感图像文本检索方法 被引量:1
17
作者 田澍 张秉熙 +5 位作者 曹林 邢相薇 田菁 沈博 杜康宁 张晔 《电子与信息学报》 北大核心 2025年第6期1734-1746,共13页
高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出... 高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出基于目标语义提示与双注意力感知的遥感图像文本检索方法。该方法首先引入空间-通道协同注意力,利用空间-通道维度注意权重交互捕捉图像全局上下文特征。同时,为了实现遥感图像显著目标信息的多粒度精准表征,模型通过所构建的基于自适应显著性区域目标感知注意力机制,通过动态多尺度目标特征加权聚合,提升对目标局部区域显著性特征聚焦响应。此外,该文设计了目标类别概率先验引导策略,对文本描述进行目标类别语义词频统计,以获取高概率先验目标语义信息,进而指导在跨模态共性嵌入空间中的图像特征聚类,最终实现高效准确的图像-文本特征对齐。该方法在RSICD与RSITMD两组遥感图像文本检索基准数据集上开展实验评估。结果表明,所设计的方法在检索精度指标上展现出了卓越的性能优势。 展开更多
关键词 遥感图像 跨模态 图像文本检索 CLIP 空间通道注意力
在线阅读 下载PDF
混合对比学习和多视角CLIP的多模态图文情感分析 被引量:1
18
作者 叶佳乐 普园媛 +3 位作者 赵征鹏 冯珏 周联敏 谷金晶 《计算机科学》 北大核心 2025年第S1期224-230,共7页
以往的多模态图文情感分析模型大多采用不同的编码器结构分别对图像和文本进行特征编码,重点关注探索不同的模态特征融合方法来实现情感分析。但由于独立提取的特征具有语义空间差异性,在交互时无法有效地捕捉到不同特征之间的语义关联... 以往的多模态图文情感分析模型大多采用不同的编码器结构分别对图像和文本进行特征编码,重点关注探索不同的模态特征融合方法来实现情感分析。但由于独立提取的特征具有语义空间差异性,在交互时无法有效地捕捉到不同特征之间的语义关联和互补性,进而降低了情感分析的准确性。针对上述问题,文中提出了混合对比学习和多视角CLIP的多模态图文情感分析方法。具体来说,多视角CLIP特征编码模块采用CLIP对图像和文本进行联合编码表示,以提升特征的语义一致性,从图像、文本和图文交互等多个视角进行多模态情感分析。此外,通过混合对比学习模块使模型提取更具有情感特性以及有效信息的特征,提升模型的鲁棒性。其中,在图文交互时为了去除冗余信息,采用CNN和Transformer级联的融合策略,充分利用图文局部和全局信息来提高特征表示能力。最后,在3个公开数据集上进行综合实验,验证了所提方法的优越性,通过消融实验证明了所提方法各组件的有效性。 展开更多
关键词 多模态 CLIP 对比学习 预训练模型 情感分析
在线阅读 下载PDF
多领域多模态融合网络的虚假新闻检测 被引量:1
19
作者 焦世明 于凯 《计算机工程与应用》 北大核心 2025年第11期238-248,共11页
公众能够从互联网快速获取海量有价值的信息,但也为虚假新闻的广泛和迅速传播提供了便利。因此,在社交媒体上发现并标记出虚假新闻变得非常重要,快速准确地识别出虚假新闻能够有效防止负面网络舆情的形成,减少不良社会影响。在现有虚假... 公众能够从互联网快速获取海量有价值的信息,但也为虚假新闻的广泛和迅速传播提供了便利。因此,在社交媒体上发现并标记出虚假新闻变得非常重要,快速准确地识别出虚假新闻能够有效防止负面网络舆情的形成,减少不良社会影响。在现有虚假新闻识别研究基础上,构建了多领域多模态融合网络虚假新闻检测模型(DMMFN)。DMMFN模型中使用了BERT模型将虚假新闻的文本内容转换为文本向量,使用CLIP提取图片特征信息,考虑文本与图像相关性与交互性,建立一个多模态融合网络,组成的两个联合矩阵促进不同模态之间的信息交互和融合。引入一个多领域分类器,让不同事件的多模态特征可以映射到同一个特征空间中。在Twitter和Weibo数据集中测试了模型的性能,实验结果证明,DMMFN模型在accuracy、precision和F1分数上均优于SIMPLE、CCD等基线模型。 展开更多
关键词 虚假新闻 BERT CLIP 多模态融合 多领域分类
在线阅读 下载PDF
基于提示词优化的AIGC辅助产品设计方法研究 被引量:1
20
作者 吴京 王沈策 牛虹苏 《包装工程》 北大核心 2025年第16期186-201,共16页
目的针对AIGC技术在产品设计中存在的需求形式化困难、方案质量不稳定及评估标准不完善等问题,探索构建面向产品的生成式人工智能(AIGC)辅助设计方法论。方法构建一种基于提示词优化的AIGC辅助产品设计(POA)框架,通过需求分析、概念生... 目的针对AIGC技术在产品设计中存在的需求形式化困难、方案质量不稳定及评估标准不完善等问题,探索构建面向产品的生成式人工智能(AIGC)辅助设计方法论。方法构建一种基于提示词优化的AIGC辅助产品设计(POA)框架,通过需求分析、概念生成和方案评价的协同迭代提升AIGC辅助设计的质量。首先,基于主成分分析(PCA)的多源数据分析实现设计需求形式化表达,提取外观特征、动力性能等关键主成分;其次,基于对比语言-图像预训练(CLIP)模型构建“基础描述+功能约束+风格定义”的分层提示词架构,通过定向优化与结构化重构提升生成质量;最后,运用改进的属性层次模型-逼近理想解排序法(AHM-TOPSIS)多准则决策方法,建立包含人机工程学、材料选用等多维度量化评估体系。结果以手持式旋耕机设计为例进行验证,结果表明相较于单纯AIGC方法,本文提出的POA方法在需求分析、概念方案生成和迭代优化等方面表现出显著改进且整体设计周期显著缩短,方案创新性和用户满意度均有所提升。结论所提出的基于提示词优化的AIGC辅助产品设计方法,通过需求结构化表达、方案优化及多准则决策,实现了AIGC技术在产品设计领域的标准化应用,为人工智能辅助设计提供新的理论框架与技术路径。 展开更多
关键词 生成式人工智能(AIGC) 提示词优化 CLIP对比语言-图像预训练模型 手持式旋耕机
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部