期刊文献+
共找到583篇文章
< 1 2 30 >
每页显示 20 50 100
Human Nail Clippings as a Source of DNA for Genetic Studies 被引量:2
1
作者 Le Truong Hannah Lui Park +5 位作者 Seong Sil Chang Argyrios Ziogas Susan L. Neuhausen Sophia S. Wang Leslie Bernstein Hoda Anton-Culver 《Open Journal of Epidemiology》 2015年第1期41-50,共10页
Blood samples have traditionally been used as the main source of DNA for genetic analysis. How-ever, this source can be difficult in terms of collection, transportation, and long-term storage. In this study, we invest... Blood samples have traditionally been used as the main source of DNA for genetic analysis. How-ever, this source can be difficult in terms of collection, transportation, and long-term storage. In this study, we investigated whether human nail clippings could be used as a source of DNA for SNP genotyping, null-allele detection, and whole-genome amplification. From extracted nail DNA, we achieved amplicons up to a length of ~400 bp and >96% concordance for SNP genotyping and 100% concordance for null-allele detection compared to DNA derived from matched blood sam-ples. For whole-genome amplification, OmniPlex performed better than Multiple Displacement Amplification with a success rate of 89.3% and 76.8% for SNP genotyping and null-allele detection, respectively. Concordance was ~98% for both methods. When combined with OmniPlex whole-genome amplification, human nail clippings could potentially be used as an alternative to whole blood as a less invasive and more convenient source of DNA for genotyping studies. 展开更多
关键词 Single NUCLEOTIDE POLYMORPHISM (SNP) NAIL clippings GENOTYPING WHOLE Genome Amplification (WGA)
暂未订购
多模态信息融合下的监控视频人员身份重识别
2
作者 吴军 陈慧 +2 位作者 徐刚 赵雪梅 陈睿星 《仪器仪表学报》 北大核心 2026年第1期270-286,共17页
针对目前监控视频人员身份重识别任务难以有效应对低分辨率小目标、人员姿(形)态变化及遮挡检测问题,以YOLOv9为基础网络并结合多模态预训练神经网络(CLIP)模型提出一种多模态信息融合下的监控视频人员身份识别新方法,主要涉及两个方面... 针对目前监控视频人员身份重识别任务难以有效应对低分辨率小目标、人员姿(形)态变化及遮挡检测问题,以YOLOv9为基础网络并结合多模态预训练神经网络(CLIP)模型提出一种多模态信息融合下的监控视频人员身份识别新方法,主要涉及两个方面工作:1)通过引入感受野增强模块与可变形卷积计算提高目标人员不同姿态(形)态下的特征检测性能、引入空间增强注意力机制学习特征间的关系以恢复被遮挡人员特征、引入基于归一化高斯距离的损失度量以增强低分辨率目标人员特征检测敏感性等系列模块设计,构建网络ReID-YOLO有效增强监控视频在不同姿态、形态及低分辨率、遮挡条件下的目标人员特征检测精度、鲁棒性;2)将CLIP跨模态信息融合优势迁移到视频人员身份重识别任务并利用CLIP图像-文本信息对齐优势对前一阶段提取的人员目标特征进行身份预测,在利用ReID-YOLO人员视觉特征有效区分能力缓解CLIP全局场景过度依赖的同时,借助CLIP模型场景泛化优势有效克服YOLO系列网络在整合场景信息深入解析目标方面的不足,从而整体提高网络模型的监控视频人员身份重识别精度与场景泛化能力。在低分辨率、消融与身份重叠等条件下的实验结果表明,所提方法视频人员身份重识别性能表现出色,优于YOLO系列网络及其他7个主流的视频人员身份重识别网络模型,具有良好应用前景。 展开更多
关键词 视频监控 人员身份识别 YOLO目标检测 多模态模型CLIP
原文传递
融合提示学习与分类确定性最大化的领域自适应
3
作者 丁美荣 卓金鑫 +1 位作者 刘庆龙 郎济聪 《郑州大学学报(理学版)》 北大核心 2026年第2期25-32,共8页
领域自适应面临现实场景复杂多变的问题,且现有的方法大多注重优化分类的一致性,而忽略了分类的确定性。针对上述问题,提出一种结合对比语言-图像预训练(constrastive language-image pre-training,CLIP)与分类确定性最大化的网络模型。... 领域自适应面临现实场景复杂多变的问题,且现有的方法大多注重优化分类的一致性,而忽略了分类的确定性。针对上述问题,提出一种结合对比语言-图像预训练(constrastive language-image pre-training,CLIP)与分类确定性最大化的网络模型。CLIP作为一个多模态预训练模型,通过对大规模的图像-文本对进行预训练,具有强大的跨域泛化能力。通过提示学习和对比学习获取CLIP模型的知识,使模型适应更多的复杂现实场景。通过分类确定性最大化的方法,采用双分类器评估分类的一致性,减少模型在推理过程中的混淆。在Office-31、Office-Home和MiniDomainNet三个领域自适应基准数据集上进行实验,结果表明,与现有的先进方法相比,所提模型在三个数据集上的图像分类精确度均有提升。 展开更多
关键词 迁移学习 图像分类 CLIP模型 提示学习 领域自适应 分类确定性
在线阅读 下载PDF
基于方向性CLIP引导的语义调制人脸属性编辑
4
作者 顾广华 杨远航 伊柏宇 《计算机学报》 北大核心 2026年第4期782-795,共14页
实现高精度且解耦的真实人脸图像编辑仍然是一个具有挑战性的任务。尽管生成对抗网络的隐空间蕴含着丰富且复杂的语义信息,但基于隐空间操作的人脸属性编辑研究常常面临属性纠缠、编辑失效甚至人物身份信息丢失等困境。为了解决这些问题... 实现高精度且解耦的真实人脸图像编辑仍然是一个具有挑战性的任务。尽管生成对抗网络的隐空间蕴含着丰富且复杂的语义信息,但基于隐空间操作的人脸属性编辑研究常常面临属性纠缠、编辑失效甚至人物身份信息丢失等困境。为了解决这些问题,本文提出了一种基于方向性CLIP引导的语义调制人脸属性编辑模型——SMCI-CLIP。该模型主要包括两大模块:语义调制模块和多通道交互模块。语义调制模块通过调制函数动态调整文本信息在潜码中的权重,并通过正交文本运算去除无关信息,从而生成解耦且精准的编辑向量,实现高精度且解耦的属性编辑。与此同时,多通道交互模块利用交叉注意力机制深入挖掘隐空间潜码各通道间的互信息,以提升模型的全局感知能力。大量实验结果表明,本文所提模型在有效保留人物身份信息的同时,能够实现高精度且解耦的人脸属性编辑,显著优于现有主流方法。 展开更多
关键词 人脸属性编辑 方向性CLIP 隐空间操作 语义调制 多通道交互
在线阅读 下载PDF
基于CLIP与注意力机制优化的多阶段人脸图像修复方法
5
作者 赵阳 丁建伟 《科学技术与工程》 北大核心 2026年第4期1575-1585,共11页
现有的人脸图像修复方法在处理大面积遮挡时生成的图像往往会出现结构不协调和上下文语义不连贯的问题,无法准确恢复面部细节。针对此问题,提出一种基于CLIP(contrastive language-image pre-training)与注意力机制优化的多阶段人脸图... 现有的人脸图像修复方法在处理大面积遮挡时生成的图像往往会出现结构不协调和上下文语义不连贯的问题,无法准确恢复面部细节。针对此问题,提出一种基于CLIP(contrastive language-image pre-training)与注意力机制优化的多阶段人脸图像修复算法。首先,通过编解码器结构进行初步的面部恢复。然后,针对口罩遮挡区域进行局部特征处理,在局部细节网络中引入AOT(aggregated contextual transformations)block,增强面部边缘和遮挡区域的细节重建效果。最后,将预训练好的CLIP模型嵌入到全局编码器中捕捉图像的整体细粒度细节,并通过注意力机制整合面部全局信息,确保修复后的图像在全局一致性和局部细节上都达到高质量复原的要求。在多个数据集上将该方法与多种算法进行比较,实验结果表明,所提方法在主观评价和客观评价方面均表现突出,在融合计算效率和提高修复质量之间实现了更好的平衡。 展开更多
关键词 注意力机制 人脸图像修复 CLIP 多阶段修复网络 生成式对抗网络
在线阅读 下载PDF
跨模态风格评分模型引导的矢量图风格迁移
6
作者 郑舒洋 陈佳舟 +1 位作者 朱欣定 李凯勇 《中国图象图形学报》 北大核心 2026年第3期840-849,共10页
目的矢量图风格迁移旨在将特定艺术风格应用于目标内容,同时保持其结构。然而,现有方法仅提取特定图像特征作为风格,导致迁移结果与人类视觉感知存在差距。为解决这一问题,提出了一种跨模态风格评分模型引导的矢量图风格迁移方法(vector... 目的矢量图风格迁移旨在将特定艺术风格应用于目标内容,同时保持其结构。然而,现有方法仅提取特定图像特征作为风格,导致迁移结果与人类视觉感知存在差距。为解决这一问题,提出了一种跨模态风格评分模型引导的矢量图风格迁移方法(vector graphics style transfer guided by cross-modal style evaluation models,CLIPVGStyler),旨在利用CLIP(contrastive language-image pre-training)模型的跨模态理解能力实现更符合感知的矢量图风格迁移。方法首先,将风格描述文本或风格参考图像作为输入,通过预训练的CLIP模型将其编码至共享语义信息的潜在空间,无需额外训练;然后,计算风格文本/图像编码与当前画面编码之间的余弦距离,构建风格损失,而内容损失则由像素域的L2距离和CLIP编码后的余弦距离共同组成;最后,通过迭代优化画面参数(路径控制点、颜色等)最小化联合损失函数(风格损失+内容损失),最终生成符合目标风格的矢量图。结果与先进的3种方法进行了风格迁移效率和风格质量比较,CLIP评分和用户调研的评分均更高,CLIP评分相比排名第2的模型高了0.003,用户调研的得分相比排名第2的模型高了0.36分,迭代速度排第2。实验结果表明,相比现有矢量图风格迁移方法,该方法生成的图像细节更精细,风格迁移效果更显著且符合人类视觉感知。此外,该方法在迭代优化速度上也展现出优势。结论本文提出的基于CLIP跨模态风格评分的CLIPVGStyler方法,有效融合了文本和图像的语义信息,成功解决了现有方法风格迁移结果与人类视觉感知不符的问题,显著提升了矢量图风格迁移的效果和效率。 展开更多
关键词 矢量图 风格迁移 跨模态 少样本 CLIP
原文传递
基于CLIP模型的苏丹Ⅲ染色切片扫描图像脂滴分割研究
7
作者 王子夜 汤晓蕙 +5 位作者 周兰 许春燕 周顺平 张开乔 刘方舟 周盛斌 《刑事技术》 2026年第2期121-128,共8页
组织病理学检验中苏丹Ⅲ染色可确认脂肪栓塞,其定量分级对确定死因有重要意义,但镜下人工观察定级比较依赖个人经验。为了使栓塞程度客观量化,本文探索了对肺组织苏丹Ⅲ特染切片的全视野数字图像中脂滴进行自动分割的方法。苏丹Ⅲ特染... 组织病理学检验中苏丹Ⅲ染色可确认脂肪栓塞,其定量分级对确定死因有重要意义,但镜下人工观察定级比较依赖个人经验。为了使栓塞程度客观量化,本文探索了对肺组织苏丹Ⅲ特染切片的全视野数字图像中脂滴进行自动分割的方法。苏丹Ⅲ特染切片染剂残留、脂滴染色不均、形状不一、大小差异过大等问题,容易导致误分割和分割不精确。为此,本文提出结合提示学习的对比语言-图像预训练(contrastive language-image pre-training,CLIP)模型框架进行脂滴分割:首先通过跳跃连接的方式将CLIP图像编码器输出的特征图进行融合,通过文本提示引导模型利用CLIP的先验知识精准分割脂滴;再采用dice损失函数缓解图像前景和背景不平衡的问题;最后在切片数据集上进行验证,并与U-Net、FCN8s、UNet++模型进行对比。结果表明,本文所提出的CLIP模型在特染切片图片上进行脂滴分割的效果优于所对比模型。 展开更多
关键词 法医病理学 脂肪栓塞 特殊染色 图像分割 对比语言-图像预训练(CLIP) 深度学习 全视野数字图像
在线阅读 下载PDF
基于CLIP的无监督大尺寸DR图像增强算法研究
8
作者 陈明飞 廖望 +2 位作者 王广文 吴义顺 沈宽 《仪器仪表学报》 北大核心 2026年第2期309-321,共13页
X射线数字成像技术(DR)已广泛应用于工业无损检测领域。然而在实际应用中,存在大量的结构不规则、厚度变化范围大的工件。DR检测容易在工件厚度厚的地方呈现曝光不足,在工件厚度薄的地方出现曝光过度的现象,导致DR扫描图像质量差,结构... X射线数字成像技术(DR)已广泛应用于工业无损检测领域。然而在实际应用中,存在大量的结构不规则、厚度变化范围大的工件。DR检测容易在工件厚度厚的地方呈现曝光不足,在工件厚度薄的地方出现曝光过度的现象,导致DR扫描图像质量差,结构信息严重缺失。伴随探测器像素矩阵增至4 K×4 K以上,大多数算法难以在消费级设备上处理DR扫描产生的大尺寸图像。同时工业检测场景难以获取大量的成对配对标签。针对大尺寸DR推理与标签稀缺的问题,将对比语言-图像预训练(CLIP)与限制对比度自适应直方图均衡化(CLAHE)先验耦合,构建两阶段轻量级无监督增强框架,全程无需配对或分块操作。该算法在第1阶段初步学习提示向量引导冻结的CLIP图像编码器,通过CLIP增强损失、结构一致性损失,以及CLAHE特征图感知损失指导训练;第2阶段通过排序损失迭代对提示权值迭代精炼,交替更新增强网络直至视觉收敛。实验结果表明,与同期的无监督算法相比,峰值信噪比(PSNR)、感知图像相似度(LPIPS)、结构相似度(SSIM)等指标分别提高1.0 dB、1.6%和2.0%,在多个参考指标优于对比方法。在推理时只需加载0.279 M的参数,处理5732×2333的大尺寸图像单张耗时约1.5 s。仅用380张铸件图像训练的模型即可直接在未训练过的碳纤维线路板以及其他材料的物品上迁移,并展现出良好的泛化能力,为工业检测落地提供实时增强方案。 展开更多
关键词 大尺寸DR图像 CLIP CLAHE 损失函数 图像增强
原文传递
MF-cache:用于玉米病害识别的CLIP多模态缓存模型
9
作者 孙伟 陈俊杰 《计算机工程》 北大核心 2026年第3期420-428,共9页
玉米是重要的经济作物,广泛应用于工业、畜牧业及粮油加工等领域,病害的及时识别对保障产量具有重要意义。当前,卷积神经网络(CNN)等深度学习方法已广泛应用于病害识别,但多数方法仅依赖图像信息,忽略其他模态特征,且模型参数规模较大,... 玉米是重要的经济作物,广泛应用于工业、畜牧业及粮油加工等领域,病害的及时识别对保障产量具有重要意义。当前,卷积神经网络(CNN)等深度学习方法已广泛应用于病害识别,但多数方法仅依赖图像信息,忽略其他模态特征,且模型参数规模较大,部署成本较高,限制了实际应用。为解决上述问题,提出一种基于图像-文本多模态的轻量级缓存模型MF-cache,模型参数量仅为61 000个,兼具低计算开销与较高识别精度。该模型借助多模态预训练模型CLIP提取图像与文本特征,通过并行融合策略获取融合特征,用于构建含领域知识的可学习key-value缓存结构。此外,采用加权的两阶段融合机制,用于动态调整不同模态对分类结果的贡献比例,提高分类稳定性与合理性。为增强鲁棒性,引入多种数据增强策略,提升样本多样性,缓解小样本带来的过拟合问题。在自建数据集CornI&T与公开数据集PlantVillage上的实验结果表明,该方法准确率分别达到99.72%与98.80%,具备良好的泛化性能。所提方法在保持低计算开销的同时,具备良好的识别性能,为作物病害检测提供了一种高效可行的解决方案,并展示了多模态预训练模型与小样本学习在农业智能识别领域的应用潜力。 展开更多
关键词 玉米病害识别 多模态缓存 预训练模型 CLIP模型 小样本
在线阅读 下载PDF
基于去噪扩散模型的多尺度图像条件生成算法
10
作者 向涛 朱佩佩 +2 位作者 常祥辉 刘杰 李鹏 《电讯技术》 北大核心 2026年第3期360-369,共10页
针对传统去噪扩散模型生成图像尺寸固定以及生成过程不能按需控制的问题,提出一种基于去噪扩散模型的多尺度图像条件生成模型。该模型的核心在于通过自适应多尺度全卷积网络,实现了对任意尺度图像的输入与生成。首先,改进现有去噪扩散... 针对传统去噪扩散模型生成图像尺寸固定以及生成过程不能按需控制的问题,提出一种基于去噪扩散模型的多尺度图像条件生成模型。该模型的核心在于通过自适应多尺度全卷积网络,实现了对任意尺度图像的输入与生成。首先,改进现有去噪扩散模型框架,通过多尺度扩散实现层次化特征提取;然后,通过上/下采样以及多尺度自适应全卷积器,实现模型对单个图像由粗到精的多尺度学习;最后,基于预训练的CLIP(Contrastive Language-Image Pre-training)模型提出条件控制损失函数,进而指导模型通过文本内容控制图像的条件生成。实验结果表明,所提方法不仅能适应尺度变化,还可通过文本引导生成过程,在无条件生成和有条件生成2种场景下,相比当前典型算法,在多样性、生成质量、块状伪影等指标上均有显著提升,其中,Clipscore与神经图像评估(Neural Image Assessment,NIMA)评分分别提高了0.43与0.2。 展开更多
关键词 多尺度图像 条件生成 扩散去噪模型 CLIP模型
在线阅读 下载PDF
基于多模态交叉对齐网络的小样本图像语义分割
11
作者 周莹 赵国栋 《燕山大学学报》 北大核心 2026年第1期76-84,94,共10页
针对现有小样本图像语义分割方法对未知图片中目标定位不精确的问题,提出一种基于多模态交叉对齐网络的小样本图像语义分割方法。首先,利用一组共享权重的主干网络将支持图片和查询图片映射到深度特征空间,提取图片在视觉维度的编码特... 针对现有小样本图像语义分割方法对未知图片中目标定位不精确的问题,提出一种基于多模态交叉对齐网络的小样本图像语义分割方法。首先,利用一组共享权重的主干网络将支持图片和查询图片映射到深度特征空间,提取图片在视觉维度的编码特征。其次,利用预训练的CLIP文本编码器将支持图片中的目标类信息编码到文本空间中,捕获目标类对应的文本语义。再次,利用交叉注意力机制建立文本和视觉空间的特征交互,促进不同模态间的语义对齐。最后,利用临时预测的查询掩码建立反向交叉指导策略,指导原始支持图片中已知目标的掩码预测。在开源的PASCAL和COCO数据集上进行了对比实验和消融实验,实验结果验证了所设计方法在处理查询图片中未知目标时的优越性。 展开更多
关键词 图像语义分割 小样本学习 多模态交叉对齐 反向交叉指导 CLIP
在线阅读 下载PDF
一种基于CLIP和动态语义优化的文本到3D形状生成方法
12
作者 袁康 王旭智 +2 位作者 万旺根 孙学涛 张振 《工业控制计算机》 2026年第1期47-48,54,共3页
文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而,由于文本与3D形状在模态上的显著差异,以及高质量3D形状生成中存在的语义一致性和多样性挑战,目前的方法往往难以在生成质量与文本一... 文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而,由于文本与3D形状在模态上的显著差异,以及高质量3D形状生成中存在的语义一致性和多样性挑战,目前的方法往往难以在生成质量与文本一致性之间取得平衡。提出了一种基于CLIP和动态语义优化的文本到3D形状生成方法。该方法通过构建动态语义优化模块,实时分解并调整文本特征的语义权重,使生成的3D形状更符合输入文本的描述。将动态语义优化嵌入现有的两阶段特征空间对齐框架中,显著提升了文本到3D形状生成的精度和质量。实验结果表明,与现有方法相比,该方法在生成质量、一致性方面得到了提升。 展开更多
关键词 文本到3D形状生成 CLIP 动态语义优化 特征空间对齐 生成一致性
在线阅读 下载PDF
面向组合零样本识别的图文解耦合方法
13
作者 田弋 钱毅鑫 +3 位作者 黄清宝 陈佳岳 钟磊 伍贤瑞 《中国图象图形学报》 北大核心 2026年第3期826-839,共14页
目的组合零样本识别是计算机视觉领域零样本学习任务的子任务,旨在从已经见过的组合图像中学习属性和物体概念,并将其迁移到未见过的组合上。现有方法对组合图像中属性和物体的解耦合能力不足,并且未能充分发挥文本标签对于属性和物体... 目的组合零样本识别是计算机视觉领域零样本学习任务的子任务,旨在从已经见过的组合图像中学习属性和物体概念,并将其迁移到未见过的组合上。现有方法对组合图像中属性和物体的解耦合能力不足,并且未能充分发挥文本标签对于属性和物体信息的解耦合作用。方法为解决组合图像中属性与物体信息纠缠的问题,针对文本与视觉模态的差异,提出双模态解耦机制:在文本端构建图神经网络以建模属性与物体间的语义关系,在视觉端引入交叉注意力机制增强对属性和物体特征的分离能力。该方法集成于语言图像预训练框架中,从语言与视觉两个层面提升模型对属性与物体概念的建模能力,从而增强未见组合的识别效果。结果在3个主流的组合零样本识别基准数据集MIT-States、UT-Zappos和C-GQA(compositional GQA)上对所提方法进行了系统评估,结果表明模型性能显著提升。以MIT-States数据集为例,在封闭世界设置下,相较于性能排名第2的模型,本文方法的AUC(area under curve)提升3.3%,HM(Harmonic mean)提升2.4%,已见组合的识别准确率提升5.3%,未见组合提升1.0%;在开放世界设置下,本文方法的AUC提升0.9%,HM提升0.7%,已见组合与未见组合准确率分别提升3.2%和1.0%。此外,在MIT-States数据集上对提出的文本与视觉解耦模块及其上下文建模组件进行了消融实验,进一步验证了各子模块对整体性能的有效贡献。结论所提出的图文双端解耦合模块提升了模型对于组合中属性和物体的学习能力,显著提升了模型在组合零样本识别任务上的表现。 展开更多
关键词 零样本学习(ZSL) 组合零样本识别(CZSL) 解耦合 图卷积网络(GCN) 交叉注意力 对比语言图像预训练(CLIP)
原文传递
面向草分类的粗细粒度结合模型——基于CLIP的实现
14
作者 李鹏飞 杨文淞 +1 位作者 裴生雷 罗涛 《河北师范大学学报(自然科学版)》 2026年第2期109-116,共8页
计算机视觉技术在智慧农业的应用中,经常面临开放环境下的分布外(out-of-distribution,OOD)样本识别差、细粒度分类能力不足等问题,比如草的图像分类问题.然而,传统基于CNN架构在开放场景下表现不佳,遇到与训练分布偏离的样本,不能够识... 计算机视觉技术在智慧农业的应用中,经常面临开放环境下的分布外(out-of-distribution,OOD)样本识别差、细粒度分类能力不足等问题,比如草的图像分类问题.然而,传统基于CNN架构在开放场景下表现不佳,遇到与训练分布偏离的样本,不能够识别出OOD样本,并将其分配给类内标签,这会显著降低模型的稳定性.为此,提出一种基于视觉语言模型的分类方法,利用预训练好的CLIP(contrastive language-image pretraining)模型中的视觉编码器与文本编码器提取图像与文本的特征嵌入向量结合,通过特征相似度对比实现跨模态,匹配提升分类效果.首先,基于提示词引导粗粒度判别,快速区分已知类别与OOD类别图像;其次,对判定为已知类别的图像引入CUM-CLIP(custom adapter-CLIP)模块,执行细粒度识别,进一步区分具体子类别,从而实现精细化、层次化分类.该方法在小样本条件下显着提升了训练效率与模型泛化能力.实验结果表明,CUM-CLIP与传统模型相比,该方法在训练时间、计算成本和分类精度方面均表现出显著优势,验证了其在开放场景下的鲁棒性和实用性.本研究为智慧农业领域的图像分类任务提供了一种高效、低成本的解决方案,可为相关研究提供有价值的参考. 展开更多
关键词 粗细粒度分类策略 CLIP 特征适配器 小样本训练
在线阅读 下载PDF
联合视觉-文本特征的复合型触发器后门攻击
15
作者 黄荣 唐迎春 +1 位作者 周树波 蒋学芹 《计算机科学》 北大核心 2026年第1期382-394,共13页
后门攻击指攻击者通过毒化数据集,隐蔽地诱导受害模型关联中毒数据和目标标签,对人工智能技术的可信和安全产生威胁。现有后门攻击方法普遍存在着有效性和隐蔽性之间顾此失彼的矛盾,有效性强的触发器隐蔽性差,反之,隐蔽性好的触发器有... 后门攻击指攻击者通过毒化数据集,隐蔽地诱导受害模型关联中毒数据和目标标签,对人工智能技术的可信和安全产生威胁。现有后门攻击方法普遍存在着有效性和隐蔽性之间顾此失彼的矛盾,有效性强的触发器隐蔽性差,反之,隐蔽性好的触发器有效性弱。针对该问题,提出一种联合视觉-文本特征的复合型触发器净标签后门攻击。复合型触发器由通用型和个性化两部分可学习的触发器叠加而成。复合型触发器的设计和优化均以块内像素值的同余为约束,旨在诱导受害模型捕捉同余规律,建立起触发器和目标标签的关联,形成后门。通用型触发器使得中毒图像的块内像素值对位权2同余,其信号形态对于所有的中毒图像单一固定;个性化触发器使得中毒图像的边缘像素值对LoSB(Lower Significant Bit)的位权同余,其信号特定于图像的边缘位置。两部分触发器相叠加,有利于兼顾有效性和隐蔽性。在此基础上,引入CLIP(Contrastive Language-Image Pre-training)模型,联合视觉和文本特征构建驱动复合型触发器训练的监督信号。预训练的CLIP模型具有较强的泛化能力,能够引导复合型触发器吸收异类的文本特征,起到弱化图像内容特征的作用,进一步增强触发器的有效性。在CIFAR-10,ImageNet,GTSRB这3个数据集上开展了实验。结果表明,所提方法能够抵御后门防御技术的侦测,在攻击成功率指标上平均超越次优方法2.48个百分点;在峰值信噪比、结构相似性度量、梯度幅度相似性偏差和学习感知图像块相似度4项指标上分别平均超越次优方法10.61%,0.31%,68.44%和46.38%。消融实验的结果验证了联合视觉和本文特征引导复合型触发器训练的优势,还验证了通用型和个性化两部分触发器对后门攻击的有效性和隐蔽性。 展开更多
关键词 后门攻击 复合型触发器 同余规律 CLIP模型
在线阅读 下载PDF
基于单步扩散和量化语义的极端图像压缩方法
16
作者 张洲弘 乔欣 +2 位作者 李智远 安宁 孔贺 《模式识别与人工智能》 北大核心 2026年第2期157-169,共13页
近年来,基于扩散模型的极端图像压缩方法在极低码率场景中性能显著优于传统方法.然而,这类方法依赖扩散模型的逐步去噪策略,通常需要多次采样才能完成解码,在重建保真度与推理效率之间存在一定的局限性,并且现有方法难以精准保留航拍场... 近年来,基于扩散模型的极端图像压缩方法在极低码率场景中性能显著优于传统方法.然而,这类方法依赖扩散模型的逐步去噪策略,通常需要多次采样才能完成解码,在重建保真度与推理效率之间存在一定的局限性,并且现有方法难以精准保留航拍场景中的地形结构与细节特征.因此,文中提出基于单步扩散和量化语义的极端图像压缩方法.设计单步扩散策略,从压缩特征而非纯噪声出发,仅通过一次采样即可实现高质量的图像重建.同时,引入量化CLIP特征替代文本条件,兼顾语义表达与传输效率,为重建过程提供精细稳定的语义约束.此外,在训练中融合像素级损失,结合潜在特征空间优化与像素域监督,缓解分布差异问题,进一步提升重建质量.大量实验表明,文中方法在仅使用一次采样的情况下即可达到较优的重建效果. 展开更多
关键词 图像压缩 图像重建 极低码率 量化CLIP语义特征
在线阅读 下载PDF
NEWSPAPER CLIPPINGS: AN EXCELLENT SUPPLEMENT TO EXTENSIVE READING IN LANGUAGE LEARNING 被引量:1
17
《Chinese Journal of Applied Linguistics》 1998年第2期56-57,共2页
Introduction Extensive Reading, as the name indicates, is a guide for students into the vast sea of knowledge. Reading demonstrates to students that there is no end in learning knowledge. However, reading and language... Introduction Extensive Reading, as the name indicates, is a guide for students into the vast sea of knowledge. Reading demonstrates to students that there is no end in learning knowledge. However, reading and language learning based on textbooks is far from enough because the knowledge from them is too narrow, the vocabulary is too limited and the contents are not current enough in these times of information exchange. Throughout my teaching experiments, I have found that newspaper clippings can become a very good way to bring more benefits to students’ learning than I expected. It can broaden the students’ horizons, 展开更多
关键词 AN EXCELLENT SUPPLEMENT TO EXTENSIVE READING IN LANGUAGE LEARNING NEWSPAPER clippings
原文传递
miR-11903a modulates CLIPB9-mediated pathogen defense and longevity in Aedes aegypti
18
作者 Yan-Hui Liu Ya-Nan Yin +2 位作者 Ling-Ling Yu Meng-He Chang Qian Han 《Insect Science》 2026年第1期44-56,共13页
Arthropod melanization is a crucial defense mechanism mediated by a complex cascade of CLIP domain serine proteases(CLIPs).In this study,it was confirmed that microRNA-11903a(miR-11903a)targets Aedes-CLIPB9(AeCLIPB9)b... Arthropod melanization is a crucial defense mechanism mediated by a complex cascade of CLIP domain serine proteases(CLIPs).In this study,it was confirmed that microRNA-11903a(miR-11903a)targets Aedes-CLIPB9(AeCLIPB9)by bioinformatics prediction and dual-luciferase reporter assays.Following intrathoracic injection of miR-11903a agomir and antagomir,Real-time quantitative polymerase chain reaction confirmed that AeCLIPB9 is negatively regulated by miR-11903a.Spatiotemporal expression analysis revealed that miR-11903a is most abundant in 4th instar larvae,followed by pupae and adults,and highly expressed in the wings,head,and midgut of female adults.Following pathogen infection,AeCLIPB9 and miR-11903a exhibited opposite expression trends,indicating their potential roles in mosquito innate immunity.To further investigate the relationship between AeCLIPB9 and miR-11903a,double-strand CLIPB9 was synthesized and RNA interference was performed.Seven-d survival assays revealed that both AeCLIPB9 and miR-11903a were crucial immune factors in fighting pathogens.Finally,longevity assays demonstrated that miR-11903a influenced mosquito lifespan. 展开更多
关键词 Aedes aegypti CLIP domain serine protease innate immunity LIFESPAN MELANIZATION MICRORNA
暂未订购
融合解耦和文本增强的多模态少样本与零样本分类方法
19
作者 常世杰 闫旸 《天津职业技术师范大学学报》 2026年第1期54-60,共7页
针对对比式语言-图像预训练(CLIP)模型在少样本和复杂零样本场景中存在的泛化能力有限及对抗鲁棒性不足等问题,提出一种融合改进的残差多层感知机(ResMLP)架构与对比学习方法的CLIP-ResMLP模型。该模型采用文本增强技术解耦数据中的内... 针对对比式语言-图像预训练(CLIP)模型在少样本和复杂零样本场景中存在的泛化能力有限及对抗鲁棒性不足等问题,提出一种融合改进的残差多层感知机(ResMLP)架构与对比学习方法的CLIP-ResMLP模型。该模型采用文本增强技术解耦数据中的内容与风格特征,以优化网络结构设计;引入零初始化线性层和类别-增强文本对比学习机制,并采用InfoNCE损失函数优化特征相似度计算,以提升模型的泛化能力与语义对齐能力。在PACS、VLCS、OfficeHome和DomainNet这4个跨领域数据集上进行训练,实验结果表明:CLIP-ResMLP在零样本、少样本及对抗攻击场景下展现出明显优势;在零样本分类任务中,CLIP-ResMLP模型在PACS素描领域准确率提高至91.9%(CLIP为87.7%),展现出优异的跨风格与跨域泛化能力;在8-样本任务中,改进模型在OfficeHome产品图像领域达到了93.9%的准确率,验证了其在样本稀缺情况下的稳定表现;在零样本学习场景FGSM攻击下,CLIP-ResMLP在PACS漫画领域的准确率为95.4%,表明其在对抗轻微扰动时具有较强鲁棒性。改进的模型为复杂跨模态任务提供了更优方案。 展开更多
关键词 CLIP CLIP-ResMLP 少样本与零样本学习 文本增强 对比学习 解耦表示
在线阅读 下载PDF
基于CLIP的零样本迁移对象计数方法
20
作者 邹冠宇 王佳 +1 位作者 庞婧桐 周安亮 《机器人技术与应用》 2026年第1期54-60,共7页
服务机器人在自动盘点任务中需要采用对象计数算法,但现有方法在跨域场景中泛化能力有限。为此,提出一种基于对比语言图像预训练(Contrastive Language-Image Pre-Training,CLIP)的零样本迁移计数方法HybridCount,以提升模型的跨域适应... 服务机器人在自动盘点任务中需要采用对象计数算法,但现有方法在跨域场景中泛化能力有限。为此,提出一种基于对比语言图像预训练(Contrastive Language-Image Pre-Training,CLIP)的零样本迁移计数方法HybridCount,以提升模型的跨域适应性。该方法通过视觉傅里叶提示词微调(Visual Fourier Prompt Tuning, VFPT)引入频域滤波增强特征鲁棒性,并利用混合注意力机制(Hybrid Attention,HA)构建双路径融合架构,动态调节文本与视觉特征的贡献度,有效缓解了跨模态语义鸿沟导致的对齐偏差,并在FSC147和Shanghai Tech数据集上进行了实验。实验结果表明,该方法在仅更新模型参数0.1%的前提下,在跨域场景中的性能显著优于基线方法,其平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)分别为187.7和300.4,与CLIP-Count相比分别降低5.3%和2.6%。 展开更多
关键词 机器人 对象计数 HybridCount 零样本迁移 多模态 注意力 CLIP 低参数微调
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部