期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
基于大语言模型的中文隐喻多维度评估
1
作者 黄孝喜 查正超 陆诗佳 《浙江大学学报(工学版)》 北大核心 2026年第2期388-395,共8页
探讨大语言模型(LLMs)在中文隐喻句子质量评估中的应用.结合以往工作和认知语言学知识,制定中文隐喻的多维度评估标准.按照该标准构建高质量的人工评估数据集作为基准,以验证大语言模型在中文隐喻评估任务上的表现.以概念隐喻理论为指导... 探讨大语言模型(LLMs)在中文隐喻句子质量评估中的应用.结合以往工作和认知语言学知识,制定中文隐喻的多维度评估标准.按照该标准构建高质量的人工评估数据集作为基准,以验证大语言模型在中文隐喻评估任务上的表现.以概念隐喻理论为指导,将多轮对话和思维链提示相结合,提出基于大语言模型的中文隐喻多维度评估框架.实验结果显示,大语言模型在直接评分任务上与人工评分结果的皮尔逊相关系数为0.807,在组内择优任务上与人工评分结果的卡帕系数为0.831;大语言模型的评估结果与人工评分结果的一致性极高.所提评估框架结合概念隐喻理论与大语言模型,能够出色地完成中文隐喻评估任务. 展开更多
关键词 隐喻评估 中文隐喻 概念隐喻理论 大语言模型(LLM) 提示工程 多轮对话 思维链
在线阅读 下载PDF
基于双重优化稳定扩散模型的文本生成图像方法 被引量:1
2
作者 黄金杰 刘彬 《模式识别与人工智能》 北大核心 2025年第4期359-373,共15页
稳定扩散模型(Stable Diffusion Model,SD)在面对包含多个对象的文本提示时,不能保证输入文本与其生成的图像完全对齐,而完全重新训练SD花费的资源是巨大的.因此,文中提出基于双重优化稳定扩散模型的文本生成图像方法(Text-to-Image Gen... 稳定扩散模型(Stable Diffusion Model,SD)在面对包含多个对象的文本提示时,不能保证输入文本与其生成的图像完全对齐,而完全重新训练SD花费的资源是巨大的.因此,文中提出基于双重优化稳定扩散模型的文本生成图像方法(Text-to-Image Generation via Dual Optimization Stable Diffusion Model,DualOpt-SD).首先,基于预训练的SD,将布局生成图像模型(Layout-to-Image Generation,L2I)通过生成框架引入文本生成图像模型(Text-to-Image Generation,T2I)中.然后,设计双重优化策略(Dual Optimization,DualOpt),优化推理过程中输出的噪声.DualOpt由两部分组成:一部分结合注意力分数,动态调整L2I和T2I学习的先验知识;另一部分针对不同去噪阶段的需求,对L2I和T2I进行差异化关注度处理.实验表明,当文本提示包含多个对象时,DualOpt-SD在保留SD强理解力的同时,可提高构图准确性,并且生成图像的综合能力较优,能够生成高真实性和对象位置合理的图像. 展开更多
关键词 稳定扩散模型 布局生成图像 文本生成图像 多目标文本提示
在线阅读 下载PDF
提示学习与门控前馈网络的多尺度图像去模糊 被引量:1
3
作者 谢斌 黎彦先 +1 位作者 邵祥 戴邦强 《中国图象图形学报》 北大核心 2025年第3期755-768,共14页
目的针对传统基于深度学习的去模糊方法存在的伪影明显、细节模糊和噪声残留等问题,提出一种基于提示学习的多尺度图像去模糊新方法。方法首先,在详细分析传统去模糊方法的基础上,引入基于提示学习的特定退化信息编码模块,利用退化信息... 目的针对传统基于深度学习的去模糊方法存在的伪影明显、细节模糊和噪声残留等问题,提出一种基于提示学习的多尺度图像去模糊新方法。方法首先,在详细分析传统去模糊方法的基础上,引入基于提示学习的特定退化信息编码模块,利用退化信息中包含的上下文信息来动态地引导深度网络以更有效地完成去模糊任务。其次,设计了新的门控前馈网络,通过控制各个层级的信息流动构建更为丰富和更具层次结构的特征表示,从而进一步提高对复杂数据的理解和处理能力,以更好地保持结果图像的几何结构。另外,新方法引入了经典的总变差正则来抑制去模糊过程中的噪声残留,以提高结果图像的视觉表现。结果基于GoPro和REDS(the realistic and diverse scenes)数据集的大量实验结果表明,与其他先进的基于深度学习的去模糊方法相比,本文方法在图像去模糊方面取得了更好的效果。在峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似性(structural similarity,SSIM)指标上,本文方法在GoPro数据集上分别达到33.04 dB和0.962的最优结果。在REDS数据集上分别达到28.70 dB和0.859的结果。并且,相比SAM-deblur(segment anything model-deblur)方法,PSNR提升了1.77 dB。结论相较于其他的去模糊方法,本文方法不仅能够较好地保持结果图像的细节信息,而且还能够有效地克服伪影明显和噪声残留的问题,所得结果图像在PSNR和SSIM等客观评价指标方面均有更好的表现。 展开更多
关键词 图像去模糊 提示学习 多尺度 门控前馈网络(GFFN) 深度卷积
原文传递
基于注意力机制和提示学习的图像去模糊网络 被引量:1
4
作者 朱金秀 徐传蕾 +1 位作者 朱京京 苏新 《计算机测量与控制》 2025年第9期310-317,325,共9页
针对现有运动去模糊算法在边缘恢复效果不佳且易产生模糊伪影的问题,提出了一种基于注意力机制和提示学习的图像去模糊网络;结合注意力机制设计了特征融合模块,利用不同层的多尺度信息,引导网络关注于图像的边缘信息,以提高图像边缘复... 针对现有运动去模糊算法在边缘恢复效果不佳且易产生模糊伪影的问题,提出了一种基于注意力机制和提示学习的图像去模糊网络;结合注意力机制设计了特征融合模块,利用不同层的多尺度信息,引导网络关注于图像的边缘信息,以提高图像边缘复原质量;在解码器中引入轻量级提示模块,通过捕捉图像的全局结构信息,增强对模糊区域特征的重建能力,其中采用两个注意力分支减少了网络参数量和计算量;实验结果表明,该网络在3个公开数据集上的定量评价指标均表现优异,同时参数量和计算量具有一定竞争力,能够有效恢复图像边缘细节并减少模糊伪影。 展开更多
关键词 图像去模糊 注意力机制 提示学习 多尺度网络 特征融合
在线阅读 下载PDF
多任务联合学习下的复杂天气航拍图像目标检测算法 被引量:3
5
作者 王新蕾 王硕 +2 位作者 翟嘉政 肖瑞林 廖晨旭 《计算机工程与应用》 北大核心 2025年第2期97-111,共15页
针对雨雾等复杂天气下无人机图像质量下降导致目标检测效果不佳的问题,提出基于上下文引导和提示学习的目标检测算法CGP-YOLO(context-guided and prompt-based YOLOv8)。构建一个多任务联合学习的检测网络,通过双分支结构达到平衡图像... 针对雨雾等复杂天气下无人机图像质量下降导致目标检测效果不佳的问题,提出基于上下文引导和提示学习的目标检测算法CGP-YOLO(context-guided and prompt-based YOLOv8)。构建一个多任务联合学习的检测网络,通过双分支结构达到平衡图像检测和恢复的任务。提出基于提示学习的跨层注意力加权图像去噪分支,指导网络利用退化提示重构清晰的图像;模型主干设计基于上下文的残差采样模块,集成卷积注意力机制,综合目标的局部和全局信息;采用可分离大核多尺度特征提取模块,处理网络多尺度特征;引入小目标的专用检测头,增强小目标的检测精度。实验结果表明,在参数量仅为基线模型60%的情况下,该模型的检测精度提高了2.4个百分点,平均精度(mAP)提高了2.04个百分点,模型检测效果优于其他经典模型,具备卓越的性能。 展开更多
关键词 多任务学习 目标检测 无人机图像 复杂天气 提示学习 去噪模型
在线阅读 下载PDF
基于Puma算法引导帕累托前沿的高效多目标提示优化方法
6
作者 董祥千 肖铮 《计算机应用研究》 北大核心 2025年第10期3041-3052,共12页
针对现有提示优化方法在可扩展性与自适应性方面的局限,提出一种基于Puma算法的多目标提示优化框架Puma-MOPT。该框架结合Puma算法的自适应相位切换和全局搜索能力与PromptWizard的提示生成及评估机制,以实现对提示词的自动搜索和多目... 针对现有提示优化方法在可扩展性与自适应性方面的局限,提出一种基于Puma算法的多目标提示优化框架Puma-MOPT。该框架结合Puma算法的自适应相位切换和全局搜索能力与PromptWizard的提示生成及评估机制,以实现对提示词的自动搜索和多目标权衡。为提高搜索效率并增强小样本场景下的泛化能力,Puma-MOPT框架引入语义相似性约束并采用对抗过滤技术。在数学推理、医疗问答和代码生成等五个领域的实验结果表明,该框架在多个评估指标上均显著优于NSGA-Ⅱ、MOEA/D、EvoPrompt和PromptWizard等基线方法。Puma-MOPT为大语言模型(LLM)提示工程提供了一种高效、鲁棒且通用的解决方案。 展开更多
关键词 提示优化 多目标优化 美洲狮算法 帕累托最优 大型语言模型
在线阅读 下载PDF
基于语义的小样本学习原型优化方法
7
作者 刘媛媛 邵明文 +1 位作者 张黎旭 邵浚 《模式识别与人工智能》 北大核心 2025年第2期132-142,共11页
语义信息可为小样本学习提供丰富的先验知识,然而,现有的小样本研究只在浅层结合图像与语义,无法充分利用语义探索类别特征,从而限制模型性能.为了缓解此问题,文中提出基于语义的小样本学习原型优化方法.首先,设计逐通道级语义提示模块... 语义信息可为小样本学习提供丰富的先验知识,然而,现有的小样本研究只在浅层结合图像与语义,无法充分利用语义探索类别特征,从而限制模型性能.为了缓解此问题,文中提出基于语义的小样本学习原型优化方法.首先,设计逐通道级语义提示模块,引导方法提取视觉特征,逐步优化类原型.然后,设计多模态边界损失,将视觉和语义维度上的类间相关性与损失函数结合,约束方法增强类原型的区分性.最后,通过两阶段微调,充分利用语义知识优化类原型,提高分类准确率.在4个基准数据集上的实验表明文中方法性能较优. 展开更多
关键词 小样本学习 原型优化 语义知识 多模态小样本学习 提示学习
在线阅读 下载PDF
基于提示学习的电力设备故障多谱段融合识别方法 被引量:2
8
作者 姚一杨 杜泽星 +1 位作者 周果清 王庆 《西北工业大学学报》 北大核心 2025年第2期410-417,共8页
针对单谱段图像在电力设备故障识别中的局限性,提出了一种基于提示学习(prompt learning)的多谱段融合识别方法。为提升大模型对电力设备故障的识别精度,设计了基于红外图像和紫外图像的可训练提示(prompts),这些提示作为可训练部分用... 针对单谱段图像在电力设备故障识别中的局限性,提出了一种基于提示学习(prompt learning)的多谱段融合识别方法。为提升大模型对电力设备故障的识别精度,设计了基于红外图像和紫外图像的可训练提示(prompts),这些提示作为可训练部分用于模型的参数更新。这种策略很大程度地减少了训练所需的参数量,且降低了大模型对下游数据量的依赖。利用集成可见光、红外和紫外等谱段的混合成像系统,对正常和故障电力设备进行了拍摄,并构建了相应的多谱段数据集,该数据集经过文本标注后,可用于大模型的训练。实验结果表明,所提出的方法可显著提升电力设备故障识别的精度,平均识别精度达到90.14%。消融实验和可视化结果进一步验证了所提出方法的有效性。此外,由于所设计的方法只优化了极少数可训练参数,确保了方法的高效性。 展开更多
关键词 提示学习 多模态融合 电力设备 故障识别
在线阅读 下载PDF
面向工程图纸理解的大语言模型提示生成方法 被引量:2
9
作者 孙晨伟 侯俊利 +1 位作者 刘祥根 吕建成 《计算机应用》 北大核心 2025年第3期801-807,共7页
近年来,大语言模型(LLM)在自然语言处理、计算机视觉等领域都展示出卓越的语言理解和对话能力。然而,它们常常会在专业领域中产生与正确答案不相符的推理结果。这为LLM在精确和准确的决策任务中的应用带来了重大挑战。为了解决这个问题... 近年来,大语言模型(LLM)在自然语言处理、计算机视觉等领域都展示出卓越的语言理解和对话能力。然而,它们常常会在专业领域中产生与正确答案不相符的推理结果。这为LLM在精确和准确的决策任务中的应用带来了重大挑战。为了解决这个问题,提出一种规则指导的后提示词大模型(PP-LLM)生成方法。该方法通过生成后提示词可以将原问题转化为2个更容易解决的子问题,从而引入专家知识、降低任务学习难度。具体来说,使用知识指导的特定规则将监督数据集的输出部分转化为后提示词与输出部分的组合。PP-LLM方法不改变模型的训练和推理过程,并且不增加计算量。实验结果表明,PP-LLM方法显著提高了推理结果的准确性,缩小了模型预测与实际答案之间的差距,与不使用所提方法的结果相比,F1值、ROUGE(Recall-Oriented Understudy for Gisting Evaluation)等都有显著提高。可见,以上工作提高了LLM在专业应用上的可靠性,并为LLM生成技术提供了新的思路。 展开更多
关键词 工程图纸 大语言模型 数据增强 多模态 提示词
在线阅读 下载PDF
CineMAS:基于多智能体的影视创作新范式
10
作者 靳聪 范静茹 +1 位作者 王贺升 罗杰波 《信息传播研究》 2025年第3期15-23,共9页
针对当前电影创作流程中创意结构难以建模、视听生成缺乏反馈调节机制以及跨模态协作效率低等问题,本文提出了一个融合具身智能与多智能体技术的电影自动化创作系统——CineMAS(cinematic multi-agent system)。系统构建了包括编剧、角... 针对当前电影创作流程中创意结构难以建模、视听生成缺乏反馈调节机制以及跨模态协作效率低等问题,本文提出了一个融合具身智能与多智能体技术的电影自动化创作系统——CineMAS(cinematic multi-agent system)。系统构建了包括编剧、角色设计、分镜、摄影与导演在内的五类具身智能体,模拟真实剧组协同流程,完成从文本生成到视频输出的多阶段创作任务。为支持多角色间的动态协作与质量控制,系统设计了基于强化学习的“导演–智能体”控制架构,并引入领域专家知识构建提示词优化机制,提升生成内容的结构完整性与艺术表达一致性。同时,采用统一的数据交换格式与多维评分机制,实现跨模态任务间的高效通信与闭环反馈。在典型样本集上开展的定量与对比实验中,CineMAS在剧本一致性、情节连贯性及视频语义契合度等多个维度上表现优异。研究结果表明,该系统能够有效支持复杂创意流程的自动执行与质量调节,具备进一步扩展至多场景内容生成任务的可行性。 展开更多
关键词 多智能体系统 自动化电影创作 提示词优化 强化学习 跨模态生成
在线阅读 下载PDF
重新审视代码补全中的检索增强策略 被引量:2
11
作者 邹佰翰 汪莹 +5 位作者 彭鑫 娄一翎 刘力华 张昕东 林帆 刘名威 《软件学报》 北大核心 2025年第6期2747-2773,共27页
软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额... 软件开发者在编写代码时,常常会参考项目中实现了相似功能的代码.代码生成模型在生成代码时也具有类似特点,会以输入中给出的代码上下文信息作为参考.基于检索增强的代码补全技术与这一思想类似,该技术从检索库中检索到外部代码作为额外信息,对生成模型起到提示的作用,从而生成目标代码.现有的基于检索增强的代码补全方法将输入代码和检索结果直接拼接到一起作为生成模型的输入,这种方法带来了一个风险,即检索到的代码片段可能并不能对模型起到提示作用,反而有可能会误导模型,导致生成的代码结果不准确.此外,由于无论检索到的外部代码是否与输入代码完全相关,都会被与输入代码拼接起来输入到模型,这导致该方法的效果在很大程度上依赖于代码检索阶段的准确性.如果检索阶段不能返回可用的代码片段,那么后续的代码补全效果可能也会受到影响.首先,针对现有的代码补全方法中的检索增强策略进行了经验研究,通过定性和定量实验分析检索增强的各个阶段对于代码补全效果的影响,在经验研究中重点识别了代码粒度、代码检索方法、代码后处理方法这3种影响检索增强效果的因素.接着,基于经验研究的结论设计改进方法,提出一种通过分阶段优化代码检索策略来改进检索增强的代码补全方法MAGIC(multi-stage optimization for retrieval augmented code completion),设计了代码切分、二次检索精排、模板提示生成等改进策略,可以有效地提升检索增强对代码补全模型的辅助生成作用,并减少模型在代码生成阶段受到的噪声干扰,提升生成代码的质量.最后,在Java代码数据集上的实验结果表明:与现有的基于检索增强的代码补全方法相比,该方法在编辑相似度和完全匹配指标上分别提升了6.76%和7.81%.与6B参数量的代码大模型相比,该方法能够在节省94.5%的显存和73.8%的推理时间的前提下,在编辑相似度和完全匹配指标上分别提升5.62%和4.66%. 展开更多
关键词 检索增强 大语言模型 代码补全 提示学习 多阶段优化
在线阅读 下载PDF
大语言模型驱动的多元关系知识图谱补全方法 被引量:3
12
作者 刘畅成 桑磊 +1 位作者 李炜 张以文 《计算机科学》 北大核心 2025年第1期94-101,共8页
知识图谱通过将复杂的互联网信息转化为易于理解的结构化形式,极大地提高了信息的可访问性。知识图谱补全技术进一步增强了知识图谱的信息完整性,显著提升了智能问答和推荐系统等通用领域应用的性能与用户体验。然而,现有的知识图谱补... 知识图谱通过将复杂的互联网信息转化为易于理解的结构化形式,极大地提高了信息的可访问性。知识图谱补全技术进一步增强了知识图谱的信息完整性,显著提升了智能问答和推荐系统等通用领域应用的性能与用户体验。然而,现有的知识图谱补全方法大多专注于关系类型较少和简单语义情景下的三元组实例,未能充分利用知识图谱在处理多元关系和复杂语义方面的潜力。针对此问题,提出了一种由大语言模型(LLM)驱动的多元关系知识图谱补全方法。将LLM的深层语言理解能力与知识图谱的结构特性相结合,有效捕捉多元关系,理解复杂语义情景。此外,还引入了一种基于思维链的提示工程策略,旨在提高补全任务的准确性。该方法在两个公开知识图谱数据集上的实验结果都取得了显著的提升。 展开更多
关键词 知识图谱 大语言模型 知识图谱补全 多元关系 候选集构建 思维链提示
在线阅读 下载PDF
多粒度提示驱动的野生动物识别
13
作者 李鹏飞 邵一飞 +3 位作者 裴生雷 祁清 贾国庆 余炼 《闽南师范大学学报(自然科学版)》 2025年第2期35-48,共14页
现有的野生动物识别方法主要依赖于静态数据集,难以适应物种动态迁移和新增类别识别的需求,导致监测效率低下。针对这一问题,提出多粒度提示驱动的野生动物识别方法(multi-granularity prompt-driven for wildlife recognition,MGP-WILD... 现有的野生动物识别方法主要依赖于静态数据集,难以适应物种动态迁移和新增类别识别的需求,导致监测效率低下。针对这一问题,提出多粒度提示驱动的野生动物识别方法(multi-granularity prompt-driven for wildlife recognition,MGP-WILD)。通过云端大语言模型生成层次化语义描述(粗粒度生物分类+细粒度形态特征),由边缘节点协同维护动态知识表。具体而言,MGP-WILD利用大语言模型生成多粒度文本提示,相较于传统单粒度提示方法,本工作通过多粒度语义描述生成,实现了粗细粒度特征的深度融合,并结合视觉语言模型的跨模态对齐能力,实现了零样本精准识别。实验结果表明,该方法在多个数据集上均有较大提升,尤其在开放集识别任务中展现了较强的适应性。该系统已成功应用于青海野生动物栖息地保护,构建了基于真实场景的动物图像数据集,为生态脆弱区的生物多样性保护提供了创新技术范式。代码及部分数据集将在GitHub上公开。 展开更多
关键词 野生动物识别 云边协同 大型语言模型(LLM) 视觉语言模型(VLM) 多粒度提示
在线阅读 下载PDF
大语言模型知识引导的开放域多标签动作识别
14
作者 朱荣江 石语珩 +2 位作者 杨硕 王子奕 吴心筱 《计算机研究与发展》 北大核心 2025年第8期1875-1883,共9页
开放域多标签动作识别任务旨在对视频中训练阶段未见的人的多类动作进行识别.相较于传统动作识别,该任务更适应实际场景,具有广泛的应用前景.然而,开放域多标签动作识别具有很大的挑战性,需要将模型有效泛化到未见过的新动作类别.为了... 开放域多标签动作识别任务旨在对视频中训练阶段未见的人的多类动作进行识别.相较于传统动作识别,该任务更适应实际场景,具有广泛的应用前景.然而,开放域多标签动作识别具有很大的挑战性,需要将模型有效泛化到未见过的新动作类别.为了解决此问题,提出大语言模型知识引导的开放域多标签动作识别方法.该方法挖掘大语言模型蕴含的丰富的动作类别共现知识,并将共现知识嵌入视觉-语言模型的提示学习,实现基本动作类别(base action classes)与新动作类别(novel action classes)之间的信息传递,从而提升新类别的识别性能.在实验中将基本动作类别和新动作类别的比例设置为3∶1和1∶1,分别表示为“75%可见”和“50%可见”.在AVA和Movie Net数据集上的实验结果表明,相较于现有方法,当基本动作类别为“75%”时,该方法在2个数据集的新动作类别识别指标m AP上分别提升了1.95个百分点和1.21个百分点;当面临基本动作类别为“50%”的更困难场景时,提出的方法在这2个数据集上新动作类别识别指标m AP上分别提升了2.59个百分点和1.06个百分点. 展开更多
关键词 开放域动作识别 多标签分类 提示学习 大语言模型 CLIP模型
在线阅读 下载PDF
知识与关系协同提示增强的中文事件关系抽取方法
15
作者 李嘉 卜凡亮 梁家杰 《小型微型计算机系统》 北大核心 2025年第10期2313-2320,共8页
针对预训练语言模型在中文事件关系抽取中存在上下游任务不匹配、抽取准确度较低等问题,本文提出了知识和关系语义协同进行提示增强的中文事件关系抽取模型.首先基于提示学习的方法构建提示模板和标签表达器,通过改造下游的关系抽取任... 针对预训练语言模型在中文事件关系抽取中存在上下游任务不匹配、抽取准确度较低等问题,本文提出了知识和关系语义协同进行提示增强的中文事件关系抽取模型.首先基于提示学习的方法构建提示模板和标签表达器,通过改造下游的关系抽取任务以对齐差异,随后针对中文场景设计了一种融入关系标签语义和常识背景知识的提示模板改建策略,将含有高质量先验知识的关系标签和外部背景常识的知识注入提示模板,形成关系语义和知识的双重提示增强.最后利用RoBERTa编码,完成对事件关系的多标签分类.结果表明,模型在CEC2.0数据集上F1值达到了90.88%,效果优于当前大多数集基线模型与先进模型,即使在少样本场景下也能表现良好. 展开更多
关键词 提示学习 提示增强 RoBERTa 多标签分类
在线阅读 下载PDF
上下文感知增强的多轮个性化对话检索方法研究
16
作者 陈彦冰 李琳 《中文信息学报》 北大核心 2025年第7期114-126,共13页
个性化回复检索系统通常使用对话者画像(Persona)作为额外的知识来保持回复的一致性,并通过对话历史来共同选择符合语境的个性化回复。然而,现有的研究在进行这两者与回复的深层交互中,仍存在选择与对话历史矛盾或不符合画像的回复。针... 个性化回复检索系统通常使用对话者画像(Persona)作为额外的知识来保持回复的一致性,并通过对话历史来共同选择符合语境的个性化回复。然而,现有的研究在进行这两者与回复的深层交互中,仍存在选择与对话历史矛盾或不符合画像的回复。针对上述问题,该文提出了上下文感知增强的深度交互模型CEDI。该模型使用提示学习将个性化回复检索任务重构为掩码语言模型和连续语句检测的任务形式,并融入说话人及其画像表征增强多轮对话的句子间、句子内,以及对话场景的上下文对于选择回复的指导作用。此外,还利用多级注意力模块进行全局和局部的对话关键特征提取。在PERSONA-CHAT数据集上的实验结果表明,该文提出的模型在召回率(hits@1)和均值倒数序位(MRR)方面都优于现有的方法。在不同设定场景下,hit@1提升了0.7%~2.7%,MRR提升了0.9%~2.3%。 展开更多
关键词 个性化对话检索 上下文感知增强 提示学习 多轮对话系统
在线阅读 下载PDF
LEAD-Cyber:基于开源大模型和全周期本地微调的网络安全垂域大模型
17
作者 关永健 朴乘锴 +3 位作者 王布宏 赵博夫 李思琦 赵正阳 《网络空间安全科学学报》 2025年第4期94-110,共17页
网络安全运维领域面临着知识碎片化、响应效率低及专业数据敏感性等挑战。为了更好地应对上述挑战提出了一种基于开源大模型和全周期本地微调的网络安全垂直领域大模型—LEAD-Cyber。采用多步生成方法构建网络安全领域专业知识数据集,... 网络安全运维领域面临着知识碎片化、响应效率低及专业数据敏感性等挑战。为了更好地应对上述挑战提出了一种基于开源大模型和全周期本地微调的网络安全垂直领域大模型—LEAD-Cyber。采用多步生成方法构建网络安全领域专业知识数据集,该数据集能够满足开源大模型预训练、指令微调与推理微调3个训练阶段的需求;并采用全参数微调方法与低秩适应(LoRA)对DeepSeek和QWen开源大模型进行全周期优化。结合主客观指标实现大模型性能量化评估和其他大模型测试基准集以验证模型在处理不同任务中的有效性,评价指标包括Rouge、BLEU以及胜率分析WinRate。实验结果表明,微调后模型显著优于基线模型。研究验证了全周期微调策略在优化领域知识表达与保持通用能力上的优势,为智能化安全运维提供了高效可靠的解决方案。 展开更多
关键词 网络运维 多步生成方法 提示工程 全周期本地微调 开源大模型
在线阅读 下载PDF
基于语义概念关联的参考多目标跟踪方法
18
作者 林家丞 陈嘉俊 +1 位作者 李智勇 王耀南 《自动化学报》 北大核心 2025年第12期2664-2678,共15页
参考多目标跟踪(RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务,旨在在视频帧中根据语言提示精准识别并持续跟踪指定目标.尽管现有RMOT方法在该领域取得了一定进展,但针对语言表述概念粒度的建模仍较为有限,导致模型在处... 参考多目标跟踪(RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务,旨在在视频帧中根据语言提示精准识别并持续跟踪指定目标.尽管现有RMOT方法在该领域取得了一定进展,但针对语言表述概念粒度的建模仍较为有限,导致模型在处理复杂语言描述时存在语义解析不足的问题.为此,提出基于语义概念关联的参考多目标跟踪方法(SCATrack),通过引入共享语义概念(SSC)和语义概念辅助生成(SCG)模块,以提升模型对语言表述的深层理解能力,从而增强跟踪任务的持续性与鲁棒性.具体而言,SSC模块对语言表述进行语义概念划分,使模型能够有效区分相同语义的不同表达方式,以及不同语义间的相似表达方式,从而提升多粒度输入条件下的目标辨别能力.SCG模块则采用特征遮蔽与生成机制,引导模型学习多粒度语言概念的表征信息,增强其对复杂语言描述的鲁棒性和辨别能力.在两个广泛使用的基准数据集上的实验结果表明,所提出的SCATrack显著提升了RMOT任务的跟踪性能,验证了方法的有效性与优越性. 展开更多
关键词 参考多目标跟踪 多模态融合 对比学习 目标跟踪 提示场景理解
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部