期刊文献+
共找到2,046篇文章
< 1 2 103 >
每页显示 20 50 100
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究 被引量:1
1
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
面向医疗问答的KG与LLMs协同推理机制
2
作者 袁嵩 程芬 顾进广 《计算机工程与设计》 北大核心 2026年第1期252-259,共8页
针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。... 针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。引入剪枝技术去除冗余推理路径,并设计推理融合机制对LLMs诊断结果与子图推理结果进行对比,以优化推理过程。在GenMedGPT-5k和CMCQA两个数据集上进行了广泛实验,实验结果表明,所提方法在推理准确性上均优于现有基准模型。 展开更多
关键词 医疗问答 提示工程 知识图谱 大型语言模型 医疗诊断 知识图谱与LLMs结合 知识图谱增强推理
在线阅读 下载PDF
素养导向的中小学人工智能课程知识图谱构建与应用研究
3
作者 黄景修 郑孜譞 +3 位作者 赖飞宇 张舒冉 陈星宇 郑云翔 《中国电化教育》 北大核心 2026年第2期46-52,59,共8页
人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依... 人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依托广州市中小学人工智能课程教材,采用自顶向下方法构建面向中小学的课程知识图谱。为验证其有效性,研发课程知识图谱增强的大模型问答系统,并通过人工评估测试系统性能。研究结果表明,课程知识图谱通过结构化知识注入机制,显著提升了大语言模型在人工智能素养的情感、思维、知识三个维度上的问答表现。该文通过课程知识图谱与大语言模型的融合应用,探索其在教育场景中的增益效应,实现从知识体系重构到工程实践的范式跃迁,为人工智能素养教育的规模化推广提供了理论与实践耦合的技术框架。 展开更多
关键词 课程知识图谱 人工智能素养 人工智能教育 大语言模型 问答系统
在线阅读 下载PDF
基于检索增强生成和智能体的建筑材料碳排放单位换算问答模型
4
作者 阎俏 焦飞 +2 位作者 严毅 杜向华 刘鹏程 《山东大学学报(工学版)》 北大核心 2026年第1期97-104,共8页
为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步... 为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步骤构建本地知识库,设计RAG模块,为换算提供步骤参考;开发可调用计算工具的Agent,执行换算过程中的数学运算;设计提示词模板并接入大语言模型,实现基于本地知识库的文本问答。试验结果表明,所提模型能够准确回答建材的单位换算问题,支持Web端与本地控制台交互,实现单位换算结果及推理步骤的可视化。 展开更多
关键词 建筑材料碳排放 单位换算 检索增强生成 智能体 问答模型
原文传递
基于协同专家系统的建筑施工大语言模型问答系统
5
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 大语言模型 本地知识库
在线阅读 下载PDF
基于检索增强生成的化工领域大模型智能问答
6
作者 宋凯 陈泽华 +3 位作者 娄娟 陈建 董宇轩 魏啸然 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第2期212-220,共9页
化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设... 化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究. 展开更多
关键词 大语言模型 检索增强生成 化工设备设计 智能问答 复杂数据信息提取
在线阅读 下载PDF
基于多粒度知识的无监督常识问答
7
作者 杨陟卓 王年楷 《中北大学学报(自然科学版)》 2026年第1期62-70,共9页
常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利... 常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利用常识知识,限制了模型在复杂场景下的推理能力。针对这一问题,本文提出了一种新颖的无监督常识问答方法,其核心优势在于通过无监督学习有效整合外部常识知识,从而提升模型的泛化能力和推理深度。首先,该方法对问题进行分类,区分科学常识问题与日常事件问题;随后,根据问题类型生成相应的知识前缀;接着,将知识前缀输入预训练语言模型,通过大模型提示生成多粒度的常识知识;最后,利用多粒度知识辅助问答推理模块进行答案生成。采用无监督方法不仅可以减少对标注数据的依赖,还能更好地适应多样化的常识场景,体现了其在实际应用中的灵活性和普适性。实验结果表明,所提方法在相关数据集上显著优于基线模型,验证了其在无监督常识问答任务中的正确性和合理性。 展开更多
关键词 常识问答 大模型提示 知识生成 答案推理
在线阅读 下载PDF
医学视觉问答中图像与答案一致性验证方法研究
8
作者 从浩 刘利军 杨小兵 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期118-127,共10页
针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过... 针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过结合多个预训练任务,增强模型的多模态特征提取与融合能力。在微调阶段,利用部位信息对图像进行部位划分,生成答案掩码矩阵,并对最终答案进行一致性验证,从而提升模型准确率。实验结果表明,IACV模型在公共数据集VQA-RAD和SLAKE上的准确率分别达到78.9%和84.6%,显著提高了Med-VQA任务的准确性,为后续的应用提供了更可靠的支持。 展开更多
关键词 医学视觉问答(Med-VQA) 答案掩码矩阵 一致性验证 预训练
在线阅读 下载PDF
表格问答研究综述
9
作者 吴贤杰 李彤亮 李舟军 《计算机科学》 北大核心 2026年第3期295-306,共12页
表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语... 表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语言处理与数据分析交叉领域的重要研究方向。与传统的文本问答和知识库问答相比,表格问答不仅需要理解自然语言,还须解析表格的二维结构,并处理数值计算与复杂逻辑推理,因此面临更大的挑战。近年来,随着多样化数据集的持续构建,表格问答技术不断取得进展。其研究范式经历了从基于规则与模板的方法,到统计学习与神经网络模型的应用,再到预训练语言模型的引入,整体性能不断提升。尤其是近年来大语言模型(Large Language Models,LLMs)的兴起,进一步推动了表格问答进入新的发展阶段。凭借卓越的跨任务泛化能力与推理能力,大语言模型加速了新型研究范式的形成与发展,为方法创新提供了有力支撑。文中系统梳理了表格问答技术的演进脉络与代表性方法,重点总结了大语言模型驱动下的最新研究进展,概述了当前研究面临的关键挑战,并对未来发展趋势进行了展望。 展开更多
关键词 表格问答 表格推理 大语言模型 自然语言处理
在线阅读 下载PDF
基于细粒度特征增强的多模态视觉问答研究
10
作者 王志伟 陆振宇 《南京信息工程大学学报》 北大核心 2026年第1期35-47,共13页
现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视... 现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视觉和文本分别增加一种细粒度特征提取方法,以便更全面准确地提取图像和问题的语义特征;然后,为了利用不同层次模态之间的对齐信息,提出一种对齐引导的自注意力模块来对齐单一模态内(视觉或文本)细粒度特征和全局语义特征之间的对应关系,并以统一的方式融合不同层次的单模态信息;最后,在VQA v2.0和VQA-CP v2数据集上进行实验,结果表明,本文所提方法在各项视觉问答评估指标上的表现优于现有的模型. 展开更多
关键词 视觉问答 多模态 细粒度 特征增强 实体对齐 特征融合
在线阅读 下载PDF
智能问答系统逻辑推理测试
11
作者 沈庆超 李行健 +3 位作者 姜佳君 陈俊洁 齐一先 王赞 《软件学报》 北大核心 2026年第2期543-562,共20页
智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修... 智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修复智能问答系统中的缺陷至关重要.目前,智能问答系统自动测试方法主要分为两类.其一,基于问题与预测答案合成假定事实,并基于假定事实生成新问题和预期答案,以此揭示问答系统中的缺陷.其二,从现有数据集中提取不影响原问题答案的知识片段并融入原始测试输入中生成答案一致的新测试输入,实现对问答系统的缺陷检测任务.然而,这两类方法均着重于测试模型的语义理解能力,未能充分测试模型的逻辑推理能力.此外,这两类方法分别依赖于问答系统的回答范式和模型自带的数据集来生成新的测试用例,限制了其在基于大规模语言模型的问答系统中的测试效能.针对上述挑战,提出一种逻辑引导的蜕变测试技术QALT.QALT设计了3种逻辑相关的蜕变关系,并使用了语义相似度度量和依存句法分析等技术指导生成高质量的测试用例,实现对智能问答系统的精准测试.实验结果表明,QALT在两类智能问答系统上一共检测9247个缺陷,分别比当前两种最先进的技术(即QAQA和QAAskeR)多检测3150和3897个缺陷.基于人工采样标注结果的统计分析,QALT在两个智能问答系统上检测到真阳性缺陷的期望数量总和为8073,预期比QAQA和QAAskeR分别多检测2142和4867个真阳性缺陷.此外,使用QALT生成的测试输入通过模型微调对被测软件中的缺陷进行修复.微调后模型的错误率成功地从22.33%降至14.37%. 展开更多
关键词 智能问答系统 测试用例生成 蜕变测试 大型语言模型
在线阅读 下载PDF
基于知识图谱的舰船问答系统
12
作者 陈琨 陈思源 +3 位作者 张舵 高靖雯 李欣雨 刘军民 《工程数学学报》 北大核心 2026年第1期183-198,共16页
随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识... 随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识图谱实现了舰船知识问答系统的搭建。为更好地实现知识文本中三元组抽取与用户问题的意图识别,提出了一种融合BERT、卷积神经网络和注意力机制的BERT-CNN-Att命名实体识别模型,以及由BERT和双向长短时记忆网络构成的BERT-BiLSTM关系抽取模型。与知识抽取的传统神经网络不同,命名实体识别模型还引入了词汇反馈和词汇增强机制,实现了低层表征对高层信息的充分利用,极大丰富了语义的表征信息。实验结果表明,模型在命名实体识别与关系抽取任务中取得了很好的效果与明显的速度提升。此外,对问答系统架构进行了详细设计,最终构建了基于知识图谱的交互式舰船知识问答系统,测试结果显示该系统能够满足用户的舰船知识问答需求。 展开更多
关键词 知识图谱 舰船 命名实体识别 关系抽取 问答系统
在线阅读 下载PDF
基于检索增强的日志问答系统
13
作者 武智晖 黄绍晗 +4 位作者 张逸飞 齐家兴 肖智文 曾畅 栾钟治 《数据与计算发展前沿(中英文)》 2026年第1期64-76,共13页
【目的】在智能运维(AIOps)领域,日志问答是支持团队和系统管理员高效定位和解决系统问题的重要任务。然而,现有大语言模型在日志问答中的应用面临训练语料与日志内容之间的差异性,以及问答所需的日志上下文检索准确性不足等挑战。本研... 【目的】在智能运维(AIOps)领域,日志问答是支持团队和系统管理员高效定位和解决系统问题的重要任务。然而,现有大语言模型在日志问答中的应用面临训练语料与日志内容之间的差异性,以及问答所需的日志上下文检索准确性不足等挑战。本研究旨在提出一种新方法,提升日志问答系统的性能与泛化能力。【文献范围】文章重点调研智能运维领域中日志问答任务的研究现状,重点分析了当前大语言模型在处理系统日志方面的局限性。【方法】本文提出了一种基于检索增强的日志问答系统名为LogMind,采用迭代反馈机制联合训练检索模型与大语言模型,同时设计了一种稳定的训练策略。【结果】在6个领域的16个系统日志数据集上进行了实验,结果表明LogMind框架显著提升了检索模型与大语言模型的准确性,同时展现出较强的跨模型泛化能力。同时,本文还分析了DeepSeek推理模型在日志问答场景下的效果,展示了推理模型在问答场景下的优势。【局限】本研究主要在离线场景中评估了方法的性能,未来需进一步探索实际生产环境中的实时响应能力与系统扩展性。【结论】LogMind框架为智能运维提供了一种可靠且智能的日志问答解决方案,为高级系统管理提供了重要支持,同时为日志问答任务的研究与应用提供了新的思路。 展开更多
关键词 智能运维 日志问答 日志检索 大语言模型 问答系统
在线阅读 下载PDF
大模型时代自动问答系统及评价体系综述
14
作者 崔龙飞 王宗水 +1 位作者 鲍盈旭 赵红 《计算机工程与应用》 北大核心 2026年第5期1-17,共17页
大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模... 大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模”的训练方法和如今“注重数据和模型效率”之间的差异,系统分析基于大模型的自动问答系统新的特征。总结当前各种类型的自动问答大模型评测体系,并详细梳理自动化评价体系HELM(holistic evaluation of language model)在自动问答任务上的数据集、评价指标和量化计算方法。未来基于大模型的自动问答系统研究将会围绕多模态融合、高安全性、高可解释性、低资源消耗,以及结合大模型和自动化的综合评价体系这几个方面进一步拓展与深化。 展开更多
关键词 大模型(LMs) 自动问答(QA)系统 系统特征 HELM评价体系
在线阅读 下载PDF
犬木塘水库工程灌区知识图谱构建与智能问答应用
15
作者 刘超 周俊 +2 位作者 谢宸 甘茂辉 邓斌 《水利信息化》 2026年第1期89-96,共8页
犬木塘水库工程灌区作为解决衡邵干旱走廊水资源短缺的关键工程,面临多水源联合调度复杂、作物需水动态性强及旱情预警精度要求高等挑战,因此融合知识图谱与大语言模型(LLM)技术,构建灌区智能化管理系统。依据水利行业标准,定义河流、... 犬木塘水库工程灌区作为解决衡邵干旱走廊水资源短缺的关键工程,面临多水源联合调度复杂、作物需水动态性强及旱情预警精度要求高等挑战,因此融合知识图谱与大语言模型(LLM)技术,构建灌区智能化管理系统。依据水利行业标准,定义河流、枢纽、灌区等6类核心实体及19种实体关系,采用统一信息抽取框架实现高精度知识抽取,基于多源异构数据构建包含621个实体的灌区知识图谱,并基于Neo4j图数据库完成存储与可视化查询。通过LangChain框架与ChatGLM2-6B模型开发智能问答系统,利用LoRA(低秩自适应)高效微调技术优化模型参数,问答准确率达92%。同时,设计知识图谱与LLM融合机制,通过意图解析生成Cypher查询提取相关子图,转化为自然语言后与用户问题拼接,为水利专业知识理解与回答提供基础支撑。研究成果可为灌区管理场景的知识查询与决策分析提供参考。 展开更多
关键词 知识图谱 LLM 智能化管理系统 智能问答 犬木塘水库工程灌区
在线阅读 下载PDF
Meta-RAG:基于元数据驱动的电力领域检索增强生成框架
16
作者 王合庆 魏杰 +2 位作者 景红雨 宋晖 徐波 《计算机工程》 北大核心 2026年第2期383-392,共10页
大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合... 大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合了混合检索策略和经过微调的生成模型,提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析,针对电力领域的知识问答(QA)任务,提出了元数据驱动的RAG框架Meta-RAG,该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块,在此阶段,借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理,并且构建了电力领域的EleQA(Electricity Question Answering)数据集,这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段,通过多问题生成、思维链提示生成和监督指令微调数据集构建模块,优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略,结合检索和生成模块,进一步提高了答案的准确性和合理性。通过一系列实验,Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比,Meta-RAG具有更高的回答准确率和检索命中率,其中,基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3,高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大,失去检索能力整体准确率下降了0.292 8。 展开更多
关键词 EleQA数据集 元信息抽取 知识问答 电力领域 检索增强生成 模型微调 文档转换
在线阅读 下载PDF
面向遥感视觉问答的跨模态知识引入与提示推理框架
17
作者 董欣 俞鹏飞 顾晶晶 《计算机科学与探索》 北大核心 2026年第3期760-772,共13页
随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以... 随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以及文本问题表达形式多样等挑战。为了应对这些挑战,提出一种面向RSVQA的跨模态知识引入与提示推理框架(CMKIP)。针对遥感图像的高复杂度,CMKIP为大语言模型LLaMA构建可学习的图像特征适配器,以具备对复杂图像的表征能力;针对遥感图像-文本对齐数据稀缺问题,构建自动化数据生成管道,从公开遥感数据集中生成高质量的图像-文本对,实现高效的遥感领域知识注入;针对问题表达的多样性,创新性地提出一种大小模型协同推理机制,利用小模型进行知识库检索与中间推理校正,显著提升大语言模型对多样化问题的理解能力与推理准确性。此外,CMKIP支持根据任务需求灵活更换小模型,可广泛应用于遥感领域的多项下游任务。实验结果表明,CMKIP在RSVQA基准数据集上的性能显著优于现有方法,特别是在低样本场景下表现尤为突出,展示了其在RSVQA任务中的有效性和泛化性。 展开更多
关键词 遥感视觉问答 大语言模型 跨模态扩展 遥感微调指令集 轻量级模型 提示推理
在线阅读 下载PDF
基于心力衰竭领域数据增强的问答模型优化与应用
18
作者 施雪斐 郭奇 +3 位作者 马琳 秦志英 石兆峰 王肖龙 《中国医学教育技术》 2026年第1期72-79,共8页
心力衰竭是心血管领域的一种复杂疾病,对精准诊断、治疗和管理有着很高的要求。针对心力衰竭领域高精度可溯源的问答场景,本文提出了一种心力衰竭领域数据增强的问答模型优化方法。首先收集并整理大量心力衰竭相关的内容,并构建包含170... 心力衰竭是心血管领域的一种复杂疾病,对精准诊断、治疗和管理有着很高的要求。针对心力衰竭领域高精度可溯源的问答场景,本文提出了一种心力衰竭领域数据增强的问答模型优化方法。首先收集并整理大量心力衰竭相关的内容,并构建包含170余万个令牌的心力衰竭领域语料库,用于BGE-M3模型的增量预训练;其次构建超过3 200个心力衰竭专业问答的数据集,对预训练后的模型进一步进行细粒度的微调;最后将优化后的模型应用于检索增强生成(retrievalaugmented generation,RAG)中,实现了最终的问答系统。通过实验对比,较BGE-M3模型,微调后的模型与增量预训练并微调后的模型准确度分别提升了48%和52%,且在回答的精准性和内容全面性上均优于DeepSeek和通用RAG,验证了基于领域数据驱动的模型优化的有效性。本文方法证明了针对心力衰竭领域的智能化知识服务方案是实际可行的,尤其在医学教育场景中能显著提升教学效果,对于其他垂直领域的建模工作同样具有重要的参考价值。 展开更多
关键词 问答系统 RAG 模型优化 心力衰竭
在线阅读 下载PDF
基于LangChain的民族草药知识图谱构建及问答
19
作者 罗森强 潘秀琴 杜海英 《现代信息科技》 2026年第1期117-124,共8页
文章针对民族医药知识分散、难以系统化利用及智能化查询的问题,依托中国民族药大数据平台,采集并清洗了55个少数民族药材的结构化数据。创新性提出“民族药数据立方模型”,明确定义民族、药材、病症三元域及其映射关系,支持多维度闭环... 文章针对民族医药知识分散、难以系统化利用及智能化查询的问题,依托中国民族药大数据平台,采集并清洗了55个少数民族药材的结构化数据。创新性提出“民族药数据立方模型”,明确定义民族、药材、病症三元域及其映射关系,支持多维度闭环推理与动态交叉验证。该模型有效解决了“药材跨民族使用”“相似病症异药同治”等复杂规律的动态挖掘难题,提升了知识关联分析能力。进一步,结合LangChain框架构建知识图谱问答系统,针对上下文理解与查询控制局限,提出上下文重构链与约束式Cypher查询生成机制,有效解决了语义解析精度不足的问题,提升了问答准确性。结果表明:数据立方模型能有效揭示药材跨民族使用等规律;所提问答机制在解析精度和回答准确性上优于基线方法,验证了其可行性与有效性。该系统融合Neo4j与大语言模型技术,支持用户以自然语言交互式探索药材核心知识,为民族医药知识的系统性组织、智能应用与数字化传承提供了新路径。 展开更多
关键词 民族药材 知识图谱 LangChain LLM 智能问答
在线阅读 下载PDF
数字人技术在课程知识问答中的应用研究——以信息安全技术课程为例
20
作者 韦昌法 赵涛 +1 位作者 刘惠娜 周燃犀 《现代信息科技》 2026年第2期156-160,共5页
以信息安全技术课程为例,对数字人技术在课程知识问答中的应用进行了研究。从应用场景、技术实现流程和实践案例三方面展开分析,设计了多模态输入解析、知识库交互与溯源式应答、智能体驱动课件生成及数字人多模态呈现的技术流程。研究... 以信息安全技术课程为例,对数字人技术在课程知识问答中的应用进行了研究。从应用场景、技术实现流程和实践案例三方面展开分析,设计了多模态输入解析、知识库交互与溯源式应答、智能体驱动课件生成及数字人多模态呈现的技术流程。研究结果表明,该技术通过形象化、拟人化的多模态交互方式,有效解决了传统知识问答中抽象知识难以直观呈现、交互形式单一、个性化需求响应不足等问题,显著提升了知识理解效率与学习体验。同时指出了情感交互深度不足、知识库动态更新机制不完善等局限性,并提出了技术优化与应用拓展方向。 展开更多
关键词 数字人技术 知识问答 多模态交互 信息安全技术
在线阅读 下载PDF
上一页 1 2 103 下一页 到第
使用帮助 返回顶部