期刊文献+
共找到2,047篇文章
< 1 2 103 >
每页显示 20 50 100
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究 被引量:1
1
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
面向医疗问答的KG与LLMs协同推理机制
2
作者 袁嵩 程芬 顾进广 《计算机工程与设计》 北大核心 2026年第1期252-259,共8页
针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。... 针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。引入剪枝技术去除冗余推理路径,并设计推理融合机制对LLMs诊断结果与子图推理结果进行对比,以优化推理过程。在GenMedGPT-5k和CMCQA两个数据集上进行了广泛实验,实验结果表明,所提方法在推理准确性上均优于现有基准模型。 展开更多
关键词 医疗问答 提示工程 知识图谱 大型语言模型 医疗诊断 知识图谱与LLMs结合 知识图谱增强推理
在线阅读 下载PDF
素养导向的中小学人工智能课程知识图谱构建与应用研究
3
作者 黄景修 郑孜譞 +3 位作者 赖飞宇 张舒冉 陈星宇 郑云翔 《中国电化教育》 北大核心 2026年第2期46-52,59,共8页
人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依... 人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依托广州市中小学人工智能课程教材,采用自顶向下方法构建面向中小学的课程知识图谱。为验证其有效性,研发课程知识图谱增强的大模型问答系统,并通过人工评估测试系统性能。研究结果表明,课程知识图谱通过结构化知识注入机制,显著提升了大语言模型在人工智能素养的情感、思维、知识三个维度上的问答表现。该文通过课程知识图谱与大语言模型的融合应用,探索其在教育场景中的增益效应,实现从知识体系重构到工程实践的范式跃迁,为人工智能素养教育的规模化推广提供了理论与实践耦合的技术框架。 展开更多
关键词 课程知识图谱 人工智能素养 人工智能教育 大语言模型 问答系统
在线阅读 下载PDF
基于检索增强生成和智能体的建筑材料碳排放单位换算问答模型
4
作者 阎俏 焦飞 +2 位作者 严毅 杜向华 刘鹏程 《山东大学学报(工学版)》 北大核心 2026年第1期97-104,共8页
为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步... 为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步骤构建本地知识库,设计RAG模块,为换算提供步骤参考;开发可调用计算工具的Agent,执行换算过程中的数学运算;设计提示词模板并接入大语言模型,实现基于本地知识库的文本问答。试验结果表明,所提模型能够准确回答建材的单位换算问题,支持Web端与本地控制台交互,实现单位换算结果及推理步骤的可视化。 展开更多
关键词 建筑材料碳排放 单位换算 检索增强生成 智能体 问答模型
原文传递
基于协同专家系统的建筑施工大语言模型问答系统
5
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 大语言模型 本地知识库
在线阅读 下载PDF
基于检索增强生成的化工领域大模型智能问答
6
作者 宋凯 陈泽华 +3 位作者 娄娟 陈建 董宇轩 魏啸然 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第2期212-220,共9页
化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设... 化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究. 展开更多
关键词 大语言模型 检索增强生成 化工设备设计 智能问答 复杂数据信息提取
在线阅读 下载PDF
基于多粒度知识的无监督常识问答
7
作者 杨陟卓 王年楷 《中北大学学报(自然科学版)》 2026年第1期62-70,共9页
常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利... 常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利用常识知识,限制了模型在复杂场景下的推理能力。针对这一问题,本文提出了一种新颖的无监督常识问答方法,其核心优势在于通过无监督学习有效整合外部常识知识,从而提升模型的泛化能力和推理深度。首先,该方法对问题进行分类,区分科学常识问题与日常事件问题;随后,根据问题类型生成相应的知识前缀;接着,将知识前缀输入预训练语言模型,通过大模型提示生成多粒度的常识知识;最后,利用多粒度知识辅助问答推理模块进行答案生成。采用无监督方法不仅可以减少对标注数据的依赖,还能更好地适应多样化的常识场景,体现了其在实际应用中的灵活性和普适性。实验结果表明,所提方法在相关数据集上显著优于基线模型,验证了其在无监督常识问答任务中的正确性和合理性。 展开更多
关键词 常识问答 大模型提示 知识生成 答案推理
在线阅读 下载PDF
基于人在回路负反馈机制的可修正问答研究
8
作者 朱运昌 庞亮 +1 位作者 沈华伟 程学旗 《中文信息学报》 北大核心 2026年第1期163-175,共13页
问答是测试机器智能水平的重要任务。以往的研究主要关注如何提高问答模型基于语料信息的回答准确性,而忽略了问答系统对用户反馈的在线处理能力。与人类在了解初始答案错误后能够反思并修正答案的情况相比,模型在这方面的能力尚未得到... 问答是测试机器智能水平的重要任务。以往的研究主要关注如何提高问答模型基于语料信息的回答准确性,而忽略了问答系统对用户反馈的在线处理能力。与人类在了解初始答案错误后能够反思并修正答案的情况相比,模型在这方面的能力尚未得到合理的建模与研究。因此,该文提出了一种可修正问答任务,其中用户可以拒绝不满意的答案预测,而模型可以基于用户的负反馈修正答案直到被接受。为了避免规模化训练和评估中人在回路的成本,该文提出使用现有数据集中的答案标注反向模拟用户的反馈。为了赋予传统问答模型基于反馈修正答案的能力,该文还从模型的输入、嵌入和输出方面提出了三种负反馈增强方法。实验结果表明,在三个数据集模拟的交互环境下,这三种方法均具有有效性。 展开更多
关键词 问答 可修正 人在回路 负反馈
在线阅读 下载PDF
基于解题思维机制的大语言模型多项选择阅读理解增强框架
9
作者 苏艺淞 张元哲 +3 位作者 廖祥文 卫一帆 刘康 赵军 《中文信息学报》 北大核心 2026年第1期176-187,206,共13页
多项选择阅读理解任务目标是要求模型基于给定的文章和问题从候选选项中选择正确答案。已有工作表明,尽管大语言模型在该项任务上已经达到最好性能,但其缺乏激活选项相关的思维方式,难以正确感知到给定文章、问题和选项之间的深层联系... 多项选择阅读理解任务目标是要求模型基于给定的文章和问题从候选选项中选择正确答案。已有工作表明,尽管大语言模型在该项任务上已经达到最好性能,但其缺乏激活选项相关的思维方式,难以正确感知到给定文章、问题和选项之间的深层联系并充分利用候选选项信息,故未能达到预期的性能。为此,该文提出一种基于解题思维机制的大语言模型多项选择阅读理解增强框架。具体地,该文考虑两种解题思维:按步分析和选项评估,分别从按步骤求解以获取正确选项和深入验证选项正误两方面提升大语言模型对于多项选择阅读理解题型的解题能力。为了合理利用这两种解题思维,该文进一步提出了自我激活和教师蒸馏两种提升策略,进一步提升大模型的解题效果。实验结果表明,该文所提方法相对于已有基准在六个多项选择阅读理解数据集上的平均准确率和平均严格准确率分别提升了22.61%和28.95%。 展开更多
关键词 思维链 多项选择阅读理解 问答
在线阅读 下载PDF
基于多视图的旅游相似问题匹配方法
10
作者 李旸 王浩 +2 位作者 王素格 廖健 郑建兴 《中文信息学报》 北大核心 2026年第1期188-196,共9页
旅游社区问答平台是目前人们获取旅游知识的主要手段,人们可以自由地提出问题或提交答案。为了提高服务的效率,相似问题识别成为旅游社区问答平台的核心任务。由于自然语言表达的多样性和复杂性,一方面存在不同表达的相似问题以及相似... 旅游社区问答平台是目前人们获取旅游知识的主要手段,人们可以自由地提出问题或提交答案。为了提高服务的效率,相似问题识别成为旅游社区问答平台的核心任务。由于自然语言表达的多样性和复杂性,一方面存在不同表达的相似问题以及相似表达的不同问题,另一方面存在关联于不同角度的旅游问题。因此,如何正确度量两个问题之间的相似性仍具有挑战性。为此,该文利用问题的关键词、意图和答案,提出了一种基于多视图联合判定的问题对匹配方法,该方法旨在利用关键词视图提取问题的主题信息、意图视图识别问题所表达的目的、答案视图学习更多有关问题的上下文信息。在TQD和QQPa数据集上,该文的方法都取得了较为稳定的性能提升。 展开更多
关键词 旅游社区问答 多视图 相似问题匹配
在线阅读 下载PDF
基于意图识别的知识图谱增强大语言模型问答方法——以防汛抢险为例
11
作者 张栋梁 马刚 +3 位作者 周伟 王旭东 张义 王小毛 《水利学报》 北大核心 2026年第2期280-292,305,共14页
利用水利专业知识图谱增强大语言模型(LLM)在防汛抢险方面的应用时,用户问句的意图识别面临语料匮乏、术语繁多、语义理解困难等挑战,现有方法在小样本意图识别中表现不佳。本文提出一种基于投票策略的多模型融合方法,在小样本条件下准... 利用水利专业知识图谱增强大语言模型(LLM)在防汛抢险方面的应用时,用户问句的意图识别面临语料匮乏、术语繁多、语义理解困难等挑战,现有方法在小样本意图识别中表现不佳。本文提出一种基于投票策略的多模型融合方法,在小样本条件下准确识别问句意图并提取图谱知识,进而开发水利领域防汛抢险知识问答系统。首先,基于领域实体识别和文本语义表示,构建了基于规则、机器学习和LLM的意图识别单体模型;其次,采用灰狼优化算法,依据单体模型表现分配权重,采用投票策略构建意图识别联合模型。进而,基于联合模型查询防汛抢险知识图谱,基于LLM开发了知识问答系统,实现了自然语言与知识图谱的高效交互。实验结果表明,联合模型在小样本意图识别任务中五折交叉验证的平均F1为0.912,显著超越了以BERT为代表的深度学习模型。所开发防汛抢险知识问答系统实现了准确高效的领域知识检索与重用,为水利知识转化利用和智慧水利建设提供了新路径。 展开更多
关键词 防汛抢险 意图识别 知识问答 投票策略 大语言模型 知识图谱
在线阅读 下载PDF
基于深度学习护理知识问答系统的构建与评估
12
作者 姚嘉佩 王小飞 徐冬梅 《护理研究》 北大核心 2026年第6期965-970,共6页
目的:基于深度学习技术构建护理知识问答系统,并评估其在临床护理中的应用效果。方法:采用深度学习方法构建护理领域知识库,以Transformer的双边编码器表示(BERT)等预训练语言模型为核心,开发护理知识问答系统。对系统的技术性能和临床... 目的:基于深度学习技术构建护理知识问答系统,并评估其在临床护理中的应用效果。方法:采用深度学习方法构建护理领域知识库,以Transformer的双边编码器表示(BERT)等预训练语言模型为核心,开发护理知识问答系统。对系统的技术性能和临床应用效果进行评估。结果:构建的护理知识问答系统在护理专业问题上的准确率为86.8%,平均响应时间为1.2 s。临床应用结果显示,系统可有效减轻护士工作负担,护士每班回答病人常见问题时间减少93.4%,护士满意度达4.3分。结论:基于深度学习的护理知识问答系统能有效提升护理工作效率,为护士提供可靠的知识支持。 展开更多
关键词 深度学习 人工智能 知识问答系统 自然语言处理 护理信息化 护理管理
在线阅读 下载PDF
医学视觉问答中图像与答案一致性验证方法研究
13
作者 从浩 刘利军 杨小兵 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期118-127,共10页
针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过... 针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过结合多个预训练任务,增强模型的多模态特征提取与融合能力。在微调阶段,利用部位信息对图像进行部位划分,生成答案掩码矩阵,并对最终答案进行一致性验证,从而提升模型准确率。实验结果表明,IACV模型在公共数据集VQA-RAD和SLAKE上的准确率分别达到78.9%和84.6%,显著提高了Med-VQA任务的准确性,为后续的应用提供了更可靠的支持。 展开更多
关键词 医学视觉问答(Med-VQA) 答案掩码矩阵 一致性验证 预训练
在线阅读 下载PDF
表格问答研究综述
14
作者 吴贤杰 李彤亮 李舟军 《计算机科学》 北大核心 2026年第3期295-306,共12页
表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语... 表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语言处理与数据分析交叉领域的重要研究方向。与传统的文本问答和知识库问答相比,表格问答不仅需要理解自然语言,还须解析表格的二维结构,并处理数值计算与复杂逻辑推理,因此面临更大的挑战。近年来,随着多样化数据集的持续构建,表格问答技术不断取得进展。其研究范式经历了从基于规则与模板的方法,到统计学习与神经网络模型的应用,再到预训练语言模型的引入,整体性能不断提升。尤其是近年来大语言模型(Large Language Models,LLMs)的兴起,进一步推动了表格问答进入新的发展阶段。凭借卓越的跨任务泛化能力与推理能力,大语言模型加速了新型研究范式的形成与发展,为方法创新提供了有力支撑。文中系统梳理了表格问答技术的演进脉络与代表性方法,重点总结了大语言模型驱动下的最新研究进展,概述了当前研究面临的关键挑战,并对未来发展趋势进行了展望。 展开更多
关键词 表格问答 表格推理 大语言模型 自然语言处理
在线阅读 下载PDF
基于知识图谱的钻井阻卡监测与分析方法
15
作者 张诚恺 刘子豪 +6 位作者 宋先知 祝兆鹏 王建龙 贾亿博 朱林 刘慕臣 王正 《钻探工程》 2026年第2期57-67,共11页
为应对钻井过程中卡钻事故频发、诊断依赖经验、智能模型可解释性不足等问题,本文提出了一种基于知识图谱的钻井阻卡监测与分析方法。针对卡钻知识的多源、异构及专业性强等特点,形成了“本体设计-多源数据预处理-知识抽取-图谱可视化... 为应对钻井过程中卡钻事故频发、诊断依赖经验、智能模型可解释性不足等问题,本文提出了一种基于知识图谱的钻井阻卡监测与分析方法。针对卡钻知识的多源、异构及专业性强等特点,形成了“本体设计-多源数据预处理-知识抽取-图谱可视化”的知识图谱构建流程。通过自顶向下的本体设计定义卡钻类型、影响因素、表征特征与处置措施等核心节点。在此基础上,利用BERT-BiLSTM-CRF模型实现非结构化文本知识抽取,F1分数达88.2%,从327例历史案例中提取约2000个结构化实体,并结合结构化时序卡钻样本数据,构建阻卡分析多模态知识图谱。进一步提出了一种融合数据相似度计算与知识图谱检索的阻卡识别方法,有效提升了诊断过程的可解释性。同时,设计了面向现场应用且具备良好人机交互性能的智能问答系统,该系统采用“输入解析-意图分类-知识检索-答案生成”架构,能够快速输出阻卡类型、成因分析与调控建议。本研究实现了钻井文本知识与实时监测数据的有效融合,显著提升了阻卡诊断的智能化水平与决策的可解释性,为深层、超深层及非常规油气的安全高效钻井提供了新的技术手段和工程参考。 展开更多
关键词 知识图谱 智能钻井 卡钻 知识抽取 智能问答系统
在线阅读 下载PDF
基于细粒度特征增强的多模态视觉问答研究
16
作者 王志伟 陆振宇 《南京信息工程大学学报》 北大核心 2026年第1期35-47,共13页
现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视... 现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视觉和文本分别增加一种细粒度特征提取方法,以便更全面准确地提取图像和问题的语义特征;然后,为了利用不同层次模态之间的对齐信息,提出一种对齐引导的自注意力模块来对齐单一模态内(视觉或文本)细粒度特征和全局语义特征之间的对应关系,并以统一的方式融合不同层次的单模态信息;最后,在VQA v2.0和VQA-CP v2数据集上进行实验,结果表明,本文所提方法在各项视觉问答评估指标上的表现优于现有的模型. 展开更多
关键词 视觉问答 多模态 细粒度 特征增强 实体对齐 特征融合
在线阅读 下载PDF
智能问答系统逻辑推理测试
17
作者 沈庆超 李行健 +3 位作者 姜佳君 陈俊洁 齐一先 王赞 《软件学报》 北大核心 2026年第2期543-562,共20页
智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修... 智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修复智能问答系统中的缺陷至关重要.目前,智能问答系统自动测试方法主要分为两类.其一,基于问题与预测答案合成假定事实,并基于假定事实生成新问题和预期答案,以此揭示问答系统中的缺陷.其二,从现有数据集中提取不影响原问题答案的知识片段并融入原始测试输入中生成答案一致的新测试输入,实现对问答系统的缺陷检测任务.然而,这两类方法均着重于测试模型的语义理解能力,未能充分测试模型的逻辑推理能力.此外,这两类方法分别依赖于问答系统的回答范式和模型自带的数据集来生成新的测试用例,限制了其在基于大规模语言模型的问答系统中的测试效能.针对上述挑战,提出一种逻辑引导的蜕变测试技术QALT.QALT设计了3种逻辑相关的蜕变关系,并使用了语义相似度度量和依存句法分析等技术指导生成高质量的测试用例,实现对智能问答系统的精准测试.实验结果表明,QALT在两类智能问答系统上一共检测9247个缺陷,分别比当前两种最先进的技术(即QAQA和QAAskeR)多检测3150和3897个缺陷.基于人工采样标注结果的统计分析,QALT在两个智能问答系统上检测到真阳性缺陷的期望数量总和为8073,预期比QAQA和QAAskeR分别多检测2142和4867个真阳性缺陷.此外,使用QALT生成的测试输入通过模型微调对被测软件中的缺陷进行修复.微调后模型的错误率成功地从22.33%降至14.37%. 展开更多
关键词 智能问答系统 测试用例生成 蜕变测试 大型语言模型
在线阅读 下载PDF
基于知识图谱的舰船问答系统
18
作者 陈琨 陈思源 +3 位作者 张舵 高靖雯 李欣雨 刘军民 《工程数学学报》 北大核心 2026年第1期183-198,共16页
随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识... 随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识图谱实现了舰船知识问答系统的搭建。为更好地实现知识文本中三元组抽取与用户问题的意图识别,提出了一种融合BERT、卷积神经网络和注意力机制的BERT-CNN-Att命名实体识别模型,以及由BERT和双向长短时记忆网络构成的BERT-BiLSTM关系抽取模型。与知识抽取的传统神经网络不同,命名实体识别模型还引入了词汇反馈和词汇增强机制,实现了低层表征对高层信息的充分利用,极大丰富了语义的表征信息。实验结果表明,模型在命名实体识别与关系抽取任务中取得了很好的效果与明显的速度提升。此外,对问答系统架构进行了详细设计,最终构建了基于知识图谱的交互式舰船知识问答系统,测试结果显示该系统能够满足用户的舰船知识问答需求。 展开更多
关键词 知识图谱 舰船 命名实体识别 关系抽取 问答系统
在线阅读 下载PDF
基于检索增强的日志问答系统
19
作者 武智晖 黄绍晗 +4 位作者 张逸飞 齐家兴 肖智文 曾畅 栾钟治 《数据与计算发展前沿(中英文)》 2026年第1期64-76,共13页
【目的】在智能运维(AIOps)领域,日志问答是支持团队和系统管理员高效定位和解决系统问题的重要任务。然而,现有大语言模型在日志问答中的应用面临训练语料与日志内容之间的差异性,以及问答所需的日志上下文检索准确性不足等挑战。本研... 【目的】在智能运维(AIOps)领域,日志问答是支持团队和系统管理员高效定位和解决系统问题的重要任务。然而,现有大语言模型在日志问答中的应用面临训练语料与日志内容之间的差异性,以及问答所需的日志上下文检索准确性不足等挑战。本研究旨在提出一种新方法,提升日志问答系统的性能与泛化能力。【文献范围】文章重点调研智能运维领域中日志问答任务的研究现状,重点分析了当前大语言模型在处理系统日志方面的局限性。【方法】本文提出了一种基于检索增强的日志问答系统名为LogMind,采用迭代反馈机制联合训练检索模型与大语言模型,同时设计了一种稳定的训练策略。【结果】在6个领域的16个系统日志数据集上进行了实验,结果表明LogMind框架显著提升了检索模型与大语言模型的准确性,同时展现出较强的跨模型泛化能力。同时,本文还分析了DeepSeek推理模型在日志问答场景下的效果,展示了推理模型在问答场景下的优势。【局限】本研究主要在离线场景中评估了方法的性能,未来需进一步探索实际生产环境中的实时响应能力与系统扩展性。【结论】LogMind框架为智能运维提供了一种可靠且智能的日志问答解决方案,为高级系统管理提供了重要支持,同时为日志问答任务的研究与应用提供了新的思路。 展开更多
关键词 智能运维 日志问答 日志检索 大语言模型 问答系统
在线阅读 下载PDF
大模型时代自动问答系统及评价体系综述
20
作者 崔龙飞 王宗水 +1 位作者 鲍盈旭 赵红 《计算机工程与应用》 北大核心 2026年第5期1-17,共17页
大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模... 大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模”的训练方法和如今“注重数据和模型效率”之间的差异,系统分析基于大模型的自动问答系统新的特征。总结当前各种类型的自动问答大模型评测体系,并详细梳理自动化评价体系HELM(holistic evaluation of language model)在自动问答任务上的数据集、评价指标和量化计算方法。未来基于大模型的自动问答系统研究将会围绕多模态融合、高安全性、高可解释性、低资源消耗,以及结合大模型和自动化的综合评价体系这几个方面进一步拓展与深化。 展开更多
关键词 大模型(LMs) 自动问答(QA)系统 系统特征 HELM评价体系
在线阅读 下载PDF
上一页 1 2 103 下一页 到第
使用帮助 返回顶部