期刊文献+
共找到2,087篇文章
< 1 2 105 >
每页显示 20 50 100
TCMLCM:an intelligent question-answering model for traditional Chinese medicine lung cancer based on the KG2TRAG method
1
作者 Chunfang ZHOU Qingyue GONG +2 位作者 Wendong ZHAN Jinyang ZHU Huidan LUAN 《Digital Chinese Medicine》 2025年第1期36-45,共10页
Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the know... Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the knowledge graph(KG)to text-enhanced retrievalaugmented generation(KG2TRAG)method.Methods The TCM lung cancer model(TCMLCM)was constructed by fine-tuning Chat-GLM2-6B on the specialized datasets Tianchi TCM,HuangDi,and ShenNong-TCM-Dataset,as well as a TCM lung cancer KG.The KG2TRAG method was applied to enhance the knowledge retrieval,which can convert KG triples into natural language text via ChatGPT-aided linearization,leveraging large language models(LLMs)for context-aware reasoning.For a comprehensive comparison,MedicalGPT,HuatuoGPT,and BenTsao were selected as the baseline models.Performance was evaluated using bilingual evaluation understudy(BLEU),recall-oriented understudy for gisting evaluation(ROUGE),accuracy,and the domain-specific TCM-LCEval metrics,with validation from TCM oncology experts assessing answer accuracy,professionalism,and usability.Results The TCMLCM model achieved the optimal performance across all metrics,including a BLEU score of 32.15%,ROUGE-L of 59.08%,and an accuracy rate of 79.68%.Notably,in the TCM-LCEval assessment specific to the field of TCM,its performance was 3%−12%higher than that of the baseline model.Expert evaluations highlighted superior performance in accuracy and professionalism.Conclusion TCMLCM can provide an innovative solution for TCM lung cancer QA,demonstrating the feasibility of integrating structured KGs with LLMs.This work advances intelligent TCM healthcare tools and lays a foundation for future AI-driven applications in traditional medicine. 展开更多
关键词 Traditional Chinese medicine(TCM) Lung cancer question-answering Large language model Fine-tuning Knowledge graph KG2TRAG method
暂未订购
Question-Answering Pair Matching Based on Question Classification and Ensemble Sentence Embedding
2
作者 Jae-Seok Jang Hyuk-Yoon Kwon 《Computer Systems Science & Engineering》 SCIE EI 2023年第9期3471-3489,共19页
Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,w... Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,we deal with the QA pair matching approach in QA models,which finds the most relevant question and its recommended answer for a given question.Existing studies for the approach performed on the entire dataset or datasets within a category that the question writer manually specifies.In contrast,we aim to automatically find the category to which the question belongs by employing the text classification model and to find the answer corresponding to the question within the category.Due to the text classification model,we can effectively reduce the search space for finding the answers to a given question.Therefore,the proposed model improves the accuracy of the QA matching model and significantly reduces the model inference time.Furthermore,to improve the performance of finding similar sentences in each category,we present an ensemble embedding model for sentences,improving the performance compared to the individual embedding models.Using real-world QA data sets,we evaluate the performance of the proposed QA matching model.As a result,the accuracy of our final ensemble embedding model based on the text classification model is 81.18%,which outperforms the existing models by 9.81%∼14.16%point.Moreover,in terms of the model inference speed,our model is faster than the existing models by 2.61∼5.07 times due to the effective reduction of search spaces by the text classification model. 展开更多
关键词 question-answering text classification model data augmentation text embedding
在线阅读 下载PDF
A comparative analysis of major Chinese and English online question-answering communities
3
作者 WU Dan LIU Yuan HE Daqing 《Chinese Journal of Library and Information Science》 2010年第4期61-82,共22页
This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment f... This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment from a comparative perspective was also conducted on them by using 12 questions representing for four types of questions,which are assigned evenly to three different subject fields so as to examine the task performance of these 12 selected online Q&A communities. Our goal was to evaluate those online Q&A communities in terms of their quality and efficiency for answering questions posed to them. It was hoped that our empirical research would yield greater understanding and insights to the working intricacy of these online Q&A communities and hence their possible further improvement. 展开更多
关键词 Online question answering community Comparative study Evaluation
原文传递
Chinese Question-Answering System 被引量:2
4
作者 Gai-TaiHuang Hsiu-HsenYao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第4期479-488,共10页
Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. ... Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. Usually it would be better for the system to provide the answeritself instead of requiring the user to search for the answer in a set of documents. Since Chinesetext retrieval has just been developed lately, and due to various specific characteristics ofChinese language, the approaches to its retrieval are quite different from those studies andresearches proposed to deal with Western language. Thus, an architecture that augments existingsearch engines is developed to support Chinese natural language question answering. In this paper anew approach to building Chinese question-answering system is described, which is thegeneral-purpose, fully-automated Chinese quest ion-answering system available on the web. In theapproach, we attempt to represent Chinese text by its characteristics, and try to convert theChinese text into ERE (E: entity, R: relation) relation data lists, and then to answer the questionthrough ERE relation model. The system performs quite well giving the simplicity of the techniquesbeing utilized. Experimental results show that question-answering accuracy can be greatly improvedby analyzing more and more matching ERE relation data lists. Simple ERE relation data extractiontechniques work well in our system making it efficient to use with many backend retrieval engines. 展开更多
关键词 ERE relation model conceptual schema question-answering INFORMATIONRETRIEVAL
原文传递
Question-answering system based on concepts and statistics
5
作者 LIN Hongfei YANG Zhihao ZHAO Jing 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2007年第1期23-28,共6页
Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.Th... Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.The system determines the question and focuses on the answer types,making different conceptual expansions for different questions.It applies the latent semantic indexing(LSI)method to retrieve relevant passages.It uses matching algorithms to find a match between questions and sentences stored in a database.It also extracts answers from a frequently asked questions(FAQ)database by finding matching or similar sentences.The answering ability of the system has been improved with the use of LSI and FAQ.The question-answering system introduced in Chinese universities is a developed and proven system capable of precise results. 展开更多
关键词 question-answering system concept expansion latent semantic analysis similarity of sentence passage match
原文传递
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究 被引量:5
6
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
基于协同专家系统的建筑施工大语言模型问答系统 被引量:1
7
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 大语言模型 本地知识库
在线阅读 下载PDF
面向医疗问答的KG与LLMs协同推理机制
8
作者 袁嵩 程芬 顾进广 《计算机工程与设计》 北大核心 2026年第1期252-259,共8页
针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。... 针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。引入剪枝技术去除冗余推理路径,并设计推理融合机制对LLMs诊断结果与子图推理结果进行对比,以优化推理过程。在GenMedGPT-5k和CMCQA两个数据集上进行了广泛实验,实验结果表明,所提方法在推理准确性上均优于现有基准模型。 展开更多
关键词 医疗问答 提示工程 知识图谱 大型语言模型 医疗诊断 知识图谱与LLMs结合 知识图谱增强推理
在线阅读 下载PDF
素养导向的中小学人工智能课程知识图谱构建与应用研究
9
作者 黄景修 郑孜譞 +3 位作者 赖飞宇 张舒冉 陈星宇 郑云翔 《中国电化教育》 北大核心 2026年第2期46-52,59,共8页
人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依... 人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依托广州市中小学人工智能课程教材,采用自顶向下方法构建面向中小学的课程知识图谱。为验证其有效性,研发课程知识图谱增强的大模型问答系统,并通过人工评估测试系统性能。研究结果表明,课程知识图谱通过结构化知识注入机制,显著提升了大语言模型在人工智能素养的情感、思维、知识三个维度上的问答表现。该文通过课程知识图谱与大语言模型的融合应用,探索其在教育场景中的增益效应,实现从知识体系重构到工程实践的范式跃迁,为人工智能素养教育的规模化推广提供了理论与实践耦合的技术框架。 展开更多
关键词 课程知识图谱 人工智能素养 人工智能教育 大语言模型 问答系统
在线阅读 下载PDF
基于检索增强生成和智能体的建筑材料碳排放单位换算问答模型
10
作者 阎俏 焦飞 +2 位作者 严毅 杜向华 刘鹏程 《山东大学学报(工学版)》 北大核心 2026年第1期97-104,共8页
为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步... 为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步骤构建本地知识库,设计RAG模块,为换算提供步骤参考;开发可调用计算工具的Agent,执行换算过程中的数学运算;设计提示词模板并接入大语言模型,实现基于本地知识库的文本问答。试验结果表明,所提模型能够准确回答建材的单位换算问题,支持Web端与本地控制台交互,实现单位换算结果及推理步骤的可视化。 展开更多
关键词 建筑材料碳排放 单位换算 检索增强生成 智能体 问答模型
原文传递
基于检索增强生成的化工领域大模型智能问答
11
作者 宋凯 陈泽华 +3 位作者 娄娟 陈建 董宇轩 魏啸然 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第2期212-220,共9页
化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设... 化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究. 展开更多
关键词 大语言模型 检索增强生成 化工设备设计 智能问答 复杂数据信息提取
在线阅读 下载PDF
基于知识图谱的智能问答系统设计研究
12
作者 关沧 《科技资讯》 2026年第4期25-27,共3页
基于知识图谱的智能问答系统融合知识图谱构建、自然语言处理等技术。系统通过分层架构实现数据存储、知识抽取与融合、语义理解与问答交互。知识图谱构建模块处理多源数据形成结构化知识,自然语言处理模块解析用户问题,问答逻辑处理模... 基于知识图谱的智能问答系统融合知识图谱构建、自然语言处理等技术。系统通过分层架构实现数据存储、知识抽取与融合、语义理解与问答交互。知识图谱构建模块处理多源数据形成结构化知识,自然语言处理模块解析用户问题,问答逻辑处理模块结合知识图谱完成查询推理,用户交互模块提供多形式交互。经功能与性能测试验证,系统能够准确回答问题,响应时间、吞吐量等指标满足需求,为智能问答应用提供解决方案。 展开更多
关键词 知识图谱 智能问答系统 自然语言处理 问答逻辑 系统测试
在线阅读 下载PDF
基于多粒度知识的无监督常识问答
13
作者 杨陟卓 王年楷 《中北大学学报(自然科学版)》 2026年第1期62-70,共9页
常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利... 常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利用常识知识,限制了模型在复杂场景下的推理能力。针对这一问题,本文提出了一种新颖的无监督常识问答方法,其核心优势在于通过无监督学习有效整合外部常识知识,从而提升模型的泛化能力和推理深度。首先,该方法对问题进行分类,区分科学常识问题与日常事件问题;随后,根据问题类型生成相应的知识前缀;接着,将知识前缀输入预训练语言模型,通过大模型提示生成多粒度的常识知识;最后,利用多粒度知识辅助问答推理模块进行答案生成。采用无监督方法不仅可以减少对标注数据的依赖,还能更好地适应多样化的常识场景,体现了其在实际应用中的灵活性和普适性。实验结果表明,所提方法在相关数据集上显著优于基线模型,验证了其在无监督常识问答任务中的正确性和合理性。 展开更多
关键词 常识问答 大模型提示 知识生成 答案推理
在线阅读 下载PDF
Meta-RAG:基于元数据驱动的电力领域检索增强生成框架 被引量:1
14
作者 王合庆 魏杰 +2 位作者 景红雨 宋晖 徐波 《计算机工程》 北大核心 2026年第2期383-392,共10页
大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合... 大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合了混合检索策略和经过微调的生成模型,提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析,针对电力领域的知识问答(QA)任务,提出了元数据驱动的RAG框架Meta-RAG,该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块,在此阶段,借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理,并且构建了电力领域的EleQA(Electricity Question Answering)数据集,这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段,通过多问题生成、思维链提示生成和监督指令微调数据集构建模块,优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略,结合检索和生成模块,进一步提高了答案的准确性和合理性。通过一系列实验,Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比,Meta-RAG具有更高的回答准确率和检索命中率,其中,基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3,高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大,失去检索能力整体准确率下降了0.292 8。 展开更多
关键词 EleQA数据集 元信息抽取 知识问答 电力领域 检索增强生成 模型微调 文档转换
在线阅读 下载PDF
基于解题思维机制的大语言模型多项选择阅读理解增强框架
15
作者 苏艺淞 张元哲 +3 位作者 廖祥文 卫一帆 刘康 赵军 《中文信息学报》 北大核心 2026年第1期176-187,206,共13页
多项选择阅读理解任务目标是要求模型基于给定的文章和问题从候选选项中选择正确答案。已有工作表明,尽管大语言模型在该项任务上已经达到最好性能,但其缺乏激活选项相关的思维方式,难以正确感知到给定文章、问题和选项之间的深层联系... 多项选择阅读理解任务目标是要求模型基于给定的文章和问题从候选选项中选择正确答案。已有工作表明,尽管大语言模型在该项任务上已经达到最好性能,但其缺乏激活选项相关的思维方式,难以正确感知到给定文章、问题和选项之间的深层联系并充分利用候选选项信息,故未能达到预期的性能。为此,该文提出一种基于解题思维机制的大语言模型多项选择阅读理解增强框架。具体地,该文考虑两种解题思维:按步分析和选项评估,分别从按步骤求解以获取正确选项和深入验证选项正误两方面提升大语言模型对于多项选择阅读理解题型的解题能力。为了合理利用这两种解题思维,该文进一步提出了自我激活和教师蒸馏两种提升策略,进一步提升大模型的解题效果。实验结果表明,该文所提方法相对于已有基准在六个多项选择阅读理解数据集上的平均准确率和平均严格准确率分别提升了22.61%和28.95%。 展开更多
关键词 思维链 多项选择阅读理解 问答
在线阅读 下载PDF
基于意图识别的知识图谱增强大语言模型问答方法——以防汛抢险为例
16
作者 张栋梁 马刚 +3 位作者 周伟 王旭东 张义 王小毛 《水利学报》 北大核心 2026年第2期280-292,305,共14页
利用水利专业知识图谱增强大语言模型(LLM)在防汛抢险方面的应用时,用户问句的意图识别面临语料匮乏、术语繁多、语义理解困难等挑战,现有方法在小样本意图识别中表现不佳。本文提出一种基于投票策略的多模型融合方法,在小样本条件下准... 利用水利专业知识图谱增强大语言模型(LLM)在防汛抢险方面的应用时,用户问句的意图识别面临语料匮乏、术语繁多、语义理解困难等挑战,现有方法在小样本意图识别中表现不佳。本文提出一种基于投票策略的多模型融合方法,在小样本条件下准确识别问句意图并提取图谱知识,进而开发水利领域防汛抢险知识问答系统。首先,基于领域实体识别和文本语义表示,构建了基于规则、机器学习和LLM的意图识别单体模型;其次,采用灰狼优化算法,依据单体模型表现分配权重,采用投票策略构建意图识别联合模型。进而,基于联合模型查询防汛抢险知识图谱,基于LLM开发了知识问答系统,实现了自然语言与知识图谱的高效交互。实验结果表明,联合模型在小样本意图识别任务中五折交叉验证的平均F1为0.912,显著超越了以BERT为代表的深度学习模型。所开发防汛抢险知识问答系统实现了准确高效的领域知识检索与重用,为水利知识转化利用和智慧水利建设提供了新路径。 展开更多
关键词 防汛抢险 意图识别 知识问答 投票策略 大语言模型 知识图谱
在线阅读 下载PDF
基于人在回路负反馈机制的可修正问答研究
17
作者 朱运昌 庞亮 +1 位作者 沈华伟 程学旗 《中文信息学报》 北大核心 2026年第1期163-175,共13页
问答是测试机器智能水平的重要任务。以往的研究主要关注如何提高问答模型基于语料信息的回答准确性,而忽略了问答系统对用户反馈的在线处理能力。与人类在了解初始答案错误后能够反思并修正答案的情况相比,模型在这方面的能力尚未得到... 问答是测试机器智能水平的重要任务。以往的研究主要关注如何提高问答模型基于语料信息的回答准确性,而忽略了问答系统对用户反馈的在线处理能力。与人类在了解初始答案错误后能够反思并修正答案的情况相比,模型在这方面的能力尚未得到合理的建模与研究。因此,该文提出了一种可修正问答任务,其中用户可以拒绝不满意的答案预测,而模型可以基于用户的负反馈修正答案直到被接受。为了避免规模化训练和评估中人在回路的成本,该文提出使用现有数据集中的答案标注反向模拟用户的反馈。为了赋予传统问答模型基于反馈修正答案的能力,该文还从模型的输入、嵌入和输出方面提出了三种负反馈增强方法。实验结果表明,在三个数据集模拟的交互环境下,这三种方法均具有有效性。 展开更多
关键词 问答 可修正 人在回路 负反馈
在线阅读 下载PDF
基于知识图谱与指代消解的对话式问答
18
作者 王笳辉 赵林超 +3 位作者 尹兆睿 岳昆 陈兴通 段亮 《模式识别与人工智能》 北大核心 2026年第2期170-182,共13页
如何解决对话式问答中的指示代词和长依赖现象,有效利用依赖信息,以及如何有效维护上下文查询子图,避免因不当扩展而导致的子图过度增长的风险,在上下文查询子图中精准检索问题的答案是当前对话式问答亟待解决的问题.为此,文中提出基于... 如何解决对话式问答中的指示代词和长依赖现象,有效利用依赖信息,以及如何有效维护上下文查询子图,避免因不当扩展而导致的子图过度增长的风险,在上下文查询子图中精准检索问题的答案是当前对话式问答亟待解决的问题.为此,文中提出基于知识图谱与指代消解的对话式问答模型.首先,将指代消解应用于对话式问答,利用指代消解模块获取指代簇,并提出索引替换算法,完善问题的语义信息.同时,提出词汇指代结构和字符语义两种依赖计算方式,获取依赖信息,指导上下文查询子图的扩展和答案检索.然后,为了有效扩展上下文查询子图并避免过度增长,基于依赖信息扩展查询子图,得到准确的查询子图,进而根据对话轮次和查询子图大小提出奖惩机制,有效防止子图过度增长.最后,将依赖信息用于答案检索,有效提升答案检索准确率.在ConvQuestions数据集上的实验表明文中模型的有效性. 展开更多
关键词 对话式问答 指代消解 知识图谱 查询子图
在线阅读 下载PDF
基于聚类重组和预解析的检索增强生成方法
19
作者 王文博 张志飞 +1 位作者 王睿智 苗夺谦 《智能系统学报》 北大核心 2026年第1期236-244,共9页
检索增强生成(retrieval-augmented generation,RAG)技术因具有为大语言模型(large language model,LLM)提供模型外知识的能力而受到人们的关注,然而绝大多数方法都难以同时兼顾局部的细节知识和原文中不连续的多跳知识。针对上述问题,... 检索增强生成(retrieval-augmented generation,RAG)技术因具有为大语言模型(large language model,LLM)提供模型外知识的能力而受到人们的关注,然而绝大多数方法都难以同时兼顾局部的细节知识和原文中不连续的多跳知识。针对上述问题,提出基于聚类重组和预解析的检索增强生成方法。在索引阶段,首先通过聚类算法将不连续的相关知识组合成新分块,以提高多跳知识的检索能力;然后基于提示工程对各知识分块进行预解析生成更细粒度的新分块,以提高检索阶段的召回率。在检索阶段,将召回的所有新分块还原为原文分块,并连同查询语句输入给大语言模型以得到最终答案。在数据集QuALITY上对所提出的方法进行了评估,通过消融实验和开源基线对比实验验证了方法的有效性,并在公开的评测排行榜上取得了最佳效果。本文分析结果可为RAG的索引和检索技术提供参考。 展开更多
关键词 深度学习 自然语言处理 大语言模型 向量检索 自动问答 检索增强生成 聚类算法 提示工程
在线阅读 下载PDF
MTR-QA:多类型推理问答数据集 被引量:1
20
作者 王强 姜程林 +2 位作者 马宁 李英杰 吴文社 《中国科学数据(中英文网络版)》 2026年第1期182-191,共10页
针对大语言模型在处理复杂推理任务时容易出现逻辑混乱和隐含关系捕捉不足问题,本研究提出并构建了一个覆盖多推理类型的高质量问答数据集MTR-QA(Multi-Type Reasoning Question Answering)。通过收集整理近15年的公务员考试真题与权威... 针对大语言模型在处理复杂推理任务时容易出现逻辑混乱和隐含关系捕捉不足问题,本研究提出并构建了一个覆盖多推理类型的高质量问答数据集MTR-QA(Multi-Type Reasoning Question Answering)。通过收集整理近15年的公务员考试真题与权威模拟题库,使用包括文本标准化、哈希去重、近重复检测与语义嵌入相似度过滤的多阶段文本处理框架实现数据清洗,有效降低冗余与噪声干扰。为确保数据可靠性,本研究设计了一种融合GPT-4、DeepSeek-V1和Qwen-2.5的多模型评分机制,从完整性(CPL)、准确性(ACC)、安全性(SFC)和思维链质量(CoT-Q)4个维度进行量化评估,结合人工审核对低质量样本进行过滤,消除有害性、歧义性和不安全性数据,确保数据的可靠性与严谨性,最终筛选出24,312条高质量数据,使用json格式存储,大小为34.1 MB。每条数据样本包含问题、选项、答案、思维链、类型和难度等级共6个属性,并将其分为逻辑、语义、数理和综合知识推理4大核心推理类型。MTR-QA数据集在推理类型和题材广度上实现了扩展,后续可为大语言模型预训练、监督微调和模型评估等多种推理任务提供可靠数据基础,推动大语言模型在复杂推理问答场景下的性能提升。 展开更多
关键词 大语言模型 多类型 推理问答 数据集
在线阅读 下载PDF
上一页 1 2 105 下一页 到第
使用帮助 返回顶部