期刊文献+
共找到2,054篇文章
< 1 2 103 >
每页显示 20 50 100
TCMLCM:an intelligent question-answering model for traditional Chinese medicine lung cancer based on the KG2TRAG method
1
作者 Chunfang ZHOU Qingyue GONG +2 位作者 Wendong ZHAN Jinyang ZHU Huidan LUAN 《Digital Chinese Medicine》 2025年第1期36-45,共10页
Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the know... Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the knowledge graph(KG)to text-enhanced retrievalaugmented generation(KG2TRAG)method.Methods The TCM lung cancer model(TCMLCM)was constructed by fine-tuning Chat-GLM2-6B on the specialized datasets Tianchi TCM,HuangDi,and ShenNong-TCM-Dataset,as well as a TCM lung cancer KG.The KG2TRAG method was applied to enhance the knowledge retrieval,which can convert KG triples into natural language text via ChatGPT-aided linearization,leveraging large language models(LLMs)for context-aware reasoning.For a comprehensive comparison,MedicalGPT,HuatuoGPT,and BenTsao were selected as the baseline models.Performance was evaluated using bilingual evaluation understudy(BLEU),recall-oriented understudy for gisting evaluation(ROUGE),accuracy,and the domain-specific TCM-LCEval metrics,with validation from TCM oncology experts assessing answer accuracy,professionalism,and usability.Results The TCMLCM model achieved the optimal performance across all metrics,including a BLEU score of 32.15%,ROUGE-L of 59.08%,and an accuracy rate of 79.68%.Notably,in the TCM-LCEval assessment specific to the field of TCM,its performance was 3%−12%higher than that of the baseline model.Expert evaluations highlighted superior performance in accuracy and professionalism.Conclusion TCMLCM can provide an innovative solution for TCM lung cancer QA,demonstrating the feasibility of integrating structured KGs with LLMs.This work advances intelligent TCM healthcare tools and lays a foundation for future AI-driven applications in traditional medicine. 展开更多
关键词 Traditional Chinese medicine(TCM) Lung cancer question-answering Large language model Fine-tuning Knowledge graph KG2TRAG method
暂未订购
Question-Answering Pair Matching Based on Question Classification and Ensemble Sentence Embedding
2
作者 Jae-Seok Jang Hyuk-Yoon Kwon 《Computer Systems Science & Engineering》 SCIE EI 2023年第9期3471-3489,共19页
Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,w... Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,we deal with the QA pair matching approach in QA models,which finds the most relevant question and its recommended answer for a given question.Existing studies for the approach performed on the entire dataset or datasets within a category that the question writer manually specifies.In contrast,we aim to automatically find the category to which the question belongs by employing the text classification model and to find the answer corresponding to the question within the category.Due to the text classification model,we can effectively reduce the search space for finding the answers to a given question.Therefore,the proposed model improves the accuracy of the QA matching model and significantly reduces the model inference time.Furthermore,to improve the performance of finding similar sentences in each category,we present an ensemble embedding model for sentences,improving the performance compared to the individual embedding models.Using real-world QA data sets,we evaluate the performance of the proposed QA matching model.As a result,the accuracy of our final ensemble embedding model based on the text classification model is 81.18%,which outperforms the existing models by 9.81%∼14.16%point.Moreover,in terms of the model inference speed,our model is faster than the existing models by 2.61∼5.07 times due to the effective reduction of search spaces by the text classification model. 展开更多
关键词 question-answering text classification model data augmentation text embedding
在线阅读 下载PDF
A comparative analysis of major Chinese and English online question-answering communities
3
作者 WU Dan LIU Yuan HE Daqing 《Chinese Journal of Library and Information Science》 2010年第4期61-82,共22页
This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment f... This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment from a comparative perspective was also conducted on them by using 12 questions representing for four types of questions,which are assigned evenly to three different subject fields so as to examine the task performance of these 12 selected online Q&A communities. Our goal was to evaluate those online Q&A communities in terms of their quality and efficiency for answering questions posed to them. It was hoped that our empirical research would yield greater understanding and insights to the working intricacy of these online Q&A communities and hence their possible further improvement. 展开更多
关键词 Online question answering community Comparative study Evaluation
原文传递
Chinese Question-Answering System 被引量:2
4
作者 Gai-TaiHuang Hsiu-HsenYao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第4期479-488,共10页
Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. ... Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. Usually it would be better for the system to provide the answeritself instead of requiring the user to search for the answer in a set of documents. Since Chinesetext retrieval has just been developed lately, and due to various specific characteristics ofChinese language, the approaches to its retrieval are quite different from those studies andresearches proposed to deal with Western language. Thus, an architecture that augments existingsearch engines is developed to support Chinese natural language question answering. In this paper anew approach to building Chinese question-answering system is described, which is thegeneral-purpose, fully-automated Chinese quest ion-answering system available on the web. In theapproach, we attempt to represent Chinese text by its characteristics, and try to convert theChinese text into ERE (E: entity, R: relation) relation data lists, and then to answer the questionthrough ERE relation model. The system performs quite well giving the simplicity of the techniquesbeing utilized. Experimental results show that question-answering accuracy can be greatly improvedby analyzing more and more matching ERE relation data lists. Simple ERE relation data extractiontechniques work well in our system making it efficient to use with many backend retrieval engines. 展开更多
关键词 ERE relation model conceptual schema question-answering INFORMATIONRETRIEVAL
原文传递
Question-answering system based on concepts and statistics
5
作者 LIN Hongfei YANG Zhihao ZHAO Jing 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2007年第1期23-28,共6页
Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.Th... Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.The system determines the question and focuses on the answer types,making different conceptual expansions for different questions.It applies the latent semantic indexing(LSI)method to retrieve relevant passages.It uses matching algorithms to find a match between questions and sentences stored in a database.It also extracts answers from a frequently asked questions(FAQ)database by finding matching or similar sentences.The answering ability of the system has been improved with the use of LSI and FAQ.The question-answering system introduced in Chinese universities is a developed and proven system capable of precise results. 展开更多
关键词 question-answering system concept expansion latent semantic analysis similarity of sentence passage match
原文传递
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究 被引量:1
6
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
面向医疗问答的KG与LLMs协同推理机制
7
作者 袁嵩 程芬 顾进广 《计算机工程与设计》 北大核心 2026年第1期252-259,共8页
针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。... 针对现有大型语言模型(LLMs)在医学推理任务中存在的隐式知识利用不足、推理路径冗余及透明度缺失等问题,提出一种基于协同推理的医学问答方法。构建推理子图学习医学知识的显式关联,并利用LLMs的隐式知识进行初步诊断,扩展关键实体。引入剪枝技术去除冗余推理路径,并设计推理融合机制对LLMs诊断结果与子图推理结果进行对比,以优化推理过程。在GenMedGPT-5k和CMCQA两个数据集上进行了广泛实验,实验结果表明,所提方法在推理准确性上均优于现有基准模型。 展开更多
关键词 医疗问答 提示工程 知识图谱 大型语言模型 医疗诊断 知识图谱与LLMs结合 知识图谱增强推理
在线阅读 下载PDF
素养导向的中小学人工智能课程知识图谱构建与应用研究
8
作者 黄景修 郑孜譞 +3 位作者 赖飞宇 张舒冉 陈星宇 郑云翔 《中国电化教育》 北大核心 2026年第2期46-52,59,共8页
人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依... 人工智能重构教育系统背景下,构建中小学人工智能课程知识图谱是智能化人才培养的重要举措。然而,现有研究多集中于高等教育领域,缺乏与核心素养目标的深度融合,难以满足中小学人工智能教育需求。为此,该文以人工智能素养框架为指导,依托广州市中小学人工智能课程教材,采用自顶向下方法构建面向中小学的课程知识图谱。为验证其有效性,研发课程知识图谱增强的大模型问答系统,并通过人工评估测试系统性能。研究结果表明,课程知识图谱通过结构化知识注入机制,显著提升了大语言模型在人工智能素养的情感、思维、知识三个维度上的问答表现。该文通过课程知识图谱与大语言模型的融合应用,探索其在教育场景中的增益效应,实现从知识体系重构到工程实践的范式跃迁,为人工智能素养教育的规模化推广提供了理论与实践耦合的技术框架。 展开更多
关键词 课程知识图谱 人工智能素养 人工智能教育 大语言模型 问答系统
在线阅读 下载PDF
基于检索增强生成和智能体的建筑材料碳排放单位换算问答模型
9
作者 阎俏 焦飞 +2 位作者 严毅 杜向华 刘鹏程 《山东大学学报(工学版)》 北大核心 2026年第1期97-104,共8页
为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步... 为解决建筑材料生产及运输阶段碳排放计算时建筑材料计量单位与碳排放因子单位不匹配的问题,提出一种基于检索增强生成(retrieval-augmented generation,RAG)和智能体(Agent)的建筑材料碳排放单位换算问答模型。通过解析典型材料换算步骤构建本地知识库,设计RAG模块,为换算提供步骤参考;开发可调用计算工具的Agent,执行换算过程中的数学运算;设计提示词模板并接入大语言模型,实现基于本地知识库的文本问答。试验结果表明,所提模型能够准确回答建材的单位换算问题,支持Web端与本地控制台交互,实现单位换算结果及推理步骤的可视化。 展开更多
关键词 建筑材料碳排放 单位换算 检索增强生成 智能体 问答模型
原文传递
基于协同专家系统的建筑施工大语言模型问答系统
10
作者 杨彬 肖鸿儒 +4 位作者 高尚 雷克 陈文硕 张其林 汪丛军 《同济大学学报(自然科学版)》 北大核心 2026年第1期13-21,30,共10页
为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成... 为解决大型语言模型问答系统在建筑施工场景中存在的生成幻觉与部署成本高的问题,提出了一种基于协同专家机制的大型语言模型施工问答系统。该系统通过共享专家与路由专家的协同工作方式,在保证模型表达能力的同时,显著提升了问答生成的准确性与推理效率,并有效降低了计算开销。此外,设计了一种领域知识库注入的微调策略,在训练阶段引导模型深度学习施工领域专业语义,从而增强其对工程文本的理解能力,确保生成结果更加符合实际工程需求。实验结果表明,在仅激活约1/3模型参数的情况下,所提出系统仍可达到81.1%的生成语义相似度,兼顾了效率与性能,为建筑施工管理提供了一种高效、可靠且具备工程针对性的智能决策支持工具。 展开更多
关键词 建筑施工 智能建造 问答系统 大语言模型 本地知识库
在线阅读 下载PDF
基于检索增强生成的化工领域大模型智能问答
11
作者 宋凯 陈泽华 +3 位作者 娄娟 陈建 董宇轩 魏啸然 《天津大学学报(自然科学与工程技术版)》 北大核心 2026年第2期212-220,共9页
化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设... 化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究. 展开更多
关键词 大语言模型 检索增强生成 化工设备设计 智能问答 复杂数据信息提取
在线阅读 下载PDF
基于多粒度知识的无监督常识问答
12
作者 杨陟卓 王年楷 《中北大学学报(自然科学版)》 2026年第1期62-70,共9页
常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利... 常识性问答(Commonsense Question Answering,CQA)是一项比传统问答任务更具挑战性的自然语言理解任务,它要求模型具备更强的常识推理能力。目前,基于无监督方法的常识问答在若干数据集上取得了较好的性能,但这些方法难以充分挖掘和利用常识知识,限制了模型在复杂场景下的推理能力。针对这一问题,本文提出了一种新颖的无监督常识问答方法,其核心优势在于通过无监督学习有效整合外部常识知识,从而提升模型的泛化能力和推理深度。首先,该方法对问题进行分类,区分科学常识问题与日常事件问题;随后,根据问题类型生成相应的知识前缀;接着,将知识前缀输入预训练语言模型,通过大模型提示生成多粒度的常识知识;最后,利用多粒度知识辅助问答推理模块进行答案生成。采用无监督方法不仅可以减少对标注数据的依赖,还能更好地适应多样化的常识场景,体现了其在实际应用中的灵活性和普适性。实验结果表明,所提方法在相关数据集上显著优于基线模型,验证了其在无监督常识问答任务中的正确性和合理性。 展开更多
关键词 常识问答 大模型提示 知识生成 答案推理
在线阅读 下载PDF
医学视觉问答中图像与答案一致性验证方法研究
13
作者 从浩 刘利军 杨小兵 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期118-127,共10页
针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过... 针对医学视觉问答(medical visual question answering,Med-VQA)中多模态特征融合不足和图像答案不匹配导致模型准确率不高的问题,构建了图像答案一致性验证(image and answer consistency verification,IACV)模型。在预训练阶段,通过结合多个预训练任务,增强模型的多模态特征提取与融合能力。在微调阶段,利用部位信息对图像进行部位划分,生成答案掩码矩阵,并对最终答案进行一致性验证,从而提升模型准确率。实验结果表明,IACV模型在公共数据集VQA-RAD和SLAKE上的准确率分别达到78.9%和84.6%,显著提高了Med-VQA任务的准确性,为后续的应用提供了更可靠的支持。 展开更多
关键词 医学视觉问答(Med-VQA) 答案掩码矩阵 一致性验证 预训练
在线阅读 下载PDF
基于细粒度特征增强的多模态视觉问答研究
14
作者 王志伟 陆振宇 《南京信息工程大学学报》 北大核心 2026年第1期35-47,共13页
现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视... 现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视觉和文本分别增加一种细粒度特征提取方法,以便更全面准确地提取图像和问题的语义特征;然后,为了利用不同层次模态之间的对齐信息,提出一种对齐引导的自注意力模块来对齐单一模态内(视觉或文本)细粒度特征和全局语义特征之间的对应关系,并以统一的方式融合不同层次的单模态信息;最后,在VQA v2.0和VQA-CP v2数据集上进行实验,结果表明,本文所提方法在各项视觉问答评估指标上的表现优于现有的模型. 展开更多
关键词 视觉问答 多模态 细粒度 特征增强 实体对齐 特征融合
在线阅读 下载PDF
表格问答研究综述
15
作者 吴贤杰 李彤亮 李舟军 《计算机科学》 北大核心 2026年第3期295-306,共12页
表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语... 表格作为一种重要的数据载体,能以紧凑的形式承载大量高价值信息,被广泛应用于经济、金融及科研等领域。表格问答(Table Question Answering,TableQA)旨在针对用自然语言描述的问题,从表格数据中自动进行推理并生成相应的答案,是自然语言处理与数据分析交叉领域的重要研究方向。与传统的文本问答和知识库问答相比,表格问答不仅需要理解自然语言,还须解析表格的二维结构,并处理数值计算与复杂逻辑推理,因此面临更大的挑战。近年来,随着多样化数据集的持续构建,表格问答技术不断取得进展。其研究范式经历了从基于规则与模板的方法,到统计学习与神经网络模型的应用,再到预训练语言模型的引入,整体性能不断提升。尤其是近年来大语言模型(Large Language Models,LLMs)的兴起,进一步推动了表格问答进入新的发展阶段。凭借卓越的跨任务泛化能力与推理能力,大语言模型加速了新型研究范式的形成与发展,为方法创新提供了有力支撑。文中系统梳理了表格问答技术的演进脉络与代表性方法,重点总结了大语言模型驱动下的最新研究进展,概述了当前研究面临的关键挑战,并对未来发展趋势进行了展望。 展开更多
关键词 表格问答 表格推理 大语言模型 自然语言处理
在线阅读 下载PDF
智能问答系统逻辑推理测试
16
作者 沈庆超 李行健 +3 位作者 姜佳君 陈俊洁 齐一先 王赞 《软件学报》 北大核心 2026年第2期543-562,共20页
智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修... 智能问答系统利用信息检索和自然语言处理技术,实现对问题的自动化回复.然而,与其他人工智能软件相似,智能问答系统同样存在缺陷.存在缺陷的智能问答系统会降低用户体验,造成企业的经济损失,甚至引发社会层面的恐慌.因此,及时检测并修复智能问答系统中的缺陷至关重要.目前,智能问答系统自动测试方法主要分为两类.其一,基于问题与预测答案合成假定事实,并基于假定事实生成新问题和预期答案,以此揭示问答系统中的缺陷.其二,从现有数据集中提取不影响原问题答案的知识片段并融入原始测试输入中生成答案一致的新测试输入,实现对问答系统的缺陷检测任务.然而,这两类方法均着重于测试模型的语义理解能力,未能充分测试模型的逻辑推理能力.此外,这两类方法分别依赖于问答系统的回答范式和模型自带的数据集来生成新的测试用例,限制了其在基于大规模语言模型的问答系统中的测试效能.针对上述挑战,提出一种逻辑引导的蜕变测试技术QALT.QALT设计了3种逻辑相关的蜕变关系,并使用了语义相似度度量和依存句法分析等技术指导生成高质量的测试用例,实现对智能问答系统的精准测试.实验结果表明,QALT在两类智能问答系统上一共检测9247个缺陷,分别比当前两种最先进的技术(即QAQA和QAAskeR)多检测3150和3897个缺陷.基于人工采样标注结果的统计分析,QALT在两个智能问答系统上检测到真阳性缺陷的期望数量总和为8073,预期比QAQA和QAAskeR分别多检测2142和4867个真阳性缺陷.此外,使用QALT生成的测试输入通过模型微调对被测软件中的缺陷进行修复.微调后模型的错误率成功地从22.33%降至14.37%. 展开更多
关键词 智能问答系统 测试用例生成 蜕变测试 大型语言模型
在线阅读 下载PDF
Meta-RAG:基于元数据驱动的电力领域检索增强生成框架
17
作者 王合庆 魏杰 +2 位作者 景红雨 宋晖 徐波 《计算机工程》 北大核心 2026年第2期383-392,共10页
大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合... 大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合了混合检索策略和经过微调的生成模型,提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析,针对电力领域的知识问答(QA)任务,提出了元数据驱动的RAG框架Meta-RAG,该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块,在此阶段,借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理,并且构建了电力领域的EleQA(Electricity Question Answering)数据集,这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段,通过多问题生成、思维链提示生成和监督指令微调数据集构建模块,优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略,结合检索和生成模块,进一步提高了答案的准确性和合理性。通过一系列实验,Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比,Meta-RAG具有更高的回答准确率和检索命中率,其中,基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3,高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大,失去检索能力整体准确率下降了0.292 8。 展开更多
关键词 EleQA数据集 元信息抽取 知识问答 电力领域 检索增强生成 模型微调 文档转换
在线阅读 下载PDF
大模型时代自动问答系统及评价体系综述
18
作者 崔龙飞 王宗水 +1 位作者 鲍盈旭 赵红 《计算机工程与应用》 北大核心 2026年第5期1-17,共17页
大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模... 大模型时代,自动问答系统呈现出诸多新的特征。通过文献阅读和梳理,对自动问答系统特征和评测体系进行总结与归纳,从问答模型推理训练的训练数据、预训练框架、模型后处理、模型高效微调等阶段,对比大模型发展初期“追求数据和参数规模”的训练方法和如今“注重数据和模型效率”之间的差异,系统分析基于大模型的自动问答系统新的特征。总结当前各种类型的自动问答大模型评测体系,并详细梳理自动化评价体系HELM(holistic evaluation of language model)在自动问答任务上的数据集、评价指标和量化计算方法。未来基于大模型的自动问答系统研究将会围绕多模态融合、高安全性、高可解释性、低资源消耗,以及结合大模型和自动化的综合评价体系这几个方面进一步拓展与深化。 展开更多
关键词 大模型(LMs) 自动问答(QA)系统 系统特征 HELM评价体系
在线阅读 下载PDF
面向遥感视觉问答的跨模态知识引入与提示推理框架
19
作者 董欣 俞鹏飞 顾晶晶 《计算机科学与探索》 北大核心 2026年第3期760-772,共13页
随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以... 随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以及文本问题表达形式多样等挑战。为了应对这些挑战,提出一种面向RSVQA的跨模态知识引入与提示推理框架(CMKIP)。针对遥感图像的高复杂度,CMKIP为大语言模型LLaMA构建可学习的图像特征适配器,以具备对复杂图像的表征能力;针对遥感图像-文本对齐数据稀缺问题,构建自动化数据生成管道,从公开遥感数据集中生成高质量的图像-文本对,实现高效的遥感领域知识注入;针对问题表达的多样性,创新性地提出一种大小模型协同推理机制,利用小模型进行知识库检索与中间推理校正,显著提升大语言模型对多样化问题的理解能力与推理准确性。此外,CMKIP支持根据任务需求灵活更换小模型,可广泛应用于遥感领域的多项下游任务。实验结果表明,CMKIP在RSVQA基准数据集上的性能显著优于现有方法,特别是在低样本场景下表现尤为突出,展示了其在RSVQA任务中的有效性和泛化性。 展开更多
关键词 遥感视觉问答 大语言模型 跨模态扩展 遥感微调指令集 轻量级模型 提示推理
在线阅读 下载PDF
基于知识图谱的舰船问答系统
20
作者 陈琨 陈思源 +3 位作者 张舵 高靖雯 李欣雨 刘军民 《工程数学学报》 北大核心 2026年第1期183-198,共16页
随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识... 随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识图谱实现了舰船知识问答系统的搭建。为更好地实现知识文本中三元组抽取与用户问题的意图识别,提出了一种融合BERT、卷积神经网络和注意力机制的BERT-CNN-Att命名实体识别模型,以及由BERT和双向长短时记忆网络构成的BERT-BiLSTM关系抽取模型。与知识抽取的传统神经网络不同,命名实体识别模型还引入了词汇反馈和词汇增强机制,实现了低层表征对高层信息的充分利用,极大丰富了语义的表征信息。实验结果表明,模型在命名实体识别与关系抽取任务中取得了很好的效果与明显的速度提升。此外,对问答系统架构进行了详细设计,最终构建了基于知识图谱的交互式舰船知识问答系统,测试结果显示该系统能够满足用户的舰船知识问答需求。 展开更多
关键词 知识图谱 舰船 命名实体识别 关系抽取 问答系统
在线阅读 下载PDF
上一页 1 2 103 下一页 到第
使用帮助 返回顶部