期刊文献+
共找到2,008篇文章
< 1 2 101 >
每页显示 20 50 100
TCMLCM:an intelligent question-answering model for traditional Chinese medicine lung cancer based on the KG2TRAG method
1
作者 Chunfang ZHOU Qingyue GONG +2 位作者 Wendong ZHAN Jinyang ZHU Huidan LUAN 《Digital Chinese Medicine》 2025年第1期36-45,共10页
Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the know... Objective To improve the accuracy and professionalism of question-answering(QA)model in traditional Chinese medicine(TCM)lung cancer by integrating large language models with structured knowledge graphs using the knowledge graph(KG)to text-enhanced retrievalaugmented generation(KG2TRAG)method.Methods The TCM lung cancer model(TCMLCM)was constructed by fine-tuning Chat-GLM2-6B on the specialized datasets Tianchi TCM,HuangDi,and ShenNong-TCM-Dataset,as well as a TCM lung cancer KG.The KG2TRAG method was applied to enhance the knowledge retrieval,which can convert KG triples into natural language text via ChatGPT-aided linearization,leveraging large language models(LLMs)for context-aware reasoning.For a comprehensive comparison,MedicalGPT,HuatuoGPT,and BenTsao were selected as the baseline models.Performance was evaluated using bilingual evaluation understudy(BLEU),recall-oriented understudy for gisting evaluation(ROUGE),accuracy,and the domain-specific TCM-LCEval metrics,with validation from TCM oncology experts assessing answer accuracy,professionalism,and usability.Results The TCMLCM model achieved the optimal performance across all metrics,including a BLEU score of 32.15%,ROUGE-L of 59.08%,and an accuracy rate of 79.68%.Notably,in the TCM-LCEval assessment specific to the field of TCM,its performance was 3%−12%higher than that of the baseline model.Expert evaluations highlighted superior performance in accuracy and professionalism.Conclusion TCMLCM can provide an innovative solution for TCM lung cancer QA,demonstrating the feasibility of integrating structured KGs with LLMs.This work advances intelligent TCM healthcare tools and lays a foundation for future AI-driven applications in traditional medicine. 展开更多
关键词 Traditional Chinese medicine(TCM) Lung cancer question-answering Large language model Fine-tuning Knowledge graph KG2TRAG method
暂未订购
Question-Answering Pair Matching Based on Question Classification and Ensemble Sentence Embedding
2
作者 Jae-Seok Jang Hyuk-Yoon Kwon 《Computer Systems Science & Engineering》 SCIE EI 2023年第9期3471-3489,共19页
Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,w... Question-answering(QA)models find answers to a given question.The necessity of automatically finding answers is increasing because it is very important and challenging from the large-scale QA data sets.In this paper,we deal with the QA pair matching approach in QA models,which finds the most relevant question and its recommended answer for a given question.Existing studies for the approach performed on the entire dataset or datasets within a category that the question writer manually specifies.In contrast,we aim to automatically find the category to which the question belongs by employing the text classification model and to find the answer corresponding to the question within the category.Due to the text classification model,we can effectively reduce the search space for finding the answers to a given question.Therefore,the proposed model improves the accuracy of the QA matching model and significantly reduces the model inference time.Furthermore,to improve the performance of finding similar sentences in each category,we present an ensemble embedding model for sentences,improving the performance compared to the individual embedding models.Using real-world QA data sets,we evaluate the performance of the proposed QA matching model.As a result,the accuracy of our final ensemble embedding model based on the text classification model is 81.18%,which outperforms the existing models by 9.81%∼14.16%point.Moreover,in terms of the model inference speed,our model is faster than the existing models by 2.61∼5.07 times due to the effective reduction of search spaces by the text classification model. 展开更多
关键词 question-answering text classification model data augmentation text embedding
在线阅读 下载PDF
A comparative analysis of major Chinese and English online question-answering communities
3
作者 WU Dan LIU Yuan HE Daqing 《Chinese Journal of Library and Information Science》 2010年第4期61-82,共22页
This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment f... This paper compares 12 representative Chinese and English online questionanswering communities(Q&A communities) based on their basic functions, interactive modes, and customized services. An empirical experiment from a comparative perspective was also conducted on them by using 12 questions representing for four types of questions,which are assigned evenly to three different subject fields so as to examine the task performance of these 12 selected online Q&A communities. Our goal was to evaluate those online Q&A communities in terms of their quality and efficiency for answering questions posed to them. It was hoped that our empirical research would yield greater understanding and insights to the working intricacy of these online Q&A communities and hence their possible further improvement. 展开更多
关键词 Online question answering community Comparative study Evaluation
原文传递
Chinese Question-Answering System 被引量:2
4
作者 Gai-TaiHuang Hsiu-HsenYao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第4期479-488,共10页
Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. ... Traditional Chinese text retrieval systems return a ranked list of documentsin response to a user''s request. While a ranked list of documents may be an appropriate response forthe user, frequently it is not. Usually it would be better for the system to provide the answeritself instead of requiring the user to search for the answer in a set of documents. Since Chinesetext retrieval has just been developed lately, and due to various specific characteristics ofChinese language, the approaches to its retrieval are quite different from those studies andresearches proposed to deal with Western language. Thus, an architecture that augments existingsearch engines is developed to support Chinese natural language question answering. In this paper anew approach to building Chinese question-answering system is described, which is thegeneral-purpose, fully-automated Chinese quest ion-answering system available on the web. In theapproach, we attempt to represent Chinese text by its characteristics, and try to convert theChinese text into ERE (E: entity, R: relation) relation data lists, and then to answer the questionthrough ERE relation model. The system performs quite well giving the simplicity of the techniquesbeing utilized. Experimental results show that question-answering accuracy can be greatly improvedby analyzing more and more matching ERE relation data lists. Simple ERE relation data extractiontechniques work well in our system making it efficient to use with many backend retrieval engines. 展开更多
关键词 ERE relation model conceptual schema question-answering INFORMATIONRETRIEVAL
原文传递
Question-answering system based on concepts and statistics
5
作者 LIN Hongfei YANG Zhihao ZHAO Jing 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2007年第1期23-28,共6页
Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.Th... Question-answering systems provide short answers with the use of available information.The implementation mechanism for a question answering system is presented in this paper and is based on concepts and statistics.The system determines the question and focuses on the answer types,making different conceptual expansions for different questions.It applies the latent semantic indexing(LSI)method to retrieve relevant passages.It uses matching algorithms to find a match between questions and sentences stored in a database.It also extracts answers from a frequently asked questions(FAQ)database by finding matching or similar sentences.The answering ability of the system has been improved with the use of LSI and FAQ.The question-answering system introduced in Chinese universities is a developed and proven system capable of precise results. 展开更多
关键词 question-answering system concept expansion latent semantic analysis similarity of sentence passage match
原文传递
融合DeepSeek-R1和RAG技术的先秦文化元典智能问答研究
6
作者 张强 高颖 +2 位作者 任豆豆 韩牧哲 包平 《现代情报》 北大核心 2026年第1期173-186,共14页
[目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的... [目的/意义]先秦文化元典是中华文明的源头文献,对其进行知识组织与智能应用,可以为建设中华民族现代文明提供历史依据和价值判断,增强国家文化软实力。本研究旨在基于检索增强生成(RAG)技术的先秦文化元典智能问答系统,推动相关知识的智能化应用与传承。[方法/过程]以中华书局出版的《春秋》三传为研究对象,构建先秦文化元典本体模型,采用DeepSeek-R1进行知识抽取并构建知识图谱。基于LangChain框架,运用GraphRAG、NaiveRAG、LightRAG、HybridRAG这4种RAG方法对大语言模型进行检索增强,并从定量和混合两方面评估问答能力。[结果/结论]研究结果显示,DeepSeek-R1抽取效果良好,生成的三元组能有效覆盖关键知识且质量较高。在智能问答评估中,不同RAG方法各有优劣。GraphRAG在各类问题和评估维度上表现较佳,尤其在考证溯源型、应用实践型等问题上表现突出;NaiveRAG在事实知识型问题上表现较好。综合定量与混合评估来看,根据实际应用场景选择合适的RAG技术至关重要。 展开更多
关键词 先秦文化元典 大语言模型 DeepSeek 检索增强生成 智能问答
在线阅读 下载PDF
基于细粒度特征增强的多模态视觉问答研究
7
作者 王志伟 陆振宇 《南京信息工程大学学报》 北大核心 2026年第1期35-47,共13页
现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视... 现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视觉和文本分别增加一种细粒度特征提取方法,以便更全面准确地提取图像和问题的语义特征;然后,为了利用不同层次模态之间的对齐信息,提出一种对齐引导的自注意力模块来对齐单一模态内(视觉或文本)细粒度特征和全局语义特征之间的对应关系,并以统一的方式融合不同层次的单模态信息;最后,在VQA v2.0和VQA-CP v2数据集上进行实验,结果表明,本文所提方法在各项视觉问答评估指标上的表现优于现有的模型. 展开更多
关键词 视觉问答 多模态 细粒度 特征增强 实体对齐 特征融合
在线阅读 下载PDF
基于知识图谱的舰船问答系统
8
作者 陈琨 陈思源 +3 位作者 张舵 高靖雯 李欣雨 刘军民 《工程数学学报》 北大核心 2026年第1期183-198,共16页
随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识... 随着数字化改革与海洋信息化建设的推进,对于舰船数据信息整合与知识问答的需求更加迫切。基于知识图谱的问答系统因其相较于传统搜索引擎更智能、更高效、更准确的问答体验,越来越受到研究人员的重视。构建了舰船知识图谱,并基于知识图谱实现了舰船知识问答系统的搭建。为更好地实现知识文本中三元组抽取与用户问题的意图识别,提出了一种融合BERT、卷积神经网络和注意力机制的BERT-CNN-Att命名实体识别模型,以及由BERT和双向长短时记忆网络构成的BERT-BiLSTM关系抽取模型。与知识抽取的传统神经网络不同,命名实体识别模型还引入了词汇反馈和词汇增强机制,实现了低层表征对高层信息的充分利用,极大丰富了语义的表征信息。实验结果表明,模型在命名实体识别与关系抽取任务中取得了很好的效果与明显的速度提升。此外,对问答系统架构进行了详细设计,最终构建了基于知识图谱的交互式舰船知识问答系统,测试结果显示该系统能够满足用户的舰船知识问答需求。 展开更多
关键词 知识图谱 舰船 命名实体识别 关系抽取 问答系统
在线阅读 下载PDF
基于心力衰竭领域数据增强的问答模型优化与应用
9
作者 施雪斐 郭奇 +3 位作者 马琳 秦志英 石兆峰 王肖龙 《中国医学教育技术》 2026年第1期72-79,共8页
心力衰竭是心血管领域的一种复杂疾病,对精准诊断、治疗和管理有着很高的要求。针对心力衰竭领域高精度可溯源的问答场景,本文提出了一种心力衰竭领域数据增强的问答模型优化方法。首先收集并整理大量心力衰竭相关的内容,并构建包含170... 心力衰竭是心血管领域的一种复杂疾病,对精准诊断、治疗和管理有着很高的要求。针对心力衰竭领域高精度可溯源的问答场景,本文提出了一种心力衰竭领域数据增强的问答模型优化方法。首先收集并整理大量心力衰竭相关的内容,并构建包含170余万个令牌的心力衰竭领域语料库,用于BGE-M3模型的增量预训练;其次构建超过3 200个心力衰竭专业问答的数据集,对预训练后的模型进一步进行细粒度的微调;最后将优化后的模型应用于检索增强生成(retrievalaugmented generation,RAG)中,实现了最终的问答系统。通过实验对比,较BGE-M3模型,微调后的模型与增量预训练并微调后的模型准确度分别提升了48%和52%,且在回答的精准性和内容全面性上均优于DeepSeek和通用RAG,验证了基于领域数据驱动的模型优化的有效性。本文方法证明了针对心力衰竭领域的智能化知识服务方案是实际可行的,尤其在医学教育场景中能显著提升教学效果,对于其他垂直领域的建模工作同样具有重要的参考价值。 展开更多
关键词 问答系统 RAG 模型优化 心力衰竭
在线阅读 下载PDF
农用电机故障知识图谱的构建与应用 被引量:4
10
作者 黄友锐 荣雪 +2 位作者 徐善永 韩涛 宋奇 《农业工程学报》 北大核心 2025年第6期216-226,共11页
随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法... 随着农业机械化和智能化的发展,农用电机作为主要动力来源,显著提升了农业生产效率,并推动农业向绿色化、智能化和高效化方向发展。为解决农用电机的故障可能导致的作物收获延误、经济损失和安全隐患。尽管传统机器学习和深度学习方法在电机故障诊断中展现出潜力,但其解释性不足和高成本限制了其广泛应用,亟需开发一种能够有效挖掘关键信息以指导故障维修的方法。该研究提出了一种基于多源数据异构融合的农用电机故障诊断知识图谱系统,旨在提升故障诊断效率和降低维修成本。通过实体识别与关系抽取,将非结构化数据转化为结构化数据,使用BERTBiLSTM-CRF模型进行实体识别,模型在实体识别任务中的准确率、召回率、F1值分别达到0.952 3、0.915 7、0.933 6,结合模式匹配与正则表达式进行关系抽取,并嵌入GPT模型构建智能问答系统,采用Neo4j图数据库存储电机故障知识,最终形成包含702个故障实体的图谱。研究表明,农用电机故障诊断知识图谱系统能够提升故障诊断效率,降低维修成本,增强农业生产的智能化水平,为农用电机故障诊断提供了一种高效、智能的解决方案,具有重要的应用前景和研究价值。 展开更多
关键词 知识图谱 农用电机 故障诊断 知识抽取 智能问答
在线阅读 下载PDF
基于大模型检索增强生成的气象数据库问答模型实现 被引量:9
11
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
大语言模型及其在矿物问答系统中的应用 被引量:1
12
作者 季晓慧 刘成健 +4 位作者 杨眉 何明跃 张招崇 曾姗 王玉柱 《矿物岩石地球化学通报》 北大核心 2025年第3期453-461,I0002,共10页
大语言模型(LLMs,Large Language Models)具有极强的自然语言理解和复杂问题求解能力,本文基于大语言模型构建了矿物问答系统,以高效地获取矿物知识。该系统首先从互联网资源获取矿物数据,清洗后将矿物数据结构化为矿物文档和问答对;将... 大语言模型(LLMs,Large Language Models)具有极强的自然语言理解和复杂问题求解能力,本文基于大语言模型构建了矿物问答系统,以高效地获取矿物知识。该系统首先从互联网资源获取矿物数据,清洗后将矿物数据结构化为矿物文档和问答对;将矿物文档经过格式转换和建立索引后转化为矿物知识库,用于检索增强大语言模型生成,问答对用于微调大语言模型。使用矿物知识库检索增强大语言模型生成时,采用先召回再精排的两级检索模式,以获得更好的大语言模型生成结果。矿物大语言模型微调采用了主流的低秩适配(Low-Rank Adaption,LoRA)方法,以较少的训练参数获得了与全参微调性能相当的效果,节省了计算资源。实验结果表明,基于检索增强生成的大语言模型的矿物问答系统能以较高的准确率快捷地获取矿物知识。 展开更多
关键词 大语言模型 矿物 检索增强生成 低秩适配 问答系统
原文传递
基于对抗迁移学习与孪生网络的知识库问答 被引量:1
13
作者 方义秋 李阳 葛君伟 《计算机应用与软件》 北大核心 2025年第4期289-294,共6页
传统问答方法通常存在效率不高以及未充分利用数据信息的问题。针对以上问题,在实体识别部分,利用对抗迁移学习融入中文分词边界信息提升实体识别准确性,同时提出基于全局指针的实体标注方法代替CRF提升模型训练效率;在谓词匹配部分,利... 传统问答方法通常存在效率不高以及未充分利用数据信息的问题。针对以上问题,在实体识别部分,利用对抗迁移学习融入中文分词边界信息提升实体识别准确性,同时提出基于全局指针的实体标注方法代替CRF提升模型训练效率;在谓词匹配部分,利用孪生网络的思想解决直接使用BERT获取的句向量语义表达不充分的问题。在数据集NLPCC-2016KBQA上取得了85.99%的平均F1值,表明了该方法的可行性。 展开更多
关键词 实体识别 谓词匹配 问答系统 BERT
在线阅读 下载PDF
基于检索增强生成(RAG)技术的医学教学辅助智能问答系统的构建探索 被引量:12
14
作者 丁宁 宋雨欣 +2 位作者 单泽田 董秀 于敏 《中国医学教育技术》 2025年第1期1-5,共5页
在医学教育领域,人工智能技术的应用前景广阔,但其在特定知识领域的准确性和可靠性尚须提高,这限制了其在医学教学辅助智能问答系统中的应用普及。为了解决这一问题,本研究尝试探索一种结合检索增强生成(retrieval augmented generation... 在医学教育领域,人工智能技术的应用前景广阔,但其在特定知识领域的准确性和可靠性尚须提高,这限制了其在医学教学辅助智能问答系统中的应用普及。为了解决这一问题,本研究尝试探索一种结合检索增强生成(retrieval augmented generation,RAG)技术和临床医学专业教科书知识库的方法,以提高智能问答系统的准确性和可靠性,并减少人工智能幻觉的产生。结果显示,该系统能够为医学生提供丰富、准确且可靠的医学知识资源;在准确性和可靠性方面也显著优于仅依赖大语言模型的智能平台;能为学生提供智能化的学习支持。这表明,通过整合先进的人工智能技术和专业的医学知识库,可以有效提升医学教育的质量和效率。 展开更多
关键词 生成式人工智能 医学教育 智能问答系统 幻觉问题 RAG技术
在线阅读 下载PDF
基于信息检索的知识库问答综述 被引量:9
15
作者 田萱 吴志超 《计算机研究与发展》 北大核心 2025年第2期314-335,共22页
知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答... 知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答研究进行梳理总结.首先对知识库问答的研究意义和相关定义进行介绍.然后按照模型执行过程从问句解析、信息检索、模型推理、答案生成这4个阶段阐述每个阶段面临的关键问题以及典型解决方法,对每个阶段所使用到的共性网络模块进行总结.其次针对基于信息检索的知识库问答方法的不可解释性进行分析梳理.此外,对不同特点的相关数据集和不同阶段的基线模型进行了分类介绍与总结.最后对基于信息检索的知识库问答每个执行阶段以及该领域整体发展方向进行了总结和展望. 展开更多
关键词 知识库问答 信息检索 深度学习 大语言模型 阶段性问题
在线阅读 下载PDF
面向民航飞机故障安全诊断的知识图谱构建方法 被引量:2
16
作者 朱江 谢涛 《中国安全生产科学技术》 北大核心 2025年第3期186-194,共9页
为更好地管理和利用民航飞机设备故障维修知识,提高飞机故障安全诊断的决策效率,提出融合数据增强和多尺度注意力机制的飞机设备故障知识图谱构建方法。首先,创建基于语义相似性的实体集构建模式,结合余弦相似度计算扩充数据样本。其次... 为更好地管理和利用民航飞机设备故障维修知识,提高飞机故障安全诊断的决策效率,提出融合数据增强和多尺度注意力机制的飞机设备故障知识图谱构建方法。首先,创建基于语义相似性的实体集构建模式,结合余弦相似度计算扩充数据样本。其次,采用多尺度注意力对BERT-BiLSTM-CRF模型进行优化改进,以提升知识抽取时局部和全局信息的关注度。最后,利用Neo4j图数据库搭建飞机设备故障知识图谱,并辅助开发智能问答系统用于决策推荐。研究结果表明:所提方法有效解决模型在小样本数据上的局限性,且故障文本知识抽取性能较基准模型显著提升,实体识别精确率、召回率和F 1分别达到92.59%,94.68%和93.62%,为搭建知识图谱提供可靠信息。研究结果可为实现飞机故障的高效诊断和预防飞机事故风险提供参考。 展开更多
关键词 飞机设备 故障诊断 数据增强 多尺度注意力 知识图谱 智能问答
在线阅读 下载PDF
基于大语言模型的企业碳排放分析与知识问答系统 被引量:1
17
作者 韩明 曹智轩 +2 位作者 王敬涛 段丽英 王剑宏 《计算机工程与应用》 北大核心 2025年第16期370-382,共13页
随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,... 随着全球气候变化日益严重,企业碳排放分析成为国际关注的焦点,针对通用大语言模型(large language model,LLM)知识更新滞后,增强生成架构在处理复杂问题时缺乏专业性与准确性,以及大模型生成结果中幻觉率高的问题,通过构建专有知识库,开发了基于大语言模型的企业碳排放分析与知识问答系统。提出了一种多样化索引模块构建方法,构建高质量的知识与法规检索数据集。针对碳排放报告(政策)领域的知识问答任务,提出了自提示检索增强生成架构,集成意图识别、改进的结构化思维链、混合检索技术、高质量提示工程和Text2SQL系统,支持多维度分析企业可持续性报告,为企业碳排放报告(政策)提供了一种高效、精准的知识问答解决方案。通过多层分块机制、文档索引和幻觉识别功能,确保结果的准确性与可验证性,降低了LLM技术在系统中的幻觉率。通过对比实验,所提算法在各模块的协同下在检索增强生成实验中各指标表现优异,对于企业碳排放报告的关键信息抽取和报告评价,尤其是长文本处理具有明显的优势。 展开更多
关键词 大语言模型(LLM) 知识问答系统 大模型幻觉 信息检索 提示学习
在线阅读 下载PDF
融合知识图谱和语义信息的烟叶分级问答系统 被引量:3
18
作者 陈婷 朱昌群 《湖南农业大学学报(自然科学版)》 北大核心 2025年第3期97-109,共13页
针对烟叶分级领域知识冗余且没有专业化平台用于学术检索的现状,采集多源烟叶分级数据并结合自顶向下的方法构建烟叶分级知识图谱,并以此为基础开发智能问答系统。其核心技术主要包括:1)采集烟叶分级数据,经过命名实体识别(NER)以及关... 针对烟叶分级领域知识冗余且没有专业化平台用于学术检索的现状,采集多源烟叶分级数据并结合自顶向下的方法构建烟叶分级知识图谱,并以此为基础开发智能问答系统。其核心技术主要包括:1)采集烟叶分级数据,经过命名实体识别(NER)以及关系抽取(RE)后提取三元组信息,并将其导入Neo4j平台储存;2)对于问句语义解析,采用融合图谱数据的BERT-BiGRU-MHSA-CRF模型提升问句实体识别效果,同时将自注意力机制融入BERT-TextCNN模型中,用于解析用户分级意图,再通过匹配模板并替换槽位信息以便自动化构建cypher查询语句,在Neo4j知识库中查询最精确的答案并返回。结果表明:构建的知识图谱包含6 620个实体,超过14 000条关系;基于问句实体识别模型BERT-BiGRU-MHSA-CRF的调和平均值F1为94.12%,分级意图识别模型BERT-TextCNN-Attention的F1为98.77%。综上,该系统实现了对烟叶分级相关的多类问题的快速检索和精确回答,可以为分级人员提供辅助。 展开更多
关键词 领域知识图谱 语义解析 问答系统 烟叶分级 问句实体识别 意图识别
在线阅读 下载PDF
基于大语言模型和RAG的持续交付智能问答系统 被引量:10
19
作者 鞠炜刚 汪鹏 王佳 《计算机技术与发展》 2025年第2期107-114,共8页
持续交付是一种持续的将各类变更快速、高质量地落实到生产环境的方法和技术,对提升产品竞争力越来越重要。因此迫切需要对持续交付进行规划、建设和应用,但其知识范围广、专业性强、更新快,难以有效及时获取指导和帮助,影响实施效果。... 持续交付是一种持续的将各类变更快速、高质量地落实到生产环境的方法和技术,对提升产品竞争力越来越重要。因此迫切需要对持续交付进行规划、建设和应用,但其知识范围广、专业性强、更新快,难以有效及时获取指导和帮助,影响实施效果。针对该问题,提出了一种基于大语言模型和检索增强生成(RAG)的持续交付智能问答系统构建方法。该方法通过高质量语料处理形成数据集,采用高效微调技术训练领域大模型,使用改进的向量知识检索并结合提示词工程的多场景提示词模板技术增强生成效果,实现了一种持续交付智能问答系统。实验结果表明,该系统对持续交付各环节的知识问答覆盖场景范围广,能有效提升回答的准确性,降低幻觉率,效果明显,从而极大帮助了持续交付的规划、实施和应用。提出的方法和技术具备很强的通用性,可以向更多领域的智能问答推广应用。 展开更多
关键词 持续交付 智能问答 大语言模型 检索增强生成 提示词工程
在线阅读 下载PDF
基于知识图谱的钻井顶部驱动装置故障智能诊断方法 被引量:1
20
作者 陈冬 肖远山 +2 位作者 尹志勇 张彦龙 叶智慧 《天然气工业》 北大核心 2025年第2期125-135,共11页
钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井... 钻井顶部驱动装置结构复杂、故障类型多样,现有的故障树分析法和专家系统难以有效应对复杂多变的现场情况。为此,利用知识图谱在结构化与非结构化信息融合、故障模式关联分析以及先验知识传递方面的优势,提出了一种基于知识图谱的钻井顶部驱动装置故障诊断方法,利用以Transformer为基础的双向编码器模型(Bidirectional Encoder Representations from Transformers,BERT)构建了混合神经网络模型BERT-BiLSTM-CRF与BERT-BiLSTM-Attention,分别实现了顶驱故障文本数据的命名实体识别和关系抽取,并通过相似度计算,实现了故障知识的有效融合和智能问答,最终构建了顶部驱动装置故障诊断方法。研究结果表明:①在故障实体识别任务上,BERT-BiLSTM-CRF模型的精确度达到95.49%,能够有效识别故障文本中的信息实体;②在故障关系抽取上,BERT-BiLSTM-Attention模型的精确度达到93.61%,实现了知识图谱关系边的正确建立;③开发的问答系统实现了知识图谱的智能应用,其在多个不同类型问题上的回答准确率超过了90%,能够满足现场使用需求。结论认为,基于知识图谱的故障诊断方法能够有效利用顶部驱动装置的先验知识,实现故障的快速定位与智能诊断,具备良好的应用前景。 展开更多
关键词 钻井装备 顶部驱动装置 故障诊断 深度学习 知识图谱 自然语言处理 命名实体识别 智能问答系统
在线阅读 下载PDF
上一页 1 2 101 下一页 到第
使用帮助 返回顶部