为解决财务人员数字技术应用能力不足、传统财务流程中数据采集质量差导致重复返工、人工数据处理效率低等问题,设计开发了财务共享辅助系统。采用机器人流程自动化(RPA,Robotic Process Automation)和图检索增强生成(Graph RAG,Graph-b...为解决财务人员数字技术应用能力不足、传统财务流程中数据采集质量差导致重复返工、人工数据处理效率低等问题,设计开发了财务共享辅助系统。采用机器人流程自动化(RPA,Robotic Process Automation)和图检索增强生成(Graph RAG,Graph-based Retrieval-Augmented Generation)技术,实现数据填报收集、RPA自动化处理、智能问答等功能,显著提升财务报账效率,为铁路局集团公司财务共享中心的建设提供支撑。展开更多
现有的检索增强生成(RAG)问答系统在特定领域应用时,存在检索路径单一、用户潜在意图覆盖不足和召回文段质量低导致的系统回答准确性低与不全面的问题。因此,提出一种双阶段优化方法——预回答与召回过滤(PARF)。首先,通过结合领域知识...现有的检索增强生成(RAG)问答系统在特定领域应用时,存在检索路径单一、用户潜在意图覆盖不足和召回文段质量低导致的系统回答准确性低与不全面的问题。因此,提出一种双阶段优化方法——预回答与召回过滤(PARF)。首先,通过结合领域知识图谱与提示工程技术,引导大语言模型(LLM)生成预回答,构建“原始查询→预回答→相关文段”的多向检索路径,从而扩展原始查询的语义空间;其次,利用BERT(Bidirectional Encoder Representations from Transformers)模型对召回文段进行相关性评分与过滤,实现检索与生成阶段的协同优化,提升有效信息的密度。实验结果表明,相较于基线方法DPR-LLM(Dense Passage Retrieval with LLM)构建的RAG问答系统,PARF方法构建的RAG问答系统的一致性指标F1和ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation-L)在轨道交通问答数据集上分别提升19.8和41.5个百分点,在医药问答数据集上分别提升16.1和17.6个百分点,效果指标正确率分别提升10.2和8.8个百分点。展开更多
随着大语言模型(Large Language Model,简称LLM)技术的飞速发展,衍生出了对文档的检索增强生成(Retrieval-Augmented Generation,简称RAG)方法,但对于特定领域内多样化异构文档,传统RAG方法仍难以运用。面向对知识推理准确性有苛刻要求...随着大语言模型(Large Language Model,简称LLM)技术的飞速发展,衍生出了对文档的检索增强生成(Retrieval-Augmented Generation,简称RAG)方法,但对于特定领域内多样化异构文档,传统RAG方法仍难以运用。面向对知识推理准确性有苛刻要求的特定领域(如军事、医疗等),本文针对远距离知识无法关联、答案不完整、特殊领域推理能力匮乏等问题,提出了基于远亲知识联结推理的异构文档问答增强方法(简称KiRAG),该方法通过解析异构文档,抽取、构建领域知识图谱,根据问题在图谱中推理并动态召回文档分片,使LLM理解问题和生成答案时,具备完备的信息视野,以确保最终答案的完整性、合理性及准确性。实验验证表明,该方法能够有效解决军事领域异构文档的知识问答运用问题,并具备在其他相似领域泛化运用的潜力。展开更多
文摘现有的检索增强生成(RAG)问答系统在特定领域应用时,存在检索路径单一、用户潜在意图覆盖不足和召回文段质量低导致的系统回答准确性低与不全面的问题。因此,提出一种双阶段优化方法——预回答与召回过滤(PARF)。首先,通过结合领域知识图谱与提示工程技术,引导大语言模型(LLM)生成预回答,构建“原始查询→预回答→相关文段”的多向检索路径,从而扩展原始查询的语义空间;其次,利用BERT(Bidirectional Encoder Representations from Transformers)模型对召回文段进行相关性评分与过滤,实现检索与生成阶段的协同优化,提升有效信息的密度。实验结果表明,相较于基线方法DPR-LLM(Dense Passage Retrieval with LLM)构建的RAG问答系统,PARF方法构建的RAG问答系统的一致性指标F1和ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation-L)在轨道交通问答数据集上分别提升19.8和41.5个百分点,在医药问答数据集上分别提升16.1和17.6个百分点,效果指标正确率分别提升10.2和8.8个百分点。
文摘随着大语言模型(Large Language Model,简称LLM)技术的飞速发展,衍生出了对文档的检索增强生成(Retrieval-Augmented Generation,简称RAG)方法,但对于特定领域内多样化异构文档,传统RAG方法仍难以运用。面向对知识推理准确性有苛刻要求的特定领域(如军事、医疗等),本文针对远距离知识无法关联、答案不完整、特殊领域推理能力匮乏等问题,提出了基于远亲知识联结推理的异构文档问答增强方法(简称KiRAG),该方法通过解析异构文档,抽取、构建领域知识图谱,根据问题在图谱中推理并动态召回文档分片,使LLM理解问题和生成答案时,具备完备的信息视野,以确保最终答案的完整性、合理性及准确性。实验验证表明,该方法能够有效解决军事领域异构文档的知识问答运用问题,并具备在其他相似领域泛化运用的潜力。