检索增强生成技术研究综述被引量：6

Comprehensive Review of Retrieval-Augmented Generation

下载PDF

导出

摘要大语言模型在自然语言处理领域表现出强大的能力,但依然面临诸如幻觉、缺乏领域特定知识等问题。检索增强生成(retrieval-augmented generation,RAG)利用大规模的外部知识库来增强模型的语义理解和生成能力,有效缓解了大语言模型所面临的部分问题,为开放域问答、文本摘要、对话系统等自然语言处理任务提供了有效的解决方案。将全面综述检索增强生成的关键技术进展,包括检索器、生成器以及各个部分优化的可能性;总结了现有的检索增强生成评估方法,探讨了当前RAG评估的局限性。最后,讨论了检索增强生成未来可能的研究方向。 Large language models have shown strong capabilities in the field of natural language processing,but still face problems such as hallucinations and lack of domain-specific knowledge.Retrieval-augmented generation(RAG)effectively alleviates some of the problems faced by large language models by utilizing large-scale external knowledge bases to enhance the semantic understanding and generation capabilities of the models,and providing an effective solution for natural language processing tasks such as open-domain question answering,text summarization,and dialogue systems.This paper comprehensively reviews the key technical advances in retrieval-augmented generation,including the retriever,generator,and the possibility of optimizing each part.In addition,it summarizes the existing retrieval-augmented generation evaluation methods and explores the limitations of the current RAG evaluation.Finally,possible future research directions for retrieval-augmented generation are discussed.

作者吴璇付涛 WU Xuan;FU Tao(Yunnan University of Finance and Economics,Kunming 650221,China)

机构地区云南财经大学

出处《计算机工程与应用》北大核心 2025年第20期19-35,共17页 Computer Engineering and Applications

基金 2025年度云南财经大学研究生创新基金(2025YUFEYC152)。

关键词检索增强生成(RAG) 大语言模型(LLM) 知识库信息检索 retrieval-augmented generation(RAG) large language model(LLM) knowledge base information retrieval

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1文森,钱力,胡懋地,常志军.基于大语言模型的问答技术研究进展综述[J].数据分析与知识发现,2024,8(6):16-29. 被引量：85
2赵悦阳,崔雷.文本嵌入技术的研究与应用进展[J].数据与计算发展前沿,2023,5(3):92-110. 被引量：7
3张艳萍,陈梅芳,田昌海,易子博,胡文鹏,罗威,罗准辰.面向军事领域知识问答系统的多策略检索增强生成方法[J].计算机应用,2025,45(3):746-754. 被引量：12

二级参考文献16

1何永强,秦勤,王俊鹏.基于深度神经网络的嵌入式向量及话题模型[J].计算机工程与设计,2016,37(12):3384-3388. 被引量：4
2Jindong Chen,Xiaoji Zhou,Xijin Tang.AN EMPIRICAL FEASIBILITY STUDY OF SOCIETAL RISK CLASSIFICATION TOWARD BBS POSTS[J].Journal of Systems Science and Systems Engineering,2018,27(6):709-726. 被引量：3
3张涛,王俊峰.基于文本嵌入特征表示的恶意软件家族分类[J].四川大学学报（自然科学版）,2019,56(3):441-449. 被引量：5
4肖琳,陈博理,黄鑫,刘华锋,景丽萍,于剑.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089. 被引量：74
5Mahdi Farnaghi,Zeinab Ghaemi,Ali Mansourian.Dynamic Spatio-Temporal Tweet Mining for Event Detection:A Case Study of Hurricane Florence[J].International Journal of Disaster Risk Science,2020,11(3):378-393. 被引量：1
6薛扬,梁循,谢华伦,杜玮.基于最优文档嵌入的《红楼梦》作者辨析[J].中文信息学报,2020,34(9):97-110. 被引量：2
7范昊,李鹏飞.基于FastText字向量与双向GRU循环神经网络的短文本情感分析研究——以微博评论文本为例[J].情报科学,2021,39(4):15-22. 被引量：24
8马建红,张少光,曹文斌,王晨曦.面向功能信息的相似专利动态聚类混合模型[J].计算机应用与软件,2021,38(5):201-207. 被引量：3
9张爽,刘非凡,罗双玲,夏昊翔.基于领域语义地图的区块链研究主题发现及演化分析[J].情报工程,2021,7(2):3-14. 被引量：3
10陈峥,任建坤,袁浩瑞.融合序列和图结构的机器阅读理解[J].中文信息学报,2021,35(4):120-128. 被引量：3

共引文献100

1张殿元,余传明.基于知识增强与多模态融合的医疗视觉问答模型[J].数据分析与知识发现,2024,8(8):226-239. 被引量：6
2文森,钱力,胡懋地,常志军.基于大语言模型的问答技术研究进展综述[J].数据分析与知识发现,2024,8(6):16-29. 被引量：85
3肖明魁.词向量嵌入在优化聚类算法中的应用[J].福建电脑,2024,40(9):1-6. 被引量：1
4叶宇,武静芬,李翔宁.人工智能赋能下的城市风貌评价理论知识图谱建构[J].世界建筑,2024(10):65-71. 被引量：3
5郑路程,李旭涛,徐敏.基于大语言模型的体检总检结论自动生成研究[J].小型微型计算机系统,2024,45(11):2569-2575. 被引量：1
6张文升,靳雅茹,郑义平.基于大型语言模型人工智能的探索与实践[J].金融科技时代,2024,32(11):24-26. 被引量：1
7王海军.矿山行业大模型建设路径探索与应用展望[J].煤炭科学技术,2024,52(11):45-59. 被引量：18
8陈俊臻,王淑营,罗浩然.融合大模型微调与图神经网络的知识图谱问答[J].计算机工程与应用,2024,60(24):166-176. 被引量：10
9张文超,王玉阳,郜勇.检索增强生成的大模型技术在医院IT运维中的应用[J].中国卫生信息管理杂志,2024,21(6):915-919. 被引量：2
10刘贝玲,张雨卉.大语言模型在图书馆采编业务中的应用展望[J].信息与管理研究,2024,9(5):14-23. 被引量：5

同被引文献38

1化柏林.知识抽取中的停用词处理技术[J].现代图书情报技术,2007(8):48-51. 被引量：41
2洪毅.“十三五”时期我国应急体系建设的几个重点问题[J].党政干部参考,2015,0(20):19-20. 被引量：14
3边原,赵俊清,王冬明,刘寅.三维重建技术在铁路BIM运维管理中的应用研究[J].铁路计算机应用,2021,30(7):85-89. 被引量：1
4张辉,刘远立,陈春花,陈宏民,韩传峰,王红卫,刘兴华,吕欣,周涛,吕孝礼,陈育德,王耀刚,毛基业,杨维中,侯世科,孟令鹏,张维,李磊,胡业飞.全球性公共卫生危机治理:趋势与重点[J].管理科学学报,2021,24(8):133-146. 被引量：22
5林峰,黄明亮,李晚莲.新时代我国应急管理的运行逻辑、困境与出路[J].岭南学刊,2022(2):23-32. 被引量：6
6裘君娜,孔长虹,金立明,徐烨彪,王翠娥,胡伟.献血咨询管理系统构建及应用[J].中国卫生质量管理,2022,29(7):94-96. 被引量：3
7李大玮,陈委娜,刘鹏,冯君祥.基于智慧城市概念模型的智慧血液网建设与应用[J].中国卫生质量管理,2023,30(1):80-83. 被引量：5
8曹书林,史佳欣,侯磊,李涓子.知识库问答研究进展与展望[J].计算机学报,2023,46(3):512-539. 被引量：23
9朱声荣,张晨,李维,计虹,王欣,席韩旭,王梦莹,张欣,李文桓.临床智能应用平台的架构设计与应用[J].中华医院管理杂志,2022,38(11):828-831. 被引量：11
10何赛克,张培杰,张玮光,於世为,曾大军.大模型时代下的决策范式转变[J].中国地质大学学报（社会科学版）,2023,23(4):82-91. 被引量：30

引证文献6

1王子炎.AIOps在铁路勘察设计信息化平台中的应用[J].微型计算机,2026(2):217-219.
2张中华,胡金先,刘宇哲.基于大模型与RAG技术的铁路智能旅服问答系统构建研究[J].高速铁路技术,2025,16(6):126-132. 被引量：1
3朱声荣,计虹.应用大语言模型深化临床辅助决策支持系统建设实践[J].中国数字医学,2026,21(3):24-29.
4印凌宇,杨波,王晨,杜渂,何之栋.面向应急响应的智能体决策经验演化机制研究[J].电信快报,2026(3):20-26.
5李大玮,陈委娜,单晓丽,刘鹏,焦淑贤.献血咨询服务系统的设计与应用[J].中国卫生质量管理,2026,33(3):67-70.
6常江,姜克儒,陈天佑,王灿,金文,韩勇.基于DeepSeek和RAG技术的复函分析知识库系统的构建[J].数字技术与应用,2026,44(3):169-174.

二级引证文献1

1何金璐,覃山,杨枝雨,零贤亮.基于AI大模型的合同智能审查关键技术研究[J].智能物联技术,2026,58(3):99-102.

1潘明星.高温烟气余热发电水汽循环腐蚀防护体系设计与工程应用[J].奥秘,2022(31):1-3.

计算机工程与应用

2025年第20期

浏览历史

内容加载中请稍等...

检索增强生成技术研究综述被引量：6

参考文献3

二级参考文献16

共引文献100

同被引文献38

引证文献6

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

检索增强生成技术研究综述 被引量：6

参考文献3

二级参考文献16

共引文献100

同被引文献38

引证文献6

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

检索增强生成技术研究综述被引量：6