基于知识蒸馏的设备运维管理大模型应用实践

Application and practice of knowledge distillation-based large model for equipment operation and maintenance management

下载PDF

导出

摘要近年来,大语言模型(Large Language Model,LLM)的快速发展显著推动了人工智能与各垂直领域的融合应用。然而,其在工业场景的部署应用仍面临高计算开销与缺乏领域知识深度适配的双重挑战。本方案针对格物平台,构建了一套基于知识蒸馏和思维链技术的行业大模型框架。该框架通过监督微调,将大模型的推理能力和领域知识迁移到较小规模的学生模型上,从而构建出兼具高效推理能力和领域知识专精化的轻量化模型。实验结果显示,经过蒸馏微调后的Qwen2.5-7B模型在评测集上的准确率显著提升。 In recent years,the rapid development of Large Language Models has significantly promoted the integration and application of artificial intelligence in various vertical fields.However,their deployment and application in industrial scenarios still face the dual challenges of high computational overhead and the lack of in-depth adaptation of domain knowledge.This paper proposes a framework for building industry-specific large language models for the GeWu platform based on knowledge distillation and chain-of-thought techniques.Through supervised fine-tuning,this framework transfers the reasoning ability and domain knowledge of the large model to a smaller-scale student model,thereby constructing a light-weight model with both efficient reasoning ability and specialized domain knowledge.Experimental results show that the accuracy of the Qwen2.5-7B model after distillation and fine-tuning has been significantly improved on the evaluation set.

作者朱亮蒋维唐俊李子涵李朝辉 ZHU Liang;JIANG Wei;TANG Jun;LI Zihan;LI Zhaohui(China Unicom Digital Technology Co.,Ltd.)

机构地区联通数字科技有限公司

出处《江苏通信》 2025年第5期69-73,共5页 Jiangsu Communications

关键词大语言模型知识蒸馏思维链监督微调 Large Language Model knowledge distillation chain-of-thought supervised fine-tuning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1李铂鑫.面向私有问答系统的检索增强式大模型稳定输出方法[J].计算机科学与探索,2025,19(1):132-140. 被引量：4
2许世民,解冰,卢钰情,王凯.大模型技术在客服领域的智能化应用研究[J].江苏通信,2024,40(3):92-95. 被引量：4
3李荣涵,浦荣成,沈佳楠,李栋栋,苗启广.基于思维链的大语言模型知识蒸馏[J].数据采集与处理,2024,39(3):547-558. 被引量：20
4司悦航,成清,黄金才,胡星辰.基于大语言模型的时序知识图谱推理模型蒸馏方法[J].指挥与控制学报,2024,10(6):712-719. 被引量：3
5张小燕,刘月峰.基于知识蒸馏压缩混合模型的航空发动机剩余寿命预测研究[J].计算机集成制造系统,2025,31(1):290-305. 被引量：1

二级参考文献13

1杨婷婷,刘忠,朱先强,黄金才.面向知识图谱的作战体系运行机制研究[J].指挥控制与仿真,2018,40(2):15-21. 被引量：12
2梁汝鹏,邓克波,毛泽湘,徐沛.基于军事知识图谱的作战预案语义匹配方法研究[J].指挥与控制学报,2019,5(2):115-120. 被引量：18
3宋亚,夏唐斌,郑宇,卓鹏程,潘尔顺.基于Autoencoder-BLSTM的涡扇发动机剩余寿命预测[J].计算机集成制造系统,2019,25(7):1611-1619. 被引量：47
4徐涌鑫,赵俊峰,王亚沙,谢冰,杨恺.时序知识图谱表示学习[J].计算机科学,2022,49(9):162-171. 被引量：13
5安靖,司光亚,周杰,韩旭.基于知识图谱的仿真想定智能生成方法[J].指挥与控制学报,2023,9(1):103-109. 被引量：4
6白佳,杭一揆.在线服务智能化技术的应用研究--基于江苏12345政务服务热线的实践[J].江苏通信,2023,39(3):86-89. 被引量：2
7马晓亮,刘英,杜德泉,张国新.电信运营商AI客服平台技术研究与应用分析[J].电信科学,2023,39(9):141-152. 被引量：14
8夏润泽,李丕绩.ChatGPT大模型技术发展与应用[J].数据采集与处理,2023,38(5):1017-1034. 被引量：49
9徐恩庆,张琳琳,吴佳兴.政务大模型赋能数字政府创新发展路径的探索[J].通信世界,2023(22):46-47. 被引量：9
10徐敬文,贡岩,张亚琦,田正鑫.基于知识图谱的作战场景设计[J].指挥与控制学报,2023,9(5):573-579. 被引量：4

共引文献27

1褚文博,甘露,李国法,唐小林,李克强.面向自动驾驶的大模型高效压缩技术:综述[J].机械工程学报,2024,60(22):224-240. 被引量：2
2李欣桐,马素芬,张丰聪,周扬,李小童,生慧.中医药领域大语言模型的研究进展与应用前景[J].南京中医药大学学报,2024,40(12):1393-1403. 被引量：12
3李晓冬,刘小毅,王鑫鹏.基于LLM思维链的指挥控制智能体应用设想[J].指挥信息系统与技术,2024,15(6):21-27. 被引量：7
4肖明魁,张亮.大模型函数调用机制下的计算优化[J].信息技术与信息化,2025(3):22-29. 被引量：1
5叶娜.基于知识图谱的粤菜烹调工艺在线课程个性化学习路径构建[J].中外食品工业,2025(2):93-95.
6沈阳,闫佳琦,邹开元.基于DeepSeek思维链的人机协同知识生产[J].中国编辑,2025(4):95-100. 被引量：24
7蒋玲,潘小炎,韦秋文,蒋晓波,甘嘉亮.生成式大语言模型在临床教学案例库构建中的探索[J].广西医学,2025,47(3):478-483. 被引量：1
8钱波,李富江,郑常乐,张道强.医疗大模型发展现状与展望[J].数据采集与处理,2025,40(3):562-584. 被引量：4
9王丽丽.基于大语言模型的高校图书馆传统文化阅读推广的知识图谱构建及优化路径[J].情报科学,2024,42(12):130-140. 被引量：1
10陶亚辉,杨军,冯嘉琪.基于RAG架构的私域教学智能问答系统设计与实现[J].信息与电脑,2025,37(11):130-132. 被引量：6

1冯铁.凹坐格物[J].上海文学,2025(12):87-87.
2董勇.小学数学单元作业的类型与设计[J].华夏教师,2025(23):98-100. 被引量：1
3郑小洪.浅谈小学数学生活化教学[J].故事家(下),2025(11):148-150.
4邓云.知识图谱赋能高校课程创新研究——以《计算机网络》课程为例[J].现代教育与实践,2025,7(23):46-48.
5覃睿.初中化学学业水平考试与课程标准一致性研究[J].中学化学教学参考,2025(33):74-77.
6周苏洋.宋元山水画笔法流变探赜[J].中国书画,2025(9):4-8.

江苏通信

2025年第5期

浏览历史

内容加载中请稍等...

基于知识蒸馏的设备运维管理大模型应用实践

参考文献5

二级参考文献13

共引文献27

相关作者

相关机构

相关主题

浏览历史