大模型驱动的学术文本挖掘——调优端参数高效微调策略研究

Large Language Model Driven Academic Text Mining:Parameter-Efficient Fine-Tuning Strategy from the Tuning End

下载PDF

导出

摘要学术文本深度理解能力已成为情报工作重要支撑,大模型在此类工作中展现了巨大的潜力。大模型可以从推理端和调优端两个方向提升模型的知识挖掘和利用能力。当前,在领域深度相关的学术文本挖掘任务上,推理端的各类指令工程技术仍难以充分发挥大模型的深度语义理解能力,因此,在调优端使用参数高效微调技术面向领域任务对模型参数进行适配,成为大模型赋能学术文本挖掘的关键。目前尚未形成对模型应用不同调优方法的性能和效益的系统性探索。本研究构建了面向学术文本挖掘的参数高效微调框架和性能效益评测体系,通过对7类指令调优模型应用8项调优方法后的性能指标与成本效益进行评估,对参数高效微调策略与调优模型在学术文本挖掘任务上的能力边界进行探索。研究结果表明,在各类调优方法中,全量微调性能最优,但其领先优势并不显著;QLoRA(quantized low-rank adaptation)的计算成本最低,成为综合效益最高的调优方法。不同规模和架构的大模型调优后的性能差异不大,Mistral-7B-Instruct-v0.1等规模较小的模型使用QLoRA调优后可取得与百亿级模型相当的性能指标。调优后的大模型在引文功能识别、科技实体抽取、科技文本推理3类任务上的性能指标均大幅领先于其在指令端的表现;相比于传统深度学习模型,大模型在学术文本推理任务上全面领先,在科技实体抽取和引文功能识别任务上与小模型性能相近。由此可见,大模型在难度较高的复杂任务上表现更好,而对于简单的序列标注任务和分类任务,使用小模型的收益更高。 The ability to deeply understand academic texts has become a crucial support in intelligence work,and large language models(LLMs)have shown great potential in this area.LLMs can enhance knowledge extraction and utilization capabilities from both the inference end and tuning end.Currently,in academic text mining,various instruction engineering techniques at the inference end struggle to fully leverage the deep semantic understanding capabilities of LLMs.Therefore,adapting model parameters for domain-specific tasks using techniques such as parameter-efficient fine-tuning(PEFT)at the tuning end has become the key for LLMs to empower academic text mining.The performance and efficiency of applying different PEFT methods to LLMs have not yet been systematically explored.This study constructs a PEFT framework and evaluation system for academic text mining.It evaluates the performance metrics and cost-efficiency of seven instruction-tuned LLMs after applying seven PEFT methods,exploring the capability boundaries of PEFT strategies and instruction-tuned LLMs in academic text mining.The experiments demonstrate that,among the various tuning methods,finetuning achieves the best performance.However,its advantage is not significantly pronounced.By contrast,quantized lowrank adaptation(QLoRA)incurs the lowest computational cost,making it the most efficient PEFT method in terms of overall benefits.The performance differences following tuning across LLMs of varying sizes and architectures are minimal.Mistral-7B-Instruct-v0.1,which is smaller in scale,can achieve performance metrics comparable to those of models with 70B parameters when tuned with QLoRA.The LLMs show substantial improvements in performance across tasks such as citation function identification,scientific entity extraction,and scientific text reasoning,surpassing their performance on the instruction end by a significant margin.Compared with traditional deep learning models,LLMs in the tuning end comprehensively outperform in academic text reasoning tasks and perform similarly to smaller models in scientific entity extraction and citation function identification tasks.Therefore,LLMs perform better in tasks with higher difficulty,whereas small models are more beneficial for simpler sequence labeling and classification tasks.

作者刘寅鹏陆伟石湘刘家伟程齐凯黄永 Liu Yinpeng;Lu Wei;Shi Xiang;Liu Jiawei;Cheng Qikai;Huang Yong(School of Information Management,Wuhan University,Wuhan 430072;Institute of Intelligence and Innovation Governance,Wuhan University,Wuhan 430072)

机构地区武汉大学信息管理学院武汉大学智能与创新治理研究所

出处《情报学报》北大核心 2025年第9期1159-1172,共14页 Journal of the China Society for Scientific and Technical Information

基金国家自然科学基金重点项目“数智赋能的科技信息资源与知识管理理论变革”(72234005) 国家自然科学基金面上项目“基于机器阅读理解的科学命题文本论证逻辑识别”(72174157)。

关键词大模型学术文本挖掘参数高效微调策略能力评估 large language models academic text mining parameter-efficient fine-tuning(PEFT) capability evaluation

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1张智雄,于改红,刘熠,林歆,张梦婷,钱力.ChatGPT对文献情报工作的影响[J].数据分析与知识发现,2023,7(3):36-42. 被引量：111
2陆伟,刘寅鹏,石湘,刘家伟,程齐凯,黄永,汪磊.大模型驱动的学术文本挖掘--推理端指令策略构建及能力评测[J].情报学报,2024,43(8):946-959. 被引量：19
3曹树金,曹茹烨.从ChatGPT看生成式AI对情报学研究与实践的影响[J].现代情报,2023,43(4):3-10. 被引量：117
4陆伟,黄永,程齐凯.学术文本的结构功能识别——功能框架及基于章节标题的识别[J].情报学报,2014,33(9):979-985. 被引量：55
5陆伟,马永强,刘家伟,杨金庆,程齐凯.数智赋能的科研创新——基于数智技术的创新辅助框架探析[J].情报学报,2023,42(9):1009-1017. 被引量：40
6张恒,赵毅,章成志.基于SciBERT与ChatGPT数据增强的研究流程段落识别[J].情报理论与实践,2024,47(1):164-172. 被引量：12
7时宗彬,朱丽雅,乐小虬.基于本地大语言模型和提示工程的材料信息抽取方法研究[J].数据分析与知识发现,2024,8(7):23-31. 被引量：30
8陈昱成,韩涛.生成式人工智能视角下研究问题与研究方法句生成研究——以高能物理领域为例[J].情报杂志,2024,43(10):144-149. 被引量：3
9罗鹏程,王继民,聂磊.基于生成式大语言模型的文献资源自动分类研究[J].情报理论与实践,2024,47(12):174-182. 被引量：16

二级参考文献91

1马费成,张帅.我国图书情报领域新兴交叉学科发展探析[J].中国图书馆学报,2023,49(2):4-14. 被引量：40
2李雪思,张智雄,刘欢.基于BERT模型实现概念定义句自动识别[J].情报科学,2022,40(8):160-166. 被引量：4
3Koraljka Golub,Johan Hagelback,Anders Ardo.Automatic Classification of Swedish Metadata Using Dewey Decimal Classification:A Comparison of Approaches[J].Journal of Data and Information Science,2020,5(1):18-38. 被引量：2
4周晓英,赖茂生.认知过程链与情报学的新定位[J].情报资料工作,2003,24(3):5-7. 被引量：10
5王兴成.科学经济学的对象[J].国外社会科学,1982(1):71-73. 被引量：2
6Qikai Cheng,Xiaoguang Wang,Wei Lu, et al. NEViewer: A New Software for Analyzing the Evolution of Research Topics [ J ]. Proceedings of the 14th International Conference of the International Society for Scientometrics and Informetrics. 2013: 1307-1320.
7Xiaodan Zhu, Peter Turney, Daniel Lemire, et al. Measuring academic influence: Not a!l citations are equal [ J ]. Journal of the Association for Information Science and Technology, 2014 ,doi: 10. 1002/asi. 23179.
8Carole Slade. Form and Style:Research Papers, Reports, Theses [ M ]. Houghton Mifflin Company, 1997.
9Song Mao, Azriel Rosenfeld, Tapas Kanungo. Document structure analysis algorithms: a literature survey [ C ]. International Society for Optics and Photonics, 2003: 197-207.
10Simone Marinai,Marco Gori,Giovanni Soda. Artificial neural networks for document analysis and recognition [ J ]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2005, 27 ( 1 ) : 23-35.

共引文献355

1王文雨.社交媒体中公众对ChatGPT的认知与态度研究——基于社会网络视角的微博文本数据分析[J].新媒体研究,2023,9(18):97-101. 被引量：1
2商锦铃,张建勇.基于ChatGPT和提示工程的查询式摘要数据集AMTQFSum构建研究[J].数据分析与知识发现,2024,8(8):122-132. 被引量：7
3王若佳,范科鸣,刘智锋,王继民.生成式人工智能环境下用户信息检索式行为研究[J].数据分析与知识发现,2024,8(8):20-30. 被引量：28
4文俊.生成式人工智能时代的学术期刊版权风险及其应对——以ChatGPT为例[J].学报编辑论丛,2024(1):499-505. 被引量：3
5邢淼,田丽.国内外大语言模型生成中文论文摘要对比研究——以图书情报领域为例[J].知识管理论坛,2024(5):437-447.
6王益君,董韵美.公众对人工智能的认知与情感态度——以ChatGPT为例[J].知识管理论坛,2024(1):16-29. 被引量：5
7安子栋,敬卿,郝志超,余奕.基于生成式AI技术的图书馆文献资源管理创新策略[J].图书馆工作与研究,2023(S01):9-16. 被引量：39
8闫慧,贾诗威,吴兆桐,李阳,程宇.2022—2023年情报学前沿进展综述[J].情报学进展,2024(1):420-477.
9曹树金,曹茹烨,李睿婧.数智时代的知识组织研究进展[J].情报学进展,2024(1):318-347. 被引量：4
10耿国桐,卢胜军,雷帅,汤珊红,赵柯然,杨湘云.人工智能赋能情报研究的变革与发展[J].情报学进展,2024(1):278-317. 被引量：6

1孙承春,沈成成,王有明,任宪桥.人工智能在智慧电厂设备故障预测中的应用[J].北斗与空间信息应用技术,2025(4):69-72. 被引量：1
2施顺顺,苟震宇,张琳,黄颖.基于深度域适应方法的非结构化摘要功能识别研究[J].现代情报,2025,45(10):3-15. 被引量：1
3晏飞翔.基于不平衡数据的暖通空调系统故障诊断模型[J].今日制造与升级,2025(7):143-145.
4姜大从,张玉兰,卢建松.人工智能在农业领域的多元化应用[J].中国农业资源与区划,2025,46(7):38-38.
5叶佳鑫,朱乐,雷凌云,李争来,陈勇跃.词汇功能赋能的知识关联挖掘方法[J].情报杂志,2025,44(9):176-184. 被引量：1
6陈万鹏.群文艺术活动在基层文化建设中的功能与路径研究[J].中国民族博览,2025(14):78-80.
7孙荣能,刘琳,亢元召.面向lncRNA亚细胞定位预测的注意力BiLSTM与原型网络[J].计算机工程,2025,51(8):168-180.
8张敏娜,唐仁明,王光辉.抗动脉粥样硬化的细胞膜仿生纳米递药平台研究进展[J].解放军医学杂志,2025,50(8):1029-1037. 被引量：1
9潘李冬,郑建勇,古玉祺,周忠贺,许皆乐,夏立.基于BN-FCEM的燃气管道风险评估[J].化工机械,2025,52(4):674-682.
10陈楠,张锐雯,张元清.音乐管理专业人才核心能力实证研究[J].中国音乐,2025(4):182-192.

情报学报

2025年第9期

浏览历史

内容加载中请稍等...

大模型驱动的学术文本挖掘——调优端参数高效微调策略研究

参考文献9

二级参考文献91

共引文献355

相关作者

相关机构

相关主题

浏览历史