基于大语言模型的审计领域命名实体识别算法研究被引量：2

Study on Named Entity Recognition Algorithms in Audit Domain Based on Large Language Models

下载PDF

导出

摘要随着ChatGPT的出现,从通用领域到专业领域,大语言模型开始在各行各业发挥着重要作用。审计领域与人工智能结合的方法不断涌现,但是传统人工智能方法的准确率远低于现有大语言模型,因此大语言模型在审计领域中的应用仍需进一步研究。在审计领域中,通过人工智能方法智能识别出文本中的有用实体可以极大提升工作效率,减少错误情况。传统的审计文本实体识别算法主要是基于机器学习结合特征工程,这种方法准确率普遍较低。鉴于此,研究几种常见的开源模型(如Llama等)和闭源模型(如ChatGPT等)在审计文本实体识别中的应用,同时结合上下文学习技术提升模型识别效果,有效提升了识别准确率。其中,上下文学习技术结合了基于相似度选择的样例组织方式,实体识别准确率最高提升至98.3%,取得了较好的效果。 With the emergence of ChatGPT,large language models have begun to play a significant role across various industries,from general fields to specialized domains.Although there have been methods combining artificial intelligence with auditing,the application of large language models in auditing still needs further research due to the fact that the accuracy of traditional artificial intelligence methods is much lower than that of existing large language models.The use of AI methods to intelligently identify useful entities within text in auditing can greatly enhance work efficiency and reduce errors.Conventional auditing text entity recognition algorithms primarily rely on machine learning combined with feature engineering,which generally results in lower accuracy.In light of this,this study investigates the applications of several common open-source models(such as Llama)and closed-source models(such as ChatGPT)in auditing text entity recognition,while integrating contextual learning techniques to improve model recognition performance.The results demonstrate that by employing a sample organization method based on similarity selection,the accuracy of entity recognition can be improved to 98.3%,achieving notable improvements.

作者户才顺 HU Caishun(Naval University of Engineering,Wuhan 430000,China)

机构地区海军工程大学

出处《计算机科学》北大核心 2025年第S1期60-63,共4页 Computer Science

关键词审计大语言模型 ChatGPT 命名实体识别上下文学习 Audit Large language models ChatGPT Named entity recognition In-context learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1张玥杰,徐智婷,薛向阳.融合多特征的最大熵汉语命名实体识别模型[J].计算机研究与发展,2008,45(6):1004-1010. 被引量：37

二级参考文献12

1Volk Martin, Clematide Simon. Learn-filter-apply-forget mixed approaches to named entity recognition [C]. In: Proc of the 6th Int'l Workshop on Applications of Natural Language for Information Systems. Berlin: Springer, 2001. 153-163.
2Y Z Wu, J Zhao, B Xu. Chinese named entity based on multiple features [C]. Human Language Technology Conference and Conf on Empirical Methods in Natural Language Processing (EMNLP-2005), Vancouver, Canada, 2005.
3H P Zhang, Q Liu, H Zhang, et al. Automatic recognition of Chinese unknown words based on roles tagging [C]. SigHan2002 Workshop Attached with the 19th Int'l Conf on Computational Linguistics, Taipei, 2002.
4O Bender, F J Och, H Ney. Maximum entropy models for named entity recognition [C]. The 7th Conf on Computational Natural Language Learning (CoNLL 2003), Edmonton, Canada, 2003.
5H L Chieu, H T Ng. Named entity recognition with a maximum entropy approach [C]. The 7th Conf on Computational Natural Language Learning (CoNLL 2003), Edmonton, Canada, 2003.
6A Berger, V J Della Pietra, S A Della Pietra. A maximum entropy approach to natural language processing [J]. Computational Linguistics, 1996, 22(1): 39-71.
7Ramaparkhi Adwait. A simple introduction to maximum entropy models for natural language processing [R]. Institute for Research in Cognitive Science Report,.
8J N Darroch, D Ratcliff. Generalized iterative scaling for loglinear models [J]. The Annals of Mathematical Statistics, 1972, 43(5): 1470-1480.
9Y Z Wu, J Zhao, B Xu. Chinese named entity recognition combining a statistical model with human knowledge [C]. The 41st Annual Meeting of the Association for Computational Linguistics (ACL-2003), Sapporo, 2003.
10T H Tsai, S H Wu, C W Lee, etal. Mencius: a Chinese named entity recognizer using maximum entropy-based hybrid model [J]. Computational Linguistics & Chinese Language Processing, 2004, 9(1): 65-82.

共引文献36

1高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量：7
2许晓丽,卢志茂,张格森.基于条件随机场的中文命名实体识别研究[J].中国新技术新产品,2009(2):15-15. 被引量：3
3刘鹏博,车海燕,陈伟.知识抽取技术综述[J].计算机应用研究,2010,27(9):3222-3226. 被引量：17
4滕青青,吉久明,郑荣廷,李楠.基于文献的中文命名实体识别算法适用性分析研究[J].情报杂志,2010,29(9):157-161. 被引量：9
5李丽双,党延忠,李丹.基于修正SVM-KNN组合算法的汉语专有名词自动抽取[J].情报学报,2011,30(6):610-617. 被引量：2
6张俊三,瞿有利,税仪冬,田盛丰.相关实体发现中基于Wikipedia的实体排序[J].计算机研究与发展,2014,51(6):1359-1372. 被引量：1
7易应萍,张志强,王强.基于自然语言处理技术的医学命名实体解析研究[J].中国数字医学,2018,13(12):20-22. 被引量：3
8王路路,艾山·吾买尔,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音.基于CRF和半监督学习的维吾尔文命名实体识别[J].中文信息学报,2018,32(11):16-26. 被引量：15
9林雄鹰,黄宇光.基于规则和混合统计模型的中文地名识别研究[J].高性能计算技术,2012,0(1):31-35.
10柏兵,侯霞,石松.基于CRF和BI-LSTM的命名实体识别方法[J].北京信息科技大学学报（自然科学版）,2018,33(6):27-33. 被引量：19

同被引文献10

1郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：95
2谢腾,杨俊安,刘辉.基于BERT-BiLSTM-CRF模型的中文实体识别[J].计算机系统应用,2020,29(7):48-55. 被引量：131
3肖唐金,肖志鹏.国外口述史研究的范式、方法、应用与中国口述史研究的耦合[J].贵州民族大学学报（哲学社会科学版）,2022(3):192-208. 被引量：4
4颜世健,喻国明.智能方法作为“第五范式”:人工智能时代科研范式的“新物种”[J].学术探索,2024(1):34-43. 被引量：25
5李国杰.智能化科研(AI4R):第五科研范式[J].新华文摘,2024(9):137-141. 被引量：1
6杨冬菊,黄俊涛.基于大语言模型的中文科技文献标注方法[J].计算机工程,2024,50(9):113-120. 被引量：6
7张国宾,姬红兵,王佳萌,韩如雪,曹秋生.基于通用信息抽取大模型的特定领域文本实体关系抽取研究[J].中国信息界,2024(8):159-161. 被引量：4
8周代数,魏杉汀.人工智能驱动的科学研究第五范式:演进、机制与影响[J].中国科技论坛,2024(12):97-107. 被引量：33
9孙翌,刘音.基于知识图谱和大语言模型的口述历史资源的问答应用研究[J].图书馆杂志,2025,44(1):98-107. 被引量：9
10刘畅,张琪,王东波,沈思,吴梦成,刘浏,苏雨诗.基于大语言模型技术的古籍限定域关系抽取及应用研究[J].情报学报,2025,44(2):200-219. 被引量：19

引证文献2

1马林青,石佳琪,曹星宇.面向口述史文本分析的大语言模型提示工程与人机协同策略[J].数字人文研究,2025,5(3):41-60.
2李永斌,刘楝,郑杰.一种面向特定信息领域的大模型命名实体识别方法[J].电子与信息学报,2026,48(2):662-672.

1许钢茵.小学高段数学错题成因分析与纠错策略[J].新智慧,2025(6):89-91.
2多洛米.研究发现Llama 2在识别失礼行为上优于人类同样场景下GPT频繁出错[J].海外星云,2024(7):74-75.
3杨爱玲,赵利,熊英.病案室编码的病案信息技术对病案质量的影响[J].中国卫生产业,2025,22(2):35-38. 被引量：1
4殷磊,雷颖诗,温宇标,胡旭君.人工智能方法在医疗器械检测研究[J].人工智能研究,2025,2(2):13-15.
5陈子佳,韩宇,刘欣,阿孜古丽,张德政,谢雁鸣,王志飞.基于大模型的肺癌表皮生长因子受体突变患者生存预测模型构建与验证[J].世界中医药,2025,20(8):1379-1390. 被引量：3
6李天云,李韬,温冬,杨惠,张毓涛,罗欣,董德尊.基于人工智能方法的网络拥塞控制综述[J].计算机工程与科学,2025,47(6):1018-1027.
7穆媛媛,李国印,刘梦瑶.基于信息工程技术的网络安全漏洞检测与修复研究[J].网络安全和信息化,2025(5):128-130.
8龙星全,李佳.基于Bert-BiLSTM-CRF模型的中文命名实体识别[J].吉林大学学报(信息科学版),2025,43(2):384-393. 被引量：4
9王承先,赵晴.基于CR-BACC模型的彝文命名实体识别方法[J].计算机与现代化,2025(5):28-35.

计算机科学

2025年第S1期

浏览历史

内容加载中请稍等...

基于大语言模型的审计领域命名实体识别算法研究被引量：2

参考文献1

二级参考文献12

共引文献36

同被引文献10

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于大语言模型的审计领域命名实体识别算法研究 被引量：2

参考文献1

二级参考文献12

共引文献36

同被引文献10

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于大语言模型的审计领域命名实体识别算法研究被引量：2