基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究被引量：1

Universal information extraction method based on prompt learning with ERNIE-BiLSTM-PN

下载PDF

导出

摘要随着大数据时代的到来,信息抽取已成为自然语言处理领域的重要研究方向。信息抽取涉及多项任务,包括命名实体识别、关系抽取和事件抽取等,每项任务通常需要依靠专用模型来应对其特定的挑战。该文提出一种基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法(EBP-UIE),结合预训练语言模型(ERNIE)、双向长短期记忆网络(BiLSTM)和指针网络(PN),旨在通过一个统一的框架解决信息抽取任务的复杂性,并实现跨任务知识的共享。ERNIE优化了对文本的深层理解和上下文分析,BiLSTM的应用加强了对序列特征的捕捉及长距离依赖关系的解析,PN则提高了对文本中信息元素起止位置的精确标定,提示学习机制灵活实现多个信息抽取任务的统一建模。实验结果显示:在命名实体识别任务,EBP-UIE在MSRA和PeopleDaily数据集上的F1分数比UIE模型分别高出7.12%和0.53%;在关系抽取任务,EBP-UIE在DuIE数据集上的F1分数超过UIE模型6.84%;对于事件抽取任务,EBP-UIE在DuEE数据集上的触发词和论元抽取F1分数分别比UIE模型高出4.49%和0.95%。 With the advent of the big data era,information extraction has become a significant research direction in the field of natural language processing.Information extraction involves multiple tasks,including named entity recognition,relation extraction,and event extraction,each typically relying on specialized models to address its specific challenges.This paper proposes a universal information extraction method based on prompt learning(EBP-UIE),enhanced representation through knowledge integration(ERNIE),bi-directional long short-term memory networks(BiLSTM),and pointer networks(PN),aimed at resolving the complexities of information extraction tasks through a unified framework and facilitating cross-task knowledge sharing.The introduction of the ERNIE model enhances deep text understanding and contextual analysis,the application of BiLSTM strengthens the capture of sequential features and the parsing of long-distance dependencies,and the pointer network improves the precise identification of start and end positions of information elements in text.The experimental results show that on named entity recognition,the F1 scores of EBP-UIE on the MSRA and PeopleDaily datasets are respectively 7.12%and 0.53%higher than those of the UIE models;on relation extraction,the F1 score of EBP-UIE on the DuIE dataset exceeded that of the UIE model by 6.84%;And on the event extraction,the F1 score of EBP-UIE outperforms the UIE model by 4.49%and 0.95%in trigger word and argument extraction performance on the DuEE dataset,respectively.

作者刘万里雍新有曹开臣陈俞舟刘禄波蔡世民 LIU Wanli;YONG Xinyou;CAO Kaichen;CHEN Yuzhou;LIU Lubo;CAI Shimin(Second Laboratory,Southwest Institute of Electronic Technology,Chengdu 610036,China;Big Data Research Center,University of Electronic Science and Technology of China,Chengdu 611731,China)

机构地区西南电子技术研究所第二实验室电子科技大学大数据研究中心

出处《电子科技大学学报》北大核心 2025年第3期411-423,共13页 Journal of University of Electronic Science and Technology of China

基金国家自然科学基金(T2293771,11975071)。

关键词通用信息抽取深度学习指针网络提示学习 universal information extraction deep learning pointer network prompt learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1QIU XiPeng,SUN TianXiang,XU YiGe,SHAO YunFan,DAI Ning,HUANG XuanJing.Pre-trained models for natural language processing: A survey[J].Science China(Technological Sciences),2020,63(10):1872-1897. 被引量：208
2贺瑞芳,段绍杨.基于多任务学习的中文事件抽取联合模型[J].软件学报,2019,30(4):1015-1030. 被引量：50
3王炳乾,宿绍勋,梁天新.基于BERT的多层标签指针网络事件抽取模型--2020语言与智能技术竞赛事件抽取任务系统报告[J].中文信息学报,2021,35(7):81-88. 被引量：15

二级参考文献5

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
2邱泉清,苗夺谦,张志飞.中文微博命名实体识别[J].计算机科学,2013,40(6):196-198. 被引量：33
3徐浩煜,任智慧,施俊,周晗.基于链式条件随机场的中文分词改进方法[J].计算机应用与软件,2016,33(12):211-213. 被引量：11
4贺瑞芳,段绍杨.基于多任务学习的中文事件抽取联合模型[J].软件学报,2019,30(4):1015-1030. 被引量：50
5仲伟峰,杨航,陈玉博,刘康,赵军.基于联合标注和全局推理的篇章级事件抽取[J].中文信息学报,2019,33(9):88-95. 被引量：24

共引文献268

1王伟,阮文翰,孟祥福.融合对抗训练的中文GPT对话模型研究[J].辽宁工程技术大学学报（自然科学版）,2023(3):378-384.
2邱凯锋,王则远,何志超,付凯利,梅童霖,关英杰,高飞,伍俊妍.人工智能技术在超说明书用药循证中的应用研究[J].中华临床医师杂志（电子版）,2023,17(12):1212-1218. 被引量：1
3盛煜堃,彭艳兵.基于注意力机制BiLSTM的事件抽取方法[J].电子设计工程,2020,28(8):170-173. 被引量：13
4曹文斌,武卓峰,杨涛,凡友荣.基于文本语料的涉恐事件实体属性抽取[J].工程科学学报,2020,42(4):500-508. 被引量：7
5黄婧.突发事件触发特征层级与事件识别模型构建研究[J].情报杂志,2020,39(9):137-142. 被引量：1
6余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：24
7王晓浪,邓蔚,胡峰,邓维斌,张清华.基于序列标注的事件联合抽取方法[J].重庆邮电大学学报（自然科学版）,2020,32(5):884-890. 被引量：4
8余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：72
9万齐智,万常选,胡蓉,刘德喜.基于句法语义依存分析的中文金融事件抽取[J].计算机学报,2021,44(3):508-530. 被引量：35
10邓君华,邹云峰,沈盛宇,季梦黎.基于卷积神经网络的电力领域事件要素提取方法研究[J].电子设计工程,2021,29(3):132-135. 被引量：2

同被引文献4

1季忠祥,吴悦.基于组合神经网络的中文事件抽取[J].上海大学学报（自然科学版）,2021,27(3):535-543. 被引量：5
2李元诚,罗昊,王庆乐,李建彬.一种基于ATT&CK的新型电力系统APT攻击建模[J].信息网络安全,2023(2):26-34. 被引量：10
3郭梓萌,朱广劼,杨轶杰,司群.基于APT特征的铁路网络安全性能研究[J].信息网络安全,2024(5):802-811. 被引量：2
4赵新强,范博,张东举.基于威胁发现的APT攻击防御体系研究[J].信息网络安全,2024(7):1122-1128. 被引量：7

引证文献1

1曹骏,向尕,任亚唯,谭自程,杨群生.基于大模型的少样本APT攻击事件抽取方法[J].信息网络安全,2025(9):1338-1347. 被引量：2

二级引证文献2

1毕述玥.基于网络流量元数据与图神经网络的高级持续性威胁检测[J].消费电子,2026(4):101-103.
2覃锦端,尉雯雯,王月兵,柳遵梁,刘聪.基于大模型的深层Web越权漏洞检测方法[J].网络安全与数据治理,2026,45(2):20-27.

1孙浩,时勇,康瑞.为界面注入AI灵魂:人机交互设计的范式重构[J].网行者,2025(2):98-100.
2付清廉.计算机数据交换系统结构的设计与实现[J].中文科技期刊数据库(文摘版)自然科学,2016(5):00171-00171.
3豆子.“公益+族游”创意涌动,信息服务应加强赋能[J].至爱,2024(7):64-65.
4杜壮.人形机器人应用正在“卷”啥?[J].中国战略新兴产业,2025(5):21-24.
5李宏亮.光伏消纳背景下的源网荷储协同优化应用[J].通信电源技术,2025,42(10):100-102.
6杨竹清.农商银行嵌入乡村治理的路径优化研究[J].中国银行业,2025(4):69-72.
7冯雨松,王海稳.基于未来社区的智能社区服务机器人设计[J].今日自动化,2025(3):62-64.
8王威.核心素养视域下高中数学深度学习效果评价[J].高考,2025(10):48-51.

电子科技大学学报

2025年第3期

浏览历史

内容加载中请稍等...

基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究被引量：1

参考文献3

二级参考文献5

共引文献268

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究 被引量：1

参考文献3

二级参考文献5

共引文献268

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究被引量：1