融合内容引导与多尺度注意力的摘要生成模型

Summary Generation Model Integrating Content-guided and Multi-scale Attention

下载PDF

导出

摘要长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点.为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型.该模型通过双分支结构实现对多粒度语义的联合建模,并利用内容引导机制聚焦于摘要相关的关键信息区域.模型在传统BERT-Transformer架构基础上引入双分支结构增强语义表达能力,并通过MSAA-SAM融合机制设计,进一步实现跨分支信息对齐与表达统一.同时,本文对指针生成网络进行了改进,结合全局句向量引导机制提升生成控制能力,从而增强对长文本中关键信息的提取与冗余内容的抑制.在NLPCC 2017数据集和LCSTS数据集上的实验结果表明,该模型在生成式摘要任务上均优于主流基线模型,验证了其在语义建模、生成质量与控制能力方面的综合优势. Information compression and semantic coherence in long texts are persistent challenges in summary generation models.To address this issue,this study proposes a summary generation model integrating content-guided and multi-scale attention.The model adopts a dual-branch architecture to jointly model multi-granularity semantics and utilizes a contentguided mechanism to focus on key information relevant to the summary.Based on the conventional BERT-Transformer framework,a dual-branch structure is introduced to enhance semantic representation,and a cross-branch fusion mechanism(MSAA-SAM)is designed to achieve semantic alignment and unified representation.In addition,the pointergenerator network is improved by incorporating a global sentence vector guidance mechanism to enhance generation control,thereby improving key information extraction and reducing redundancy in long-text summarization.Experimental results on the NLPCC 2017 and LCSTS datasets demonstrate that the proposed model outperforms mainstream baseline models in generative summarization tasks,verifying its comprehensive advantages in semantic modeling,generation quality,and control capability.

作者岳帅王业 YUE Shuai;WANG Ye(College of Computer and Information Engineering,Xinjiang Agricultural University,Urumqi 830052,China;Network and Information Technology Center,Xinjiang Agricultural University,Urumqi 830052,China)

机构地区新疆农业大学计算机与信息工程学院新疆农业大学网络与信息技术中心

出处《计算机系统应用》 2026年第1期276-287,共12页 Computer Systems & Applications

关键词深度学习文本摘要多尺度注意力内容引导机制指针生成网络语义建模 deep learning text summary multi-scale attention content-guided mechanism pointer-generator network semantic modeling

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1田萱,李嘉梁,孟晓欢.基于深度学习的抽取式摘要研究综述[J].计算机科学与探索,2024,18(11):2823-2847. 被引量：1
2陈明轩,肖诗斌,王洪俊.基于深度学习的生成式文本摘要综述[J].软件导刊,2024,23(5):212-220. 被引量：5

二级参考文献5

1侯圣峦,张书涵,费超群.文本摘要常用数据集和方法研究综述[J].中文信息学报,2019,33(5):1-16. 被引量：23
2石磊,阮选敏,魏瑞斌,成颖.基于序列到序列模型的生成式文本摘要研究综述[J].情报学报,2019,38(10):1102-1116. 被引量：16
3李金鹏,张闯,陈小军,胡玥,廖鹏程.自动文本摘要研究综述[J].计算机研究与发展,2021,58(1):1-21. 被引量：66
4Sheng-Luan Hou,Xi-Kun Huang,Chao-Qun Fei,Shu-Han Zhang,Yang-Yang Li,Qi-Lin Sun,Chuan-Qing Wang.A Survey of Text Summarization Approaches Based on Deep Learning[J].Journal of Computer Science & Technology,2021,36(3):633-663. 被引量：2
5侯丽微,胡珀,曹雯琳.主题关键词信息融合的中文生成式自动摘要研究[J].自动化学报,2019,45(3):530-539. 被引量：31

共引文献4

1段慧蓉,冯国富.一种基于跨度的实体关系联合抽取模型[J].技术与市场,2024,31(6):26-29. 被引量：1
2蒲秋梅,叶芬,李辅德,韦洁瑶,赵丽娜.基于提示学习的生成式文本摘要研究[J].东北师大学报(自然科学版),2025,57(1):63-73. 被引量：1
3陈敬添.基于Transformer模型与指针生成网络的摘要生成[J].广播电视网络,2025,32(4):24-27.
4金彦亮,冯湫燕,高塬.结合提示信号与图结构的对话摘要生成模型[J].计算机工程与应用,2025,61(15):241-250.

1杨家全,苏适,冯勇,和学豪,马九顺.ERASum:基于实体关系感知的摘要生成方法[J].昆明理工大学学报(自然科学版),2026,51(1):102-111.
2刘佳旭,吴石,张艳菊.融合知识增强与SimCLS框架的生成式文本摘要模型[J].计算机系统应用,2026,35(3):44-58.
3王淑慧,李燕,王超.基于多图卷积网络的中药处方推荐算法研究进展[J].医学信息学杂志,2026,47(1):75-82.
4霍智恒,王俊超,樊可汗,庞建民.基于图卷积神经网络的二阶段长文本自动摘要方法[J].中文信息学报,2026,40(1):144-152.
5谢婉莹,李瑞,徐泽水.TTKE-LLM:基于大语言模型与提示工程的旅游知识图谱构建框架[J].图书馆论坛,2026,46(3):148-160. 被引量：1
6陈贵平,梁城.电力电子变压器接入配电网的电能质量调节方法研究[J].光源与照明,2025(6):190-192.
7吴振耀,徐长苗.法医临床鉴定质量控制及程序规范探讨[J].中国法医学杂志,2025,40(S1):58-59.
8文春明,刘康,贾讯,徐咏,安慧,梁湘,廖义奎.基于动态可变形卷积与注意力融合的密集桑蚕分割算法[J].农业机械学报,2026,57(3):353-364.
9熊承义,王薇,高志荣.基于跨尺度Transformer全局-局部交互的遥感图像连续超分辨率[J].中南民族大学学报(自然科学版),2026,45(3):353-363.

计算机系统应用

2026年第1期

浏览历史

内容加载中请稍等...

融合内容引导与多尺度注意力的摘要生成模型

参考文献2

二级参考文献5

共引文献4

相关作者

相关机构

相关主题

浏览历史