Transformer架构中长序列依赖的高效注意力计算优化

Efficient Attention Calculation Optimization for Long Sequence Dependence in Transformer Architecture

下载PDF

导出

摘要文章提出了融合稀疏注意力预处理、低秩近似处理和递归计算整合的优化方法,详细阐述了其设计思路与算法流程,并通过长文本分类和时间序列预测实验进行了验证。结果表明,该优化策略显著提升了模型的性能,为Transformer在长序列任务中的应用提供了有力的技术支持。 The paper proposes an optimized method that integrates sparse attention preprocessing,low-rank approximation processing,and recursive computation.It elaborates on the design concept and algorithm flow,and validates it through experiments in long text classification and time series prediction.The results show that this optimization strategy significantly enhances model performance,providing strong technical support for the application of Transformer in long sequence tasks.

作者江雨欣 JIANG Yuxin(Institute of Artificial Intelligence,Hubei University,Wuhan Hubei 430062,China)

机构地区湖北大学人工智能学院

出处《信息与电脑》 2025年第22期82-84,共3页 Information & Computer

关键词 Transformer架构长序列依赖注意力计算优化 Transformer architecture long sequence dependence attentional calculation optimization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张梦璇,方榉炫,刘龙,赵秋博,张文博.基于Transformer特征关联融合小目标检测算法研究[J].信号处理,2024,40(11):1990-2006. 被引量：10
2樵宏运,刘绒,高赟.基于非对称稀疏注意力的单流Transformer跟踪器[J].计算机技术与发展,2025,35(2):166-173. 被引量：1
3王汝桥,张谊,何玉鹏,周岱.基于自注意力机制的时间序列预测及异常检测研究[J].电工技术,2024(19):55-57. 被引量：3
4徐泽鑫,杨磊,李康顺.较短的长序列时间序列预测模型[J].计算机应用,2024,44(6):1824-1831. 被引量：4
5侍国文.电力电子转换器在新能源系统中的应用研究[J].信息与电脑,2025,37(5):89-91. 被引量：2

二级参考文献12

1丁红斌.智能电网构建中电力电子技术的应用[J].信息与电脑,2018,30(14):8-9. 被引量：1
2任立成,杨嘉棋,魏宇星,张建林.基于特征融合与双模板嵌套更新的孪生网络跟踪算法[J].计算机工程,2021,47(7):239-248. 被引量：10
3陈志浩,杨小军.基于孪生网络多级注意特征融合目标跟踪算法[J].计算机技术与发展,2021,31(11):58-63. 被引量：6
4江英杰,宋晓宁.基于视觉Transformer的双流目标跟踪算法[J].计算机工程与应用,2022,58(12):183-190. 被引量：10
5徐晓芳,管瑞.基于神经网络集成学习算法的金融时间序列预测[J].计算机系统应用,2022,31(6):29-37. 被引量：6
6王海起,王志海,李留珂,孔浩然,王琼,徐建波.基于网格划分的城市短时交通流量时空预测模型[J].计算机应用,2022,42(7):2274-2280. 被引量：7
7李毅,彭晋卿,廖维,邹斌,曹静宇.一种基于时间序列的集成电力负荷预测方法研究[J].建筑科学,2022,38(10):190-197. 被引量：10
8夏进,王正群,朱世明.基于时间序列分解的交通流量预测模型[J].计算机应用,2023,43(4):1129-1135. 被引量：13
9杨程喻.基于功率因素的电力电子变换器优化研究[J].科技创新与应用,2023,13(28):153-156. 被引量：3
10孙国荣.电力系统中的电力电子转换器设计与优化[J].科技风,2024(9):59-61. 被引量：2

共引文献15

1敬硕肄,蒋志卿,曲木阿妩,包旭.基于神经网络的运氢需求预测模型研究[J].西部特种设备,2024,7(3):28-32.
2李天成,李固冲,王锐,易伟,周共健,范红旗.《信号处理》空天目标跟踪前沿技术专刊编者按[J].信号处理,2024,40(11):1921-1924.
3孙洋舟,严天峰,孙文灏,汤春阳,王映植.基于Swin Transformer的图像语义通信系统[J].电子测量技术,2024,47(24):85-92. 被引量：1
4田伟,殷兆凯,董义阳,黄迪,刘青.耦合多变量筛选和多层LSTM的短期径流预测研究[J].水力发电,2025,51(3):22-27.
5陈钦仁.基于表征学习和Transformer的时间序列数据异常检测[J].舰船电子对抗,2025,48(1):65-69.
6吴晨旭,张冬妍,张榄翔,陈诺,毛思雨.基于RT-DETR的林间松果检测方法[J].林业科学,2025,61(6):25-37. 被引量：2
7李晓艳,马进财,甘寿成,陈佳鑫,赵云鹏.青海新能源电力交易市场化分析的数据驱动方法研究[J].消费电子,2025(16):86-88.
8陈熙.基于神经网络的文字信息提取在电力通信管理中的应用研究[J].中国设备工程,2025(16):79-81.
9张大卫,牛永界,熊伟.基于数据驱动的油料消耗预测模型综述[J].军事运筹与评估,2025,40(3):74-80.
10钟美华,钟国坚,曾志宏.基于RetinaNet深度学习的煤矿带式运输机异物识别方法[J].中国矿业,2025,34(9):203-208.

1高鑫,王驰中,桂芳旭,陈衡,张锴,张国强.不同区域集中式光伏电站平价上网经济性分析[J].发电技术,2025,46(5):930-938. 被引量：2
2王朝祥,闫凌加,张聪.高中物理中的近似计算与估算问题[J].高中数理化,2025(20):1-4.
3王宗伟,范超,耿建强,成丽燕.基于前后向线性预测的宽带零中频IQ不平衡校准算法[J].自动化与信息工程,2025,46(3):1-8.
4左冬晓.基于无迹卡尔曼滤波的电动汽车状态惯性监测[J].拖拉机与农用运输车,2025,52(6):48-50.
5赵立兵.“活力”之物:数智基础设施如何塑造出版业的未来[J].编辑之友,2025(10):39-46.
6张泊明,李富强.基于粒子群优化的多机器人任务分配实验[J].佳木斯大学学报(自然科学版),2025,43(10):24-27.

信息与电脑

2025年第22期

浏览历史

内容加载中请稍等...

Transformer架构中长序列依赖的高效注意力计算优化

参考文献5

二级参考文献12

共引文献15

相关作者

相关机构

相关主题

浏览历史