基于计算机视觉的Transformer研究进展被引量：96

Research Progress of Transformer Based on Computer Vision

下载PDF

导出

摘要 Transformer是一种基于自注意力机制、并行化处理数据的深度神经网络。近几年基于Transformer的模型成为计算机视觉任务的重要研究方向。针对目前国内基于Transformer综述性文章的空白,对其在计算机视觉上的应用进行概述。回顾了Transformer的基本原理,重点介绍了其在图像分类、目标检测、图像分割等七个视觉任务上的应用,并对效果显著的模型进行分析。最后对Transformer在计算机视觉中面临的挑战以及未来的发展趋势进行了总结和展望。 Transformer is a deep neural network based on the self-attention mechanism and parallel processing data.In recent years,Transformer-based models have emerged as an important area of research for computer vision tasks.Aiming at the current blanks in domestic review articles based on Transformer,this paper covers its application in computer vision.This paper reviews the basic principles of the Transformer model,mainly focuses on the application of seven visual tasks such as image classification,object detection and segmentation,and analyzes Transformer-based models with significant effects.Finally,this paper summarizes the challenges and future development trends of the Transformer model in computer vision.

作者刘文婷卢新明 LIU Wenting;LU Xinming(College of Computer Science and Engineering,Shandong University of Science and Technology,Qingdao,Shandong 266500,China)

机构地区山东科技大学计算机科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第6期1-16,共16页 Computer Engineering and Applications

基金国家重点研发计划(2017YFC0804406) 山东省重点研发计划(2016ZDJS02A05)。

关键词 TRANSFORMER 计算机视觉自注意力机制神经网络 Transformer computer vision self-attention mechanism neural network

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：2005
2杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：506
3任欢,王旭光.注意力机制综述[J].计算机应用,2021,41(S01):1-6. 被引量：193
4王红,史金钏,张志伟.基于注意力机制的LSTM的语义关系抽取[J].计算机应用研究,2018,35(5):1417-1420. 被引量：68
5唐海桃,薛嘉宾,韩纪庆.一种多尺度前向注意力模型的语音识别方法[J].电子学报,2020,48(7):1255-1260. 被引量：21

二级参考文献38

1赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：107
2CAO Wenming,HE Tiancheng.The Multi-Weight Neuron with Geometry Algorithm and Its Application[J].Chinese Journal of Electronics,2008,17(2):261-264. 被引量：4
3张妮,徐文尚,王文文.人工智能技术发展及应用研究综述[J].煤矿机械,2009,30(2):4-7. 被引量：97
4孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：673
5陈宇,郑德权,赵铁军.基于Deep Belief Nets的中文名实体关系抽取[J].软件学报,2012,23(10):2572-2585. 被引量：75
6余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：648
7刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：72
8刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：303
9CHENG Gaofeng,LI Xin,YAN Yonghong.Using Highway Connections to Enable Deep Small-footprint LSTM-RNNs for Speech Recognition[J].Chinese Journal of Electronics,2019,28(1):107-112. 被引量：8
10金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：39

共引文献2707

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27. 被引量：4
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
4杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
5陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：9
6林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：23
7陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：24
8鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
9谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126. 被引量：1
10任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3

同被引文献886

1郑戈.在法律与科技之间——智慧法院与未来司法[J].中国社会科学评价,2021(1):80-92. 被引量：39
2钮晓音,郭晓奎.“新医科”背景下的医学教育改革与人才培养[J].中国高等医学教育,2021(5):1-2. 被引量：172
3吴瑛.“新医科”需要创新型护理人才[J].云南教育（视界）,2020(12):30-30. 被引量：4
4靳亚军.阿伏伽德罗常数的新定义对高中化学教学的影响分析[J].试题与研究,2023(15):34-36. 被引量：2
5张凌寒.智慧司法中技术依赖的隐忧及应对[J].法制与社会发展,2022,28(4):180-200. 被引量：104
6蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：90
7宋志娜,眭海刚,李永成.高分辨率可见光遥感图像舰船目标检测综述[J].武汉大学学报（信息科学版）,2021,46(11):1703-1715. 被引量：17
8杨志凯,扶兰兰,唐灿,王发明,倪昕东,陈度.基于MobileViT模型的小麦收获机喂入密度分类方法[J].农业机械学报,2023,54(S01):172-180. 被引量：4
9郭小燕,于帅卿,沈航驰,李龙,杜佳举.基于全局特征提取的农作物病害识别模型[J].农业机械学报,2022,53(12):301-307. 被引量：8
10董永胜,陈为高,侯佃平,孙宝昌.智能化选煤厂研究与建议[J].工矿自动化,2021,47(S01):26-31. 被引量：24

引证文献96

1朱小勇,陈胜.基于ResNet-ViT的海战多目标态势感知[J].信息与控制,2023,52(5):638-647. 被引量：2
2陈凡,宋文革,范誉瀚,陈塞.基于CNN-Transformer融合模型的选煤厂振动筛上杂物语义分割研究[J].煤炭工程,2023,55(S01):193-199. 被引量：2
3张余冉,段喜萍,李昀松,刘庭圆.基于ResNet-ACmix融合特征的ECO目标跟踪算法改进[J].哈尔滨师范大学自然科学学报,2023,39(1):75-82.
4林少丹,李效彬,杨碧云,陈晨,何伟城,翁海勇,叶大鹏.适用于小样本显微图像数据集的柑橘黄龙病快速诊断模型[J].农业工程学报,2022,38(12):216-223. 被引量：7
5王威,李玉洁,郭富林,刘岩,何俊霖.生成对抗网络及其文本图像合成综述[J].计算机工程与应用,2022,58(19):14-36. 被引量：12
6袁媛,陈明惠,柯舒婷,王腾,何龙喜,吕林杰,孙好,刘健南.基于集成卷积神经网络和Vit的眼底图像分类研究[J].中国激光,2022,49(20):102-110. 被引量：16
7李翔,张涛,张哲,魏宏杨,钱育蓉.Transformer在计算机视觉领域的研究综述[J].计算机工程与应用,2023,59(1):1-14. 被引量：31
8付苗苗,邓淼磊,张德贤.基于深度学习和Transformer的目标检测算法[J].计算机工程与应用,2023,59(1):37-48. 被引量：12
9刘春磊,陈天恩,王聪,姜舒文,陈栋.小样本目标检测研究综述[J].计算机科学与探索,2023,17(1):53-73. 被引量：23
10张恒,张赛,孙佳伟,陆正大,倪昕晔.深度学习脑肿瘤MRI图像分类研究进展[J].磁共振成像,2023,14(1):166-171. 被引量：5

二级引证文献452

1李玉星,董邵灿,胡其会,袁运栋,安成名,王武昌.油气管道第三方破坏预警技术现状[J].中国安全生产科学技术,2023,19(S02):115-121. 被引量：7
2白俊卿,张文静.基于并行反向注意网络的跑道线检测[J].中国惯性技术学报,2022,30(5):609-614. 被引量：1
3贺国豪,于本化.基于YoloV3的分布式光纤传感振动识别[J].网络新媒体技术,2022,11(6):42-47.
4安胜彪,郭昱岐,白宇,王腾博.小样本图像分类研究综述[J].计算机科学与探索,2023,17(3):511-532. 被引量：16
5王慧,李康顺,蔡铁,王文祥,董纯铿.基于约束性多目标优化算法的柑橘黄龙病识别算法[J].江苏农业科学,2023,51(6):159-167. 被引量：2
6张世友,毕振波.基于改进虚拟现实样本生成策略的船舶检测[J].电子技术与软件工程,2023(4):188-193.
7周宏伟,张人水.基于生成对抗网络的健身榨汁杯设计研究[J].艺术与设计（理论版）,2023(4):123-126.
8杨承,高建瓴,郑美琳,丁容.LSTFormer:基于Swin Transformer的轻量化语义分割网络[J].计算机工程与应用,2023,59(12):166-175. 被引量：1
9王斌,田士来,王小成,王瀚,叶伟.以ChatGPT为代表的人工智能技术在医学教育中的机遇与挑战[J].医学教育研究与实践,2023,31(4):402-405. 被引量：26
10杨一,卢佩,刘效勇,谢峰.基于CNN-Transformer双流网络的伪脸检测[J].科学技术与工程,2023,23(19):8288-8295. 被引量：8

1吴源.基于文献计量的国内产教融合研究综述[J].职业技术,2022,21(1):62-69. 被引量：4
2刘向阳,李慧敏,贾悦,卞卫国,张芳袁.钻井废弃物中苯并芘污染治理研究进展[J].应用化工,2022,51(1):177-180. 被引量：1
3《激光技术》征稿简则[J].激光技术,2022,46(2).
4官绮慧,张新,韩东梅,孟跃中.共价有机框架材料应用于锂硫电池的进展[J].电池,2022,52(1):91-95. 被引量：1
5阮晨钊,张祥森,刘科,赵增顺.深度学习的人-物体交互检测研究进展[J].计算机科学与探索,2022,16(2):323-336. 被引量：3
6《福建农业科技》论文格式要求[J].福建农业科技,2022(1):86-86.
7姚佳伦,杨雨梦,陈昊瑜.用于存算一体的磁性随机存储器概述[J].功能材料与器件学报,2021,27(6):525-535. 被引量：2
8余显斌,吕治东,李涟漪,Nazar Muhammad Idrees,张鹿.太赫兹感知通信一体化波形设计与信号处理[J].通信学报,2022,43(2):76-88. 被引量：12
9梁竟程,陈伟聪,程强,金石,崔铁军.基于信息超表面的无线通信(特邀)[J].红外与激光工程,2022,51(1):316-331. 被引量：4
10《作物学报》征稿简则[J].作物学报,2022,48(5).

计算机工程与应用

2022年第6期

浏览历史

内容加载中请稍等...

基于计算机视觉的Transformer研究进展被引量：96

参考文献5

二级参考文献38

共引文献2707

同被引文献886

引证文献96

二级引证文献452

相关作者

相关机构

相关主题

浏览历史

基于计算机视觉的Transformer研究进展 被引量：96

参考文献5

二级参考文献38

共引文献2707

同被引文献886

引证文献96

二级引证文献452

相关作者

相关机构

相关主题

浏览历史

基于计算机视觉的Transformer研究进展被引量：96