SE-CMT语义信息补充的特征提取模型

Feature Extraction Model of SE-CMT Semantic Information Supplement

下载PDF

导出

摘要在图像分类中,有益的语义信息补充可以高效捕捉关键区域,提高分类性能。为了获得有益的图像语义信息,提出了一种SE-CMT(SE-Networks CNN Meet Transformer)模型。该模型依据简单的CNN特征提取理论,输入图像通过SE-CMT Stem重标定前面提取到的特征,再通过SE-CMT Block中的深度卷积层来增强特征。利用SE-CNN(Squeeze-and-Excitation Networks-CNN)提取低级特征、加强局部性,并结合Transformer建立长程依赖关系,通过融合SE-CNN和Transformer结构,提高特征提取性能。在ImageNet和CIFAR-10数据集上的实验结果表明:SE-CMT模型的分类准确率分别达到了85.47%和87.16%top-1精度,性能优于基线模型CMT和Vision Transformer。因此,本文提出的SE-CMT模型是一种有效的图像特征提取方法。 In image classification,beneficial semantic information supplementation can efficiently capture key regions and improve classification performance.To obtain beneficial image semantic information,an SE-CMT(SE-Networks CNN Meet Transformer)model is proposed.The model is based on the simple CNN feature extraction theory,where the input image is rescaled by the SE-CMT Stem to the previously extracted features,and then the features are enhanced by the deep convolutional layer in the SE-CMT Block.The model uses SE-CNN(Squeeze-and-Excitation Networks-CNN)to extract low-level features,enhance localization,and combine with Transformer to establish long-range dependencies to improve feature extraction performance by fusing SE-CNN and Transformer structures.The experimental results on ImageNet and CIFAR-10 datasets show that the classification accuracy of the SE-CMT model reaches 85.47%and 87.16%top-1 accuracy,respectively,and the experiments show that the method outperforms the baseline models CMT and Vision Transformer.Therefore,the proposed SE-CMT model in this study is an effective method for image feature extraction.

作者杜睿山周长坤解红涛李宏杰 DU Ruishan;ZHOU Changkun;XIE Hongtao;LI Hongjie(School of Computer and Information Technology,Northeast Petroleum School,Daqing 163318,China;Key Laboratory of Oil and Gas Reservoir and Underground Gas Storage Integrity Evaluations,Northeast Petroleum University,Daqing 163318,China)

机构地区东北石油大学计算机与信息技术学院东北石油大学油气藏及地下储库完整性评价黑龙江省重点实验室

出处《哈尔滨理工大学学报》北大核心 2024年第6期74-81,共8页 Journal of Harbin University of Science and Technology

基金国家重点研发计划(2022YFE0206800) 黑龙江省自然科学基金(LH2021F004).

关键词图像分类权重矩阵卷积神经网络 TRANSFORMER 通道域 image classification weight matrix convolutional neural network transformer channel domain

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1梁丽丽,刘昕雨,孙广路,朱素霞.MSAM:针对视频问答的多阶段注意力模型[J].哈尔滨理工大学学报,2022,27(4):107-117. 被引量：3
2张涛,张晓利,任彦.Transformer与CNN融合的单目图像深度估计[J].哈尔滨理工大学学报,2022,27(6):88-94. 被引量：6
3刘明珠,陈瑞,陈俊羽,孙晓明.B-Spline-ORB特征点提取算法[J].哈尔滨理工大学学报,2022,27(3):97-104. 被引量：5
4李翔,张涛,张哲,魏宏杨,钱育蓉.Transformer在计算机视觉领域的研究综述[J].计算机工程与应用,2023,59(1):1-14. 被引量：32

二级参考文献19

1雷明,杨丹,张小洪,张莹.基于协方差矩阵的B-样条多尺度表示的角点检测[J].光电工程,2008,35(2):45-50. 被引量：4
2徐玲,王成良,冯欣,张小洪.多尺度积的协方差矩阵行列式的角点检测方法[J].计算机工程与应用,2011,47(2):160-164. 被引量：3
3樊英平,邢辉,孟晓军,修瑞云.样条尺度空间与Canny算子结合的弱边缘检测算法研究[J].现代电子技术,2015,38(9):57-58. 被引量：2
4王金龙,周志峰.基于SIFT图像特征提取与FLANN匹配算法的研究[J].计算机测量与控制,2018,26(2):175-178. 被引量：27
5王卫兵,白小玲,徐倩.SURF和RANSAC的特征图像匹配[J].哈尔滨理工大学学报,2018,23(1):117-121. 被引量：26
6毕天腾,刘越,翁冬冬,王涌天.基于监督学习的单幅图像深度估计综述[J].计算机辅助设计与图形学学报,2018,30(8):1383-1393. 被引量：18
7黄远征,尹春丽,刘波,韩鸣晓,陈敏,张鼎瑞,梁庆华.基于改进的快速Shi-Tomasi特征点检测算法的图像拼接算法[J].机械设计与研究,2018,34(4):70-73. 被引量：21
8王健,于鸣,任洪娥.一种用于图像拼接的改进ORB算法[J].液晶与显示,2018,33(6):520-527. 被引量：17
9王爱丽,胡长雨,韩闯.基于ORB特征的复杂场景下的增强现实[J].哈尔滨理工大学学报,2018,23(2):23-28. 被引量：2
10姚海芳,郭宝龙.一种基于ORB的特征匹配算法[J].电子设计工程,2019,27(16):175-179. 被引量：6

共引文献42

1杨承,高建瓴,郑美琳,丁容.LSTFormer:基于Swin Transformer的轻量化语义分割网络[J].计算机工程与应用,2023,59(12):166-175. 被引量：1
2杨一,卢佩,刘效勇,谢峰.基于CNN-Transformer双流网络的伪脸检测[J].科学技术与工程,2023,23(19):8288-8295. 被引量：8
3余伟群,刘佳涛,张亚萍.融合注意力的拉普拉斯金字塔单目深度估计[J].图学学报,2023,44(4):728-738. 被引量：1
4汪博文,杨昌建,汪峰,杨传凯,寇宗祥,杜建超.一种无人机在线喷涂绝缘子RTV质量评价方法[J].电测与仪表,2023,60(12):126-131. 被引量：7
5胡茂伟.基于纹理增强的ORB特征点提取与匹配算法[J].长春理工大学学报（自然科学版）,2023,46(6):121-127. 被引量：5
6辛世澳,葛海波,袁昊,杨雨迪,姚洋.改进YOLOv7的轻量化水下目标检测算法[J].计算机工程与应用,2024,60(3):88-99. 被引量：25
7刘奕炜,陈铭轩,牛志伟,张伟,丁毅.基于BIM和图像识别技术的水闸闸墩浇筑高度识别方法[J].水电能源科学,2024,42(1):129-133. 被引量：4
8袁文涛,卫文韬,高德民.融合注意力机制的多视图卷积手势识别研究[J].计算机工程,2024,50(3):208-215. 被引量：2
9段毛毛,连培榆,史海涛.动态视音场景下问答模型研究[J].计算机技术与发展,2024,34(3):163-169.
10张蕾,石岩,卢文雍,徐睿,靳展,罗伟节,陈义,赵春柳,占春连.基于SURF-OKG特征匹配的三维重建技术[J].光学精密工程,2024,32(6):915-929. 被引量：8

1关昆仑,朱思文,张仰森,成琪昊,张学凯.基于深度学习的生物资产检测模型YOLOSC[J].科学技术与工程,2025,25(2):674-682.
2臧贺藏,任帅,王从胜,王盛威,赵瑞玲,陈丹丹,赵晴,张杰,郑国清,李国强.基于改进Swin-Unet的小麦条锈病分割方法[J].山东农业科学,2024,56(12):147-153. 被引量：4
3郭俊,邵梦真,陈昕羽,杨跃.基于YOLOv8改进的雾天环境下车辆检测[J].软件工程,2024,27(12):39-44. 被引量：2
4马祖鑫,崔允贺,秦永彬,申国伟,郭春,陈意,钱清.融合深度强化学习的卷积神经网络联合压缩方法[J].计算机工程与应用,2025,61(6):210-219.
5由永浩,杨义春.基于大数据的电力工程数据自动分类提取系统设计[J].电气技术与经济,2025(2):357-359. 被引量：4
6徐智,杜玉,赵龙阳,孟瑞敏,李沁璘.一种改进O2U网络的带噪声标签图像分类方法[J].桂林电子科技大学学报,2024,44(6):585-591.
7崔博文,张思远.基于多尺度卷积自编码器的船舶逆变器故障诊断[J].舰船科学技术,2025,47(3):135-140. 被引量：2
8张筱旭,邵英龙,严孟慧,王健庆.基于优化U-Net神经网络模型在医学图像分割的应用[J].现代信息科技,2025,9(4):47-52. 被引量：2
9李燕文,马萍,王聪,梁城,张浩然,张宏立.脊提取联合ACMD的变转速滚动轴承故障诊断[J].噪声与振动控制,2025,45(1):89-96. 被引量：1
10罗一中.基于深度学习的OpenCV图像处理软件设计[J].软件,2025,46(1):50-52. 被引量：2

哈尔滨理工大学学报

2024年第6期

浏览历史

内容加载中请稍等...

SE-CMT语义信息补充的特征提取模型

参考文献4

二级参考文献19

共引文献42

相关作者

相关机构

相关主题

浏览历史