期刊文献+

CNN融合Transformer在图像分类中的模型研究

在线阅读 下载PDF
导出
摘要 近年来,深度学习算法的流行对物联网技术发展和社会发展起到了很大的推动作用。在图像分类领域,传统的卷积神经网络(CNN)存在一定缺陷,其在特征提取时,卷积操作会使模型对长距离的像素关系感知能力较弱,鲁棒性较差。而Transformer借助自注意力机制能够捕捉各个序列的位置依赖关系,能更好地建模长距离依赖关系,在处理具有空间关系的图像时可发挥很好的作用。基于此,结合CNN和Transformer的优点设计了一种新模型CTM。该模型在CNN中加入注意力机制,这让模型有了更好的鲁棒性。图像数据经过CNN下采样后再加入注意力机制,可降低运算量并提升效率。该模型在对相同数据集进行CNN和Transformer对比训练测试后发现,融合了Transformer的CNN模型准确率相比CNN和Transformer分别提升了17.9个百分点和12.5个百分点,性能更佳,从而验证了所设计的模型在图像分类领域性能有所优化。
作者 王鑫玮 冯锋
出处 《物联网技术》 2025年第7期129-133,共5页 Internet of things technologies
基金 宁夏自然科学基金重点项目(2024AAC02011)。
  • 相关文献

参考文献11

二级参考文献76

共引文献212

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部