期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合CNN与ViT模型对江南8种野菜识别分类
1
作者 吴玉强 雷芷若 +1 位作者 胡乃娟 吴育宝 《种子》 北大核心 2026年第2期185-192,共8页
传统的野菜识别主要依赖人工经验,存在耗时、耗力及误判等问题,因此开发高效准确的识别算法成为关键。为解决可食用野菜图像识别问题,对视觉Transformer(Vision Transformer,ViT)的变体模型BiFormer进行改进。引入传统卷积神经网络(Conv... 传统的野菜识别主要依赖人工经验,存在耗时、耗力及误判等问题,因此开发高效准确的识别算法成为关键。为解决可食用野菜图像识别问题,对视觉Transformer(Vision Transformer,ViT)的变体模型BiFormer进行改进。引入传统卷积神经网络(Convolutional Neural Network,CNN)代表模型ResNet50的双卷积层残差块,以增强局部特征提取能力;在MLP层添加Dropout抑制过拟合;同时优化qk_dims参数提升注意力建模效率,最终构建名为Res-BiFormer的改进模型。在包含江南地区8种野菜的1509张原始图像数据集上,Res-BiFormer识别准确率高达95.77%,较原始BiFormer和ResNet50分别提升4.34%和0.76%;在6036张数据增强后的大规模数据集上,其准确率进一步较两基准模型分别提升6.96%和3.32%,充分验证了所提模型对不同规模数据集的良好适应性。通过Grad-CAM++技术生成热力图对模型决策过程进行可视化分析,结果表明,Res-BiFormer能够精准聚焦叶片叶脉纹理、边缘轮廓等野菜识别关键特征。研究不仅为可食用野菜识别提供了高效可行的技术方案,其可视化分析方法也为深度学习模型决策机制的解读提供了参考。 展开更多
关键词 可食用野菜识别 res-biformer 双卷积层残差块 Grad-CAM++
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部