二值化卷积神经网络作为一种量化模型,具有模型体积小、运算效率高等显著优点,是卷积神经网络模型在低功耗嵌入式端部署的理想形式.本文分析了二值化卷积神经网络的特点,提出了针对批归一化层及二值化层改进,设计出了无需乘法运算单元...二值化卷积神经网络作为一种量化模型,具有模型体积小、运算效率高等显著优点,是卷积神经网络模型在低功耗嵌入式端部署的理想形式.本文分析了二值化卷积神经网络的特点,提出了针对批归一化层及二值化层改进,设计出了无需乘法运算单元的二值化卷积神经网络硬件架构并在FPGA平台上实现.结果表明,在运算量相同情况下,该设计在工作频率150MHz下相比i5-7500 CPU实现了约9.7倍的加速,相比1080 Ti GPU实现了1.7倍的加速,而功耗仅为CPU的21%、GPU的5.6%。展开更多
文摘针对车辆检测领域中现有的小目标检测算法面临的复杂度高、特征提取不足以及检测率低的问题,提出了一种改进模型ARR-DETR,旨在提升小目标车辆检测的效率和精度。借助CSP的思想,通过卷积加性自注意力机制(convolutional additive self-attention,CATM)和卷积门控线性单元(gated linear unit,GLU)构建CSP-ADD-CGLU模块,以改进RT-DETR的骨干网络,在降低计算复杂度的同时增强关键特征的提取能力,从而提升模型的表现力和训练稳定性。构建AIFI-RepBN模块,采用渐进重参数化方法,在训练过程中逐渐从LayerNorm过渡到BatchNorm,实现更高效的计算,同时保持模型性能。在融合模块中引入显式空间先验和注意力分解,强化对小目标位置的感知能力,同时提升对不同尺度特征的选择性关注能力,提高模型对小目标的识别精度,还增强了整体特征融合的效果。实验结果表明,改进的RT-DETR模型在BDD100K数据集上的P、Recall和FPS指标分别为74.4%、66.1%和67.4%。与原始RT-DETR模型相比,分别提升了1.6%、2.1%和3.3%,表明该方法可以更快速、更准确地检测到小目标车辆。
文摘二值化卷积神经网络作为一种量化模型,具有模型体积小、运算效率高等显著优点,是卷积神经网络模型在低功耗嵌入式端部署的理想形式.本文分析了二值化卷积神经网络的特点,提出了针对批归一化层及二值化层改进,设计出了无需乘法运算单元的二值化卷积神经网络硬件架构并在FPGA平台上实现.结果表明,在运算量相同情况下,该设计在工作频率150MHz下相比i5-7500 CPU实现了约9.7倍的加速,相比1080 Ti GPU实现了1.7倍的加速,而功耗仅为CPU的21%、GPU的5.6%。