期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于轻量化MobileViT深度学习模型的烤烟自动分组方法 被引量:3
1
作者 顾文娟 丁灿 +7 位作者 盖小雷 刘宇晨 张冀武 张晓伟 孙浩巍 张轲 王燕 龙杰 《中国烟草科学》 CSCD 北大核心 2024年第1期104-111,120,共9页
针对烟叶自动识别分组过程中特征提取困难、分组准确率低、模型参数量大、部署困难等问题,本文结合轻量化网络MobileNetV2与ViT模型的优点提出了一种轻量化MobileViT模型的烤烟自动分组方法。首先对所采集的烟叶图像进行前景和背景的预... 针对烟叶自动识别分组过程中特征提取困难、分组准确率低、模型参数量大、部署困难等问题,本文结合轻量化网络MobileNetV2与ViT模型的优点提出了一种轻量化MobileViT模型的烤烟自动分组方法。首先对所采集的烟叶图像进行前景和背景的预处理,解决提取烟叶特征困难的问题;然后将预处理后的图像建立成完整的烟叶图像数据集;最后针对建立的数据集使用基于轻量化MobileViT模型进行分组。使用该模型对云南省多地收购的5871张混合烤烟叶片进行分组试验,结果表明MobileViT对正组烟叶、副组烟叶和正副混合组烟叶分组准确率分别达到了79.44%、83.83%、79.22%,与MobileNetV2相比分别提升了9.5%、17.66%、17.56%;与ViT模型相比分别提升了13.8%、30.83%、34.12%。与当前应用较多的MobileNetV3、Effcient、Resnet50三种模型相比,MobileViT模型在混合组上分组准确率较轻量化MobileNetV3网络提升了11.86%;较CNN为代表的Effcient、Resnet50模型分别提升了9.6%、6.55%,模型大小降低了24.62%、79.1%。轻量化MobileViT模型同时结合了轻量化网络MobileNetV2与ViT模型的优点,在降低模型大小的同时具有较高的分组准确率,更容易部署在工业设备中,符合实际工业应用需求。 展开更多
关键词 烤烟自动分组 轻量化 mobilevit模型
在线阅读 下载PDF
基于MobileViT-CBAM-BiLSTM的开放式养殖环境鱼群摄食强度分类模型 被引量:2
2
作者 徐立鸿 黄志尊 +2 位作者 龙伟 蒋林华 童欣 《农业机械学报》 EI CAS CSCD 北大核心 2024年第11期147-153,共7页
鱼群摄食的精准投喂技术是实现智慧化水产养殖的一项关键技术。大多数精准投喂模型都是基于水质较清晰的室内养殖池,不太适用于开放式养殖环境。本研究通过水上视角采集构建了一套开放式池塘数据集,并对数据集进行数据增强增加其多样性... 鱼群摄食的精准投喂技术是实现智慧化水产养殖的一项关键技术。大多数精准投喂模型都是基于水质较清晰的室内养殖池,不太适用于开放式养殖环境。本研究通过水上视角采集构建了一套开放式池塘数据集,并对数据集进行数据增强增加其多样性,然后在轻量化神经网络MobileViT基础上,将CBAM注意力模块与MV2模块结合设计了CBAM-MV2模块,并嵌入BiLSTM循环神经网络用于识别分类,提出改进的MobileViT-CBAM-BiLSTM模型,提高了模型预测能力、鲁棒性和泛化性能,实现了鱼群摄食行为的三分类。实验结果显示,改进后MobileViT在采集的视频帧数据集上明显优于改进前的MobileViT,准确率98.61%,宏F1值达98.79%,相对于原始MobileViT准确率提高6.33个百分点,宏F1值提高6.75个百分点。 展开更多
关键词 鱼群摄食强度分类模型 精准投喂 mobilevit BiLSTM CBAM
在线阅读 下载PDF
改进MobileViT轻量级网络的电网危害鸟种鸣声识别
3
作者 宋超 邵明玉 《安庆师范大学学报(自然科学版)》 2024年第2期97-106,共10页
准确识别输电线路上的危害鸟种对电网涉鸟故障的差异化防治具有重要意义。目前,基于深度学习的鸟鸣识别方法得到了广泛应用,但现有模型存在参数大、效率低等问题,为此,本文通过引入轻量高效的MobileViT网络在MV2模块中融入压缩和激励(Sq... 准确识别输电线路上的危害鸟种对电网涉鸟故障的差异化防治具有重要意义。目前,基于深度学习的鸟鸣识别方法得到了广泛应用,但现有模型存在参数大、效率低等问题,为此,本文通过引入轻量高效的MobileViT网络在MV2模块中融入压缩和激励(Squeeze Excitation,SE)机制,提出了具有更强识别能力的改进模型——MobileViT-SE模型。该研究以典型电网危害鸟种的音频作为实验样本,对MobileViT和MobileViT-SE模型的识别能力进行了评估。结果表明,相比其他典型的深度学习模型,MobileViT和MobileViT-SE模型在参数量更少的条件下识别平均准确率更高,分别达到95.5%和97.2%,且后者提高了1.7%。 展开更多
关键词 电网涉鸟故障 鸟鸣识别 mobilevit-SE模型 压缩和激励机制
在线阅读 下载PDF
基于YOLOv8-MCMA模型的道路缺陷检测应用研究 被引量:1
4
作者 徐克圣 孙蓉 《广西科学院学报》 2025年第1期33-44,共12页
道路缺陷具有多尺度特征,导致其检测准确度不高。为改进这一问题,本文提出一种面向道路缺陷检测的轻量级多尺度卷积移动注意力模型(YOLOv8 Multi-scale Convolutional Mobile Attention,YOLOv8-MC-MA)。首先,采用MobileViT网络,可以使... 道路缺陷具有多尺度特征,导致其检测准确度不高。为改进这一问题,本文提出一种面向道路缺陷检测的轻量级多尺度卷积移动注意力模型(YOLOv8 Multi-scale Convolutional Mobile Attention,YOLOv8-MC-MA)。首先,采用MobileViT网络,可以使模型在减少参数量的同时保持较高的识别准确率;其次,使用内容感知的特征重组(Content-Aware Reassembly of Features,CARAFE)模块为上采样模块,以提升细小裂缝的检测能力;再次,设计多尺度倒置残差注意力(Multi-scale Inverted Residual Attention,MIRA)模块,增强模型对多尺度特征的敏感性;最后,将颈部的普通卷积替换为可变核卷积(Alterable Kernel Convolution,AK-Conv),以更好地捕捉不规则的裂缝信息,从而降低检测误差。实验结果表明,与YOLOv8n模型相比,本文提出的模型在Road Damage Detection Dataset、RDD2022_China和Crack-forest Dataset上的平均精确度均值@0.5(mAP@0.5)分别提高了3.7%、1.4%和2.6%,参数量减少了23.3%。与其他模型相比,该模型展现出明显优势,并对多尺度道路缺陷具有较强的适应能力。 展开更多
关键词 计算机视觉 目标检测 道路缺陷检测 mobilevit网络 MIRA模块 YOLOv8 MCMA模型
在线阅读 下载PDF
一种遥感影像中耕地内违建物检测方法
5
作者 姚炎林 《经纬天地》 2025年第5期1-5,共5页
耕地是保证粮食安全的基石,但随着城镇化发展,违规占用耕地私搭私建已成为严峻问题。针对现有遥感影像违建物检测难度大、检测准确率低等问题,提出一种基于深度学习的无人机航拍违建物检测方法。首先,利用现有高精度航拍影像制作建筑物... 耕地是保证粮食安全的基石,但随着城镇化发展,违规占用耕地私搭私建已成为严峻问题。针对现有遥感影像违建物检测难度大、检测准确率低等问题,提出一种基于深度学习的无人机航拍违建物检测方法。首先,利用现有高精度航拍影像制作建筑物数据集;然后,对YOLOv6(you only look once v6)目标检测模型优化,为提取更多特征信息,使用MobileViT(mobile vision transformers)模型替换原YOLOv6主干网络,并在颈部位置添加坐标注意力机制结构;最后,在测试集中证明所提模型有效性。结果表明:所提模型查准率达95.68%,查全率为78.73%,AP值为84.82%,且能稳定、准确地定位违建物,因此,可应用到无人机航拍建筑物检测领域中。 展开更多
关键词 耕地违建检测 YOLOv6模型 mobilevit模型 坐标注意力机制结构
在线阅读 下载PDF
基于轻量级Transformer的隧道裂缝分割 被引量:3
6
作者 邝先验 徐姚明 +2 位作者 雷卉 程福军 桓湘澜 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3421-3433,共13页
裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难... 裂缝检测对保证隧道结构安全至关重要,及时发现隧道裂缝缺陷,有利于降低工程维修成本和保障行车安全。然而,传统卷积神经网络在隧道裂缝检测任务中主要侧重提高检测精度和算法复杂度,如何平衡裂缝检测的精度和实时性是当前研究的一个难点。针对这一问题,本文提出一种基于轻量级Transformer的裂缝分割方法 CrackViT。首先,采用卷积神经网络与Transformer混合的MobileViT网络构建裂缝特征提取网络,减少网络模型参数和计算量,并且有效提取裂缝图像全局信息和局部特征信息。然后,提出改进空洞空间金字塔池化解码器实现不同尺度的特征提取和信息融合,实现像素级概率分布。同时,裂缝图像存在细节信息缺失问题,引入高效通道注意力模块,增强对裂缝特征信息的提取能力。此外,针对裂缝与背景类别不平衡问题,设计了在线困难样本挖掘损失函数进行缓解。实验结果表明:在单个3050Ti GPU上,CrackViT算法最终在裂缝数据集上以63 FPS的速度获得了75.62%的IoU,模型参数量仅为2.43 M。CrackViT-L模型精度IoU为76.83%,模型参数量为3.56 M,模型推理速度达到61FPS。算法测试精度优于大多数主流模型,并且需要更少的模型参数。研究结果表明,CrackViT所预测的隧道裂缝分割图像边缘更加清晰和完整,保持推理速度的同时,能够有效检测裂缝,该算法有助于隧道裂缝检测实际应用。 展开更多
关键词 裂缝分割 TRANSFORMER mobilevit 空洞空间金字塔池化 轻量级模型
在线阅读 下载PDF
基于轻量级Transformer的城市路网提取方法 被引量:6
7
作者 冯志成 杨杰 陈智超 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第1期40-49,108,共11页
针对现有方法存在道路区域提取不精准和实时性不足的限制,提出基于轻量级Transformer的路网提取方法RoadViT.利用卷积神经网络与Transformer混合的MobileViT架构进行编码特征,有效地提取高级上下文信息.提出金字塔解码器实现多尺度特征... 针对现有方法存在道路区域提取不精准和实时性不足的限制,提出基于轻量级Transformer的路网提取方法RoadViT.利用卷积神经网络与Transformer混合的MobileViT架构进行编码特征,有效地提取高级上下文信息.提出金字塔解码器实现多尺度特征的提取和融合,生成像素类别的概率分布.结合Mosaic与多尺度缩放和随机裁剪策略实现数据增强,构建精细多样的遥感图像.针对城市遥感图像中道路类别和背景类别的不平衡问题,提出动态加权损失函数.实验结果表明,RoadViT的参数量仅为1.25×10^(6),在Jetson TX2上的推理速度可达10帧/s,在CHN6-CUG数据集上的精度可达57.0%.所提方法是轻量级Transformer在城市遥感图像中的有效探索,在保证推理实时性的同时,实现道路提取精度的提升. 展开更多
关键词 城市路网提取 TRANSFORMER mobilevit 遥感图像语义分割 轻量级模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部