针对当前钢材表面缺陷检测模型存在的结构复杂、参数量大、实时性差和检测精度不高等问题,提出了一种基于改进YOLOv5s的轻量化模型。该模型首先将YOLOv5的主干网络替换为MobileNetV3,以实现模型轻量化并提升检测速度。其次,引入在线卷...针对当前钢材表面缺陷检测模型存在的结构复杂、参数量大、实时性差和检测精度不高等问题,提出了一种基于改进YOLOv5s的轻量化模型。该模型首先将YOLOv5的主干网络替换为MobileNetV3,以实现模型轻量化并提升检测速度。其次,引入在线卷积重参数化(Online Convolutional Re-parameterization, OREPA)技术,进一步降低了训练成本,并使用K-means++算法聚类先验框来提高先验框聚类的准确性和收敛速度。最后,采用EIoU(Extended Intersection over Union)代替CIoU(Complete Intersection over Union)损失函数,加快了收敛并改善了回归精度。实验数据表明,相较于原始YOLOv5s模型,改进后模型的平均精度均值提高2.8个百分点,参数量减少84.0%,体积减小81.4%,检测速度提升60.8%,实现了模型轻量化和检测精度的平衡,易于部署,可满足钢材实际生产中实时检测的需求。展开更多
飞机机动识别在量化飞行员训练效果、预测对方战术意图及获取战场主动权等方面有着重要意义,然而战场数据的高度不平衡性严重制约了该技术的实际应用。近年来,生成式人工智能迅猛发展,其中,去噪扩散概率模型(Denoising Diffusion Probab...飞机机动识别在量化飞行员训练效果、预测对方战术意图及获取战场主动权等方面有着重要意义,然而战场数据的高度不平衡性严重制约了该技术的实际应用。近年来,生成式人工智能迅猛发展,其中,去噪扩散概率模型(Denoising Diffusion Probability Model,DDPM)在视觉领域展现出卓越的样本生成能力,受此启发,本文提出了一种基于马尔可夫转移场(Markov Transfer Field,MTF)的时序数据可视化方法:通过将飞机机动时序数据转换为二维图像,并结合DDPM生成新样本,有效解决样本不平衡问题,同时将时序分类任务转化为图像分类任务。为此,本文设计了一种新型分类网络架构,深度融合MobileNetV3的高效局部特征提取能力与Swin-Transformer的全局注意力机制优势,构建了融合可视化方法、DDPM生成模型与分类网络的飞机机动识别方法。实验结果表明,该方法在飞机机动识别任务中的精度显著优于图像分类领域的其他经典模型。展开更多
目的评价面向移动端的轻量级深度学习模型MobileNetV3用于糖尿病视网膜病变(diabetic retinopathy,DR)严重程度识别的准确性,为移动端DR识别提供技术基础。方法基于公开的DDR(dataset for diabetic retinopathy,DDR)数据集,使用MobileNe...目的评价面向移动端的轻量级深度学习模型MobileNetV3用于糖尿病视网膜病变(diabetic retinopathy,DR)严重程度识别的准确性,为移动端DR识别提供技术基础。方法基于公开的DDR(dataset for diabetic retinopathy,DDR)数据集,使用MobileNetV3-Large预训练模型通过迁移学习方法构建DR严重程度识别模型。针对DR的严重程度需求构建了4种识别模型:有无DR、是否为转诊DR、是否为威胁视力DR以及是否为增殖性DR。训练过程采用Focal Loss损失函数处理数据不平衡问题并使用数据增强技术提高模型泛化性能。通过在测试集上计算ROC(receiver operating characteristic curve)曲线下面积(area under the curve,AUC)、准确率、灵敏度、特异度等指标评价所构建模型的性能。结果MobileNetV3模型在4种DR严重程度识别任务中均表现良好,ROC曲线下AUC均未低于90%。有无DR识别模型的AUC为92.8%(92.0%,93.6%),准确率85.1%(83.9%,86.2%),灵敏度为81.3%(79.4%,83.0%),特异度为88.9%(87.4%,90.3%);是否转诊DR识别模型的AUC为91.0%(90.0%,91.9%),准确率84.1%(82.9%,85.2%),灵敏度为79.5%(77.5%,81.4%),特异度为87.8%(86.3%,89.2%);威胁视力DR识别模型的AUC为96.5%(95.5%,97.4%),准确率为89.8%(88.8%,90.8%),灵敏度为91.6%(88.2%,94.3%),特异度为89.6%(88.6%,90.6%);是否为增殖性DR识别模型的AUC为98.3%(97.7%,98.8%),准确率为93.9%(93.1%,94.6%),灵敏度93.5%(89.9%,96.1%),特异度93.9%(93.1%,94.7%)。结论MobileNetV3作为轻量级深度学习模型,其用于DR的严重程度识别具备良好的准确性,为基于MobileNetV3模型开发便携式移动设备以实现快速灵活的DR识别提供了技术基础。展开更多
文摘针对当前钢材表面缺陷检测模型存在的结构复杂、参数量大、实时性差和检测精度不高等问题,提出了一种基于改进YOLOv5s的轻量化模型。该模型首先将YOLOv5的主干网络替换为MobileNetV3,以实现模型轻量化并提升检测速度。其次,引入在线卷积重参数化(Online Convolutional Re-parameterization, OREPA)技术,进一步降低了训练成本,并使用K-means++算法聚类先验框来提高先验框聚类的准确性和收敛速度。最后,采用EIoU(Extended Intersection over Union)代替CIoU(Complete Intersection over Union)损失函数,加快了收敛并改善了回归精度。实验数据表明,相较于原始YOLOv5s模型,改进后模型的平均精度均值提高2.8个百分点,参数量减少84.0%,体积减小81.4%,检测速度提升60.8%,实现了模型轻量化和检测精度的平衡,易于部署,可满足钢材实际生产中实时检测的需求。
文摘飞机机动识别在量化飞行员训练效果、预测对方战术意图及获取战场主动权等方面有着重要意义,然而战场数据的高度不平衡性严重制约了该技术的实际应用。近年来,生成式人工智能迅猛发展,其中,去噪扩散概率模型(Denoising Diffusion Probability Model,DDPM)在视觉领域展现出卓越的样本生成能力,受此启发,本文提出了一种基于马尔可夫转移场(Markov Transfer Field,MTF)的时序数据可视化方法:通过将飞机机动时序数据转换为二维图像,并结合DDPM生成新样本,有效解决样本不平衡问题,同时将时序分类任务转化为图像分类任务。为此,本文设计了一种新型分类网络架构,深度融合MobileNetV3的高效局部特征提取能力与Swin-Transformer的全局注意力机制优势,构建了融合可视化方法、DDPM生成模型与分类网络的飞机机动识别方法。实验结果表明,该方法在飞机机动识别任务中的精度显著优于图像分类领域的其他经典模型。
文摘目的评价面向移动端的轻量级深度学习模型MobileNetV3用于糖尿病视网膜病变(diabetic retinopathy,DR)严重程度识别的准确性,为移动端DR识别提供技术基础。方法基于公开的DDR(dataset for diabetic retinopathy,DDR)数据集,使用MobileNetV3-Large预训练模型通过迁移学习方法构建DR严重程度识别模型。针对DR的严重程度需求构建了4种识别模型:有无DR、是否为转诊DR、是否为威胁视力DR以及是否为增殖性DR。训练过程采用Focal Loss损失函数处理数据不平衡问题并使用数据增强技术提高模型泛化性能。通过在测试集上计算ROC(receiver operating characteristic curve)曲线下面积(area under the curve,AUC)、准确率、灵敏度、特异度等指标评价所构建模型的性能。结果MobileNetV3模型在4种DR严重程度识别任务中均表现良好,ROC曲线下AUC均未低于90%。有无DR识别模型的AUC为92.8%(92.0%,93.6%),准确率85.1%(83.9%,86.2%),灵敏度为81.3%(79.4%,83.0%),特异度为88.9%(87.4%,90.3%);是否转诊DR识别模型的AUC为91.0%(90.0%,91.9%),准确率84.1%(82.9%,85.2%),灵敏度为79.5%(77.5%,81.4%),特异度为87.8%(86.3%,89.2%);威胁视力DR识别模型的AUC为96.5%(95.5%,97.4%),准确率为89.8%(88.8%,90.8%),灵敏度为91.6%(88.2%,94.3%),特异度为89.6%(88.6%,90.6%);是否为增殖性DR识别模型的AUC为98.3%(97.7%,98.8%),准确率为93.9%(93.1%,94.6%),灵敏度93.5%(89.9%,96.1%),特异度93.9%(93.1%,94.7%)。结论MobileNetV3作为轻量级深度学习模型,其用于DR的严重程度识别具备良好的准确性,为基于MobileNetV3模型开发便携式移动设备以实现快速灵活的DR识别提供了技术基础。