针对传统课堂质量评价手段主要依靠人工观察,存在效率低和精度差等问题,提出了一种基于改进YOLOv5s(You Only Look Once version 5 small)的轻量化课堂评价模型。通过采用该模型和层次分析法建立完善的课堂评价体系。该模型在颈部网络...针对传统课堂质量评价手段主要依靠人工观察,存在效率低和精度差等问题,提出了一种基于改进YOLOv5s(You Only Look Once version 5 small)的轻量化课堂评价模型。通过采用该模型和层次分析法建立完善的课堂评价体系。该模型在颈部网络中融入CBAM(Convolutional Block Attention Module)注意力机制,提高了模型的识别精度;通过在骨干网络中融合Ghost模块,显著降低了模型的复杂度;通过采用Focal Loss损失函数,有效地缓解了类别不平衡的问题。实验结果表明,与YOLOv5s模型相比,改进后的模型平均精度提升了7.3%,参数量减少了42.0%,计算量减少33.1%,检测速度提升了4%。最后结合层次分析法和熵权法建立课堂质量评价体系,动态显示当前课堂质量的评分,可满足实际课堂需求。展开更多
为了有效应对玉米地杂草对玉米产量和品质的影响,实现玉米与杂草的快速、准确检测,提出了一种基于改进YOLOv8n(You Only Look Once Version 8 nano)的玉米与杂草检测模型。首先,提出了ACMConv(Accurate and Computationally Minimal Con...为了有效应对玉米地杂草对玉米产量和品质的影响,实现玉米与杂草的快速、准确检测,提出了一种基于改进YOLOv8n(You Only Look Once Version 8 nano)的玉米与杂草检测模型。首先,提出了ACMConv(Accurate and Computationally Minimal Convolution)新型卷积方式,显著减少了模型计算量,使模型更加轻量化;其次,使用SELU激活函数,引入非线性因素,有效缓解了梯度消失问题;最后,引入Focal Loss作为边界框损失函数,使模型更加容易收敛。实验结果表明,相较于原始YOLOv8n模型,改进后的YOLOv8n模型的平均精度均值提升了1.3百分点,计算量降低了7.3%,实现了对玉米与杂草的高效、准确检测。展开更多
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据...为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。展开更多
为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度...为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。展开更多
文摘针对传统课堂质量评价手段主要依靠人工观察,存在效率低和精度差等问题,提出了一种基于改进YOLOv5s(You Only Look Once version 5 small)的轻量化课堂评价模型。通过采用该模型和层次分析法建立完善的课堂评价体系。该模型在颈部网络中融入CBAM(Convolutional Block Attention Module)注意力机制,提高了模型的识别精度;通过在骨干网络中融合Ghost模块,显著降低了模型的复杂度;通过采用Focal Loss损失函数,有效地缓解了类别不平衡的问题。实验结果表明,与YOLOv5s模型相比,改进后的模型平均精度提升了7.3%,参数量减少了42.0%,计算量减少33.1%,检测速度提升了4%。最后结合层次分析法和熵权法建立课堂质量评价体系,动态显示当前课堂质量的评分,可满足实际课堂需求。
文摘为了有效应对玉米地杂草对玉米产量和品质的影响,实现玉米与杂草的快速、准确检测,提出了一种基于改进YOLOv8n(You Only Look Once Version 8 nano)的玉米与杂草检测模型。首先,提出了ACMConv(Accurate and Computationally Minimal Convolution)新型卷积方式,显著减少了模型计算量,使模型更加轻量化;其次,使用SELU激活函数,引入非线性因素,有效缓解了梯度消失问题;最后,引入Focal Loss作为边界框损失函数,使模型更加容易收敛。实验结果表明,相较于原始YOLOv8n模型,改进后的YOLOv8n模型的平均精度均值提升了1.3百分点,计算量降低了7.3%,实现了对玉米与杂草的高效、准确检测。
文摘为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。
文摘为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。