期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
一种改进DETR的森林火灾烟雾识别模型 被引量:3
1
作者 颜谨 肖满生 +1 位作者 王瑶瑶 朱泽宇 《计算机技术与发展》 2025年第2期24-32,共9页
针对传统的基于卷积神经网络(CNN)的森林火灾烟雾检测中,需要大量人工设计构件、对复杂森林场景中不明显的小烟雾检测能力较差等问题,提出了一种改进DETR(Detection Transformer)的森林火灾发生早期的烟雾检测模型。首先,使用DETR作为基... 针对传统的基于卷积神经网络(CNN)的森林火灾烟雾检测中,需要大量人工设计构件、对复杂森林场景中不明显的小烟雾检测能力较差等问题,提出了一种改进DETR(Detection Transformer)的森林火灾发生早期的烟雾检测模型。首先,使用DETR作为基线,将多尺度对比局部特征模块(MCCL)和密集金字塔池化模块(DPPM)集成到特征提取模块中,用于感知小烟雾或不明显烟雾的特征;然后,提出了一种边界框迭代组合方法,生成能够覆盖整个烟雾对象的精确包围盒,以提高检查精度、减少误检与漏检;最后,利用CutMix数据增强扩充森林火灾烟雾数据集,对该方法进行评价。理论分析与实验表明,改进后的模型对森林火灾烟雾的检测精度明显高于主流模型,与传统DETR模型相比,该模型的mAP(平均精度均值)提高了4.4%,AP_(50)精度提高了3.8%。 展开更多
关键词 烟雾检测 DETR 多尺度特征信息 注意力机制 cutmix
在线阅读 下载PDF
基于CutMix算法和改进Xception网络的深度伪造检测研究 被引量:6
2
作者 耿鹏志 唐云祁 +1 位作者 樊红兴 朱新同 《激光与光电子学进展》 CSCD 北大核心 2022年第16期348-355,共8页
随着深度伪造技术的发展,生成的图片视频质量越来越逼真,给社会带来了巨大的安全风险。针对现有的检测方法参数量大、网络较深、模型结构复杂等情况,首先对取证领域的经典检测模型XceptionNet进行优化,提出一种轻量化的取证模型Xcep_Blo... 随着深度伪造技术的发展,生成的图片视频质量越来越逼真,给社会带来了巨大的安全风险。针对现有的检测方法参数量大、网络较深、模型结构复杂等情况,首先对取证领域的经典检测模型XceptionNet进行优化,提出一种轻量化的取证模型Xcep_Block8,在减少模型参数量的同时,仍保持较高的检测精度。其次,针对类别不均衡问题,通过提高较少类别样本的采样概率,较好地解决了正负样本不均的情况。最后使用混合式数据增强方法CutMix增强样本之间的线性表达。实验结果表明,所提模型的测试结果较基线结果提升约1.01个百分点,同时在参数量方面较其他方法也有一定优势。 展开更多
关键词 机器视觉 深度伪造 伪造检测 Xception网络 混合式数据增强
原文传递
基于优化Yolov5的腰椎医学图像检测算法
3
作者 李明 《长江信息通信》 2023年第12期42-44,共3页
腰椎MRI检查可将对应节段腰椎的病理变化显现出,医务人员了解病变范围、程度,有助于选择合适的手术方案。假如患者遗留腰椎间盘突出的问题等,可能会影响到手术;对腰椎间盘突出患者进行手术治疗,需进行相关腰椎MRI检查,可提高手术治愈率... 腰椎MRI检查可将对应节段腰椎的病理变化显现出,医务人员了解病变范围、程度,有助于选择合适的手术方案。假如患者遗留腰椎间盘突出的问题等,可能会影响到手术;对腰椎间盘突出患者进行手术治疗,需进行相关腰椎MRI检查,可提高手术治愈率。本文提出基于Yolov5的腰椎图像检测算法,利用CutMix数据增强,添加CA注意力模块,来改善模型性能。通过优化的Yolov5检测,将大量腰椎MRI图像变得直观可视,使医务人员的临床工作效率得到提升,对社会贡献有着重大的意义。实验结果显示,本文提供的算法能够有效、精确、快速地检测腰椎MRI图像。 展开更多
关键词 腰椎目标检测 Yolov5 cutmix数据增强 CA注意力模块
在线阅读 下载PDF
基于数据增广的声学场景分类 被引量:2
4
作者 李源 马成男 +2 位作者 李关防 王强 张文武 《指挥控制与仿真》 2021年第1期60-64,共5页
声学场景分类是计算机听觉领域的热点方向之一,相比计算机视觉,特定场景下音频数据的收集和标注成本相对较高,如何利用有限的声学场景音频获得较高的分类准确率成为当前研究的重点内容。利用深度学习技术,结合轻量化网络模型mobilenetv... 声学场景分类是计算机听觉领域的热点方向之一,相比计算机视觉,特定场景下音频数据的收集和标注成本相对较高,如何利用有限的声学场景音频获得较高的分类准确率成为当前研究的重点内容。利用深度学习技术,结合轻量化网络模型mobilenetv2以及Mel声谱特征,基于城市场景分类数据集(urbansound8k)对三种数据增广技术SpecAugment、Mixup以及Cutmix进行全面的消融实验,结果表明:Cutmix增广技术将基线结果提升了0.71%,单独的Mixup以及SpecAugment增广技术对分类结果起抑制效果,SpecAugment结合Cutmix增广技术获得了最优的测试结果,分类准确率达到97.097%;其次对比最优方案下各类标签的F1分数和T-SNE降维分布图发现,二者具有很好的对应关系,表明T-SNE技术适用于Mel声谱特征的降维及分布观测。 展开更多
关键词 声学场景分类 数据增广 SpecAugment Mixup cutmix
在线阅读 下载PDF
基于卷积神经网络的垃圾图片处理与改进 被引量:2
5
作者 尚志亮 王伟 +2 位作者 杨燚 嘉明珍 马存良 《物联网技术》 2022年第8期93-96,99,共5页
针对垃圾图片背景复杂和数量少等情况导致的神经网络准确率不高和泛化能力弱的问题,提出利用CutMix数据增强技术对数据集进行扩展,并在VGG16网络模型的基础上分别加入L1、L2正则化构建更为具体的损失函数,防止过拟合现象的发生。将上述... 针对垃圾图片背景复杂和数量少等情况导致的神经网络准确率不高和泛化能力弱的问题,提出利用CutMix数据增强技术对数据集进行扩展,并在VGG16网络模型的基础上分别加入L1、L2正则化构建更为具体的损失函数,防止过拟合现象的发生。将上述改进分为8种模型,对4大类30个小类的14921张垃圾图像分别训练,得到准确率和损失值。实验结果表明,原VGG16网络模型的准确率为91.17%;加入L1正则化并将数据集利用数据增强技术扩展增加9350张图片后,准确率提升最大为92.26%,提升幅度为1.09%。通过对比分析,改进后的网络无论是准确率还是泛化能力都有了明显的提升;此外,在单独引入L1正则化或L2正则化后,模型的损失函数变得光滑且不再过早趋于平稳,有效避免了过拟合和梯度消失情况的发生,改善了网络的整体性能。 展开更多
关键词 垃圾分类 深度学习 卷积神经网络 正则化 VGG16 图像分类 cutmix
在线阅读 下载PDF
A Study on Small Pest Detection Based on a CascadeR-CNN-Swin Model 被引量:2
6
作者 Man-Ting Li Sang-Hyun Lee 《Computers, Materials & Continua》 SCIE EI 2022年第9期6155-6165,共11页
This study aims to detect and prevent greening disease in citrus trees using a deep neural network.The process of collecting data on citrus greening disease is very difficult because the vector pests are too small.In ... This study aims to detect and prevent greening disease in citrus trees using a deep neural network.The process of collecting data on citrus greening disease is very difficult because the vector pests are too small.In this paper,since the amount of data collected for deep learning is insufficient,we intend to use the efficient feature extraction function of the neural network based on the Transformer algorithm.We want to use the Cascade Region-based Convolutional Neural Networks(Cascade R-CNN)Swin model,which is a mixture of the transformer model and Cascade R-CNN model to detect greening disease occurring in citrus.In this paper,we try to improve model safety by establishing a linear relationship between samples using Mixup and Cutmix algorithms,which are image processing-based data augmentation techniques.In addition,by using the ImageNet dataset,transfer learning,and stochastic weight averaging(SWA)methods,more accuracy can be obtained.This study compared the Faster Region-based Convolutional Neural Networks Residual Network101(Faster R-CNN ResNet101)model,Cascade Regionbased Convolutional Neural Networks Residual Network101(Cascade RCNN-ResNet101)model,and Cascade R-CNN Swin Model.As a result,the Faster R-CNN ResNet101 model came out as Average Precision(AP)(Intersection over Union(IoU)=0.5):88.2%,AP(IoU=0.75):62.8%,Recall:68.2%,and the Cascade R-CNN ResNet101 model was AP(IoU=0.5):91.5%,AP(IoU=0.75):67.2%,Recall:73.1%.Alternatively,the Cascade R-CNN Swin Model showed AP(IoU=0.5):94.9%,AP(IoU=0.75):79.8%and Recall:76.5%.Thus,the Cascade R-CNN Swin Model showed the best results for detecting citrus greening disease. 展开更多
关键词 Cascade R-CNN swin model cascade R-CNN resNet101 model faster R-CNN ResNet101 model mixup cutmix
在线阅读 下载PDF
结合注意力混合裁剪的细粒度分类网络 被引量:3
7
作者 白瑜颖 刘宁钟 姜晓通 《计算机技术与发展》 2021年第10期38-42,共5页
细粒度图像识别旨在区分同属某一大类下更为精细的子类,具有类间差距小和类内差距大的特点。同时细粒度数据集往往种类多,而数据量较少,容易产生训练时的过拟合。针对上述问题,文中提出了一种结合注意力混合裁剪的细粒度分类网络,利用... 细粒度图像识别旨在区分同属某一大类下更为精细的子类,具有类间差距小和类内差距大的特点。同时细粒度数据集往往种类多,而数据量较少,容易产生训练时的过拟合。针对上述问题,文中提出了一种结合注意力混合裁剪的细粒度分类网络,利用注意力机制指导改进的混合裁剪数据增强。首先使用ResNet50作为基础网络提取图像特征,之后利用1*1卷积获取注意力图,再通过双线性注意力池化操作将特征图与注意力融合拼接成特征矩阵,最后利用注意力图进行改进的混合裁剪数据增强。其中改进的混合裁剪数据增强是交换两张图片的注意力高峰区域,同时交换两张图片的标注信息,之后再将两张图片重新送入网络再次进行学习,以达到强化局部特征学习和丰富训练集背景的效果。实验在4个通用细粒度数据集上与弱监督数据增强网络(WS-DAN)和目前主流先进方法进行了比较,取得了具有竞争力的效果,相比WS-DAN分别提升了0.5%(鸟类)、0.4%(车型)、0.6%(狗类)、0.4%(飞机),验证了方法的有效性。 展开更多
关键词 细粒度 卷积神经网络 弱监督 注意力机制 混合裁剪 数据增强
在线阅读 下载PDF
Automatic modulation classification based on Alex Net with data augmentation 被引量:2
8
作者 Zhang Chengchang Xu Yu +1 位作者 Yang Jianpeng Li Xiaomeng 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2022年第5期51-61,共11页
Deep learning(DL) requires massive volume of data to train the network. Insufficient training data will cause serious overfitting problem and degrade the classification accuracy. In order to solve this problem, a meth... Deep learning(DL) requires massive volume of data to train the network. Insufficient training data will cause serious overfitting problem and degrade the classification accuracy. In order to solve this problem, a method for automatic modulation classification(AMC) using AlexNet with data augmentation was proposed. Three data augmentation methods is considered, i.e., random erasing, CutMix, and rotation. Firstly, modulated signals are converted into constellation representations. And all constellation representations are divided into training dataset and test dataset. Then, training dataset are augmented by three methods. Secondly, the optimal value of execution probability for random erasing and CutMix are determined. Simulation results show that both of them perform optimally when execution probability is 0.5. Thirdly, the performance of three data augmentation methods are evaluated. Simulation results demonstrate that all augmentation methods can improve the classification accuracy. Rotation improves the classification accuracy by 13.04% when signal noise ratio(SNR) is 2 dB. Among three methods, rotation outperforms random erasing and CutMix when SNR is greater than-6 dB. Finally, compared with other classification algorithms, random erasing, CutMix, and rotation used in this paper achieved the performance significantly improved. It is worth mentioning that the classification accuracy can reach 90.5% with SNR at 10 dB. 展开更多
关键词 automatic modulation classification(AMC) data augmentation random erasing cutmix ROTATION deep learning(DL)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部