期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于CAM-DenseNet模型的邮轮薄板焊缝缺陷识别算法
1
作者 黎林发 王岳 《造船技术》 2025年第1期78-84,共7页
邮轮薄板焊缝的熔深和熔宽相对较小,母材与焊缝区域差异性小,焊缝表面缺陷较难判别。为准确地定位焊缝位置,提出一种将注意力机制的坐标注意力模块(Coordinate Attention Module,CAM)融入密集链接卷积网络(Densely Connected Convolutio... 邮轮薄板焊缝的熔深和熔宽相对较小,母材与焊缝区域差异性小,焊缝表面缺陷较难判别。为准确地定位焊缝位置,提出一种将注意力机制的坐标注意力模块(Coordinate Attention Module,CAM)融入密集链接卷积网络(Densely Connected Convolutional Networks,DenseNet)的邮轮薄板焊缝缺陷识别算法,建立CAM-DenseNet模型。将网络中的激活函数ReLU替换为更具有稳定性的ReLU6,并利用贝叶斯优化算法对CAM-DenseNet模型的超参数组合进行优化和选取。在焊接车间利用相机采集邮轮薄板焊缝三原色(Red Green Blue,RGB)图片,自建立邮轮薄板焊缝缺陷数据集,并按焊缝缺陷类型将数据集分为凹陷、气孔、毛刺、表面裂纹和无缺陷等5类。试验结果表明,CAM-DonseNet模型对邮轮薄板焊缝缺陷识别具有优异表现。 展开更多
关键词 邮轮 薄板 焊缝缺陷 识别算法 深度学习 密集链接卷积网络 坐标注意力模块 cam-DenseNet模型 激活函数 贝叶斯优化算法
在线阅读 下载PDF
复杂电磁环境下的调制识别网络 被引量:1
2
作者 周金 李玉芝 +3 位作者 张徐 高硕 张立 盛家川 《计算机应用》 北大核心 2025年第8期2672-2682,共11页
自动调制识别(AMR)是无线通信系统的关键技术。针对AMR网络在复杂电磁环境下迁移能力较差以及对噪声和调制信号的特征区分能力不足的问题,提出去噪及双模态注意力Transformer及卷积融合网络(Denoising & Dual-modal Attention CNN-T... 自动调制识别(AMR)是无线通信系统的关键技术。针对AMR网络在复杂电磁环境下迁移能力较差以及对噪声和调制信号的特征区分能力不足的问题,提出去噪及双模态注意力Transformer及卷积融合网络(Denoising & Dual-modal Attention CNN-Transformer, D-DmACT)。首先,设计一种迭代生成复杂干扰的生成器和对抗干扰的判别器,增强模型在遭遇复杂电磁环境时的泛化能力;其次,设计基于复数注意力的Transformer模块,以捕获同相正交(IQ)信号的时域特征,并设计基于时频位置信息的坐标注意力模块,以获取时频图像的特征,并对两种特征进行交叉融合;再次,将判别器输出的时序复序列和时频图像送至双模态注意力融合模型;最后,实现轻量化的分类识别。在数据集RadioML2016.10a和RadioML2018.01a上分别开展的高斯白噪声以及复杂电磁环境下的识别实验的结果表明:在脉冲噪声的作用下,相较于CLDNN(Convolutional Long short-term Deep Neural Network)、残差网络(ResNet)和长短期记忆(LSTM)网络,所提网络的平均识别准确率分别提高了53.98%、28.82%和24.64%,而相较于多模态自动调制分类网络(MM-Net)、阈值自编码去噪卷积神经网络(TADCNN)和生成式对抗网络联合多模态注意力机制卷积长短期记忆网络(GAN-MnACL),所提网络的平均识别准确率分别提高了19.74%、13.55%和11.17%。在计算复杂度方面,通过参数量和浮点运算数(FLOPs)等指标验证了所提网络在终端的可部署性。 展开更多
关键词 自动调制识别 生成对抗网络 坐标注意力机制 TRANSFORMER 复杂干扰
在线阅读 下载PDF
面向鱼眼相机标定和畸变处理的深度神经网络 被引量:1
3
作者 李晗 葛动元 姚锡凡 《科学技术与工程》 北大核心 2025年第17期7260-7267,共8页
针对鱼眼相机的传统标定过程烦琐并且不适用于日常场景图像的问题,提出了一种新的基于卷积神经网络的方法,可同时标定鱼眼镜头的内参并进行图像畸变校正。该方法通过预测不同畸变参数下像素点的位移量,从而提高鱼眼相机标定和图像畸变... 针对鱼眼相机的传统标定过程烦琐并且不适用于日常场景图像的问题,提出了一种新的基于卷积神经网络的方法,可同时标定鱼眼镜头的内参并进行图像畸变校正。该方法通过预测不同畸变参数下像素点的位移量,从而提高鱼眼相机标定和图像畸变校正的精度;为了进一步提高模型精度和泛化性,在编码部分引入坐标注意力模块,增强对图像位置信息的关注度;最后为了增强图像的细节特征,在跨越连接部分设计了跨尺度融合模块。针对数据集稀缺的问题,还生成了一个新的大规模数据集,标有相应的畸变参数和畸变校正后的图像。实验结果表明:与其他鱼眼相机标定方法相比,重投影误差为0.312 pixel,标定的精度较高;与图像畸变处理方法相比,峰值信噪比(peak signal to noise ratio,PSNR)为38.055 dB,结构相似度(structural similarity,SSIM)为0.874,图像畸变校正的质量较好。 展开更多
关键词 鱼眼相机标定 畸变处理 坐标注意力模块 跨尺度融合模块
在线阅读 下载PDF
基于改进YOLOv5的玉米植株检测与识别研究 被引量:1
4
作者 崔岩 庄卫东 +1 位作者 秦韬 王楠 《中国农机化学报》 北大核心 2025年第6期136-141,共6页
为解决机械除草伤苗的问题,提出一种改进YOLOv5的玉米植株检测方法。建立复杂田间环境下的玉米植株数据集,在原有模型的基础上在Backbone和Head层增加坐标注意力(CA)机制,通过动态加权的方式提升对于玉米植株位置信息的关注度,强化位置... 为解决机械除草伤苗的问题,提出一种改进YOLOv5的玉米植株检测方法。建立复杂田间环境下的玉米植株数据集,在原有模型的基础上在Backbone和Head层增加坐标注意力(CA)机制,通过动态加权的方式提升对于玉米植株位置信息的关注度,强化位置信息,提升检测准确度,在Neck层采用加权双向特征金字塔网络(BiFPN),加强特征融合,提高检测速度和检测精确度。试验结果表明,与原始模型相比,所改进方法的平均精度均值mAP@0.5、mAP@0.5:0.95分别提升4.31、3.66个百分点,检测速度和模型大小分别为46.77帧/s和15.56 M,与SSD、YOLOv5、Fast R—CNN和YOLOv7相比也有一定的优势。改进模型能有效实现玉米植株的检测,实时性好,内存占用量小,可为智能除草机器人的护苗工作提供借鉴。 展开更多
关键词 玉米植株检测 YOLOv5模型 加权双向特征金字塔 坐标注意力机制
在线阅读 下载PDF
GCANet:面向视觉物联网的标签文本检测方法
5
作者 孔二伟 窦泽亚 +2 位作者 张亚邦 贾运红 王满利 《高技术通讯》 北大核心 2025年第10期1059-1068,共10页
针对复杂环境下含标签货物实时记录困难的问题,提出一种面向视觉物联网(visual Internet of Things,VIoT)的文本检测方法。在视觉物联网中设计并引入基于全局上下文注意力和坐标注意力的文本检测网络(text detection network based on g... 针对复杂环境下含标签货物实时记录困难的问题,提出一种面向视觉物联网(visual Internet of Things,VIoT)的文本检测方法。在视觉物联网中设计并引入基于全局上下文注意力和坐标注意力的文本检测网络(text detection network based on global context attention and coordinate attention,GCANet),首先提出一种改进型坐标注意力模块,通过水平和垂直2个并行的一维池化操作,避免了因二维全局池化造成的位置信息丢失;然后引入全局上下文注意力模块,避免在复杂的背景对文本检测的影响,并防止密集或较远间隔的文本被错误地检测。该系统中提出的GCANet在公共数据集ICDAR2015、MSRA-TD500和Total-Text上的综合指标F值分别达到87.4%、86.9%和86.3%。在工业标签数据集Label-Text上平均准确率、平均召回率和平均F值分别达到93.4%、90.9%和92.1%。此外,GCANet在矿井下的标签数据集Mine-Text上准确率、召回率和F值分别达到94.4%、84.9%和89.9%。实验结果表明,本文提出的面向视觉物联网的文本检测方法效果优异。 展开更多
关键词 视觉物联网 文本检测 坐标注意力模块 全局上下文注意力模块
在线阅读 下载PDF
PCTEA-DNet:融合极坐标变换与边缘感知的双阶段皮肤病灶分割算法
6
作者 邓汪涛 刘国华 《东华大学学报(自然科学版)》 北大核心 2025年第6期80-90,共11页
皮肤癌的早期检测对提高患者生存率至关重要。针对皮肤病灶形态多变、边缘模糊以及图像噪声较高等问题,提出一种融合极坐标变换与边缘感知的双阶段皮肤病灶分割算法PCTEA-DNet。算法将病灶质心作为极坐标原点,将病变区域转换为放射状形... 皮肤癌的早期检测对提高患者生存率至关重要。针对皮肤病灶形态多变、边缘模糊以及图像噪声较高等问题,提出一种融合极坐标变换与边缘感知的双阶段皮肤病灶分割算法PCTEA-DNet。算法将病灶质心作为极坐标原点,将病变区域转换为放射状形态,增强模型对不规则边缘的几何形变建模能力。通过设计双主干分支网络架构(DNet)、多向边缘检测模块(L-MOED)和多尺度自适应融合注意力模块(DCAF)实现多尺度特征融合。DCAF模块创新性地引入动态温度调节机制与空间-通道联合注意力,通过空洞卷积组捕获多尺度上下文特征,并利用可学习温度参数优化注意力分布。在公开数据集ISIC2018上的试验表明:该方法达到86.1%的平均交并比(mIoU),较U-Net基座模型提升8.24%;Dice系数达92.45%。本研究为皮肤癌自动筛查提供高精度、强稳健性的解决方案。 展开更多
关键词 皮肤病灶分割 极坐标变换 边缘感知 注意力模块 双主干网络
在线阅读 下载PDF
改进YOLOv5的活性污泥微生物镜检方法
7
作者 张宇航 苑明哲 +3 位作者 王文洪 张佳 肖金超 曹飞道 《环境工程》 2025年第6期188-196,共9页
针对现有活性污泥微生物检测算法精度低,漏检率较高的问题,提出了一种改进YOLOv5的微生物检测方法。利用K-Means++算法生成最适合本数据集的锚框组,在YOLOv5主干网络中用C3GC模块代替原有C3模块加强特征信息提取,颈部网络的特征金字塔... 针对现有活性污泥微生物检测算法精度低,漏检率较高的问题,提出了一种改进YOLOv5的微生物检测方法。利用K-Means++算法生成最适合本数据集的锚框组,在YOLOv5主干网络中用C3GC模块代替原有C3模块加强特征信息提取,颈部网络的特征金字塔融合坐标注意力机制与全局到空间聚合模块加强特征信息的融合。基于实际采集的活性污泥微生物数据,通过数据增强方法构建了训练和测试数据集。改进算法在测试数据集上召回率达到97.4%,平均精准度达到99.2%,模型大小仅为23.5MB,与原始YOLOv5模型和其他主流检测模型及变种相比,准确率与回归率均取得了较大提升,并能够满足在移动端的快速部署,证明了改进算法的有效性。 展开更多
关键词 污水处理 微生物检测 YOLOv5 特征金字塔 坐标注意力机制 全局到空间聚合模块
原文传递
基于改进YoloV5s的深海多金属结核识别与质量估算方法
8
作者 唐锴令 郑皓 王蕊 《哈尔滨工程大学学报》 北大核心 2025年第12期2567-2574,共8页
深海多金属结核因其丰富的金属元素成分具备极高的开采价值,为了有效开采深海多金属结核必须对海底各个矿区的结核丰度进行准确估算与分析,本文提出一种基于改进YoloV5s的深海多金属结核目标检测与质量提取的方法。引入层次化窗口变换... 深海多金属结核因其丰富的金属元素成分具备极高的开采价值,为了有效开采深海多金属结核必须对海底各个矿区的结核丰度进行准确估算与分析,本文提出一种基于改进YoloV5s的深海多金属结核目标检测与质量提取的方法。引入层次化窗口变换视觉转换模块和坐标注意力机制,并建立由个人收集的深海多金属结核数据集,共1500张图像。结果表明:本方法在结核图像检测中的平均精度达到99.50%,较原始YoloV5s提升了0.94%,在保证较快检测速度的同时实现了精度的显著提高;改进算法表现出更强的判别能力,置信度从0.74提升至0.94,增强了模型对结核目标的识别可靠性。本文方法为深海多金属结核的丰度识别提供了有力支撑,可用于对海底矿区结核的丰度进行准确估算与分析。 展开更多
关键词 YoloV5 目标检测 深度学习 滑动窗口视觉转换模块 坐标注意力机制 深海资源 图像识别 多金属结核丰度估算
在线阅读 下载PDF
DN-Net:密集嵌套网络的遥感建筑物提取
9
作者 刘毅 刘涛 +1 位作者 高天迎 李国燕 《自然资源遥感》 北大核心 2025年第6期77-87,共11页
建筑物提取的目的是从遥感图像中分割出建筑物像素,在城市规划、城市动态监测等应用中起着至关重要的作用。针对遥感建筑物提取时出现空洞、误检和漏检等问题,提出一种密集嵌套网络(densely nested network, DN-Net)。DN-Net中子网络结... 建筑物提取的目的是从遥感图像中分割出建筑物像素,在城市规划、城市动态监测等应用中起着至关重要的作用。针对遥感建筑物提取时出现空洞、误检和漏检等问题,提出一种密集嵌套网络(densely nested network, DN-Net)。DN-Net中子网络结合改进残差卷积模块将遥感建筑物进行粗略轮廓提取;为精准定位建筑物的位置,引入坐标注意力模块(coordinate attention module, CAM),有效减少误检现象;为了解决遥感建筑物提取时出现空洞现象,采取级联卷积模块(cascade convolutional module, CCM),凭借不同的大小的卷积核提取更丰富的细节信息,从而精准提取遥感建筑物。选取WHU数据集进行了试验和精度评估,在WHU的验证集上,交并比和F1分数分别达到了89.20%和94.29%;在测试集上,分别为89.85%和94.65%。结果表明:DN-Net显著提升建筑物提取精度,使得提取出的建筑物的边界更加完整和精细,表现出对不同大小建筑物的良好提取能力。 展开更多
关键词 建筑物提取 改进残差卷积模块 坐标注意力模块 级联卷积模块
在线阅读 下载PDF
基于改进YOLOv11n的下水管道裂缝识别算法
10
作者 邱丹丹 郑少峰 《重庆科技大学学报(自然科学版)》 2025年第4期69-76,109,共9页
针对下水管道裂缝检测精度不足的问题,提出了一种基于改进YOLOv11n的下水管道裂缝识别算法。首先,设计C3K2-MSCB2模块,以有效解决特征提取的信息瓶颈问题,显著降低精度损失;然后,引入坐标注意力机制对传统SPPF输出端进行优化,以提升模... 针对下水管道裂缝检测精度不足的问题,提出了一种基于改进YOLOv11n的下水管道裂缝识别算法。首先,设计C3K2-MSCB2模块,以有效解决特征提取的信息瓶颈问题,显著降低精度损失;然后,引入坐标注意力机制对传统SPPF输出端进行优化,以提升模型识别效果;最后,将特征融合网络中的Concat模块替换为BiFPN模块,在降低模型复杂度的同时确保检测精度的稳定性。实验结果表明,相较于YOLOv11n模型,改进模型的P_(mA@50)从82.9%提升至87.3%,P_(mA@50∶95)从45.2%提升至49.1%,说明该模型在目标检测准确性方面的优势显著;改进模型的置信度也得到了明显改善,充分验证了其在复杂环境中的稳定性和可靠性。 展开更多
关键词 目标检测 下水管道 C3K2-MSCB2模块 坐标注意力机制 BiFPN模块
在线阅读 下载PDF
基于LT-YOLOv5s的PCB缺陷检测方法 被引量:3
11
作者 张开生 李昊晨 +1 位作者 关凯凯 彭朋 《实验室研究与探索》 CAS 北大核心 2023年第2期108-114,共7页
针对传统PCB缺陷检测算法检测准确度低、实时性差等问题,提出一种改进的YOLOv5s网络PCB缺陷检测方法。针对缺陷特性,去除大目标的检测尺度,保留中小目标检测尺度;在网络模型末端用Transformer替代BottleneckCSP模块,提升了网络模型捕获... 针对传统PCB缺陷检测算法检测准确度低、实时性差等问题,提出一种改进的YOLOv5s网络PCB缺陷检测方法。针对缺陷特性,去除大目标的检测尺度,保留中小目标检测尺度;在网络模型末端用Transformer替代BottleneckCSP模块,提升了网络模型捕获目标特征的能力;结合坐标注意力模块,提升模型的性能并减少参数。以某PCB数据集为测试对象,结果表明,改进后的算法平均精度均值(mAP)达到99.04%,平均检测速度为19ms/帧,改进后的算法能够更加快速有效的检测出PCB缺陷。 展开更多
关键词 缺陷检测 YOLOv5s算法 Transformer模块 检测尺度 坐标注意力机制
在线阅读 下载PDF
基于改进YOLOv5的X射线图像危险品检测 被引量:18
12
作者 李启明 阙祖航 《科学技术与工程》 北大核心 2023年第4期1598-1606,共9页
目前安检甄别工作主要依靠人工完成,但巨大的工作量使自动安检成为必然趋势。为了在保证精度的前提下轻量化模型,并进一步克服X射线安检图像存在物品重叠遮挡、背景干扰严重等问题,提出了一种基于YOLOv5的改进模型。该模型采用Ghost模... 目前安检甄别工作主要依靠人工完成,但巨大的工作量使自动安检成为必然趋势。为了在保证精度的前提下轻量化模型,并进一步克服X射线安检图像存在物品重叠遮挡、背景干扰严重等问题,提出了一种基于YOLOv5的改进模型。该模型采用Ghost模块对原模型进行剪枝处理;引入坐标注意力机制,使网络在训练中更好地聚焦危险品,生成更具分辨性的特征;采用传统数据增强策略与Mixup数据增强策略相结合的方式来改善模型的泛化能力和鲁棒性。实验结果表明:改进模型的参数量和模型大小比原模型分别减少了17.3%、16.1%,改进模型在SIXray和OPIXray数据集上的平均精度均值(mAP)比原模型分别提高了2.3%、5.7%。所提出模型在轻量化的同时能够进一步提高检测能力,满足实时检测要求,具有较好的应用价值。 展开更多
关键词 X射线安检图像 Ghost模块 坐标注意力机制 数据增强策略
在线阅读 下载PDF
基于YOLOv5-CP的复杂环境下油茶果检测 被引量:2
13
作者 肖章 彭江 +2 位作者 刘俊杰 孙二杰 彭如恕 《中国农机化学报》 北大核心 2023年第12期193-199,共7页
为解决复杂环境下油茶果的检测精度不高的问题,提出一种YOLOv5-CP的油茶果检测方法。首先利用RealSense D435i深度相机在自然场景下采集各种环境下的油茶果图像,使用LabelImg软件进行油茶果的标注;然后引入Cutout数据增强方法和坐标注... 为解决复杂环境下油茶果的检测精度不高的问题,提出一种YOLOv5-CP的油茶果检测方法。首先利用RealSense D435i深度相机在自然场景下采集各种环境下的油茶果图像,使用LabelImg软件进行油茶果的标注;然后引入Cutout数据增强方法和坐标注意力模块(Coordinate Attention),以及提出一种改进的PANet特征提取层对YOLOv5模型进行优化,构建一种新的油茶果检测模型YOLOv5-CP;最后将YOLOv5-CP与现有模型在复杂环境下进行油茶果检测对比试验。试验表明:YOLOv5-CP模型的检测准确率、召回率以及平均精度分别为98%、94.6%以及98.4%,遮挡和重叠环境下对比原YOLOv5模型检测准确率分别提升11.3%和10.8%。本文方法有效提升油茶果检测过程中遮挡、重叠等复杂环境下果实的检测准确率,为后续开发油茶采摘机器人提供理论基础。 展开更多
关键词 油茶果 目标检测 YOLOv5算法 数据增强 坐标注意力模块
在线阅读 下载PDF
深度学习的红外热成像电路板元器件识别研究 被引量:3
14
作者 张林鍹 郑兴 +3 位作者 陈飞 李名洪 邱朝洁 常乾坤 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第4期560-567,共8页
针对现有YOLO目标检测算法在自建数据集漏检率高、图像受复杂环境影响造成检测准确率低等问题,提出一种基于YOLO v5改进的红外图像识别算法。根据红外数据图片的独特性质,重新设计主干网络部分,引入全维动态卷积(OMNI-Dimensional Dynam... 针对现有YOLO目标检测算法在自建数据集漏检率高、图像受复杂环境影响造成检测准确率低等问题,提出一种基于YOLO v5改进的红外图像识别算法。根据红外数据图片的独特性质,重新设计主干网络部分,引入全维动态卷积(OMNI-Dimensional Dynamic Convolution, ODConv)模块和改进坐标注意力(Coordinate Attention, CA)机制,提高模型对小目标的检测精确度并减少参数量;其次,引入解耦头(Decoupled Head, DH)模块,提高模型训练的收敛速度;最后,加入GSConv(Graph-Shifted Convolution) Slim模块,以降低模型的复杂度,提高预测速度。实验结果表明:改进后的算法模型漏检率降低40.22%,每秒浮点运算次数(Floating-point Operations Per Second, FLOPs)提升了25%,平均准确率提升了28.32%。 展开更多
关键词 红外热成像 YOLO v5 全维动态卷积 改进解耦头 改进坐标注意力机制 GSConv Slim模块
在线阅读 下载PDF
基于坐标注意力机制增强的CenterNet模型在烟草甲检测中的应用
15
作者 孙俊峰 王保录 +1 位作者 黄琰淦 黄滔 《湖北农业科学》 2024年第11期191-196,215,共7页
通过在CenterNet模型中引入坐标注意力机制,使CAM-CenterNet模型更多地关注对烟草甲(Lasioderma serricorne)(以下简称烟虫)表征能力好的通道和位置,降低烟丝、烟末等杂质的干扰,将精确率(Precision)、召回率(Recall)、平均精度(mAP)、... 通过在CenterNet模型中引入坐标注意力机制,使CAM-CenterNet模型更多地关注对烟草甲(Lasioderma serricorne)(以下简称烟虫)表征能力好的通道和位置,降低烟丝、烟末等杂质的干扰,将精确率(Precision)、召回率(Recall)、平均精度(mAP)、每秒帧率(FPS)以及模型参数量(Params size)作为评价指标,对CAM-CenterNet模型、CenterNet模型、YOLOv3模型和Faster R-CNN模型的烟虫检测性能进行对比。结果表明,在召回率和平均精度方面,YOLOv3模型表现最好,CAM-CenterNet模型稍落后于YOLOv3模型,但高于其他模型;在帧率方面,CAM-CenterNet模型检测烟虫图像的速度较YOLOv3模型更快,且模型参数量更少,对设备配置要求更低。在检测个体较小的烟虫时,CAM-CenterNet模型的烟虫检出数量高于Faster R-CNN模型、YOLOv3模型。CAM-CenterNet模型不仅能更多地关注烟虫目标特征,而且能很好地抑制烟丝、烟末等杂质带来的干扰,实现烟虫的有效检测。CAM-CenterNet模型能满足卷烟厂对烟虫检测速度和精度的要求,可以为烟厂的烟虫整治提供技术支持。 展开更多
关键词 坐标注意力机制 CenterNet模型 cam-CenterNet模型 烟草甲(Lasioderma serricorne)检测
在线阅读 下载PDF
基于改进Deeplab v3+的服装图像分割网络 被引量:10
16
作者 胡新荣 龚闯 +3 位作者 张自力 朱强 彭涛 何儒汉 《计算机工程》 CAS CSCD 北大核心 2022年第7期284-291,共8页
在服装图像分割领域,现有算法存在服装边缘分割粗糙、分割精度差和服装深层语义特征提取不够充分等问题。将Coordinate Attention机制和语义特征增强模块(SFEM)嵌入到语义分割性能较好的Deeplab v3+网络,设计一种用于服装图像分割领域的... 在服装图像分割领域,现有算法存在服装边缘分割粗糙、分割精度差和服装深层语义特征提取不够充分等问题。将Coordinate Attention机制和语义特征增强模块(SFEM)嵌入到语义分割性能较好的Deeplab v3+网络,设计一种用于服装图像分割领域的CA_SFEM_Deeplab v3+网络。为了加强服装图像有效特征的学习,在Deeplab v3+网络的主干网络resnet101中嵌入Coordinate Attention机制,并将经过带空洞卷积池化金字塔网络的特征图输入到语义特征增强模块中进行特征增强处理,从而提高分割的准确率。实验结果表明,CA_SFEM_Deeplab v3+网络在DeepFashion2数据集上的平均交并比与平均像素准确率分别为0.557、0.671,相较于Deeplab v3+网络分别提高2.1%、2.3%,其所得分割服装轮廓更为精细,具有较好的分割性能。 展开更多
关键词 服装图像 语义分割 Deeplab v3+网络 coordinate attention机制 语义特征增强模块
在线阅读 下载PDF
基于改进EfficientNetV2的苹果叶片病害识别模型 被引量:7
17
作者 王浩宇 崔艳荣 +1 位作者 胡玉荣 胡施威 《山东农业科学》 北大核心 2024年第9期124-132,共9页
斑点落叶病、褐斑病、灰斑病、花叶病和锈病是常见的5种苹果树叶部病害,严重影响苹果产量。针对实际生产中叶片病害识别准确率不高以及现有模型参数量大难以迁移到移动设备的问题,本研究基于Ef-ficientNetV2-b0模型,经过改进后提出了轻... 斑点落叶病、褐斑病、灰斑病、花叶病和锈病是常见的5种苹果树叶部病害,严重影响苹果产量。针对实际生产中叶片病害识别准确率不高以及现有模型参数量大难以迁移到移动设备的问题,本研究基于Ef-ficientNetV2-b0模型,经过改进后提出了轻量级的EGV2-CA网络。该网络在保留EfficientNetV2-b0主干网络的基础上,一是引入GhostNetV2网络中的核心Ghost Module,并选用original分支替换第一层卷积结构,可以进一步优化网络的计算效率,减少冗余计算,从而在提高模型速度和可移植性的同时保持较高的识别准确率;二是将EfficientNetV2-b0模型中Fused-MBConv模块的SE注意力机制替换为更高效的坐标注意力(CA)机制,通过将空间信息编码为坐标信息以更好地捕捉和表达空间上的细粒度特征。实验结果显示,相较于原始网络,EGV2-CA网络的识别精确率提高2.94个百分点,召回率提高2.53个百分点,F1得分提高2.67个百分点,Top-1准确率提高2.47个百分点,而参数量仅为48.9 M,可迁移至移动设备上使用,为真实场景下苹果叶片病害的快速、准确识别提供了一种有效的解决方案。 展开更多
关键词 苹果叶片病害 轻量级网络 深度学习算法 EfficientNetV2 Ghost模块 坐标注意力机制
在线阅读 下载PDF
基于密集多尺度特征和双注意力模块的皮肤病变分割 被引量:3
18
作者 费承 罗健旭 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期97-105,共9页
针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰... 针对皮肤病变分割任务中病变区域大小不一、形状各异、内部像素差异大、边界模糊、周围存在气泡等问题,提出了一种基于密集多尺度特征和双注意力模块的U型分割网络DDAnet。该网络中的DenseASPP模块通过密集连接多个空洞卷积层来获取丰富的多尺度信息,同时由通道注意力模块(CAM)和位置注意力模块(PAM)构成的双注意力模块通过编码全局上下文信息,在通道和位置上对特征图进行重新配准,实现对相关特征的强调和对无关特征的抑制。两个模块并行连接、共同作用以提高分割精度。在ISIC2018数据集上,DDAnet的准确率(Acc)、Jaccard相似系数(JI)、Dice系数(DC)、敏感度(Sen)和特异性(Spec)指标值分别为96.75%、85.00%、91.36%、91.82%和97.42%,分割结果优于其他的分割网络,并且对于极具挑战的病例,DDAnet仍然能够产生准确、可靠的分割结果,说明其具备在临床诊断中辅助医生进行皮肤病变分割的潜力。 展开更多
关键词 皮肤病变分割 DenseASPP模块 cam PAM 双注意力模块
在线阅读 下载PDF
自适应感受野机制遥感图像分割模型 被引量:6
19
作者 刘航 汪西莉 《中国图象图形学报》 CSCD 北大核心 2021年第2期464-474,共11页
目的遥感图像中存在大小、形态不一的目标,增加了目标分割任务的困难性。感受野代表了特征图中每个像素对应输入图像的区域,若感受野与目标形状的契合度较高,则特征图中包含的目标特征更加完整,有利于分割。在现有的分割方法中,通常采... 目的遥感图像中存在大小、形态不一的目标,增加了目标分割任务的困难性。感受野代表了特征图中每个像素对应输入图像的区域,若感受野与目标形状的契合度较高,则特征图中包含的目标特征更加完整,有利于分割。在现有的分割方法中,通常采用的是正方形的感受野,而遥感图像中目标形状多变,导致感受野无法较好地契合目标形状,在提取目标特征时会引入过多的无用特征,从而影响分割精度。为此,本文提出基于自适应感受野机制的遥感图像分割模型。方法在编码—解码网络结构的基础上,引入自适应感受野机制。首先在编码器上提取不同大小和宽高比的感受野特征,然后在特征融合时使用通道注意力模块自适应地获取通道权重,通过加权强化与目标形状契合度高的感受野的特征,弱化与目标形状契合度低的感受野的特征,在保留目标特征的同时减少背景特征的干扰,进而提升模型的分割精度。结果在Inria Aerial Image Labeling数据集与Deep Globe Road Extraction数据集上进行实验并与相关方法比较,在两个数据集上的平均交并比分别为76.1%和61.9%,平均F1值分别为86.5%和76.5%。结论本文模型能够提取不同形状感受野的特征,并自适应地获取通道权重,使模型能提取更加完整的目标特征,从而提升目标分割效果。 展开更多
关键词 遥感图像 卷积神经网络(CNN) 图像分割 自适应感受野机制(ARFM) 通道注意力模块(cam)
原文传递
基于改进轻量级秩扩展网络的人脸表情识别方法 被引量:4
20
作者 郑伟鹏 罗晓曙 蒙志明 《计算机工程》 CAS CSCD 北大核心 2022年第9期189-196,共8页
人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识... 人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识别方法。通过构建改进的ReXNet以提取人脸表情特征,在参数量较少的条件下解决特征表达瓶颈的问题,增强对表情局部特征的关注,获得高层次的表情特征,同时融合坐标注意力模块,将位置信息嵌入到通道注意力中,精准地定位和识别感兴趣的特征,建立位置信息与局部特征之间的长依赖关系,减少计算开销。在此基础上,将细化模块引入到改进的网络架构中,利用类别上下文信息细化分类结果,增强类间的分化效果,从而提高人脸表情识别的准确率。实验结果表明,该方法在RAF-DB和FERPlus数据集上的人脸表情识别准确率分别达到88.43%和88.8%,相比VGG16-PLD、SHCNN、ResNet+VGG等方法,具有较高的准确率和较优的鲁棒性。 展开更多
关键词 人脸表情识别 秩扩展网络 表达瓶颈 坐标注意力机制 细化模块
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部