期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
3D Data Scattergram Image Classification Based Protection for Transmission Line Connecting BESS Using Depth-wise Separable Convolution Based CNN 被引量:1
1
作者 Yingyu Liang Yi Ren +1 位作者 Xiaoyang Yang Wenting Zha 《Journal of Modern Power Systems and Clean Energy》 2025年第2期609-621,共13页
The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data... The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data scattergrams are constructed using current data from both sides of the transmission line and their sum.Following a comprehensive analysis of the varying characteristics of 3D data scattergrams under different conditions,a 3D data scattergram image classification based protection method is developed.The depth-wise separable convolution is used to ensure a lightweight convolutional neural network(CNN)structure without compromising performance.In addition,a Bayesian hyperparameter optimization algorithm is used to achieve a hyperparametric search to simplify the training process.Compared with artificial neural networks and CNNs,the depth-wise separable convolution based CNN(DPCNN)achieves a higher recognition accuracy.The 3D data scattergram image classification based protection method using DPCNN can accurately separate internal faults from other disturbances and identify fault phases under different operating states and fault conditions.The proposed protection method also shows first-class tolerability against current transformer(CT)saturation and CT measurement errors. 展开更多
关键词 convolutional neural network(CNN) battery energy storage station(BESS) depth-wise separable convolution hyperparameter optimization fault classification line protection
原文传递
Validation Research on the Application of Depthwise Separable Convolutional Al Facial Expression Recognition in Non-pharmacological Treatment of BPSD
2
作者 Xiangyu Liu 《Journal of Clinical and Nursing Research》 2021年第4期31-37,共7页
One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence... One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence of emotions.Observing the reduction of BPSD in dementia through emotions can be considered effective and widely used in the field of non-pharmacological therapy.At present,this article will verify whether the image recognition artificial intelligence(AI)system can correctly reflect the emotional performance of the elderly with dementia through a questionnaire survey of three professional elderly nursing staff.The ANOVA(sig.=0.50)is used to determine that the judgment given by the nursing staff has no obvious deviation,and then Kendall's test(0.722**)and spearman's test(0.863**)are used to verify the judgment severity of the emotion recognition system and the nursing staff unanimously.This implies the usability of the tool.Additionally,it can be expected to be further applied in the research related to BPSD elderly emotion detection. 展开更多
关键词 depth-wise separable convolution EMOTION BPSD DEMENTIA Nursing
暂未订购
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
3
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight convolutional Neural Network Depthwise dilated separable convolution Hierarchical Multi-Scale Feature Fusion
在线阅读 下载PDF
SepFE:Separable Fusion Enhanced Network for Retinal Vessel Segmentation 被引量:2
4
作者 Yun Wu Ge Jiao Jiahao Liu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第9期2465-2485,共21页
The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation... The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation approaches based on convolutional neural networks(CNNs)have achieved remarkable effectiveness.Here,we extend a retinal vessel segmentation model with low complexity and high performance based on U-Net,which is one of the most popular architectures.In view of the excellent work of depth-wise separable convolution,we introduce it to replace the standard convolutional layer.The complexity of the proposed model is reduced by decreasing the number of parameters and calculations required for themodel.To ensure performance while lowering redundant parameters,we integrate the pre-trained MobileNet V2 into the encoder.Then,a feature fusion residual module(FFRM)is designed to facilitate complementary strengths by enhancing the effective fusion between adjacent levels,which alleviates extraneous clutter introduced by direct fusion.Finally,we provide detailed comparisons between the proposed SepFE and U-Net in three retinal image mainstream datasets(DRIVE,STARE,and CHASEDB1).The results show that the number of SepFE parameters is only 3%of U-Net,the Flops are only 8%of U-Net,and better segmentation performance is obtained.The superiority of SepFE is further demonstrated through comparisons with other advanced methods. 展开更多
关键词 Retinal vessel segmentation U-Net depth-wise separable convolution feature fusion
暂未订购
基于深度可变形配准的多图谱海马体图像分割
5
作者 张静 马瑜 +1 位作者 巫睿阳 肖博文 《西北工程技术学报(中英文)》 2025年第2期137-145,共9页
针对海马体图像多图谱分割算法精度低的问题,在多图谱分割的配准环节提出了一种基于U-Net的深度可变形配准模型。将U-Net编码环节的标准卷积替换为深度可分离卷积(DSConv),以增强模型的特征提取能力;引入可变形大核注意力(D-LKA)模块,... 针对海马体图像多图谱分割算法精度低的问题,在多图谱分割的配准环节提出了一种基于U-Net的深度可变形配准模型。将U-Net编码环节的标准卷积替换为深度可分离卷积(DSConv),以增强模型的特征提取能力;引入可变形大核注意力(D-LKA)模块,提高对重要区域特征的注意力;运用空洞卷积(DC)模块扩展感受野,强化对多尺度信息的捕捉能力。改进算法在公开数据集LPBA40与OASIS上的实验结果表明,该模型在OASIS数据集上的配准精度可达0.7988;通过多图谱分割标签融合阶段的多数表决方法,最终分割精度相较于其他配准方法提升了5%~9%。本模型展现了潜在的临床应用价值,在早期阿尔茨海默病诊断中具有积极参考意义。 展开更多
关键词 多图谱分割 海马体 图像配准 标签融合 深度可分离卷积 空洞卷积
在线阅读 下载PDF
面向高分辨率遥感影像建筑物提取的SD-BASNet网络
6
作者 朱娟娟 黄亮 朱莎莎 《自然资源遥感》 北大核心 2025年第5期122-130,共9页
针对网络模型参数量大、下采样过程丢失影像建筑物细节信息的问题,受轻量级网络的启发,设计了一种融入深度可分离残差块和空洞卷积的建筑物提取网络(SD-BASNet)。首先,在深度监督编码器预测模块中设计了一个深度可分离残差块,将深度可... 针对网络模型参数量大、下采样过程丢失影像建筑物细节信息的问题,受轻量级网络的启发,设计了一种融入深度可分离残差块和空洞卷积的建筑物提取网络(SD-BASNet)。首先,在深度监督编码器预测模块中设计了一个深度可分离残差块,将深度可分离卷积引入主干网络ResNet中,避免卷积核过大,减少网络的参数量;其次,为防止网络轻量化带来的精度下降,将空洞卷积融入后处理优化模块的编码层,增大特征图的感受野,从而捕捉更广泛的上下文信息,提高建筑物特征提取的准确性。在WHU建筑物数据集上进行实验,在不同尺度建筑物提取中均表现较好,其平均交并比和平均像素精度分别为92.25%和96.59%,其召回率、精确率和F1指标分别达到96.50%,93.79%和92.61%。与PSPNet,SegNet,DeepLabV3,SE-UNet,UNet++等语义分割网络相比,SD-BASNet网络提取精度得到了显著提升,且提取的建筑物完整度更好;与基础网络BASNet相比,SD-BASNet网络的参数量与运行时间也有所减少,证实了该文提出的SD-BASNet网络的有效性。 展开更多
关键词 建筑物提取 高分辨率遥感影像 BASNet网络 深度可分离残差块 空洞卷积
在线阅读 下载PDF
基于多重机制优化YOLOv8的复杂环境下安全帽检测方法 被引量:7
7
作者 肖振久 严肃 曲海成 《计算机工程与应用》 CSCD 北大核心 2024年第21期172-182,共11页
为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模... 为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模块,使得网络能够更灵活地适应不同尺度的特征,以而更准确地识别图像中的物体;采用可变形卷积AKConv模块取代主干部分中的原始Conv,为卷积神经网络带来了显著的性能提升,从而实现更高效的特征提取。此外引用了大型可分离核注意力LSKA模块与SPPF结构相结合,大大增强了模型核心的融合能力。在Safety helmet数据集的实验结果表明,改进后的算法相较于原模型,mAP@0.5指标上提升了10.5个百分点,在mAP@0.5-0.95指标上提升了3.7个百分点,能有效提高复杂场景下的安全帽佩戴检测精度。 展开更多
关键词 安全帽 YOLOv8n DWR模块 AKConv模块 LSKA模块
在线阅读 下载PDF
基于改进ResNet50的钨矿石双能X射线图像分选方法 被引量:4
8
作者 刘志锋 曾灵锋 +2 位作者 彭芳伟 魏振华 张寰宇 《现代电子技术》 北大核心 2024年第13期87-92,共6页
文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模... 文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模型。通过消融实验表明,该模型准确率达到87.4%,计算量为2.7GFLOPs,参数量为16.95M,相比ResNet50准确率提高3%,计算量降低1.42 GFLOPs,参数量降低6.56M,准确率提升的同时,效率大幅提升,更适合工业生产的矿石快速分拣需求。 展开更多
关键词 钨矿石 双能X射线 图像分类 ResNet50 深度扩张可分离卷积 注意力机制
在线阅读 下载PDF
基于扩张卷积和Transformer的视听融合语音分离方法 被引量:2
9
作者 刘宏清 谢奇洲 +1 位作者 赵宇 周翊 《信号处理》 CSCD 北大核心 2024年第7期1208-1217,共10页
为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征... 为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征中的长期依赖关系,并强化网络对输入上下文信息的理解,本文提出了一种基于一维扩张卷积与Transformer的时域视听融合语音分离模型。将基于频域的传统视听融合语音分离方法应用到时域中,避免了时频变换带来的信息损失和相位重构问题。所提网络架构包含四个模块:一个视觉特征提取网络,用于从视频帧中提取唇部嵌入特征;一个音频编码器,用于将混合语音转换为特征表示;一个多模态分离网络,主要由音频子网络、视频子网络,以及Transformer网络组成,用于利用视觉和音频特征进行语音分离;以及一个音频解码器,用于将分离后的特征还原为干净的语音。本文使用LRS2数据集生成的包含两个说话者混合语音的数据集。实验结果表明,所提出的网络在尺度不变信噪比改进(Scale-Invariant Signal-to-Noise Ratio Improvement,SISNRi)与信号失真比改进(Signal-to-Distortion Ratio Improvement,SDRi)这两种指标上分别达到14.0 dB与14.3 dB,较纯音频分离模型和普适的视听融合分离模型有明显的性能提升。 展开更多
关键词 语音分离 视听融合 多头自注意力机制 扩张卷积
在线阅读 下载PDF
多尺度特征金字塔融合的街景图像语义分割 被引量:1
10
作者 曲海成 王莹 +1 位作者 董康龙 刘万军 《计算机系统应用》 2024年第3期73-84,共12页
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失... 针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率. 展开更多
关键词 语义分割 MDSDC IDCP-LC 属性注意力 通道扩展上采样 特征融合
在线阅读 下载PDF
复杂场景下自适应注意力机制融合实时语义分割
11
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
在线阅读 下载PDF
基于特征增强的高分辨率人体姿态估计网络 被引量:3
12
作者 谢唯嘉 易见兵 +1 位作者 曹锋 李俊 《电子测量技术》 北大核心 2024年第2期131-141,共11页
在轻量级卷积神经网络进行高分辨率人体姿态估计时存在提取特征不充分,针对该问题,提出了一种基于特征增强的高分辨率人体姿态估计网络。首先利用空洞卷积补全操作提取图像特征,以避免特征信息丢失且保持模型参数基本不变;接着利用池化... 在轻量级卷积神经网络进行高分辨率人体姿态估计时存在提取特征不充分,针对该问题,提出了一种基于特征增强的高分辨率人体姿态估计网络。首先利用空洞卷积补全操作提取图像特征,以避免特征信息丢失且保持模型参数基本不变;接着利用池化增强模块进行卷积提取特征的选择,以保留重要特征且减轻传统池化模块对提取特征造成的破坏;最后利用加强通道信息交互的深度可分离卷积模块进行特征提取,以保持该模块的参数量较少且能够提高其特征提取能力。在COCO2017数据集进行性能测试,本文算法和DiteHRNet30算法的AR值分别为77.9%和77.2%;在MPII数据集进行性能测试,本文算法和DiteHRNet30算法的PCKh值分别为32.6%和31.7%。实验结果表明,本文算法在人体姿态估计精度和算法复杂度之间能够达到较好的平衡。 展开更多
关键词 人体姿态估计 轻量级网络 高分辨率 空洞卷积 池化 深度可分离卷积
原文传递
基于卷积神经网络和Transformer的高效图像超分辨率重建 被引量:2
13
作者 李邦源 杨家全 +3 位作者 薛若漪 张晓宇 汪航 孙宏滨 《云南电力技术》 2024年第2期41-48,共8页
深度学习推动了图像超分辨率重建技术的显著进步,但复杂的操作导致计算和内存成本高昂,限制了其实际应用。为此,提出了一种新颖的算法,融合了Transformer和卷积神经网络,同时采用膨胀卷积和深度可分离卷积技术。在五个基准数据集上的实... 深度学习推动了图像超分辨率重建技术的显著进步,但复杂的操作导致计算和内存成本高昂,限制了其实际应用。为此,提出了一种新颖的算法,融合了Transformer和卷积神经网络,同时采用膨胀卷积和深度可分离卷积技术。在五个基准数据集上的实验证明,所提EHN模型能够高效提取超分辨率特征,在更少参数和推理时间下实现与现有方法相当甚至更好的超分辨率效果。特别地,在×2、×3和×4放大倍数下,EHN的推理时间仅为现有网络的18.4%、18.9%和20.3%,这一优势对于处理大量图像的场景至关重要,能够显著减少计算时间和资源消耗,提升整体效率。 展开更多
关键词 图像超分辨率 TRANSFORMER 卷积神经网络 膨胀卷积 深度可分离卷积
在线阅读 下载PDF
基于轻量级金字塔网络的种子分选方法研究
14
作者 李卫杰 桑肖婷 +2 位作者 李环宇 魏平俊 李骁 《计算机测量与控制》 2024年第3期239-246,共8页
针对目前卷积神经网络种子分选方法存在识别精度不高、模型参数量大、推理速度慢且难于部署等问题,提出了基于轻量级金字塔空洞卷积网络的种子分选方法;该网络提出了残差空间金字塔模块,利用不同扩张率的空洞卷积扩大感受野,更有效地提... 针对目前卷积神经网络种子分选方法存在识别精度不高、模型参数量大、推理速度慢且难于部署等问题,提出了基于轻量级金字塔空洞卷积网络的种子分选方法;该网络提出了残差空间金字塔模块,利用不同扩张率的空洞卷积扩大感受野,更有效地提取多尺度特征;再结合深度可分离卷积技术减少模型参数量和计算复杂度;在网络结构中引入轻量级注意力机制模块,利用局部跨通道交互方式关注重要的信息,提高种子关键特征提取能力;实验结果表明,提出网络参数量仅为0.13 M,在玉米和红芸豆数据集上准确率高达96.00%和97.38%,在NVIDIA Quadro板卡上识别单张图片时间仅为4.51 ms,均优于主流轻量级网络MobileNetv2、Shufflenetv2和PPLC-Net等,可以满足工业现场实时识别的要求。 展开更多
关键词 种子分选 轻量化网络 ECA注意力机制 深度可分离卷积 空洞卷积
在线阅读 下载PDF
Recognition of Bird Species of Yunnan Based on Improved ResNet18
15
作者 Wei Yang Ivy Kim D.Machica 《Intelligent Automation & Soft Computing》 2024年第5期889-905,共17页
Birds play a crucial role in maintaining ecological balance,making bird recognition technology a hot research topic.Traditional recognition methods have not achieved high accuracy in bird identification.This paper pro... Birds play a crucial role in maintaining ecological balance,making bird recognition technology a hot research topic.Traditional recognition methods have not achieved high accuracy in bird identification.This paper proposes an improved ResNet18 model to enhance the recognition rate of local bird species in Yunnan.First,a dataset containing five species of local birds in Yunnan was established:C.amherstiae,T.caboti,Syrmaticus humiae,Polyplectron bicalcaratum,and Pucrasia macrolopha.The improved ResNet18 model was then used to identify these species.This method replaces traditional convolution with depth wise separable convolution and introduces an SE(Squeeze and Excitation)module to improve the model’s efficiency and accuracy.Compared to the traditional ResNet18 model,this improved model excels in implementing a wild bird classification solution,significantly reducing computational overhead and accelerating model training using low-power,lightweight hardware.Experimental analysis shows that the improved ResNet18 model achieved an accuracy of 98.57%,compared to 98.26%for the traditional Residual Network 18 layers(ResNet18)model. 展开更多
关键词 Bird species recognition ResNet18 depth-wise separable convolutions
在线阅读 下载PDF
基于并行附加特征提取网络的SSD地面小目标检测模型 被引量:16
16
作者 李宝奇 贺昱曜 +1 位作者 强伟 何灵蛟 《电子学报》 EI CAS CSCD 北大核心 2020年第1期84-91,共8页
针对SSD原始附加特征提取网络(Original Additional Feature Extraction Network,OAFEN)中stride操作造成图像小目标信息丢失和串联结构产生的多尺度特征之间冗余度较大的问题,提出了一种计算量小、感受野大的深度可分离空洞卷积(Depthw... 针对SSD原始附加特征提取网络(Original Additional Feature Extraction Network,OAFEN)中stride操作造成图像小目标信息丢失和串联结构产生的多尺度特征之间冗余度较大的问题,提出了一种计算量小、感受野大的深度可分离空洞卷积(Depthwise Separable Dilated Convolution,DSDC),并利用DSDC设计了一个包含三个独立子网络的并行附加特征提取网络(Parallel Additional Feature Extraction Network,PAFEN).PAFEN上路用两个DSDC提取尺寸为19*19和3*3的特征图;中路用一个DSDC提取尺寸为10*10的特征图;下路用两个DSDC提取尺寸为5*5和1*1的特征图.实验结果表明,在SSD框架内,PAFEN在mAP和检测时间等方面均优于OAFEN,适用于地面小目标的检测任务. 展开更多
关键词 目标检测 SSD 深度可分离卷积 空洞卷积 深度可分离空洞卷积 并行附加特征提取网络
在线阅读 下载PDF
基于改进的DeepLabv3+图像语义分割算法研究 被引量:8
17
作者 赵为平 陈雨 +2 位作者 项松 刘远强 王超越 《系统仿真学报》 CAS CSCD 北大核心 2023年第11期2333-2344,共12页
目前主流图像语义分割网络往往存在误分割、分割不连续和模型复杂度高的问题,不能灵活高效地部署于实际场景中。针对这一现象,通过综合考虑网络的参数量、预测时间和准确度,设计出一种优化DeepLabv3+模型的图像语义分割网络。骨干网络... 目前主流图像语义分割网络往往存在误分割、分割不连续和模型复杂度高的问题,不能灵活高效地部署于实际场景中。针对这一现象,通过综合考虑网络的参数量、预测时间和准确度,设计出一种优化DeepLabv3+模型的图像语义分割网络。骨干网络改用轻量级EfficientNetv2网络提取特征,提高参数利用率;在空洞空间金字塔池化模块中使用混合条带池化模块代替全局平均池化,引入深度可分离膨胀卷积,减少参数量和提高学习多尺度信息的能力;使用注意力机制增强模型表征力,提取骨干网络多条浅层特征,丰富图像的几何细节信息。实验表明,本文算法可达到mIoU为81.19%,参数量为55.51×106,有效优化了分割精度和模型复杂度,同时也提高了模型泛化性。 展开更多
关键词 DeepLabv3+ 图像语义分割 空洞空间金字塔池化 注意力机制 深度可分离膨胀卷积
原文传递
基于多尺度深度可分离卷积的低照度图像增强算法 被引量:16
18
作者 陈清江 顾媛 《计算机工程与科学》 CSCD 北大核心 2023年第10期1830-1837,共8页
为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特... 为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特征提取模块,提取不同尺度的特征信息;最后,对不同尺寸的特征图使用2种模块,将低层空间信息与高层语义信息充分融合,获得最终输出。用深度可分离卷积代替标准卷积可大大减少网络参数量与计算量。实验结果表明,所提算法能有效地提高图像的亮度和对比度,减少模型参数量,且图像纹理细节及色彩恢复较好。 展开更多
关键词 低照度图像增强 深度可分离卷积 空洞卷积 多尺度 网格效应
在线阅读 下载PDF
无人驾驶车辆基于语义分割方法障碍物检测 被引量:4
19
作者 邹斌 王思信 +1 位作者 颜莉蓉 刘裕 《广西大学学报(自然科学版)》 CAS 北大核心 2019年第6期1667-1674,共8页
障碍物检测是无人驾驶车辆环境感知重要的组成部分,语义分割技术能够对障碍物进行像素级检测。为满足无人车系统的实时性要求和对障碍物检测精度要求,提出了一种轻量级语义分割模型。该模型构建了特征提取块,通过跳跃层结构将底层级特... 障碍物检测是无人驾驶车辆环境感知重要的组成部分,语义分割技术能够对障碍物进行像素级检测。为满足无人车系统的实时性要求和对障碍物检测精度要求,提出了一种轻量级语义分割模型。该模型构建了特征提取块,通过跳跃层结构将底层级特征与高层级特征相融合,用于提取更加细化的图像特征信息。运用深度可分离卷积代替标准卷积操作,减少了模型参数量和计算量。利用不同膨胀率的膨胀卷积以获取多尺度目标信息,在上采样时融合不同尺度的特征信息,使得语义信息更加丰富。试验结果表明:提出的轻量级语义分割模型在Cityscapes数据集和ApolloScape数据集上取得了较好的障碍物检测结果,同时也满足无人车的实时性要求。 展开更多
关键词 障碍物检测 深度学习 语义分割 膨胀卷积 深度可分离卷积
在线阅读 下载PDF
基于注意力机制和上下文信息的目标检测算法 被引量:4
20
作者 刘辉 张琳玉 +1 位作者 王复港 何如瑾 《计算机应用》 CSCD 北大核心 2023年第5期1557-1564,共8页
针对目标检测过程中存在的小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,在增大感受野的同时避免小目标信息的... 针对目标检测过程中存在的小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,在增大感受野的同时避免小目标信息的丢失;其次,在主干网络中添加注意力机制,并在通道信息中嵌入位置感知信息,进一步增强算法的特征表达能力;最后,使用Soft-NMS(Soft-Non-Maximum Suppression)代替YOLOv5使用的非极大值抑制(NMS),降低检测算法的漏检率。实验结果表明,改进算法在PASCAL VOC数据集、DOTA航拍数据集和DIOR光学遥感数据集上的检测精度分别达到了82.80%、71.74%和77.11%,相较于YOLOv5,分别提高了3.70、1.49和2.48个百分点;而且它对图像中小目标的检测效果更好。因此,改进的YOLOv5可以更好地应用到小目标检测场景中。 展开更多
关键词 目标检测 深度可分离卷积 空洞卷积 注意力机制 非极大值抑制
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部