期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
Validation Research on the Application of Depthwise Separable Convolutional Al Facial Expression Recognition in Non-pharmacological Treatment of BPSD
1
作者 Xiangyu Liu 《Journal of Clinical and Nursing Research》 2021年第4期31-37,共7页
One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence... One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence of emotions.Observing the reduction of BPSD in dementia through emotions can be considered effective and widely used in the field of non-pharmacological therapy.At present,this article will verify whether the image recognition artificial intelligence(AI)system can correctly reflect the emotional performance of the elderly with dementia through a questionnaire survey of three professional elderly nursing staff.The ANOVA(sig.=0.50)is used to determine that the judgment given by the nursing staff has no obvious deviation,and then Kendall's test(0.722**)and spearman's test(0.863**)are used to verify the judgment severity of the emotion recognition system and the nursing staff unanimously.This implies the usability of the tool.Additionally,it can be expected to be further applied in the research related to BPSD elderly emotion detection. 展开更多
关键词 depth-wise separable convolution EMOTION BPSD DEMENTIA Nursing
暂未订购
3D Data Scattergram Image Classification Based Protection for Transmission Line Connecting BESS Using Depth-wise Separable Convolution Based CNN 被引量:1
2
作者 Yingyu Liang Yi Ren +1 位作者 Xiaoyang Yang Wenting Zha 《Journal of Modern Power Systems and Clean Energy》 2025年第2期609-621,共13页
The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data... The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data scattergrams are constructed using current data from both sides of the transmission line and their sum.Following a comprehensive analysis of the varying characteristics of 3D data scattergrams under different conditions,a 3D data scattergram image classification based protection method is developed.The depth-wise separable convolution is used to ensure a lightweight convolutional neural network(CNN)structure without compromising performance.In addition,a Bayesian hyperparameter optimization algorithm is used to achieve a hyperparametric search to simplify the training process.Compared with artificial neural networks and CNNs,the depth-wise separable convolution based CNN(DPCNN)achieves a higher recognition accuracy.The 3D data scattergram image classification based protection method using DPCNN can accurately separate internal faults from other disturbances and identify fault phases under different operating states and fault conditions.The proposed protection method also shows first-class tolerability against current transformer(CT)saturation and CT measurement errors. 展开更多
关键词 convolutional neural network(CNN) battery energy storage station(BESS) depth-wise separable convolution hyperparameter optimization fault classification line protection
原文传递
SepFE:Separable Fusion Enhanced Network for Retinal Vessel Segmentation 被引量:2
3
作者 Yun Wu Ge Jiao Jiahao Liu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第9期2465-2485,共21页
The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation... The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation approaches based on convolutional neural networks(CNNs)have achieved remarkable effectiveness.Here,we extend a retinal vessel segmentation model with low complexity and high performance based on U-Net,which is one of the most popular architectures.In view of the excellent work of depth-wise separable convolution,we introduce it to replace the standard convolutional layer.The complexity of the proposed model is reduced by decreasing the number of parameters and calculations required for themodel.To ensure performance while lowering redundant parameters,we integrate the pre-trained MobileNet V2 into the encoder.Then,a feature fusion residual module(FFRM)is designed to facilitate complementary strengths by enhancing the effective fusion between adjacent levels,which alleviates extraneous clutter introduced by direct fusion.Finally,we provide detailed comparisons between the proposed SepFE and U-Net in three retinal image mainstream datasets(DRIVE,STARE,and CHASEDB1).The results show that the number of SepFE parameters is only 3%of U-Net,the Flops are only 8%of U-Net,and better segmentation performance is obtained.The superiority of SepFE is further demonstrated through comparisons with other advanced methods. 展开更多
关键词 Retinal vessel segmentation U-Net depth-wise separable convolution feature fusion
暂未订购
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
4
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight convolutional Neural Network Depthwise dilated separable convolution Hierarchical Multi-Scale Feature Fusion
在线阅读 下载PDF
A depth-wise separable residual neural network for PCDH8 status prediction in thyroid cancer pathological images
5
作者 Linlin Qi Xiangyu Li +2 位作者 Zhihong Liu Pei Zhang Liangliang Liu 《Intelligent Oncology》 2025年第4期290-298,共9页
Introduction:Accurate prediction of protocadherin 8(PCDH8)gene expression status from whole-slide images(WSIs)is critical for thyroid cancer diagnosis and prognosis,as PCDH8 overexpression is associated with tumor agg... Introduction:Accurate prediction of protocadherin 8(PCDH8)gene expression status from whole-slide images(WSIs)is critical for thyroid cancer diagnosis and prognosis,as PCDH8 overexpression is associated with tumor aggressiveness and poor outcomes.Existing methods for PCDH8 detection are often costly,time-consuming,or require specialized expertise.To address these limitations,we developed a novel depth-wise separable residual neural network(DSRNet)for noninvasive PCDH8 status prediction directly from WSIs.Materials and methods:We collected 403 thyroid cancer WSIs from The Cancer Genome Atlas(TCGA),with PCDH8 expression status classified as high or low based on median expression values.Each WSI was divided into 512×512 pixel tiles,with the top 100 non-white tiles selected per slide.DSRNet integrates depth-wise separable convolutions,residual connections,and a deformable convolutional pyramid pooling module to efficiently capture multiscale and long-range features in gigapixel WSIs.The model was trained using tenfold cross-validation.Results:DSRNet achieved state-of-the-art performance with 92.76%accuracy,91.92%precision,92.69%recall,and 0.93 area under the curve on the thyroid cancer dataset(TCGA-THCA),significantly outperforming leading convolutional neural networks and Transformer models.Ablation studies confirmed the contributions of each component,and attention visualization showed that DSRNet focuses on biologically relevant regions.The model also generalized well to a breast cancer dataset(TCGA-BRCA),achieving 89.13%accuracy.Conclusions:We developed DSRNet,a deep learning-based model for predicting PCDH8 status directly from routine hematoxylin and eosin-stained pathological images.DSRNet combines the efficiency of convolutional operations with enhanced long-range dependency modeling,providing a noninvasive,accurate,and interpretable tool for auxiliary thyroid cancer diagnosis and prognosis.The results demonstrate its strong potential for clinical translation,though further multicenter validation is warranted. 展开更多
关键词 Thyroid cancer Biomarker Whole-slide image depth-wise separable convolution Residual mechanism
在线阅读 下载PDF
基于深度可变形配准的多图谱海马体图像分割
6
作者 张静 马瑜 +1 位作者 巫睿阳 肖博文 《西北工程技术学报(中英文)》 2025年第2期137-145,共9页
针对海马体图像多图谱分割算法精度低的问题,在多图谱分割的配准环节提出了一种基于U-Net的深度可变形配准模型。将U-Net编码环节的标准卷积替换为深度可分离卷积(DSConv),以增强模型的特征提取能力;引入可变形大核注意力(D-LKA)模块,... 针对海马体图像多图谱分割算法精度低的问题,在多图谱分割的配准环节提出了一种基于U-Net的深度可变形配准模型。将U-Net编码环节的标准卷积替换为深度可分离卷积(DSConv),以增强模型的特征提取能力;引入可变形大核注意力(D-LKA)模块,提高对重要区域特征的注意力;运用空洞卷积(DC)模块扩展感受野,强化对多尺度信息的捕捉能力。改进算法在公开数据集LPBA40与OASIS上的实验结果表明,该模型在OASIS数据集上的配准精度可达0.7988;通过多图谱分割标签融合阶段的多数表决方法,最终分割精度相较于其他配准方法提升了5%~9%。本模型展现了潜在的临床应用价值,在早期阿尔茨海默病诊断中具有积极参考意义。 展开更多
关键词 多图谱分割 海马体 图像配准 标签融合 深度可分离卷积 空洞卷积
在线阅读 下载PDF
面向高分辨率遥感影像建筑物提取的SD-BASNet网络
7
作者 朱娟娟 黄亮 朱莎莎 《自然资源遥感》 北大核心 2025年第5期122-130,共9页
针对网络模型参数量大、下采样过程丢失影像建筑物细节信息的问题,受轻量级网络的启发,设计了一种融入深度可分离残差块和空洞卷积的建筑物提取网络(SD-BASNet)。首先,在深度监督编码器预测模块中设计了一个深度可分离残差块,将深度可... 针对网络模型参数量大、下采样过程丢失影像建筑物细节信息的问题,受轻量级网络的启发,设计了一种融入深度可分离残差块和空洞卷积的建筑物提取网络(SD-BASNet)。首先,在深度监督编码器预测模块中设计了一个深度可分离残差块,将深度可分离卷积引入主干网络ResNet中,避免卷积核过大,减少网络的参数量;其次,为防止网络轻量化带来的精度下降,将空洞卷积融入后处理优化模块的编码层,增大特征图的感受野,从而捕捉更广泛的上下文信息,提高建筑物特征提取的准确性。在WHU建筑物数据集上进行实验,在不同尺度建筑物提取中均表现较好,其平均交并比和平均像素精度分别为92.25%和96.59%,其召回率、精确率和F1指标分别达到96.50%,93.79%和92.61%。与PSPNet,SegNet,DeepLabV3,SE-UNet,UNet++等语义分割网络相比,SD-BASNet网络提取精度得到了显著提升,且提取的建筑物完整度更好;与基础网络BASNet相比,SD-BASNet网络的参数量与运行时间也有所减少,证实了该文提出的SD-BASNet网络的有效性。 展开更多
关键词 建筑物提取 高分辨率遥感影像 BASNet网络 深度可分离残差块 空洞卷积
在线阅读 下载PDF
基于并行附加特征提取网络的SSD地面小目标检测模型 被引量:17
8
作者 李宝奇 贺昱曜 +1 位作者 强伟 何灵蛟 《电子学报》 EI CAS CSCD 北大核心 2020年第1期84-91,共8页
针对SSD原始附加特征提取网络(Original Additional Feature Extraction Network,OAFEN)中stride操作造成图像小目标信息丢失和串联结构产生的多尺度特征之间冗余度较大的问题,提出了一种计算量小、感受野大的深度可分离空洞卷积(Depthw... 针对SSD原始附加特征提取网络(Original Additional Feature Extraction Network,OAFEN)中stride操作造成图像小目标信息丢失和串联结构产生的多尺度特征之间冗余度较大的问题,提出了一种计算量小、感受野大的深度可分离空洞卷积(Depthwise Separable Dilated Convolution,DSDC),并利用DSDC设计了一个包含三个独立子网络的并行附加特征提取网络(Parallel Additional Feature Extraction Network,PAFEN).PAFEN上路用两个DSDC提取尺寸为19*19和3*3的特征图;中路用一个DSDC提取尺寸为10*10的特征图;下路用两个DSDC提取尺寸为5*5和1*1的特征图.实验结果表明,在SSD框架内,PAFEN在mAP和检测时间等方面均优于OAFEN,适用于地面小目标的检测任务. 展开更多
关键词 目标检测 SSD 深度可分离卷积 空洞卷积 深度可分离空洞卷积 并行附加特征提取网络
在线阅读 下载PDF
基于改进的DeepLabv3+图像语义分割算法研究 被引量:8
9
作者 赵为平 陈雨 +2 位作者 项松 刘远强 王超越 《系统仿真学报》 CAS CSCD 北大核心 2023年第11期2333-2344,共12页
目前主流图像语义分割网络往往存在误分割、分割不连续和模型复杂度高的问题,不能灵活高效地部署于实际场景中。针对这一现象,通过综合考虑网络的参数量、预测时间和准确度,设计出一种优化DeepLabv3+模型的图像语义分割网络。骨干网络... 目前主流图像语义分割网络往往存在误分割、分割不连续和模型复杂度高的问题,不能灵活高效地部署于实际场景中。针对这一现象,通过综合考虑网络的参数量、预测时间和准确度,设计出一种优化DeepLabv3+模型的图像语义分割网络。骨干网络改用轻量级EfficientNetv2网络提取特征,提高参数利用率;在空洞空间金字塔池化模块中使用混合条带池化模块代替全局平均池化,引入深度可分离膨胀卷积,减少参数量和提高学习多尺度信息的能力;使用注意力机制增强模型表征力,提取骨干网络多条浅层特征,丰富图像的几何细节信息。实验表明,本文算法可达到mIoU为81.19%,参数量为55.51×106,有效优化了分割精度和模型复杂度,同时也提高了模型泛化性。 展开更多
关键词 DeepLabv3+ 图像语义分割 空洞空间金字塔池化 注意力机制 深度可分离膨胀卷积
原文传递
基于多重机制优化YOLOv8的复杂环境下安全帽检测方法 被引量:8
10
作者 肖振久 严肃 曲海成 《计算机工程与应用》 CSCD 北大核心 2024年第21期172-182,共11页
为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模... 为了解决建筑工地、隧道、煤矿等施工场景中现有安全帽检测算法对于小目标、密集目标以及复杂环境下的检测精度低的问题,提出了一种基于多重机制的安全帽检测方法。以YOLOv8n为基础将Backbone部分的C2f模块加入可扩张残差(DWR)注意力模块,使得网络能够更灵活地适应不同尺度的特征,以而更准确地识别图像中的物体;采用可变形卷积AKConv模块取代主干部分中的原始Conv,为卷积神经网络带来了显著的性能提升,从而实现更高效的特征提取。此外引用了大型可分离核注意力LSKA模块与SPPF结构相结合,大大增强了模型核心的融合能力。在Safety helmet数据集的实验结果表明,改进后的算法相较于原模型,mAP@0.5指标上提升了10.5个百分点,在mAP@0.5-0.95指标上提升了3.7个百分点,能有效提高复杂场景下的安全帽佩戴检测精度。 展开更多
关键词 安全帽 YOLOv8n DWR模块 AKConv模块 LSKA模块
在线阅读 下载PDF
基于扩张卷积和Transformer的视听融合语音分离方法 被引量:4
11
作者 刘宏清 谢奇洲 +1 位作者 赵宇 周翊 《信号处理》 CSCD 北大核心 2024年第7期1208-1217,共10页
为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征... 为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征中的长期依赖关系,并强化网络对输入上下文信息的理解,本文提出了一种基于一维扩张卷积与Transformer的时域视听融合语音分离模型。将基于频域的传统视听融合语音分离方法应用到时域中,避免了时频变换带来的信息损失和相位重构问题。所提网络架构包含四个模块:一个视觉特征提取网络,用于从视频帧中提取唇部嵌入特征;一个音频编码器,用于将混合语音转换为特征表示;一个多模态分离网络,主要由音频子网络、视频子网络,以及Transformer网络组成,用于利用视觉和音频特征进行语音分离;以及一个音频解码器,用于将分离后的特征还原为干净的语音。本文使用LRS2数据集生成的包含两个说话者混合语音的数据集。实验结果表明,所提出的网络在尺度不变信噪比改进(Scale-Invariant Signal-to-Noise Ratio Improvement,SISNRi)与信号失真比改进(Signal-to-Distortion Ratio Improvement,SDRi)这两种指标上分别达到14.0 dB与14.3 dB,较纯音频分离模型和普适的视听融合分离模型有明显的性能提升。 展开更多
关键词 语音分离 视听融合 多头自注意力机制 扩张卷积
在线阅读 下载PDF
基于多尺度深度可分离卷积的低照度图像增强算法 被引量:17
12
作者 陈清江 顾媛 《计算机工程与科学》 CSCD 北大核心 2023年第10期1830-1837,共8页
为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特... 为解决低照度图像颜色失真、对比度低以及现有增强算法存在的细节丢失严重、参数过多等问题,提出基于多尺度深度可分离卷积的低照度图像增强算法。首先,设计多尺度混合空洞卷积模块,在扩大感受野的同时解决网格效应;其次,设计多尺度特征提取模块,提取不同尺度的特征信息;最后,对不同尺寸的特征图使用2种模块,将低层空间信息与高层语义信息充分融合,获得最终输出。用深度可分离卷积代替标准卷积可大大减少网络参数量与计算量。实验结果表明,所提算法能有效地提高图像的亮度和对比度,减少模型参数量,且图像纹理细节及色彩恢复较好。 展开更多
关键词 低照度图像增强 深度可分离卷积 空洞卷积 多尺度 网格效应
在线阅读 下载PDF
基于改进ResNet50的钨矿石双能X射线图像分选方法 被引量:4
13
作者 刘志锋 曾灵锋 +2 位作者 彭芳伟 魏振华 张寰宇 《现代电子技术》 北大核心 2024年第13期87-92,共6页
文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模... 文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模型。通过消融实验表明,该模型准确率达到87.4%,计算量为2.7GFLOPs,参数量为16.95M,相比ResNet50准确率提高3%,计算量降低1.42 GFLOPs,参数量降低6.56M,准确率提升的同时,效率大幅提升,更适合工业生产的矿石快速分拣需求。 展开更多
关键词 钨矿石 双能X射线 图像分类 ResNet50 深度扩张可分离卷积 注意力机制
在线阅读 下载PDF
无人驾驶车辆基于语义分割方法障碍物检测 被引量:4
14
作者 邹斌 王思信 +1 位作者 颜莉蓉 刘裕 《广西大学学报(自然科学版)》 CAS 北大核心 2019年第6期1667-1674,共8页
障碍物检测是无人驾驶车辆环境感知重要的组成部分,语义分割技术能够对障碍物进行像素级检测。为满足无人车系统的实时性要求和对障碍物检测精度要求,提出了一种轻量级语义分割模型。该模型构建了特征提取块,通过跳跃层结构将底层级特... 障碍物检测是无人驾驶车辆环境感知重要的组成部分,语义分割技术能够对障碍物进行像素级检测。为满足无人车系统的实时性要求和对障碍物检测精度要求,提出了一种轻量级语义分割模型。该模型构建了特征提取块,通过跳跃层结构将底层级特征与高层级特征相融合,用于提取更加细化的图像特征信息。运用深度可分离卷积代替标准卷积操作,减少了模型参数量和计算量。利用不同膨胀率的膨胀卷积以获取多尺度目标信息,在上采样时融合不同尺度的特征信息,使得语义信息更加丰富。试验结果表明:提出的轻量级语义分割模型在Cityscapes数据集和ApolloScape数据集上取得了较好的障碍物检测结果,同时也满足无人车的实时性要求。 展开更多
关键词 障碍物检测 深度学习 语义分割 膨胀卷积 深度可分离卷积
在线阅读 下载PDF
基于注意力机制和上下文信息的目标检测算法 被引量:4
15
作者 刘辉 张琳玉 +1 位作者 王复港 何如瑾 《计算机应用》 CSCD 北大核心 2023年第5期1557-1564,共8页
针对目标检测过程中存在的小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,在增大感受野的同时避免小目标信息的... 针对目标检测过程中存在的小目标漏检问题,提出一种基于注意力机制和多尺度上下文信息的改进YOLOv5目标检测算法。首先,在特征提取结构中加入多尺度空洞可分离卷积模块(MDSCM)以提取多尺度特征信息,在增大感受野的同时避免小目标信息的丢失;其次,在主干网络中添加注意力机制,并在通道信息中嵌入位置感知信息,进一步增强算法的特征表达能力;最后,使用Soft-NMS(Soft-Non-Maximum Suppression)代替YOLOv5使用的非极大值抑制(NMS),降低检测算法的漏检率。实验结果表明,改进算法在PASCAL VOC数据集、DOTA航拍数据集和DIOR光学遥感数据集上的检测精度分别达到了82.80%、71.74%和77.11%,相较于YOLOv5,分别提高了3.70、1.49和2.48个百分点;而且它对图像中小目标的检测效果更好。因此,改进的YOLOv5可以更好地应用到小目标检测场景中。 展开更多
关键词 目标检测 深度可分离卷积 空洞卷积 注意力机制 非极大值抑制
在线阅读 下载PDF
多尺度特征金字塔融合的街景图像语义分割 被引量:1
16
作者 曲海成 王莹 +1 位作者 董康龙 刘万军 《计算机系统应用》 2024年第3期73-84,共12页
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失... 针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率. 展开更多
关键词 语义分割 MDSDC IDCP-LC 属性注意力 通道扩展上采样 特征融合
在线阅读 下载PDF
基于压缩激励残差分组扩张卷积和密集线性门控Unet歌声分离方法 被引量:1
17
作者 张天骐 熊天 +1 位作者 吴超 闻斌 《应用科学学报》 CAS CSCD 北大核心 2023年第5期815-830,共16页
针对Unet频域歌声分离网络模型对语音时序信息的捕获困难以及底层特征利用率不高的问题,设计了一种相比于基线Unet网络参数量更小且歌声分离效果更好的卷积神经网络。首先设计了一种残差分组扩张卷积结合压缩激励模块,并将其引入到编码... 针对Unet频域歌声分离网络模型对语音时序信息的捕获困难以及底层特征利用率不高的问题,设计了一种相比于基线Unet网络参数量更小且歌声分离效果更好的卷积神经网络。首先设计了一种残差分组扩张卷积结合压缩激励模块,并将其引入到编码和解码阶段,该模块在参数量减少和增大网络感受野的同时自适应学习不同通道的重要特征,不但增强了有用特征,而且还抑制了无用特征。其次在传输层将线性门控单元采用密集相加连接来增强网络在特征传递过程中对时序特征的获取,并且使用扩张卷积来代替普通卷积以扩大网络的感受野。最后使用注意力门控机制来代替基线Unet中的跳跃连接以加强网络对底层特征的利用。在Ccmixter和MUSDB18数据集中进行实验,与基线网络相比,歌声分离的性能指标都有提升,并且其参数量大约只有基线网络的1/5。 展开更多
关键词 歌声分离 分组扩张卷积 门控线性单元 注意力门控
在线阅读 下载PDF
复杂场景下自适应注意力机制融合实时语义分割
18
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
在线阅读 下载PDF
深度卷积神经网络支持下的遥感影像飞机检测 被引量:9
19
作者 谢梦 刘伟 +2 位作者 杨梦圆 柴琪 吉莉 《测绘通报》 CSCD 北大核心 2019年第6期19-23,共5页
针对YOLOv3算法对小目标检测较差及出现较多漏检的问题,本文提出了一种优化的YOLOv3算法.首先使用K-means算法计算出与数据集相适用的锚框;其次将扩张卷积引入到YOLOv3网络,用来增强网络高层的感受野,改善小目标的检测效果;然后使用深... 针对YOLOv3算法对小目标检测较差及出现较多漏检的问题,本文提出了一种优化的YOLOv3算法.首先使用K-means算法计算出与数据集相适用的锚框;其次将扩张卷积引入到YOLOv3网络,用来增强网络高层的感受野,改善小目标的检测效果;然后使用深度可分离卷积取代YOLOv3网络残差模块中的普通卷积,可减少计算量,从而得到一种新型卷积神经网络结构;最后在数据集上进行对比试验.结果表明,优化的YOLOv3算法能够检测出更多目标,降低漏检率,相比于YOLOv3算法,其召回率提高11.86%,F1-score提高2.99%. 展开更多
关键词 YOLOv3 遥感影像 目标检测 扩张卷积 深度可分离卷积
原文传递
基于级联可分离空洞残差U-Net的肝脏肿瘤分割 被引量:8
20
作者 于群 张建新 +1 位作者 魏小鹏 张强 《应用科学学报》 CAS CSCD 北大核心 2021年第3期378-386,共9页
计算机辅助肝脏肿瘤分割可减少医生工作量,提高手术成功率,因而具有重要的临床诊疗价值。为获得精确的肝脏肿瘤自动分割结果,该文结合医学影像分割领域近年新兴的U-Net模块提出了基于级联可分离空洞残差U-Net(cascaded separable and di... 计算机辅助肝脏肿瘤分割可减少医生工作量,提高手术成功率,因而具有重要的临床诊疗价值。为获得精确的肝脏肿瘤自动分割结果,该文结合医学影像分割领域近年新兴的U-Net模块提出了基于级联可分离空洞残差U-Net(cascaded separable and dilated residual U-Net, CSDResU-Net)的肝脏肿瘤分割方法。CSDResU-Net采用了级联操作,解决了因肿瘤在整幅图像中占比小而造成的肿瘤分割数据不平衡问题;通过在分割网络中整合残差单元、深度可分离卷积和空洞卷积,能够增加卷积核感受野并快速提取更具判别性的肝脏肿瘤图像特征,从而提高肝脏肿瘤分割精度。在国际医学图像计算和计算机辅助干预协会肝脏肿瘤分割数据库上的实验结果表明,CSDResU-Net比基线方法的Dice系数指标提升了1.3%,同时发现空洞率对分割网络的性能表现影响较大。 展开更多
关键词 U-Net 残差单元 空洞卷积 深度可分离卷积 肝脏肿瘤分割
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部