期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
Pyramid–MixNet: Integrate Attention into Encoder-Decoder Transformer Framework for Automatic Railway Surface Damage Segmentation
1
作者 Hui Luo Wenqing Li Wei Zeng 《Computers, Materials & Continua》 2025年第7期1567-1580,共14页
Rail surface damage is a critical component of high-speed railway infrastructure,directly affecting train operational stability and safety.Existing methods face limitations in accuracy and speed for small-sample,multi... Rail surface damage is a critical component of high-speed railway infrastructure,directly affecting train operational stability and safety.Existing methods face limitations in accuracy and speed for small-sample,multi-category,and multi-scale target segmentation tasks.To address these challenges,this paper proposes Pyramid-MixNet,an intelligent segmentation model for high-speed rail surface damage,leveraging dataset construction and expansion alongside a feature pyramid-based encoder-decoder network with multi-attention mechanisms.The encoding net-work integrates Spatial Reduction Masked Multi-Head Attention(SRMMHA)to enhance global feature extraction while reducing trainable parameters.The decoding network incorporates Mix-Attention(MA),enabling multi-scale structural understanding and cross-scale token group correlation learning.Experimental results demonstrate that the proposed method achieves 62.17%average segmentation accuracy,80.28%Damage Dice Coefficient,and 56.83 FPS,meeting real-time detection requirements.The model’s high accuracy and scene adaptability significantly improve the detection of small-scale and complex multi-scale rail damage,offering practical value for real-time monitoring in high-speed railway maintenance systems. 展开更多
关键词 pyramid vision transformer encoder–decoder architecture railway damage segmentation masked multi-head attention mix-attention
在线阅读 下载PDF
基于空间通道自适应特征的肝脏病理图像分割网络
2
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《电子科技》 2026年第1期9-17,共9页
针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与... 针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与肝脏病灶相关的重要特征,并在编码器最深层引入空洞空间金字塔池化模块来弥补高级特征所缺失的多尺度信息,提高模型的分割精度。在私有肝脏数据集、公开肝脏数据集以及其他两种公开病理数据集对所提网络进行对比实验和消融实验。实验结果表明,相较于其他方法,所提网络的分割结果较佳,且有效解决了肝细胞癌分割问题。 展开更多
关键词 肝细胞癌 病理图像 编解码架构 混合校准注意力模块 空间注意力 通道注意力 空洞空间金字塔池化模块 多尺度信息
在线阅读 下载PDF
基于时频双域特征融合与动态交互机制的短期电力负荷预测
3
作者 王东风 张浩 +2 位作者 胡怡然 崔玉雷 黄宇 《电力科学与工程》 2025年第12期57-64,共8页
针对电力负荷序列时序动态性、多尺度特征及复杂周期规律给预测带来的难题,提出一种基于时频双域特征融合与动态交互机制的短期电力负荷预测方法,其核心架构为双谱网。首先,针对短期电力负荷数据的非平稳和非线性特性,采用基于阿尔法进... 针对电力负荷序列时序动态性、多尺度特征及复杂周期规律给预测带来的难题,提出一种基于时频双域特征融合与动态交互机制的短期电力负荷预测方法,其核心架构为双谱网。首先,针对短期电力负荷数据的非平稳和非线性特性,采用基于阿尔法进化算法改进的变分模态分解算法对负荷数据分解,得到若干本征模态函数;其次,设计频域特征增强机制,通过频谱注意力动态融合振幅谱与相位谱,并构建时频交叉注意力网络嵌入频域先验,结合跨维度门控实现特征校准;最后,基于多尺度金字塔解码器自适应融合时空特征生成预测值。以某市电力负荷数据集进行验证并与主流模型进行对比,结果表明所采用的预测方法具有更好的预测性能。 展开更多
关键词 时频双域 动态交互 双谱网 频域特征增强 多尺度金字塔解码器
在线阅读 下载PDF
基于高效加性注意力的级联式特征融合息肉分割网络
4
作者 李萌 张孙杰 《中国生物医学工程学报》 北大核心 2025年第4期447-456,共10页
为解决大多数息肉分割方法存在的局部和全局信息交互不足、相邻层不同深度间的特征弱相关性问题,本研究提出了一种基于金字塔视觉Transformer和自注意力机制级联解码器的网络模型(PVT-SMCD)。首先,以PVTv2为骨干网络提取图像特征,通过... 为解决大多数息肉分割方法存在的局部和全局信息交互不足、相邻层不同深度间的特征弱相关性问题,本研究提出了一种基于金字塔视觉Transformer和自注意力机制级联解码器的网络模型(PVT-SMCD)。首先,以PVTv2为骨干网络提取图像特征,通过高效加性注意力获取关键信息,捕捉长距离依赖关系;其次,引入多核卷积增强块定位息肉的高级语义特征,将其输入到级联解码器中实现局部和全局间的信息交互;最后,利用特征融合模块自上而下逐步融合相邻层间的特征以减少高维特征与低维特征间的信息差距。所提出模型在5个息肉分割数据集上与其他8种医学图像分割网络进行对比,其中在Kvasir和CVC-ClinicDB数据集上,mDice分别为92.3%、94.5%,mIoU为87.1%、89.9%,MAE分别为0.021和0.006;在CVC-300上,mDice和mIoU分别达到了90%和83.3%,MAE为0.007;在CVC-ColonDB上mDice为81.5%,mIoU为73.5%,MAE为0.028;在ETIS数据集上,mDice为78.9%,mIoU为71.3%,MAE为0.019。实验结果表明,PVT-SMCD在绝大多数评价指标上均优于对比模型,展现出更优异的学习能力和泛化性能,能够实现更精准的息肉分割效果。 展开更多
关键词 息肉分割 金字塔视觉Transformer 级联解码器 高效加性注意力
暂未订购
双金字塔式编码的人像语义感知自动抠图网络
5
作者 程艳 严志航 《计算机系统应用》 2025年第7期261-271,共11页
人像抠图是图像处理领域重要任务之一,针对现有图像数据中人像前景尺度多样造成的人像抠取粗糙问题,提出一种双金字塔式编码的人像语义感知自动抠图网络.双金字塔式编码器包含输入金字塔和特征金字塔,输入金字塔中输入图像等比例下采样... 人像抠图是图像处理领域重要任务之一,针对现有图像数据中人像前景尺度多样造成的人像抠取粗糙问题,提出一种双金字塔式编码的人像语义感知自动抠图网络.双金字塔式编码器包含输入金字塔和特征金字塔,输入金字塔中输入图像等比例下采样后送入网络以保留原始图像细节,特征金字塔结合带状卷积组和5个层级的编码块充分捕获不同层次的图像特征.同时,在双分支解码结构中,全局分割解码分支上设计了视域扩张模块扩大网络感受范围,进一步增强全局上下文信息的捕获;局部细节分支上提出细节感知模块融合编码特征与解码输出,引导网络关注人像轮廓.在3个数据集上与6种人像自动抠图方法进行了对比实验,所提方法的抠图性能均优于对比方法.验证了所提方法能改善人像抠取的精细度,提高了复杂图像数据下人像抠取的鲁棒性. 展开更多
关键词 人像抠图 语义感知 双金字塔 双分支解码 全局上下文信息
在线阅读 下载PDF
编码-解码多尺度卷积神经网络人群计数方法 被引量:9
6
作者 孟月波 纪拓 +2 位作者 刘光辉 徐胜军 李彤月 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第5期149-157,共9页
针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感... 针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感受野并减少参数量,保留尺度特征和图像的上下文信息;解码器对编码器输出进行上采样,实现高层语义信息和编码器前端低层特征信息有效融合,从而提升了密度图的输出质量。为增强网络对计数的敏感性,在以往像素空间损失的基础上考虑了计数误差,提出了一种新型损失函数。采用Shanghai Tech、Mall以及自建数据集进行了对比实验,结果表明:与之前最优方法相比,所提方法在Shanghai Tech数据集Part_A部分的平均绝对误差和均方误差分别降低了8.3%和21.3%,Part_B部分分别降低了12.9%和12.0%,Mall数据集分别降低了15.1%和23.8%,自建数据集分别降低了13.5%和7.1%;在不同人群场景下,所提方法的人群计数准确性和鲁棒性均优于其他对比方法的。 展开更多
关键词 人群计数 编码-解码结构 多尺度 空洞空间金字塔池化 计数误差 损失函数
在线阅读 下载PDF
一种改进DeepLabV3+网络的高分辨率遥感影像道路提取方法 被引量:19
7
作者 葛小三 曹伟 《遥感信息》 CSCD 北大核心 2022年第1期40-46,共7页
道路网络提取是高分辨率遥感影像数据应用研究的难点之一。针对现有的道路提取方法普遍注重区域精度而边界质量缺失考虑的问题,提出一种基于DeepLabV3+语义分割神经网络的深度学习提取道路的方法。该网络模型采用编码器-解码器网络(enco... 道路网络提取是高分辨率遥感影像数据应用研究的难点之一。针对现有的道路提取方法普遍注重区域精度而边界质量缺失考虑的问题,提出一种基于DeepLabV3+语义分割神经网络的深度学习提取道路的方法。该网络模型采用编码器-解码器网络(encoder-decoder)和多孔空间金字塔池(atrous spatial pyramid pooling,ASPP)相结合的方式,增强了对道路边界的划分效果。模型在Massachusetts roads数据集进行了道路网络提取实验。分析结果表明,基于该方法的道路提取精度优于U-Net等网络模型,F1分数达到87.27%,与其他方法相比较,该方法能够更有效、完整地从遥感图像中提取道路。 展开更多
关键词 编码器-解码器 多孔金字塔池化 道路提取 DeepLabV3+ 深度学习
在线阅读 下载PDF
基于残差注意力和金字塔上采样的图像语义分割 被引量:4
8
作者 高军礼 周华 +2 位作者 宋海涛 郭靖 张慧 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2022年第1期134-140,共7页
针对图像语义分割中,存在细节信息丢失、分割类别边缘模糊而粗糙的问题,在编码解码结构的基础上,结合残差模块和注意力机制,设计一种残差注意力模块。通过注意力机制加强特征图通道之间的联系,以提升语义分割的细腻度。为提高模型对多... 针对图像语义分割中,存在细节信息丢失、分割类别边缘模糊而粗糙的问题,在编码解码结构的基础上,结合残差模块和注意力机制,设计一种残差注意力模块。通过注意力机制加强特征图通道之间的联系,以提升语义分割的细腻度。为提高模型对多尺度物体的识别能力,结合金字塔模型,设计一种金字塔上采样模块。利用编码过程中产生的不同尺度的特征图,进行不同尺度的语义信息提取,以加强模型场景识别能力。最后,对所提出的方法进行实验验证,与FCN-8s、SegNet、Deeplab-v2、PSPNet等方法相比,针对VOC 2012,平均交并比(mIoU)和平均像素精度(mPA)最高分别提高了15.9%和3.57%;针对Cityscape数据集,mIoU和mPA指标分别提高了17.8%和13.3%,图像语义分割效果得到明显提升。 展开更多
关键词 残差注意力 金字塔模型 上采样 编解码器 卷积神经网络 图像语义分割
在线阅读 下载PDF
轻量金字塔解码结构的单目深度估计网络 被引量:2
9
作者 贾瑞明 李彤 +1 位作者 李阳 王一丁 《计算机应用研究》 CSCD 北大核心 2021年第1期293-297,共5页
针对单目深度估计网络庞大的参数量和计算量,提出一种轻量金字塔解码结构的单目深度估计网络,可以在保证估计精度的情况下降低网络模型的复杂度、减少运算时间。该网络基于编解码结构,以端到端的方式估计单目图像的深度图。编码端使用Re... 针对单目深度估计网络庞大的参数量和计算量,提出一种轻量金字塔解码结构的单目深度估计网络,可以在保证估计精度的情况下降低网络模型的复杂度、减少运算时间。该网络基于编解码结构,以端到端的方式估计单目图像的深度图。编码端使用ResNet50网络结构;在解码端提出了一种轻量金字塔解码模块,采用深度空洞可分离卷积和分组卷积以提升感受野范围,同时减少了参数量,并且采用金字塔结构融合不同感受野下的特征图以提升解码模块的性能;此外,在解码模块之间增加跳跃连接实现知识共享,以提升网络的估计精度。在NYUD v2数据集上的实验结果表明,与结构注意力引导网络相比,轻量金字塔解码结构的单目深度估计网络在误差RMS的指标上降低约11.0%,计算效率提升约84.6%。 展开更多
关键词 单目深度估计 卷积神经网络 编解码结构 轻量金字塔解码
在线阅读 下载PDF
一种基于改进的MobileNetV2网络语义分割算法 被引量:35
10
作者 孟琭 徐磊 郭嘉阳 《电子学报》 EI CAS CSCD 北大核心 2020年第9期1769-1776,共8页
基于金字塔卷积神经网络的语义分割算法准确率很高,但是其计算资源消耗巨大、算法执行时间长、无法满足实时性要求.为了解决这个问题,本文做出了以下改进:(1)用MobileNet替换原网络的结构,减少了网络运算时间和内存开销;(2)引入编码器-... 基于金字塔卷积神经网络的语义分割算法准确率很高,但是其计算资源消耗巨大、算法执行时间长、无法满足实时性要求.为了解决这个问题,本文做出了以下改进:(1)用MobileNet替换原网络的结构,减少了网络运算时间和内存开销;(2)引入编码器-解码器结构提高输出图像的分辨率,进一步细化分割结果;(3)针对高分辨率图像推断时间过长的问题,本文设计了多级图像输入方法,降低了网络推断高分辨率图像所消耗的时间.本文在VOC 2012数据集和Cityscapes数据集上进行了测试,并与FCN、SegNet、DeepLab、PSPNet以及DFN等语义分割模型对比.实验结果表明,本文设计的语义分割算法在VOC 2012数据集上达到了76.1%的mIoU,在Cityscapes数据集上达到了74.1%的mIoU,略低于传统语义分割算法;处理一张分辨率为1024×512的图片需要18ms,少于传统语义分割算法,满足了实时性要求,达到了准确率与计算资源消耗之间的平衡. 展开更多
关键词 语义分割 卷积神经网络 金字塔网络 快速语义分割 MobileNet 编码器-解码器
在线阅读 下载PDF
基于注意力密集连接金字塔网络的新增建设用地变化检测 被引量:4
11
作者 潘建平 李鑫 +2 位作者 孙博文 胡勇 李明明 《测绘通报》 CSCD 北大核心 2022年第3期41-46,59,共7页
城市新增建设用地变化迅速频繁、场景复杂等因素导致变化检测结果出现欠分割或过分割等问题,基于此本文提出了一种融合注意力机制的密集连接金字塔网络用于城市新增建设用地变化检测。在编码阶段运用卷积注意力模型提升对变化信息的关注... 城市新增建设用地变化迅速频繁、场景复杂等因素导致变化检测结果出现欠分割或过分割等问题,基于此本文提出了一种融合注意力机制的密集连接金字塔网络用于城市新增建设用地变化检测。在编码阶段运用卷积注意力模型提升对变化信息的关注度,突出重要特征;采用密集连接空洞卷积空间金字塔池化模块实现多尺度特征的提取与融合,提高特征的利用率与传播效率;在解码阶段通过对提取的特征图进行上采样还原图像的空间尺度特征。试验结果表明,该方法有效改善了欠分割与过分割问题,变化检测效果更好。 展开更多
关键词 注意力机制 密集连接金字塔 编码解码 新增建设用地 变化检测
原文传递
基于倒金字塔深度学习网络的三维医学图像分割 被引量:7
12
作者 张相芬 刘艳 袁非牛 《计算机工程》 CAS CSCD 北大核心 2022年第12期304-311,共8页
基于深度学习的医学图像分割对医学研究和临床疾病诊断具有重要意义。然而,现有三维脑图像分割网络仅依赖单一模态信息,且最后一层网络的特征表达不准确,导致分割精度降低。引入注意力机制,提出一种基于深度学习的多模态交叉重构的倒金... 基于深度学习的医学图像分割对医学研究和临床疾病诊断具有重要意义。然而,现有三维脑图像分割网络仅依赖单一模态信息,且最后一层网络的特征表达不准确,导致分割精度降低。引入注意力机制,提出一种基于深度学习的多模态交叉重构的倒金字塔网络MCRAIP-Net。以多模态磁共振图像作为输入,通过三个独立的编码器结构提取各模态的特征信息,并将提取的特征信息在同一分辨率级进行初步融合。利用双通道交叉重构注意力模块实现多模态特征的细化与融合。在此基础上,采用倒金字塔解码器对解码器各阶段不同分辨率的特征进行整合,完成脑组织的分割任务。在MRBrainS13和IBSR18数据集上的实验结果表明,相比3D U-Net、MMAN、SW-3DUnet等网络,MCRAIP-Net能够充分利用多模态图像的互补信息,获取更准确丰富的细节特征且具有较优的分割精度,白质、灰质、脑脊液的Dice系数分别达到91.67%、88.95%、84.79%。 展开更多
关键词 多模态融合 交叉重构注意力 倒金字塔解码器 医学图像分割 深度学习
在线阅读 下载PDF
预指导的多阶段特征融合的图像语义分割网络 被引量:1
13
作者 王燕 范向辉 王丽康 《计算机应用研究》 CSCD 北大核心 2024年第3期951-955,共5页
针对目前语义分割对图像边缘和小物体不能进行精确识别,以及简单融合多阶段特征会造成信息冗余、混杂不清等问题,提出了一个预指导的多阶段特征融合的网络(pre-guidanced multi-stage feature fusion network,PGMFFNet),PGMFFNet采用编... 针对目前语义分割对图像边缘和小物体不能进行精确识别,以及简单融合多阶段特征会造成信息冗余、混杂不清等问题,提出了一个预指导的多阶段特征融合的网络(pre-guidanced multi-stage feature fusion network,PGMFFNet),PGMFFNet采用编解码器结构,编码阶段利用预指导模块对各阶段信息进行指导,增强各阶段特征之间的联系,解决各阶段特征在后续融合过程中产生的语义混杂问题。在解码阶段,利用多路径金字塔上采样模块融合高级语义特征,然后使用改进的密集空洞空间金字塔池化模块对融合后的特征进一步扩大感受野,最后将高低层次的特征信息融合,使得对小物体的分割效果更优。PGMFFNet在CityScapes公开数据集上进行了验证,得到了78.38%的平均交并比(mean intersection over union,MIoU),分割效果较好。 展开更多
关键词 语义分割 编解码器 预指导 金字塔 特征融合
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
14
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码器-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
基于自适应融合和注意力细化的语义分割模型
15
作者 魏赟 罗琦 赵迎志 《系统仿真学报》 CAS CSCD 北大核心 2023年第6期1226-1234,共9页
针对现有语义分割中存在的上下文信息利用不足和细节信息丢失等问题,提出了一种基于自适应融合和注意力细化的语义分割模型。该模型在编码的过程中引入一个自适应融合模块,通过让每个特征图按照相应的权重进行融合的方式来解决上下文信... 针对现有语义分割中存在的上下文信息利用不足和细节信息丢失等问题,提出了一种基于自适应融合和注意力细化的语义分割模型。该模型在编码的过程中引入一个自适应融合模块,通过让每个特征图按照相应的权重进行融合的方式来解决上下文信息利用不足的问题。在解码的过程中设计了一个注意力细化模块,使低阶特征与高阶特征之间能够进行相互指导优化,从而解决细节信息丢失的问题。实验结果表明:该模型在PASCAL VOC 2012数据集上的平均交并比达到了83.7%,比基于编解码的语义分割模型提高了1.1%;在Cityscapes数据集上取得了81.7%的平均交并比,进一步验证了该模型的泛化性。 展开更多
关键词 语义分割 金字塔池化 注意力机制 自适应融合 编码-解码架构
原文传递
遮挡条件下基于MSF-PPD网络的绿萝叶片点云补全方法 被引量:4
16
作者 肖海鸿 徐焕良 +3 位作者 马仕航 陈玲 王江波 王浩云 《农业机械学报》 EI CAS CSCD 北大核心 2021年第9期141-148,共8页
针对在自然场景中,由于遮挡、视角限制和操作不当等问题,导致传感器获取的植物或器官点云不完整,提出了一种基于多尺度特征提取模块结合点云金字塔解码器(Multi-scale feature extraction model with point cloud pyramid decoder,MSF-P... 针对在自然场景中,由于遮挡、视角限制和操作不当等问题,导致传感器获取的植物或器官点云不完整,提出了一种基于多尺度特征提取模块结合点云金字塔解码器(Multi-scale feature extraction model with point cloud pyramid decoder,MSF-PPD)的叶片形状补全网络。首先,采用多尺度特征提取模块实现不同维度特征信息的全局提取和融合,其次,通过点云金字塔解码器进行叶片点云的多阶段生成补全,最终得到完整的目标叶片形状。使用曲面参数方程构建绿萝叶片仿真模型库,并将其离散成点云作为网络模型训练的训练集和验证集,使用Kinect v2相机获取绿萝叶片点云作为网络模型补全性能评估的测试集。试验结果表明,本文网络结构对叶片点云补全的效果理想,证明本文方法能够对遮挡情况下的绿萝叶片进行高效、完整的补全。 展开更多
关键词 绿萝叶片 遮挡 点云 生成补全 金字塔解码器
在线阅读 下载PDF
基于改进U-Net网络的腺体细胞图像分割算法 被引量:11
17
作者 贝琛圆 于海滨 +2 位作者 潘勉 蒋洁 吕炳赟 《电子科技》 2019年第11期18-22,共5页
针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金... 针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金字塔池;再在解码网络中加入注意力模块,使模型输出高分辨率特征图,提高对多尺度目标的分割精度。实验结果表明,提出的网络模型参数少分割精度高,对腺体图像的平均分割精度高达89.7%,具有较好的鲁棒性。 展开更多
关键词 全卷积神经网络 编码器-解码器结构 空洞金字塔池 注意力模块 高分辨率特征图 分割精度高
在线阅读 下载PDF
基于跨层次聚合网络的实时城市街景语义分割 被引量:2
18
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码器-解码器结构 金字塔池化模块
在线阅读 下载PDF
基于多尺度特征模糊卷积神经网络的遥感图像分割 被引量:11
19
作者 马翔悦 徐金东 倪梦莹 《山东大学学报(工学版)》 CAS CSCD 北大核心 2024年第3期44-54,共11页
为解决高分辨率遥感图像“同谱异物、同物异谱”的不确定性以及大量空间信息利用率低的问题,提出一种基于多尺度特征的模糊卷积神经网络模型。该模型在长跳跃连接部分加入模糊学习模块去除噪声特征,缓解类别间的不确定性;利用多孔空间... 为解决高分辨率遥感图像“同谱异物、同物异谱”的不确定性以及大量空间信息利用率低的问题,提出一种基于多尺度特征的模糊卷积神经网络模型。该模型在长跳跃连接部分加入模糊学习模块去除噪声特征,缓解类别间的不确定性;利用多孔空间金字塔池化融合多尺度特征,提取完备的空间上下文信息,提升分割性能。试验结果表明,该模型在Potsdam数据集和Vaihingen数据集上的整体准确度分别达到92.65%和93.19%,明显优于现有流行的深度学习模型,能够显著提升高分辨率遥感图像的语义分割性能。 展开更多
关键词 模糊学习 多孔空间金字塔池化 多尺度特征 编码器-解码器 卷积神经网络
原文传递
基于非对称U型金字塔重建的轻量级人脸超分辨率网络 被引量:2
20
作者 蒋桐雨 陈帆 和红杰 《山东大学学报(工学版)》 CAS CSCD 北大核心 2022年第1期1-8,18,共9页
为解决深度卷积神经网络在人脸超分辨率任务中模型复杂并难以实际应用的问题,提出一种轻量级人脸超分辨率网络。利用残差编码块构成的编码结构进行特征提取,在解码结构中引入金字塔重建从而实现快速准确的超分辨率。为降低解码块中上采... 为解决深度卷积神经网络在人脸超分辨率任务中模型复杂并难以实际应用的问题,提出一种轻量级人脸超分辨率网络。利用残差编码块构成的编码结构进行特征提取,在解码结构中引入金字塔重建从而实现快速准确的超分辨率。为降低解码块中上采样操作的参数量,采用基于分辨率选择的非一致通道扩宽策略。为避免增加分支,通过热图损失引入人脸先验知识。试验结果表明,本研究提出的模型轻量有效地实现了超低分辨率人脸图像的超分辨重建,以较低的模型复杂度,重建出视觉质量优于其他先进方法的超分辨率人脸图像。 展开更多
关键词 深度学习 人脸超分辨率 非对称编解码 金字塔重建 热图损失 生成对抗网络
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部