-
题名基于反卷积和特征融合的SSD小目标检测算法
被引量:14
- 1
-
-
作者
赵文清
周震东
翟永杰
-
机构
华北电力大学控制与计算机工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2020年第2期310-316,共7页
-
基金
国家自然科学基金项目(61773160)。
-
文摘
由于小目标的低分辨率和噪声等影响,大多数目标检测算法不能有效利用特征图中小目标的边缘信息和语义信息,导致其特征与背景难以区分,检测效果差。为解决SSD(single shot multibox detector)模型中小目标特征信息不足的缺陷,提出反卷积和特征融合的方法。先采用反卷积作用于浅层特征层,增大特征图分辨率,然后将SSD模型中卷积层conv112的特征图上采样,拼接得到新的特征层,最后将新的特征层与SSD模型中固有的4个尺度的特征层进行融合。通过将改进后的方法与VOC2007数据集和KITTI车辆检测数据集上的SSD和DSSD方法进行比较,结果表明:该方法降低了小目标的漏检率,并提升整体目标的平均检测准确率。
-
关键词
小目标检测
反卷积
特征映射
多尺度
特征融合
SSD模型
pascal
voc数据集
KITTI数据集
-
Keywords
small target detection
deconvolution
feature mapping
multi-scale
feature fusion
SSD model
pascal voc dataset
KITTI dataset
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名引入通道注意力机制的SSD目标检测算法
被引量:24
- 2
-
-
作者
张海涛
张梦
-
机构
辽宁工程技术大学软件学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第8期264-270,共7页
-
基金
辽宁省自然科学基金(20170540426)。
-
文摘
为提升原始SSD算法的小目标检测精度及鲁棒性,提出一种基于通道注意力机制的SSD目标检测算法。在原始SSD算法的基础上对高层特征图进行全局池化操作,结合通道注意力机制增强高层特征图的语义信息,并利用膨胀卷积结构对低层特征图进行下采样扩大其感受野以增加细节与位置信息,再通过级联的方式将低层特征图与高层特征图相融合,从而实现小目标及遮挡目标的有效识别。实验结果表明,与原始SSD算法相比,该算法在PASCAL VOC数据集上的平均精度均值提升了2.2%,具有更高的小目标检测精度和更好的鲁棒性。
-
关键词
SSD算法
全局池化
通道注意力机制
膨胀卷积
pascal
voc数据集
-
Keywords
SSD algorithm
global pooling
channel attention mechanism
dilated convolution
pascal voc dataset
-
分类号
TP317
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于深度网络的图像语义分割综述
被引量:37
- 3
-
-
作者
罗会兰
张云
-
机构
江西理工大学信息工程学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2019年第10期2211-2220,共10页
-
基金
国家自然科学基金(No.61462035,No.61862031)
江西省青年科学家培养项目(No.20153BCB23010)
江西省自然科学资金项目(No.20171BAB202014)
-
文摘
图像语义分割不仅预测一幅图像中的不同类别,同时还定位不同语义类别的位置,具有重要的研究意义和应用价值.本文阐述了图像语义分割最新的研究成果和方法,从三个角度综述了基于深度卷积神经网络的图像语义分割模型,分别是基于候选区域模型、基于全卷积网络模型和基于弱监督学习的语义分割模型,对这三类模型的方法和结构进行了详细的研究和分析.并在PASCAL VOC 2012数据集上对一些代表性的语义分割算法的性能进行了比较分析.
-
关键词
图像语义分割
深度卷积神经网络
候选区域
全卷积网络
弱监督学习
pascal
voc
2012数据集
-
Keywords
image semantic segmentation
deep convolutional neural network
candidate region
full convolution network
weakly-supervised learning
pascal voc 2012 dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向军事目标识别的DRFCN深度网络设计及实现
被引量:5
- 4
-
-
作者
刘俊
孟伟秀
余杰
李亚辉
孙乔
-
机构
杭州电子科技大学通信信息传输与融合技术国防重点学科实验室
中国船舶重工集团公司第七一五研究院
-
出处
《光电工程》
CAS
CSCD
北大核心
2019年第4期18-27,共10页
-
基金
海军装备预研创新项目
国家自然科学基金重点项目(61333009
61427808)~~
-
文摘
自动目标识别(ATR)技术一直是军事领域中急需解决的重点和难点。本文设计并实现了一种新的面向军事目标识别应用的DRFCN深度网络。首先,在DRPN部分通过卷积模块稠密连接的方式,复用深度网络模型中每一层的特征,实现高质量的目标采样区域的提取;其次,在DFCN部分通过融合高低层次特征图语义特征信息,实现采样区域目标类别和位置信息的预测;最后,给出了DRFCN深度网络模型结构以及参数训练方法。与此同时,进一步对DRFCN算法开展了实验分析与讨论:1)基于PASCAL VOC数据集进行对比实验,结果表明,由于采用卷积模块稠密连接的方法,在目标识别平均准确率、实时性和深度网络模型大小方面,DRFCN算法均明显优于已有基于深度学习的目标识别算法;同时,验证了DRFCN算法可以有效解决梯度弥散和梯度膨胀问题。2)利用自建军事目标数据集进行实验,结果表明,DRFCN算法在准确率和实时性上满足军事目标识别任务。
-
关键词
深度学习
目标识别
pascal
voc数据集
军事目标
-
Keywords
deep learning
target recognition
pascal voc dataset
military target
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TB872
[一般工业技术—摄影技术]
-
-
题名编码—解码结构的语义分割
被引量:12
- 5
-
-
作者
韩慧慧
李帷韬
王建平
焦点
孙百顺
-
机构
合肥工业大学电气与自动化工程学院
东北大学流程工业综合自动化国家重点实验室
-
出处
《中国图象图形学报》
CSCD
北大核心
2020年第2期255-266,共12页
-
基金
国家电网总部科技项目(SGAHDK00DJJS1900076).
-
文摘
目的语义分割是计算机视觉中一项具有挑战性的任务,其核心是为图像中的每个像素分配相应的语义类别标签。然而,在语义分割任务中,缺乏丰富的多尺度信息和足够的空间信息会严重影响图像分割结果。为进一步提升图像分割效果,从提取丰富的多尺度信息和充分的空间信息出发,本文提出了一种基于编码—解码结构的语义分割模型。方法运用Res Net-101网络作为模型的骨架提取特征图,在骨架末端附加一个多尺度信息融合模块,用于在网络深层提取区分力强且多尺度信息丰富的特征图。并且,在网络浅层引入空间信息捕获模块来提取丰富的空间信息。由空间信息捕获模块捕获的带有丰富空间信息的特征图和由多尺度信息融合模块提取的区分力强且多尺度信息丰富的特征图将融合为一个新的信息丰富的特征图集合,经过多核卷积块细化之后,最终运用数据依赖的上采样(DUpsampling)操作得到图像分割结果。结果此模型在2个公开数据集(Cityscapes数据集和PASCAL VOC 2012数据集)上进行了大量实验,验证了所设计的每个模块及整个模型的有效性。新模型与最新的10种方法进行了比较,在Cityscapes数据集中,相比于Refine Net模型、Deep Labv2-CRF模型和LRR(Laplacian reconstruction and refinement)模型,平均交并比(m Io U)值分别提高了0.52%、3.72%和4.42%;在PASCAL VOC2012数据集中,相比于Piecewise模型、DPN(deep parsing network)模型和GCRF(Gaussion conditional random field network)模型,m Io U值分别提高了6.23%、7.43%和8.33%。结论本文语义分割模型,提取了更加丰富的多尺度信息和空间信息,使得分割结果更加准确。此模型可应用于医学图像分析、自动驾驶、无人机等领域。
-
关键词
语义分割
克罗内克卷积
多尺度信息
空间信息
注意力机制
编码—解码结构
Cityscapes数据集
pascal
voc
2012数据集
-
Keywords
semantic segmentation
Kronecker convolution
multiscale information
spatial information
attention mechanism
encoder-decoder structure
Cityscapes dataset
pascal voc 2012 dataset
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名融合语义—表观特征的无监督前景分割
被引量:1
- 6
-
-
作者
李熹
马惠敏
马洪兵
王弈冬
-
机构
清华大学
北京科技大学
新疆大学
-
出处
《中国图象图形学报》
CSCD
北大核心
2021年第10期2503-2513,共11页
-
基金
国家自然科学基金项目(U20B2062
61773231)
+1 种基金
国家重点研发计划项目(2016YFB0100901)
北京市科学技术项目(Z191100007419001)。
-
文摘
目的前景分割是图像理解领域中的重要任务,在无监督条件下,由于不同图像、不同实例往往具有多变的表达形式,这使得基于固定规则、单一类型特征的方法很难保证稳定的分割性能。针对这一问题,本文提出了一种基于语义—表观特征融合的无监督前景分割方法(semantic apparent feature fusion,SAFF)。方法基于语义特征能够对前景物体关键区域产生精准的响应,但往往产生的前景分割结果只关注于关键区域,缺乏物体的完整表达;而以显著性、边缘为代表的表观特征则提供了更丰富的细节表达信息,但基于表观规则无法应对不同的实例和图像成像模式。为了融合表观特征和语义特征优势,研究建立了融合语义、表观信息的一元区域特征和二元上下文特征编码的方法,实现了对两种特征表达的全面描述。接着,设计了一种图内自适应参数学习的方法,用于计算最适合的特征权重,并生成前景置信分数图。进一步地,使用分割网络来学习不同实例间前景的共性特征。结果通过融合语义和表观特征并采用图像间共性语义学习的方法,本文方法在PASCAL VOC(pattern analysis,statistical modelling and computational learning visual object classes)2012训练集和验证集上取得了显著超过类别激活映射(class activation mapping,CAM)和判别性区域特征融合方法(discriminative regional feature integration,DRFI)的前景分割性能,在F测度指标上分别提升了3.5%和3.4%。结论本文方法可以将任意一种语义特征和表观特征前景计算模块作为基础单元,实现对两种策略的融合优化,取得了更优的前景分割性能。
-
关键词
计算机视觉
前景分割
无监督学习
语义—表观特征融合
自然场景图像
pascal
voc数据集
自适应加权
-
Keywords
computer vision
foreground segmentation
unsupervised learning
semantic-apparent feature fusion
natural scene images
pascal voc dataset
adaptive weighting
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名违章建筑检测数据集的标注与构建
被引量:2
- 7
-
-
作者
陈欣
冯卫东
曹晓华
曹相臣
路斌
-
机构
中国铁塔股份有限公司河北省分公司
哈尔滨商业大学
首都师范大学信息工程学院
-
出处
《信息与电脑》
2021年第13期27-29,共3页
-
文摘
目标检测作为人工智能的一个重要分支领域,在近年来得到广泛发展和应用。本文基于廊坊市某县关于违章建筑检测的项目背景,构建疑似违章建筑专用数据集。针对疑似违章建筑数据集中待检测目标占比小、图像背景复杂等问题,本文依据实际项目需求,在实地考察的基础上确定待检测目标类型,进行原始数据集图像采集。并通过对原始数据集进行图像切割、锐化、增强对比度等方法进行扩充,完成数据集标注并整理成标准PASCAL VOC格式便于后续训练。
-
关键词
违章建筑数据集
复杂背景
pascal
voc
-
Keywords
dataset of ilegal buildings
complicated background
pascal voc
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名半监督学习在图像分割中的应用研究
- 8
-
-
作者
李勇
王浩
-
机构
陆军航空兵学院
唐山师范学院
-
出处
《计算机应用文摘》
2023年第24期55-57,共3页
-
文摘
传统的图像分割方法面临数据标注困难和成本高昂等挑战,而半监督学习可通过利用未标注的数据来降低对标注数据的依赖。文章提出了一种改进型DeepLab v3十网络,该网络结合了编码器、解码器、ASPP模块和不确定性分支,可实现更准确和更具鲁棒性的图像分割。文章在PascalVOC和MHP数据集上进行了实验,结果表明改进型DeepLabv3十网络在完全监督和半监督训练中均表现出较好的性能。
-
关键词
半监督学习
图像分割
DeepLabv3十
pascalvoc数据集
MHP数据集
-
Keywords
semi-supervised learning
image segmentation
DeepLab v3+
pascal voc dataset
MHP dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-