融合注意力机制的移动端人像分割网络被引量：4

Mobile-based portrait segmentation network with attention mechanism

下载PDF

导出

摘要现有的移动端人像分割网络存在分割精度差、分割边缘模糊等问题。为此,提出了一种融合注意力机制的轻量化人像分割网络。首先,利用MobileNetV2网络提取图像特征。然后对注意力模块NLNet(Non-local neural networks)进行轻量化处理,随后将优化过的注意力模块嵌入到四层解码网络中。利用融合注意力机制的解码网络自适应地学习有效特征,最后通过SoftMax层得到人像分割结果图。同时改进了损失函数,引入多损失函数(Multi-Loss),使网络更容易收敛。解码网络融合注意力机制的方式使得轻量化网络可以在语义分割任务上取得较好的效果。实验结果表明,模型在550张自采集的人像测试集上达到了92.29%的交并比(MeanIOU),单张图片在Inter(R)Core i5 CPU上的分割时间为0.74 s。与传统的人像分割网络相比,研究网络的分割精度和分割速度优势明显,适合应用于移动端设备。 Existing mobile terminal segmentation network has problems such as poor segmentation accuracy and segmentation edge blurring.To this end,a lightweight portrait segmentation network that incorporates attention mechanisms is proposed.Firstly,the image features are extracted by MobileNetV2 network.Then,the attention module NLNet(Non-local neural networks)is lightened,and then the optimized attention module is embedded in the four-layer decoding network.The decoding network with attention mechanism adaptively learns the effective features,and finally obtains the portrait segmentation result map through SoftMax.At the same time,the loss function is improved,and Multi-Loss(multi-loss function)is introduced to make the network easier to converge.The way of attention mechanisms fused in decoding networks makes the lightweight network achieve better results in the semantic segmentation task.Experimental results show that the model achieves 92.29%MeanIOU on the 550 self-collected portrait test set,and the split time of the single picture on the Inter(R)Core i5 CPU is 0.74 s.Compared with the traditional portrait segmentation network,the research network has obvious advantages in segmentation precision and segmentation speed,and is suitable for mobile devices.

作者周鹏姚剑敏林志贤严群郭太良 ZHOU Peng;YAO Jian-min;LIN Zhi-xian;YAN Qun;GUO Tai-liang(Nation & Local United Engineering Laboratory of Flat Panel DisplayTechnology,College of Physics and Information Engineering, Fuzhou University, Fuzhou 350108, China;Jinjiang RichSense Electronic Technology Co., Ltd., Jinjiang 362200, China)

机构地区平板显示技术国家地方联合工程实验室晋江市博感电子科技有限公司

出处《液晶与显示》 CAS CSCD 北大核心 2020年第6期547-554,共8页 Chinese Journal of Liquid Crystals and Displays

基金国家重点研发计划课题(No.2016YFB0401503) 广东省科技重大专项(No.2016B090906001) 福建省科技重大专项(No.2014HZ0003-1) 广东省光信息材料与技术重点实验室开放基金资助项目(No.2017B030301007)。

关键词人像分割注意力机制轻量化卷积神经网络 portrait segmentation attention mechanism lightweight convolutional neural network

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1梁华,宋玉龙,钱锋,宋策.基于深度学习的航空对地小目标检测[J].液晶与显示,2018,33(9):793-800. 被引量：28
2孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：684
3张健,李宏升.基于图论阈值算法的图像分割研究[J].液晶与显示,2014,29(4):592-597. 被引量：11
4周筑博,高佼,张巍,王晓婧,张静.基于深度卷积神经网络的输电线路可见光图像目标检测[J].液晶与显示,2018,33(4):317-325. 被引量：20

二级参考文献53

1BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36.
2BENGIO Y. Leaming deep architectures for AI[ J]. Foundations and Trends in Machine Learning ,2009,2 ( 1 ) : 1-127.
3HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets [ J ]. Neural Computation ,2006,18 (7) : 1527-1554.
4BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layer-wise training of deep networks [ C ]//Proc of the 12th Annual Conference on Neural Information Processing System. 2006:153-160.
5LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning ap- plied to document recognition[ J]. Proceedings of the iEEE, 1998, 86( 11 ) :2278-2324.
6VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[ C ]//Proc of the 25th International Conference on Machine Learning. New York: ACM Press ,2008 : 1096-1103.
7VINCENT P, LAROCHELLE H, LAJOIE I, et aL Stacked denoising autoencoders:learning useftd representations in a deep network with a local denoising criterion [ J ]. Journal of Machine Learning Re- search ,2010,11 ( 12 ) :3371-3408.
8YU Dong, DENG Li. Deep convex net: a scalable architecture for speech pattern classification [ C]//Proc of the 12th Annual Confe-rence of International Speech Comunication Association. 2011 : 2285- 2288.
9POON H, DOMINGOS P. Sum-product networks:a new deep architec- ture[ C ]//Proc of IEEE Intemational Conference on Computer Vi- sion. 2011:689-690.
10BENGIO Y,LECUN Y. Scaling learning algorithms towards AI[ M]// BOTTOU L,CHAPELLE O, DeCOSTE D,et al. Large-Scale Kernel Machines. Cambridge: MIT Press ,2007:321-358.

共引文献737

1吴秀平,赵咏梅,凌静思.幼儿游戏深度学习行为的支持体系建构[J].教育科学论坛,2024(2):63-66. 被引量：1
2高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
3张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
4周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：5
5李灿强,夏志方,丁邡.基于人工智能技术的“数字政府”研究[J].中国经贸导刊,2019(5Z):138-139. 被引量：6
6彭婉,田良臣.信息技术支持下促进深度学习的教学研究——基于语文课程的研究[J].汉字文化,2022(15):159-161. 被引量：1
7马国扬,魏巍,刘禹希,郑镇航,黄雄,谢政权.核电机组事故在线诊断及预测分析方法研究[J].电子技术应用,2024,50(S01):123-128.
8杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
9苑方.基于深度学习的典型神经网络对比分析[J].中国科技纵横,2018,0(19):9-10.
10赵丹琪.人工智能生成物的著作权认定问题研究[J].楚天法治,2018(30):124-127.

同被引文献30

1龚晓明,李航,宋璐,李莉,张笑春,余开湖,鲁植艳,李宏军.新型冠状病毒肺炎(COVID-19)CT表现初步探讨[J].放射学实践,2020,35(3):261-265. 被引量：63
2段瑞玲,李庆祥,李玉和.图像边缘检测方法研究综述[J].光学技术,2005,31(3):415-419. 被引量：390
3李中健,杜娟,郭璐.将Otsu用于多阈值彩色图像分割的方法及优化[J].计算机工程与应用,2010,46(11):176-178. 被引量：20
4邹小林,冯国灿.基于正则割(Ncut)的多阈值图像分割方法[J].计算机工程与应用,2012,48(19):174-178. 被引量：5
5金翠,王洪元,陈首兵.基于随机擦除行人对齐网络的行人重识别方法[J].山东大学学报（工学版）,2018,48(6):67-73. 被引量：9
6李红娣,袁非牛.采用金字塔纹理和边缘特征的图像烟雾检测[J].中国图象图形学报,2015,20(6):772-780. 被引量：23
7胡唯,胡庆武,艾明耀.多星形先验和图割的遥感影像交互式分割[J].遥感信息,2016,31(2):19-23. 被引量：3
8林晨曦,周艺,王世新,刘文亮,田野,张燕楠.基于变差函数的中高分辨率SAR影像农村建筑区提取[J].中国图象图形学报,2016,21(5):674-682. 被引量：7
9惠振阳,胡友健.机载LiDAR点云中道路的提取方法[J].测绘科学,2017,42(3):70-74. 被引量：6
10史劲亭,袁非牛,夏雪.视频烟雾检测研究进展[J].中国图象图形学报,2018,23(3):303-322. 被引量：35

引证文献4

1张磊,陈星材,陆万里,平钦文,陈怡然,柏森.胸部CT图像肺实质分割技术研究[J].计算机时代,2021(3):17-19. 被引量：1
2沈言善,王阿川.基于深度学习的遥感图像地物分割方法[J].液晶与显示,2021,36(5):733-740. 被引量：13
3谢书翰,张文柱,程鹏,杨子轩.嵌入通道注意力的YOLOv4火灾烟雾检测模型[J].液晶与显示,2021,36(10):1445-1453. 被引量：43
4王欣,王美丽,边党伟.融合MobileNetv2和注意力机制的轻量级人像分割算法[J].计算机工程与应用,2022,58(7):220-228. 被引量：12

二级引证文献69

1李牧,何允帅,卢金波,王芬婷,杨恒.基于深度学习的早期火灾预警算法[J].计算机系统应用,2022,31(11):230-237. 被引量：7
2王铮帅,邱联奎,李迎港.复杂环境下的YOLOv5s烟火检测方法[J].电子测量技术,2023,46(24):149-156. 被引量：9
3黄林林,李世雄,谭彧,王硕.基于改进卷积神经网络算法的路径导航研究[J].中国农机化学报,2022,43(4):146-152. 被引量：8
4汪睿卿,王慧琴,王可.融合细节特征与混合注意力机制的火灾烟雾检测[J].液晶与显示,2022,37(7):900-912. 被引量：7
5朱弥雪,刘志强,张旭,李文静,苏佳新.林火视频烟雾检测算法综述[J].计算机工程与应用,2022,58(14):16-26. 被引量：5
6王一,龚肖杰,程佳,苏皓.基于改进YOLOv5的金属工件表面缺陷检测[J].包装工程,2022,43(15):54-60. 被引量：13
7王斌,李靖,赵康,周温.面向火焰快速检测的轻量化深度网络研究[J].计算机工程与应用,2022,58(17):256-262. 被引量：9
8赵严,刘应安,业巧林,周小亮.基于深度学习的林业害虫检测优化[J].液晶与显示,2022,37(9):1216-1227. 被引量：9
9徐胜军,张若暄,孟月波,刘光辉,韩九强.融合分形几何特征Resnet遥感图像建筑物分割[J].光学精密工程,2022,30(16):2006-2020. 被引量：7
10谭炎金,陈西曲.基于VGG-16和迁移学习的苹果识别[J].武汉轻工大学学报,2022,41(5):109-115.

1陈金平,陈帆帆.网络众筹模式在产品设计专业教育中的应用研究[J].艺术教育,2020,0(3):171-174. 被引量：1
2王展.大数据时代的计算机网络安全分析[J].信息与电脑,2020,32(6):193-195. 被引量：1
3刘艳洋,张沛纲.基于深度学习的车道线与绿植分割算法[J].电子技术与软件工程,2020(6):132-135. 被引量：1
4卢健,何金鑫,李哲,周嫣然.基于深度学习的目标检测综述[J].电光与控制,2020,27(5):56-63. 被引量：30
5胡伟,高博川,黄振航,李瑞瑞.树形结构卷积神经网络优化的城区遥感图像语义分割[J].中国图象图形学报,2020,25(5):1043-1052. 被引量：8
6班彩红.计算机网络安全技术与防范措施[J].新晋商,2019(10):180-181.
7姜相森,王涛,占春华,翟乃亮,逯峰,韩其政.新型冠状病毒肺炎患者不同发病时间的胸部CT图像变化观察[J].山东医药,2020,60(15):74-77. 被引量：2
8廖峻,丁浩,夏诗画.BIM技术在金门特长隧道中的应用研究[J].公路,2020,65(4):373-377. 被引量：12
9魏华,万辉.网络零售企业社会责任对消费者购买意愿的影响——基于SOR模型的实证[J].哈尔滨商业大学学报（社会科学版）,2020,0(3):64-73. 被引量：17
10海康机器人发布VC3000视觉控制器[J].物流技术与应用,2020,0(3):157-157.

液晶与显示

2020年第6期

浏览历史

内容加载中请稍等...

融合注意力机制的移动端人像分割网络被引量：4

参考文献4

二级参考文献53

共引文献737

同被引文献30

引证文献4

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

融合注意力机制的移动端人像分割网络 被引量：4

参考文献4

二级参考文献53

共引文献737

同被引文献30

引证文献4

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

融合注意力机制的移动端人像分割网络被引量：4