基于金字塔分割注意力网络的单目深度估计方法被引量：1

Monocular depth estimation method based on pyramid split attention network

下载PDF

导出

摘要针对目前单目图像在深度估计中依然存在边缘以及深度最大区域预测不准确的问题,提出了一种基于金字塔分割注意力网络的单目深度估计方法(PS-Net)。首先,PS-Net以边界引导和场景聚合网络(BS-Net)为基础,引入金字塔分割注意力(PSA)模块处理多尺度特征的空间信息并且有效建立多尺度通道注意力间的长期依赖关系,从而提取深度梯度变化剧烈的边界和深度最大的区域;然后,使用Mish函数作为解码器中的激活函数,以进一步提升网络的性能;最后,在NYUD v2(New York University Depth dataset v2)和iBims-1(independent Benchmark images and matched scans v1)数据集上进行训练评估。iBims-1数据集上的实验结果显示,所提网络在衡量定向深度误差(DDE)方面与BS-Net相比减小了1.42个百分点,正确预测深度像素的比例达到81.69%。以上表明所提网络在深度预测上具有较高的准确性。 Aiming at the problem of inaccurate prediction of edges and the farthest region in monocular image depth estimation,a monocular depth estimation method based on Pyramid Split attention Network(PS-Net)was proposed.Firstly,based on Boundary-induced and Scene-aggregated Network(BS-Net),Pyramid Split Attention(PSA)module was introduced in PS-Net to process the spatial information of multi-scale features and effectively establish the long-term dependence between multi-scale channel attentions,thereby extracting the boundary with sharp change depth gradient and the farthest region.Then,the Mish function was used as the activation function in the decoder to further improve the performance of the network.Finally,training and evaluation were performed on NYUD v2(New York University Depth dataset v2)and iBims-1(independent Benchmark images and matched scans v1)datasets.Experimental results on iBims-1 dataset show that the proposed network reduced 1.42 percentage points compared with BS-Net in measuring Directed Depth Error(DDE),and has the proportion of correctly predicted depth pixels reached 81.69%.The above proves that the proposed network has high accuracy in depth prediction.

作者李文举李梦颖崔柳储王慧张益高慧 LI Wenju;LI Mengying;CUI Liu;CHU Wanghui;ZHANG Yi;GAO Hui(School of Computer Science and Information Engineering,Shanghai Institute of Technology,Shanghai 201418,China;School of Art and Design,Shanghai Institute of Technology,Shanghai 201418,China)

机构地区上海应用技术大学计算机科学与信息工程学院上海应用技术大学艺术与设计学院

出处《计算机应用》 CSCD 北大核心 2023年第6期1736-1742,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(61903256,61973307)。

关键词深度估计金字塔分割注意力三维场景深度特征监督学习 depth estimation Pyramid Split Attention(PSA) Three-Dimensional(3D)scene depth feature supervised learning

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1毕天腾,刘越,翁冬冬,王涌天.基于监督学习的单幅图像深度估计综述[J].计算机辅助设计与图形学学报,2018,30(8):1383-1393. 被引量：17
2李阳,陈秀万,王媛,刘茂林.基于深度学习的单目图像深度估计的研究进展[J].激光与光电子学进展,2019,56(19):1-17. 被引量：25

二级参考文献10

1徐维鹏,王涌天,刘越,翁冬冬.增强现实中的虚实遮挡处理综述[J].计算机辅助设计与图形学学报,2013,25(11):1635-1642. 被引量：24
2詹坤烽,陈文建,李武森,张璐.线激光三维场景重建系统及误差分析[J].中国激光,2018,45(12):167-176. 被引量：19
3李秀智,杨爱林,秦宝岭,贾松敏,邱欢.基于光流反馈的单目视觉三维重建[J].光学学报,2015,35(5):228-236. 被引量：12
4刘万奎,刘越.用于增强现实的光照估计研究综述[J].计算机辅助设计与图形学学报,2016,28(2):197-207. 被引量：24
5何雷,董秋雷,胡占义.从单幅图像学习场景深度信息固有的歧义性[J].中国科学：信息科学,2016,46(7):811-818. 被引量：4
6刘帆,刘鹏远,李兵,徐彬彬.TensorFlow平台下的视频目标跟踪深度学习模型设计[J].激光与光电子学进展,2017,54(9):277-285. 被引量：38
7鲍振强,李艾华,崔智高,袁梦.深度学习在视觉定位与三维结构恢复中的研究进展[J].激光与光电子学进展,2018,55(5):62-70. 被引量：2
8毕天腾,刘越,翁冬冬,王涌天.基于监督学习的单幅图像深度估计综述[J].计算机辅助设计与图形学学报,2018,30(8):1383-1393. 被引量：17
9李素梅,雷国庆,范如.基于双通道卷积神经网络的深度图超分辨研究[J].光学学报,2018,38(10):128-134. 被引量：7
10陈宗海,洪洋,王纪凯,葛振华.基于循环卷积神经网络的单目视觉里程计[J].机器人,2019,41(2):147-155. 被引量：15

共引文献38

1李阳,陈秀万,王媛,刘茂林.基于深度学习的单目图像深度估计的研究进展[J].激光与光电子学进展,2019,56(19):1-17. 被引量：25
2赵栓峰,黄涛,许倩,耿龙龙.面向无人机自主飞行的无监督单目视觉深度估计[J].激光与光电子学进展,2020,57(2):137-146. 被引量：8
3戴仁月,方志军,高永彬.融合扩张卷积网络与SLAM的无监督单目深度估计[J].激光与光电子学进展,2020,57(6):106-114. 被引量：9
4陈川,陈柘,丁双惠.深度学习发展形势下计算机视觉教学内容革新[J].计算机与现代化,2020,0(6):107-113. 被引量：5
5张旭中,翟道远,陈俊.基于深度强化学习的木材缺陷图像重构及质量评价模型研究[J].湖北农业科学,2020,59(13):140-145. 被引量：2
6杨红,徐爱俊.基于短视频图像的立木深度图生成算法[J].激光与光电子学进展,2020,57(16):135-143. 被引量：3
7张琦,张秀芬,蔚刚.基于SFM的退役零件失效特征表征精度影响研究[J].机电工程,2020,37(11):1305-1310. 被引量：1
8徐苑景.傅立叶级数+机器学习法双联预测小行星分类[J].软件导刊,2020,19(11):42-45.
9李晓雯,李建微,陈晓洁.深度学习技术的三维激光雷达目标分割研究[J].激光杂志,2020,41(11):71-75. 被引量：1
10张卡,宿东,王蓬勃,陈辉,张珊,叶龙杰,赵娜.深度学习技术在影像密集匹配方面的进展与应用[J].科学技术与工程,2020,20(30):12268-12278. 被引量：16

同被引文献4

1仇旭阳,黄影平,郭志阳,胡兴.基于深度学习的障碍物检测与深度估计[J].上海理工大学学报,2020,42(6):558-565. 被引量：9
2徐天意,夏明,李峰,常敏,姜虹.基于深度学习的多模态气管插管智能目标检测[J].上海理工大学学报,2021,43(5):436-442. 被引量：6
3蒲正东,陈姝,邹北骥,蒲保兴.基于高分辨率网络的自监督单目深度估计方法[J].计算机辅助设计与图形学学报,2023,35(1):118-127. 被引量：4
4吴俊贤,何元烈.基于通道注意力的自监督深度估计方法[J].广东工业大学学报,2023,40(2):22-29. 被引量：3

引证文献1

1张旭东,赵柏淦,吴国庆,姚建南.基于多掩膜技术的无监督深度与光流估计方法[J].上海理工大学学报,2024,46(2):129-137.

1王洪元,徐志晨,陈海琴,丁宗元,李鹏辉.基于金字塔分割和时空注意力的视频行人重识别[J].常州大学学报（自然科学版）,2023,35(2):66-76. 被引量：2
2马金林,陈德光,马自萍,魏麟.一种Petri网优化的验证码识别方法[J].计算机工程,2020,46(7):277-285. 被引量：3
3曹立波,岳鹏宇,张正阳,刘建国,黄梅珊.基于全景图像与人机交互的自动泊车系统[J].汽车技术,2023(6):24-29. 被引量：2
4谢国波,林立,林志毅,贺笛轩,文刚.基于YOLOv4-MP的绝缘子爆裂缺陷检测方法[J].广东工业大学学报,2023,40(2):15-21. 被引量：1
5于秒,周思敏,龙佳欣.内隐韵律与语境对汉语均衡型歧义结构歧义消解的作用[J].心理与行为研究,2022,20(6):739-746. 被引量：2
6吴仲琦,王琛珑,郭建伟,张晓鹏,严冬明.基于生成对抗网络的单张图像高光去除方法[J].中国科技论文,2023,18(3):265-274. 被引量：2
7李恩华,闫梦若,张佃君.融合多尺度特征的轻量级单目图像深度估计方法[J].信息记录材料,2023,24(5):246-248.
8姬嗣愚,王永生,翟一琛.基于改进YOLO V3的海上弹着点水柱信号检测算法[J].战术导弹技术,2023(2):144-152.
9Peng Chen,Weiwei Zhang,Ziyao Xiao,Yongxiang Tian.Traffic Accident Detection Based on Deformable Frustum Proposal and Adaptive Space Segmentation[J].Computer Modeling in Engineering & Sciences,2022(1):97-109.
10蒯晓,丁飞,张登银.多分支融合注意力机制的车道线检测模型[J].电子测量与仪器学报,2023,37(4):35-43. 被引量：3

计算机应用

2023年第6期

浏览历史

内容加载中请稍等...

基于金字塔分割注意力网络的单目深度估计方法被引量：1

参考文献2

二级参考文献10

共引文献38

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于金字塔分割注意力网络的单目深度估计方法 被引量：1

参考文献2

二级参考文献10

共引文献38

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于金字塔分割注意力网络的单目深度估计方法被引量：1