目标搜索与识别的视觉注意网络与学习方法被引量：2

Visual Attentional Network and Learning Method for Object Search and Recognition

导出

摘要提出一种循环视觉注意网络来同时进行目标搜索和识别。该网络能够从图像中自动选择一个局部观测序列,通过融合局部详细表观和粗略上下文视觉信息,实现视觉目标的高精度定位与识别,比传统的滑动窗口和全图卷积的方法具有更高的目标搜索效率。此外,提出了一种混合损失函数来对网络参数进行端到端的多任务学习,特别在视觉注视点序列损失函数中引入随机性和目标启发的组合策略,可以有效地挖掘更丰富的上下文信息,保证注意点快速接近视觉目标。建立了一个真实场景数据集来验证该模型在感兴趣目标和小目标搜索与识别的性能。试验结果表明,该方法通过几个注视点转移,就能够在一幅图像上预测一个视觉目标的准确边框,并在大图像上获得比较高的搜索速度。开放源代码用于该方法验证与比较分析。 A recurrent visual network is proposed to search and recognize an object simultaneously.The network can automatically select a sequence of local observations,and accurately localize and recognize objects by fusing those local detail appearance and rough context visual information.The method is more efficient than other methods with sliding windows or convolution on a whole image.Besides,a hybrid loss function is proposed to learn parameters of the multi-task network end-to-end.Especially,The combination of stochastic and object-awareness strategy is imported into visual fixation loss,which is beneficial to mine more abundant context and ensure fixation point close to object as fast as possible.A real-world dataset is built to verify the capacity of the method in searching and recognizing the object of interest including those small ones.Experiments illustrate that the method can predict an accurate bounding box for a visual object,and achieve higher searching speed.The source code will be opened to verify and analyze the method.

作者吕杰罗芳颖袁泽剑 Lü Jie;LUO Fangying;YUAN Zejian(School of Electronic and Information Engineering,Xi'an Jiaotong University,Xi'an 710049)

机构地区西安交通大学电子与信息工程学院

出处《机械工程学报》 EI CAS CSCD 北大核心 2019年第11期123-130,共8页 Journal of Mechanical Engineering

基金国家自然科学基金(91648121,61573280) 国家重点研究计划(2016YFB001001)资助项目

关键词注意力模型强化学习目标检测注意策略 attentional model reinforcement learning object detection fixation strategy

分类号 TG156 [金属学及工艺—热处理]

引文网络
相关文献

同被引文献16

1陈云,药宁娜,徐利民,孔晓峰,王斌.输电线路铁塔表面锈蚀等级划分的探讨[J].华北电力技术,2015(4):30-34. 被引量：8
2郭增伟,李龙景,姚国文.交变荷载与腐蚀环境耦合作用下拉索钢丝腐蚀行为特征及预测[J].重庆大学学报（自然科学版）,2018,41(7):48-57. 被引量：4
3李鹏飞,吉同元,秦网根.船闸闸门检测与评估技术[J].水运工程,2019(1):141-145. 被引量：4
4王达磊,彭博,潘玥,陈艾荣.基于深度神经网络的锈蚀图像分割与定量分析[J].华南理工大学学报（自然科学版）,2018,46(12):121-127. 被引量：28
5张小寒,杨东刚.基于平滑度测量与互相关制约的图像修复算法[J].包装工程,2019,40(7):222-228. 被引量：3
6楼幸欣,唐向宏,张越.相似匹配块组的稀疏表示图像修复[J].中国图象图形学报,2019,24(7):1055-1066. 被引量：6
7桂彦,郭林,曾光.单幅图像训练深度神经网络的编辑传播方法[J].计算机辅助设计与图形学学报,2019,31(8):1391-1402. 被引量：4
8李洪均,丁宇鹏,李超波,张士兵.基于特征融合时序分割网络的行为识别研究[J].计算机研究与发展,2020,57(1):145-158. 被引量：17
9张春婷.基于双线性卷积神经网络的视觉目标跟踪算法[J].激光与光电子学进展,2020,57(4):231-237. 被引量：3
10徐亦丹,葛菁.视觉传感网络图像数据曲面重构方法仿真[J].计算机仿真,2020,37(5):473-476. 被引量：2

引证文献2

1陈纾,孟刚.视觉传感网络图像破损数据交互方法仿真[J].计算机仿真,2021,38(10):185-188.
2陈法法,董海飞,潘瑞雪,杨蕴鹏,陈保家.基于注意力机制与双线性池化的锈蚀等级评估[J].工程科学与技术,2023,55(5):242-252. 被引量：2

二级引证文献2

1陈伯建,吴文斌,林承华,梁曼舒,吴晓杰.基于图像语义分割的输电设备表面腐蚀区域细粒度识别方法[J].沈阳工业大学学报,2025,47(3):339-347.
2吴宇,李广德.基于锈蚀评估的进水口检修闸门结构加固设计及有限元静力分析[J].红水河,2025,44(4):17-22.

1李绣心,凌志刚,邹文.基于卷积神经网络的半监督高光谱图像分类[J].电子测量与仪器学报,2018,32(10):95-102. 被引量：15
2Lionel Laurent,丁虹(译).Facebook推出的新加密货币有何实际用处?[J].商业周刊（中文版）,2019,0(12):9-9.
3苏晓宝,刘臣,唐莉.基于线性链条件随机场的用户生成文本标点标注[J].软件,2019,40(4):145-149.
4徐祖泽,李威远,张浩驰,王玭,于新业.智能汽车灯光控制系统[J].电子世界,2019,0(10):119-121. 被引量：7
5徐明哲,王殊轶,叶莎莎.基于眼动训练的腹腔镜手术培训方法的研究[J].生物医学工程学杂志,2017,34(5):745-751. 被引量：5
6李鑫.一种基于预测模型的网络安全风险实时预测方法设计[J].重庆理工大学学报（自然科学）,2019,33(2):132-137. 被引量：8
7肖剑伟.基于LNMP平台Moodle课程学习管理系统部署[J].信息与电脑,2019,31(8):72-75. 被引量：3
8潘国荣,乔立洋.非等间距改进灰色模型在基坑变形预测中的应用[J].测绘地理信息,2019,44(1):9-13. 被引量：6
9李朋龙,董怡储,谭攀,李晓龙.建筑物矢量辅助的正射影像镶嵌线网络选择方法[J].遥感信息,2019,34(3):107-114. 被引量：3
10任祥钰.一种乒乓球视频数据挖掘算法的研究[J].自动化技术与应用,2019,38(5):17-21. 被引量：4

机械工程学报

2019年第11期

浏览历史

内容加载中请稍等...

目标搜索与识别的视觉注意网络与学习方法被引量：2

同被引文献16

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

目标搜索与识别的视觉注意网络与学习方法 被引量：2

同被引文献16

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

目标搜索与识别的视觉注意网络与学习方法被引量：2