期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
Human-Object Interaction Recognition Based on Modeling Context 被引量:1
1
作者 Shuyang Li Wei Liang Qun Zhang 《Journal of Beijing Institute of Technology》 EI CAS 2017年第2期215-222,共8页
This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion b... This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion between human and objects during the interacting process.Since that human actions and interacted objects provide strong context information,i.e.some actions are usually related to some specific objects,the accuracy of recognition is significantly improved for both of them.Through the proposed method,both global and local temporal features from skeleton sequences are extracted to model human actions.In the meantime,kernel features are utilized to describe interacted objects.Finally,all possible solutions from actions and objects are optimized by modeling the context between them.The results of experiments demonstrate the effectiveness of our method. 展开更多
关键词 human-object interaction action recognition object recognition modeling context
在线阅读 下载PDF
Graph-based method for human-object interactions detection 被引量:1
2
作者 XIA Li-min WU Wei 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第1期205-218,共14页
Human-object interaction(HOIs)detection is a new branch of visual relationship detection,which plays an important role in the field of image understanding.Because of the complexity and diversity of image content,the d... Human-object interaction(HOIs)detection is a new branch of visual relationship detection,which plays an important role in the field of image understanding.Because of the complexity and diversity of image content,the detection of HOIs is still an onerous challenge.Unlike most of the current works for HOIs detection which only rely on the pairwise information of a human and an object,we propose a graph-based HOIs detection method that models context and global structure information.Firstly,to better utilize the relations between humans and objects,the detected humans and objects are regarded as nodes to construct a fully connected undirected graph,and the graph is pruned to obtain an HOI graph that only preserving the edges connecting human and object nodes.Then,in order to obtain more robust features of human and object nodes,two different attention-based feature extraction networks are proposed,which model global and local contexts respectively.Finally,the graph attention network is introduced to pass messages between different nodes in the HOI graph iteratively,and detect the potential HOIs.Experiments on V-COCO and HICO-DET datasets verify the effectiveness of the proposed method,and show that it is superior to many existing methods. 展开更多
关键词 human-object interactions visual relationship context information graph attention network
在线阅读 下载PDF
An Intelligent Framework for Recognizing Social Human-Object Interactions
3
作者 Mohammed Alarfaj Manahil Waheed +4 位作者 Yazeed Yasin Ghadi Tamara al Shloul Suliman A.Alsuhibany Ahmad Jalal Jeongmin Park 《Computers, Materials & Continua》 SCIE EI 2022年第10期1207-1223,共17页
Human object interaction(HOI)recognition plays an important role in the designing of surveillance and monitoring systems for healthcare,sports,education,and public areas.It involves localizing the human and object tar... Human object interaction(HOI)recognition plays an important role in the designing of surveillance and monitoring systems for healthcare,sports,education,and public areas.It involves localizing the human and object targets and then identifying the interactions between them.However,it is a challenging task that highly depends on the extraction of robust and distinctive features from the targets and the use of fast and efficient classifiers.Hence,the proposed system offers an automated body-parts-based solution for HOI recognition.This system uses RGB(red,green,blue)images as input and segments the desired parts of the images through a segmentation technique based on the watershed algorithm.Furthermore,a convex hullbased approach for extracting key body parts has also been introduced.After identifying the key body parts,two types of features are extracted.Moreover,the entire feature vector is reduced using a dimensionality reduction technique called t-SNE(t-distributed stochastic neighbor embedding).Finally,a multinomial logistic regression classifier is utilized for identifying class labels.A large publicly available dataset,MPII(Max Planck Institute Informatics)Human Pose,has been used for system evaluation.The results prove the validity of the proposed system as it achieved 87.5%class recognition accuracy. 展开更多
关键词 Dimensionality reduction human-object interaction key point detection machine learning watershed segmentation
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
4
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 Transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
智能感知中的人-物交互检测方法研究
5
作者 王志方 胡浩晨 谭守标 《自动化仪表》 2025年第6期58-64,共7页
受到变形器风格的目标检测器影响,人-物交互(HOI)检测器的性能得到了很大提升,但仍存在重复计算、建模困难等问题。为此,设计了结合交互结构与类别理解的HOI检测方法。创新性地利用预先提供的交互建议减少重复计算,构建交互结构信息模... 受到变形器风格的目标检测器影响,人-物交互(HOI)检测器的性能得到了很大提升,但仍存在重复计算、建模困难等问题。为此,设计了结合交互结构与类别理解的HOI检测方法。创新性地利用预先提供的交互建议减少重复计算,构建交互结构信息模型并提升模型建模能力与交互理解能力,从而提升HOI检测准确率;引入基于对比文字-图像对的预训练组件,以辅助交互动作类别的判别。模拟人类思维常见的关联关系,利用交互动作间的语义关系提高交互理解能力。在算法设计上,预先构建交互建议和交互结构信息,并相应地修改解码器自注意力层和交叉注意力层,从而高效利用上述信息。试验结果证明了该方法的有效性。该方法的设计证明,更优秀的交互理解范式是HOI检测的关键。 展开更多
关键词 人-物交互 智能感知 交互结构 类别理解 交互建议
在线阅读 下载PDF
基于知识检索的多模态人物交互检测
6
作者 陈妍 高永彬 《北京化工大学学报(自然科学版)》 北大核心 2025年第1期113-121,共9页
人物交互(human-object interaction,HOI)检测在复杂场景理解中发挥着至关重要的作用。目前的大多数方法都以一阶段的方式将参数交互查询直接映射到一组HOI预测中,这导致丰富的交互结构没有被充分挖掘和利用。对此可以通过多模态数据获... 人物交互(human-object interaction,HOI)检测在复杂场景理解中发挥着至关重要的作用。目前的大多数方法都以一阶段的方式将参数交互查询直接映射到一组HOI预测中,这导致丰富的交互结构没有被充分挖掘和利用。对此可以通过多模态数据获取更多维度的信息,从而更全面地理解人物之间的交互行为。为此设计了一种Transformer风格的HOI检测器,该检测器基于查询的方式检索对比语言图像预训练(CLIP)知识,然后执行交互建议生成,通过结构感知网络将非参数交互建议转换为HOI预测。本文创新性地将CLIP知识迁移到HOI检测中,并通过对整体语义结构和局部空间结构进行额外编码提高了预测结果的准确性。实验结果表明,所提模型在公共数据集V-COCO上的准确率达到了64.83%,在HICO-DET数据集上的准确率达到了28.78%,与现有的HOI检测算法相比展现出优越的性能,证明了该算法的有效性。 展开更多
关键词 人-物体交互检测 计算机视觉 深度学习 目标检测 视觉关系
在线阅读 下载PDF
融合局部特征增强感知的人-物交互检测算法
7
作者 林峻屹 陈明轩 高永彬 《计算机应用》 北大核心 2025年第11期3713-3720,共8页
人-物交互(HOI)检测任务的核心在于识别图像中的人物和物体,并准确分类它们之间的交互关系,这对于深化场景理解至关重要;但现有算法在处理复杂关系时,由于缺乏局部信息导致错误关联,难以区分细粒度操作。因此,设计一种局部特征增强的感... 人-物交互(HOI)检测任务的核心在于识别图像中的人物和物体,并准确分类它们之间的交互关系,这对于深化场景理解至关重要;但现有算法在处理复杂关系时,由于缺乏局部信息导致错误关联,难以区分细粒度操作。因此,设计一种局部特征增强的感知模块(LFPM),通过结合局部和非局部特征的相互作用增强模型对局部特征信息的捕获能力。该模块包含了3个关键部分:降采样聚合分支模块(DAM)、细粒度特征分支(FGFB)模块以及多尺度小波卷积(MSWC)模块。其中,DAM通过降采样获得低频特征,聚合非局部结构信息;FGFB模块并行执行卷积操作,补充DAM对局部信息的提取;MSWC模块进一步在空间和通道维度上优化输出特征,使特征表达更加精细完整。此外,为解决Transformer在局部空间和通道特征挖掘方面的不足,引入空间和通道挤压注意力(scSE)模块。该模块在空间和通道维度上分配注意力,可增强模型对局部显著区域的敏感性,有效提升HOI检测的精度。最后整合LFPM、scSE以及Transformer架构构成局部特征增强感知模型(LFEP)框架。实验结果表明,与SQA(Strong guidance Query with selfselected Attention)算法相比,LFEP框架在V-COCO数据集上的平均精度(AP)提升了1.1个百分点,在HICO-DET数据集上的平均精度均值(mAP)提升了0.49个百分点,消融实验也验证了LEEP中各模块的有效性。 展开更多
关键词 特征感知 多频率卷积 降采样聚合 端到端 人-物交互检测
在线阅读 下载PDF
人物交互检测研究进展综述 被引量:5
8
作者 龚勋 张志莹 +2 位作者 刘璐 马冰 吴昆伦 《西南交通大学学报》 EI CSCD 北大核心 2022年第4期693-704,共12页
作为目标检测、行为识别、视觉关系检测的交叉学科,人物交互(human-object interaction,HOI)检测旨在识别特定应用场景下人与物体的相互关系.本文对基于图像的人物交互检测研究成果进行了系统总结及论述.首先,从交互关系建模的原理出发... 作为目标检测、行为识别、视觉关系检测的交叉学科,人物交互(human-object interaction,HOI)检测旨在识别特定应用场景下人与物体的相互关系.本文对基于图像的人物交互检测研究成果进行了系统总结及论述.首先,从交互关系建模的原理出发,把人物交互检测方法分为基于全局实例和基于局部实例两类,并对代表性方法进行了详细阐述和分析;进而,根据所采用视觉特征的差异将基于全局实例的方法进行细分,包括融合空间位置信息、融合外观信息与融合人体姿态信息;然后,讨论了零样本学习、弱监督学习以及Transformer模型在人物交互检测中的应用;最后,从交互类别、视觉干扰以及运动视角三方面出发,总结了人物交互检测面临的挑战,并指出领域泛化、实时检测和端到端网络是未来发展的趋势. 展开更多
关键词 人物交互 视觉关系 目标检测 动作识别
在线阅读 下载PDF
基于深度学习的人—物交互关系检测综述 被引量:4
9
作者 廖越 李智敏 刘偲 《中国图象图形学报》 CSCD 北大核心 2022年第9期2611-2628,共18页
人—物交互关系检测旨在通过精细化定位图像或视频中产生特定动作行为的人,以及与其产生交互关系的物体,并识别人和物体之间的动作关系来理解和分析人体的行为。人—物交互关系检测是一个非常具有实际应用意义和前瞻性的研究方向,是高... 人—物交互关系检测旨在通过精细化定位图像或视频中产生特定动作行为的人,以及与其产生交互关系的物体,并识别人和物体之间的动作关系来理解和分析人体的行为。人—物交互关系检测是一个非常具有实际应用意义和前瞻性的研究方向,是高层视觉理解的关键基石。随着深度学习的发展,基于深度学习的研究方法引领了近期人—物交互关系检测研究的进步。本文一方面分析空域人—物交互关系检测任务,从数据内容场景、标注粒度两个方面总结和分析当下数据库和基准。然后从两阶段分段式方法和单阶段端到端式方法两个流派出发系统性地阐述当前检测方法的发展现状,分析两个流派方法的特性和优劣,厘清该领域方法的发展路线。其中,两阶段方法包括多流模型和图模型两种主要范式,而单阶段模型包括基于框的范式、基于关系点的范式和基于查询的范式。另一方面,对时空域人—物交互关系检测任务进行总结,分析现有时空域交互关系数据集构造与特性和现有基线算法的优劣。最后对未来的研究方向进行展望。 展开更多
关键词 人—物交互关系(hoi)检测 行为理解 深度学习 目标检测 关系检测
原文传递
深度学习的人-物体交互检测研究进展 被引量:3
10
作者 阮晨钊 张祥森 +1 位作者 刘科 赵增顺 《计算机科学与探索》 CSCD 北大核心 2022年第2期323-336,共14页
人-物体交互检测(HOI),就是把图像作为输入,检测出图像中存在交互行为的人和物体以及他们之间的交互动词。它是计算机视觉范畴里继目标检测、图像分割和目标跟踪之后又一新任务,旨在对图像进行更深层的理解。针对目前基于深度学习的HOI... 人-物体交互检测(HOI),就是把图像作为输入,检测出图像中存在交互行为的人和物体以及他们之间的交互动词。它是计算机视觉范畴里继目标检测、图像分割和目标跟踪之后又一新任务,旨在对图像进行更深层的理解。针对目前基于深度学习的HOI检测综述性文章的空白,以HOI检测方法的发展历程为主线,对基于深度学习的HOI检测方法进行了分类与分析。首先简要总结了早期的技术方法,然后根据模型结构将现有算法分为两阶段方法和一阶段方法并对一些代表性算法进行分析介绍。将两阶段方法分为融入注意力、图模型以及姿势和身体部位三类进行重点论述,总结了每类方法的基本思想与优缺点。此外,还详细介绍了HOI检测任务的实验评价指标、基准数据集和大多数现有方法的实验结果,对不同类别的方法取得的结果进行说明。最后对该技术面临的主要挑战进行总结分析并对未来发展趋势进行展望。 展开更多
关键词 人-物体交互检测(hoi) 计算机视觉 目标检测 深度学习
在线阅读 下载PDF
基于自适应三线性池化网络的细粒度图像分类 被引量:3
11
作者 石进 徐杨 曹斌 《计算机工程》 CAS CSCD 北大核心 2023年第5期239-246,254,共9页
细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空... 细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空间更符合细粒度图像特性而具有一定的有效性,但忽略了层间的相互作用。针对细粒度图像识别领域存在的关键区域识别困难和层间交互关联弱的问题,融合二阶协方差通道注意力机制、自适应特征掩码与自适应三线性池化,提出自适应三线性池化网络ATP-Net,用于细粒度图像分类任务。通过二阶协方差通道注意力机制学习通道上的注意力向量,构建自适应特征掩码模块学习空间维上的注意力矩阵,设计自适应三线性池化模块学习特征的最终表示,以充分利用空间维、通道维上的信息。在CUB-200、Cars-196和Aircraft-1003个细粒度图像分类数据集上的实验结果表明,ATP-Net的分类精度分别为89.30%、94.20%和91.80%。 展开更多
关键词 细粒度图像分类 注意力机制 特征掩码 自适应三线性池化 高阶交互
在线阅读 下载PDF
任务感知双原型网络的人物交互少样本识别 被引量:1
12
作者 安平 冀中 刘西瑶 《计算机科学与探索》 CSCD 北大核心 2021年第11期2184-2192,共9页
人物交互(HOI)识别是计算机视觉领域的重要研究热点。随着深度学习在图像分类任务中的巨大成功,人物交互识别任务也取得重大进展,但样本不平衡和组合爆炸问题仍是制约当前人物交互识别任务性能的关键挑战。由此,将人物交互识别任务与少... 人物交互(HOI)识别是计算机视觉领域的重要研究热点。随着深度学习在图像分类任务中的巨大成功,人物交互识别任务也取得重大进展,但样本不平衡和组合爆炸问题仍是制约当前人物交互识别任务性能的关键挑战。由此,将人物交互识别任务与少样本学习相结合,将人物交互识别任务定义为一个少样本任务,并提出了任务感知双原型网络(TDP-Net)来解决少样本人物交互任务。具体地,首先使用图方法为每个任务生成语义感知的任务表示作为任务的先验信息,并使用语义图注意力模块(SGA-Module)生成注意力权重,对特征图中不同区域进行不同重要程度的关注,以适应不同任务条件下的映射关系,实现在新任务中自动推理。此外,还设计了一个双路原型模块(DP-Module)以分别产生交互类别的动作类原型和物体类原型,并分别对动词和名词进行分类。通过分别为动作和物体建立类原型,有效地分离了动作和物体间复杂的视觉关系。同时由于人物交互类别之间具有相似性,可通过重新组合动作和物体类别将知识迁移到新的交互类别中。实验结果表明,该模型在人物交互少样本任务上的平均准确率比基线方法在两个实验设置上分别提高了3.2个百分点和15.7个百分点,验证了TDP-Net在少样本人物交互任务中的有效性。 展开更多
关键词 计算机视觉 图像分类 人物交互(hoi) 少样本学习(FSL) 注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部