期刊文献+
共找到762篇文章
< 1 2 39 >
每页显示 20 50 100
Human-Object Interaction Recognition Based on Modeling Context 被引量:1
1
作者 Shuyang Li Wei Liang Qun Zhang 《Journal of Beijing Institute of Technology》 EI CAS 2017年第2期215-222,共8页
This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion b... This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion between human and objects during the interacting process.Since that human actions and interacted objects provide strong context information,i.e.some actions are usually related to some specific objects,the accuracy of recognition is significantly improved for both of them.Through the proposed method,both global and local temporal features from skeleton sequences are extracted to model human actions.In the meantime,kernel features are utilized to describe interacted objects.Finally,all possible solutions from actions and objects are optimized by modeling the context between them.The results of experiments demonstrate the effectiveness of our method. 展开更多
关键词 human-object interaction action recognition object recognition modeling context
在线阅读 下载PDF
Graph-based method for human-object interactions detection 被引量:1
2
作者 XIA Li-min WU Wei 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第1期205-218,共14页
Human-object interaction(HOIs)detection is a new branch of visual relationship detection,which plays an important role in the field of image understanding.Because of the complexity and diversity of image content,the d... Human-object interaction(HOIs)detection is a new branch of visual relationship detection,which plays an important role in the field of image understanding.Because of the complexity and diversity of image content,the detection of HOIs is still an onerous challenge.Unlike most of the current works for HOIs detection which only rely on the pairwise information of a human and an object,we propose a graph-based HOIs detection method that models context and global structure information.Firstly,to better utilize the relations between humans and objects,the detected humans and objects are regarded as nodes to construct a fully connected undirected graph,and the graph is pruned to obtain an HOI graph that only preserving the edges connecting human and object nodes.Then,in order to obtain more robust features of human and object nodes,two different attention-based feature extraction networks are proposed,which model global and local contexts respectively.Finally,the graph attention network is introduced to pass messages between different nodes in the HOI graph iteratively,and detect the potential HOIs.Experiments on V-COCO and HICO-DET datasets verify the effectiveness of the proposed method,and show that it is superior to many existing methods. 展开更多
关键词 human-object interactions visual relationship context information graph attention network
在线阅读 下载PDF
An Intelligent Framework for Recognizing Social Human-Object Interactions
3
作者 Mohammed Alarfaj Manahil Waheed +4 位作者 Yazeed Yasin Ghadi Tamara al Shloul Suliman A.Alsuhibany Ahmad Jalal Jeongmin Park 《Computers, Materials & Continua》 SCIE EI 2022年第10期1207-1223,共17页
Human object interaction(HOI)recognition plays an important role in the designing of surveillance and monitoring systems for healthcare,sports,education,and public areas.It involves localizing the human and object tar... Human object interaction(HOI)recognition plays an important role in the designing of surveillance and monitoring systems for healthcare,sports,education,and public areas.It involves localizing the human and object targets and then identifying the interactions between them.However,it is a challenging task that highly depends on the extraction of robust and distinctive features from the targets and the use of fast and efficient classifiers.Hence,the proposed system offers an automated body-parts-based solution for HOI recognition.This system uses RGB(red,green,blue)images as input and segments the desired parts of the images through a segmentation technique based on the watershed algorithm.Furthermore,a convex hullbased approach for extracting key body parts has also been introduced.After identifying the key body parts,two types of features are extracted.Moreover,the entire feature vector is reduced using a dimensionality reduction technique called t-SNE(t-distributed stochastic neighbor embedding).Finally,a multinomial logistic regression classifier is utilized for identifying class labels.A large publicly available dataset,MPII(Max Planck Institute Informatics)Human Pose,has been used for system evaluation.The results prove the validity of the proposed system as it achieved 87.5%class recognition accuracy. 展开更多
关键词 Dimensionality reduction human-object interaction key point detection machine learning watershed segmentation
在线阅读 下载PDF
PKHOI:利用先验知识增强人-物交互检测算法
4
作者 赵文豪 梅萌 +1 位作者 王小平 罗航宇 《计算机科学》 北大核心 2026年第1期141-152,共12页
人-物交互检测(Human-Object Interaction,HOI)在视觉场景理解中起着至关重要的作用,随着深度学习技术的发展,基于视觉的交互检测模型已经能够获得良好的性能。然而,现有方法大多缺乏对先验的逻辑知识的运用,有时会推导出不合理的结果... 人-物交互检测(Human-Object Interaction,HOI)在视觉场景理解中起着至关重要的作用,随着深度学习技术的发展,基于视觉的交互检测模型已经能够获得良好的性能。然而,现有方法大多缺乏对先验的逻辑知识的运用,有时会推导出不合理的结果。其次,一些方法将空间信息和人体姿态信息用于推理,但它们仅在推理结果和标注之间构造损失,导致解码器无法学习到准确的隐含关系。因此,提出一种利用先验知识增强现有人-物交互检测算法的方法PKHOI,该方法能够有效增强现有人-物交互检测算法的准确性。具体而言,从训练集中构建了一个包含物品功能性、空间关系、人体姿态和动词共现的逻辑规则表,将其形式化为一阶逻辑并映射到连续空间中,在训练阶段和推理阶段分别以损失函数和矩阵乘法的形式将先验的逻辑规则融入神经网络,提升模型的准确性。此外,提出一种通过融合多模态信息(空间、语义和人体姿态信息)生成人-物对查询的方法,结合逻辑损失函数,可以引导解码器学习到更多的隐含知识。利用提出的方法增强了两个主流的人-物交互检测算法UPT和PViC,并在V-COCO,HICO-DET和Flickr30k数据集上进行了评估,实验结果表明,提出的方法可以有效提高现有方法的性能。 展开更多
关键词 人-物交互检测 先验知识 一阶逻辑 姿态信息 多模态信息融合
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
5
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 Transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
智能社会人机物互动模式与发展趋向展望——基于自动驾驶出行服务乘客群体的数据
6
作者 吕鹏 刘阳 《北京工业大学学报(社会科学版)》 北大核心 2026年第1期118-135,共18页
人类正在迈入智能社会,以智能体在社会生活场域大量出现为重要标志。在驾驶与出行场景,自动驾驶出租车运营(L4级)成为重要的智能体应用场景,为探索“智能社会”人机物互动提供了观察切口。以武汉市“萝卜快跑”模式商业化运营为案例,面... 人类正在迈入智能社会,以智能体在社会生活场域大量出现为重要标志。在驾驶与出行场景,自动驾驶出租车运营(L4级)成为重要的智能体应用场景,为探索“智能社会”人机物互动提供了观察切口。以武汉市“萝卜快跑”模式商业化运营为案例,面向自动驾驶乘客群体开展调查研究,重点关注这批“吃螃蟹者”的群体特征与社会态度评价,收集并获得问卷数据。研究发现,在群体画像方面,乘客以青年人为主,性别相对均衡,职业以上班族与学生群体为主。受教育程度能够提升认知和使用倾向。在创新的传播扩散过程中,新媒体成为个体首要信息渠道,低成本、无干扰、尝试新鲜事物等成为主要动机。乘客群体中已经出现了较大比例的高频使用者。在人机物互动中的群体主观感知(安全性、有效性、信任度)方面,既存在共识也有差异。首次乘坐的体验能够提高对新技术的信任度。乘客群体在劳动异化、社会排斥、空间正义等维度,表达了社会公平性关切。此外,新出行模式将会对产业与市场带来深刻影响。揭示出未来智能社会可能发生的一系列重大变化,为研究智能社会的人机物互动过程与机理提供了重要的实证基础。 展开更多
关键词 智能社会 人机物互动 自动驾驶 乘客群体 社会公平
在线阅读 下载PDF
矿用特种车辆驾驶室动态响应特性及结构优化研究
7
作者 马凤苹 《煤矿机械》 2026年第3期128-133,共6页
针对矿用特种车辆驾驶室在煤矿井下高振动、强冲击、多粉尘的极端工况下面临严峻的动态性能挑战,对某型铰接式矿用运输车驾驶室进行了动态响应特性分析与多目标优化研究。基于实测路谱与多体动力学理论,构建驾驶室-悬架-车架耦合系统动... 针对矿用特种车辆驾驶室在煤矿井下高振动、强冲击、多粉尘的极端工况下面临严峻的动态性能挑战,对某型铰接式矿用运输车驾驶室进行了动态响应特性分析与多目标优化研究。基于实测路谱与多体动力学理论,构建驾驶室-悬架-车架耦合系统动力学模型,通过Lagrange方程建立多体动力学方程,结合八通道数据采集系统获取30组典型工况载荷谱,模型精度经六自由度振动台验证,悬架阻尼系数与螺栓预紧力敏感性贡献度达73%。该研究通过轮胎系统改进与驾驶室结构重构,使一阶固有频率提升至67.28 Hz,与激励频带分离度达12.5%。优化后实验验证表明:座椅导轨垂直加速度峰值降幅73%,方向盘振动均方根(RMS)值降低70.8%,底板焊缝应变降低68%,疲劳寿命延长至原设计的3.2倍。矿山现场测试表明,驾驶员舒适性评分提升78.3%,振动相关故障率下降42%,年维护成本减少15%~20%。形成了动态性能驱动设计方法体系,为矿用车辆智能化升级提供了高可靠性结构设计范式,显著提升了井下作业安全性与装备人机工效水平。 展开更多
关键词 矿用特种车辆 动态响应 结构优化 多目标协同设计 人机工程性能
原文传递
多元视觉-语义联合嵌入的人-物交互检测网络
8
作者 吕学强 王晓英 +1 位作者 韩晶 陈玉忠 《计算机辅助设计与图形学学报》 北大核心 2025年第10期1811-1824,共14页
人-物交互检测对理解以人为中心的场景任务十分重要,但其因动词的一词多义带来的视觉偏差问题以及图像的层次信息和语义关系,面临难以合理利用的挑战.为此,提出多元视觉特征和语言先验联合嵌入的网络,设计了视觉-语义双分支结构.在视觉... 人-物交互检测对理解以人为中心的场景任务十分重要,但其因动词的一词多义带来的视觉偏差问题以及图像的层次信息和语义关系,面临难以合理利用的挑战.为此,提出多元视觉特征和语言先验联合嵌入的网络,设计了视觉-语义双分支结构.在视觉分支上,将人-物对中人、对象和交互的多元层次关系在层次视觉融合模块中进行丰富的上下文交换,增加用于关系推理的细粒度的上下文信息;在语义分支上,将交互三元组标签中的名词、交互动词和三元组短语联合编码成一个语义汇聚一致性图注意网络,进行信息传递和多义感知;最后通过视觉-语义联合嵌入模块计算视觉和语义之间的拟合程度,得到交互三元组的检测结果.实验结果表明,在V-COCO数据集上,代理平均精度达到70.7%,角色平均精度达到72.4%;在HICO-DET数据集上,默认场景下,完整类、罕见类和非罕见类的平均精度分别达到35.91%,33.65%和36.28%;所提网络优于对比的网络,在少样本和零样本情况下同样表现出色. 展开更多
关键词 人-物交互 语言先验 层次视觉 图注意力机制
在线阅读 下载PDF
基于轻量化网络的特定目标人体姿态估计算法
9
作者 张宝峰 贾炜昂 +4 位作者 刘娜 陆浩宇 杨雷 王莉 刘斌 《计算机应用与软件》 北大核心 2025年第9期196-202,219,共8页
针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择... 针对多人场景下对单一目标姿态估计的需求,将YOLOv5系列网络与提出的目标选择环节、轻量化light-duc模型进行融合,用于特定目标人体姿态估计。该文利用YOLOv5网络进行人体框检测;将DeepSORT多目标跟踪与条件筛选进行融合,构成目标选择环节用于选出指定目标,设计light-duc轻量化模型,完成指定目标人体姿态估计。实验结果表明,所提light-duc网络与原网络相比,速度提升了157%,YOLOv5s模型与light-duc模型结合对单人视频的检测速度提升了319%。 展开更多
关键词 人体姿态估计 多目标跟踪 轻量化 目标选择
在线阅读 下载PDF
农业空间信息可视化表达课程教学案例库建设
10
作者 王红 姜沅辰 +1 位作者 梅新 张明达 《智慧农业导刊》 2025年第10期150-154,共5页
农业空间信息可视化作为农业信息化方面的专业课程之一,重在将空间信息可视化技术与农业实践相结合。为提升农业空间信息可视化课程的教学质量,推动农业空间信息技术的创新与发展,该文以湖北大学研究生课程农业空间信息可视化表达案例... 农业空间信息可视化作为农业信息化方面的专业课程之一,重在将空间信息可视化技术与农业实践相结合。为提升农业空间信息可视化课程的教学质量,推动农业空间信息技术的创新与发展,该文以湖北大学研究生课程农业空间信息可视化表达案例库建设为例,在分析学生特点和课程特点的基础上,以荆门市为研究区域,从数据的获取、处理及可视化表达出发,基于“人-地-物”3个维度,设计冬闲田提取、三大粮食作物长势监测等案例。结果表明,该案例库能有效提高学生的空间信息可视化素养。 展开更多
关键词 人-地-物 农业 空间信息可视化 案例库 教学改革
在线阅读 下载PDF
基于YOLOv5_DeepSORT的人船目标识别与跟踪算法
11
作者 黄艳玉 张梦阳 +1 位作者 郑佳春 孙世丹 《泉州师范学院学报》 2025年第5期47-54,共8页
针对港口公共安全视频监控内容智能分析中,人船目标检测与识别还存在“认不清”“判不准”的问题,提出一种基于YOLOv5和DeepSORT的人船目标识别与跟踪算法。利用优化的YOLOv5检测算法,对摄像头不同角度的视频画面中的行人和船舶进行特... 针对港口公共安全视频监控内容智能分析中,人船目标检测与识别还存在“认不清”“判不准”的问题,提出一种基于YOLOv5和DeepSORT的人船目标识别与跟踪算法。利用优化的YOLOv5检测算法,对摄像头不同角度的视频画面中的行人和船舶进行特征识别,利用重识别技术融合检测视频判断特定的行人或者船舶;结合DeepSORT算法实现对不同轨迹的行人和船舶轨迹的跟踪。以公共数据集自建的行人和船舶图像库为实验数据集,利用YOLOv5模型和参数优化等技术手段进行算法训练,为安全决策提供研判依据。 展开更多
关键词 目标检测 人船目标识别 目标跟踪 YOLOv5 DeepSORT
在线阅读 下载PDF
中小学教师智慧素养的概念溯源、构成要素与培育路径
12
作者 代显华 蔡莹桥 高朝邦 《现代教育管理》 北大核心 2025年第10期77-87,共11页
数字化转型浪潮正在重构基础教育生态,中小学教师智慧素养作为破解技术适应困境、数据协作壁垒、价值决策与伦理判断冲突三重挑战的关键能力,成为智慧教育研究的核心议题。基于DIKW理论模型,研究构建属种明晰、维度可测的中小学教师智... 数字化转型浪潮正在重构基础教育生态,中小学教师智慧素养作为破解技术适应困境、数据协作壁垒、价值决策与伦理判断冲突三重挑战的关键能力,成为智慧教育研究的核心议题。基于DIKW理论模型,研究构建属种明晰、维度可测的中小学教师智慧素养概念框架。溯源从数据素养到智慧素养的跃迁规律,以此确立自主性素养与互动性素养的双维结构。中小学教师智慧素养的根本属性是计算思维、辩证思维和创新思维的融合共生,其构成要素聚焦物理、信息、社会三维空间的差异协同,涵盖智慧适应力、智慧洞察力及智慧领导力。在实践层面,针对基础教育数字化转型的三重矛盾,设计“物—理”认知、“物—物”协作、“物—人”协同的培育路径,旨在促进教师自主性素养的奠基、互动性素养的深化及双维素养的融合,以期为基础教育高质量发展提供理论指导。 展开更多
关键词 中小学教师智慧素养 DIKW理论模型 素养演进 “物—人”协同 智慧教育
在线阅读 下载PDF
主体—对象/客体的镜像关系与认识论障碍:阿尔都塞对费尔巴哈人道主义的批判
13
作者 徐克飞 《当代中国价值观研究》 2025年第5期24-40,共17页
对于费尔巴哈人道主义哲学的批判是阿尔都塞思想发展史上的一个重要环节。阿尔都塞认为费尔巴哈的“人”首先是一个认识的主体,对于人的本质的认识就是对于预设的关于人的本质的“绝对知识”的揭示。费尔巴哈因受到了康德、费希特哲学... 对于费尔巴哈人道主义哲学的批判是阿尔都塞思想发展史上的一个重要环节。阿尔都塞认为费尔巴哈的“人”首先是一个认识的主体,对于人的本质的认识就是对于预设的关于人的本质的“绝对知识”的揭示。费尔巴哈因受到了康德、费希特哲学的影响,将认识的客体视为主体的对象化存在,因而造成了对象与客体概念的混淆,对象/客体成为主体(人)认识自身的镜像。主体—对象/客体的镜像关系是一种意识形态的认识方式,通过这种方式获得的是“再认”和“误认”,而不是真正的认识(即科学的认识)。马克思在摆脱了主体—对象/客体的镜像关系的思维模式之后才走向对社会形态的科学研究。 展开更多
关键词 费尔巴哈的人本主义 主体—对象/客体的镜像关系 认识论障碍
在线阅读 下载PDF
马克思“人化自然”思想的生存论诠释——《1844年经济学哲学手稿》的再解读
14
作者 陈芬 姜棋馨 《马克思主义哲学研究》 2025年第1期164-171,M0011,M0012,共10页
马克思在《1844年经济学哲学手稿》中发动了一场存在论革命,使存在论的目标从“建立关于存在的知识体系”转变为“对人的生存意义的澄明”,这标志着存在论由知识论路向至生存论路向的转变。“人化自然”思想正是在这样的理论背景下提出... 马克思在《1844年经济学哲学手稿》中发动了一场存在论革命,使存在论的目标从“建立关于存在的知识体系”转变为“对人的生存意义的澄明”,这标志着存在论由知识论路向至生存论路向的转变。“人化自然”思想正是在这样的理论背景下提出的。马克思考察了“人化自然”中自由概念、生命概念和活动概念的感性来源,将概念从理性的束缚中解放出来,使概念获得了此岸的真实性。他通过批判资本主义社会“人化自然”的现实状况,为禁锢在资本主义运行逻辑和理性形而上学牢笼中的人提供了全新的生存图景。此外,其“人化自然”思想展现了求真、求知、求善的终极性追求,实现了对人的存在的澄明。 展开更多
关键词 马克思 人化自然 生存论 感性活动 对象性
在线阅读 下载PDF
基于MOPSO和布局特征指标的钻机界面优化研究
15
作者 陈晓鹂 刘润余 +1 位作者 文国军 郝国成 《机械设计》 北大核心 2025年第2期166-172,共7页
为提升地质操作钻机的用户满意度,提出基于界面布局特征衡量指标构建的数学模型,并应用于多目标的粒子群算法求解,从而获取更合理的钻机界面布局。对钻机界面进行拓扑化并建立坐标系;基于衡量指标的计算对界面内元素进行范围约束并构建... 为提升地质操作钻机的用户满意度,提出基于界面布局特征衡量指标构建的数学模型,并应用于多目标的粒子群算法求解,从而获取更合理的钻机界面布局。对钻机界面进行拓扑化并建立坐标系;基于衡量指标的计算对界面内元素进行范围约束并构建数学模型;采用改进后的多目标的粒子群算法求解得到综合最优平衡解;将最优平衡解对应的坐标应用至界面并进行布局改进;通过SUS评估布局优化的有效性。以某型号钻机操纵界面为例进行试验,结果表明,优化后的界面可有效提升用户满意度。文中所提出的方法可作为一种从用户体验角度出发的复杂操控界面布局优化方法。 展开更多
关键词 人机界面 布局优化 多目标粒子群算法 钻机界面 布局特征衡量指标
原文传递
“物−人−场”交互视域下的数字孪生技术研究进展 被引量:1
16
作者 游佳莉 邓佳文 +4 位作者 焦子韵 罗阿理 宋轶晗 邱波 任福继 《科技导报》 北大核心 2025年第20期62-84,共23页
随着新一代信息技术的融合创新,数字孪生(digital twin,DT)技术作为推动数字化转型与智能系统演进的关键支撑,已广泛应用于工业制造、智慧城市、智能交通等领域。然而,现有研究主要聚焦于“物”的建模和分析,较少系统整合“人”和“环... 随着新一代信息技术的融合创新,数字孪生(digital twin,DT)技术作为推动数字化转型与智能系统演进的关键支撑,已广泛应用于工业制造、智慧城市、智能交通等领域。然而,现有研究主要聚焦于“物”的建模和分析,较少系统整合“人”和“环境”因素,难以满足复杂智能系统对多层次、全方位交互的发展需求。鉴于此,引入“物−人−场”交互视域,从智能物理实体(物)、智能个体(人)以及虚实融合环境(场)3大核心维度,全面且系统地剖析数字孪生技术的研究前沿与进展。首先,分析以“物”为核心的传统数字孪生技术体系,重点介绍其理论起源、框架及应用等。其次,探讨AI(人工智能)驱动下的数字人定义、发展脉络、国家政策和核心技术等。最后,将视野拓展至“场”的维度,探究元宇宙多元场景中“场”的应用实践,深入研讨“物”“人”和“场”3个元素的深度融合交互机制,揭示三者如何相互作用、相互促进,为元宇宙的构建提供支撑。进一步,围绕“物−人−场”面临的关键挑战,提出3方面研究建议:(1)构建智能化且具备多层架构的数据融合框架;(2)研究AIGC(生成式人工智能)赋能的智能虚实映射与虚拟原生进化;(3)构建新的虚拟经济与智能化治理体系。研究成果为构建具备多主体协同感知、多模态智能交互与虚实融合闭环反馈的新型数字孪生系统提供了理论基础与实践启示。 展开更多
关键词 数字孪生 物−人−场交互 数字人 虚实融合 元宇宙
原文传递
基于改进的YOLOv7的高校学生课堂行为识别研究
17
作者 徐辉 《芜湖职业技术学院学报》 2025年第3期32-37,共6页
当前,高校学生课堂行为识别算法中存在目标易混淆、运算效率低、资源消耗大等问题。为提升课堂行为检测效果,研究者在模型训练阶段制定了8类学生行为识别和标注标准,并针对数据长尾分布问题,优化了YOLOv7的损失函数。在推理阶段,通过分... 当前,高校学生课堂行为识别算法中存在目标易混淆、运算效率低、资源消耗大等问题。为提升课堂行为检测效果,研究者在模型训练阶段制定了8类学生行为识别和标注标准,并针对数据长尾分布问题,优化了YOLOv7的损失函数。在推理阶段,通过分块检测策略增强了对后排学生及手机等小目标的检测效果;通过多轮非极大值抑制算法整合检测结果,并保留高置信度结果;利用人体关键点检测动态调整阈值,以对手机使用行为进行二次验证。该方法使行为识别的平均准确率达85.75%、平均召回率达72.00%,且在16周真实场景实验中有效降低了课堂消极行为占比。 展开更多
关键词 课堂行为 目标检测 模型训练 人体姿态估计 YOLOv7
在线阅读 下载PDF
基于细粒度注意力机制的人与物体交互检测
18
作者 丁元博 白琳 李陶深 《计算机科学》 北大核心 2025年第11期141-149,共9页
细粒度信息作为一种上下文信息,能够辅助模型识别相对空间关系相似的人与物体交互动作。然而,如何利用这一关键线索统一建模多尺度特征图上不同粒度的特征信息,仍然是人与物体交互检测精度进一步提升面临的主要挑战之一。为了解决这一问... 细粒度信息作为一种上下文信息,能够辅助模型识别相对空间关系相似的人与物体交互动作。然而,如何利用这一关键线索统一建模多尺度特征图上不同粒度的特征信息,仍然是人与物体交互检测精度进一步提升面临的主要挑战之一。为了解决这一问题,提出了一种基于细粒度注意力机制的人与物体交互检测模型(FGDHOI)。该模型在细粒度信息的指导下强化局部特征,融合不同尺度的特征图,通过可变形注意力机制自动学习图像内容,并建模不同粒度特征之间的长距离依赖关系,从本质上提高了人与物体交互检测模型的精度。在V-COCO和HICO数据集上进行了广泛的定性、定量及消融实验。实验结果表明,所提出的方法相比基准模型,在V-COCO数据集上mAP提升了7.7个百分点,在HICO数据集3项指标上mAP分别提升了7.43个百分点、7.5个百分点和7.85个百分点。 展开更多
关键词 深度学习 人与物体交互检测 细粒度信息 注意力机制
在线阅读 下载PDF
基于HOI集合预测的带电作业场景元素交互关系解析方法
19
作者 马富齐 刘永文 +3 位作者 王波 贾嵘 董旭柱 马恒瑞 《高电压技术》 北大核心 2025年第6期3054-3064,共11页
带电作业风险辨识与防护对保障人员生命安全及电网安全运行意义重大。现有风险辨识研究主要集中在安全防护工具的规范佩戴、人员动态不安全行为辨识及电力设备故障隐患检测等单场景元素风险辨识,对场景元素间的交互关系考虑不足。为此,... 带电作业风险辨识与防护对保障人员生命安全及电网安全运行意义重大。现有风险辨识研究主要集中在安全防护工具的规范佩戴、人员动态不安全行为辨识及电力设备故障隐患检测等单场景元素风险辨识,对场景元素间的交互关系考虑不足。为此,该文提出了一种基于人物交互(human object interactions,HOI)集合预测的带电作业场景元素交互关系解析方法。该方法首先基于残差网络的视觉特征提取模块感知带电作业影像的降维扁平化特征,并利用位置编码模块获取图像像素特征的位置信息;然后基于多头注意力机制编码器捕获全局交互关系的增强型特征向量,利用解码器得到固定数量的HOI交互特征查询向量,并通过对增强型特征向量交叉感知的方式实现对查询向量的迭代解码;其次以基于二分图匹配方式的多层感知机集合预测模块进行最优交互关系的判别,从而实现了带电作业场景元素交互关系的精细解析。最后以登高作业场景为例,结果表明所提方法的平均准确率可达94.40%,且在不同环境下均具有较好的识别效果。所提模型可为带电场景关系检测提供参考。 展开更多
关键词 带电作业 安全影像解译 场景元素关系解析 集合预测 人物交互
原文传递
基于计算机视觉技术的人体姿态跟踪方法 被引量:3
20
作者 刘恒 高新燕 +1 位作者 苏新新 李成龙 《软件导刊》 2025年第4期136-146,共11页
人体姿态跟踪在人体运动分析、智能监控、虚拟现实等应用场景中得到了广泛应用。为解决在多人姿态跟踪过程中因多人遮挡、复杂环境等原因导致的目标易丢失、姿态估计不准确等问题,提出一种结合DeepSORT和OpenPose的人体姿态跟踪方法。... 人体姿态跟踪在人体运动分析、智能监控、虚拟现实等应用场景中得到了广泛应用。为解决在多人姿态跟踪过程中因多人遮挡、复杂环境等原因导致的目标易丢失、姿态估计不准确等问题,提出一种结合DeepSORT和OpenPose的人体姿态跟踪方法。选择合适的数据集分别训练人体运动跟踪模型和人体姿态估计模型。在人体运动跟踪阶段,基于改进的YOLOv5与改进的DeepSORT算法进行准确地识别与跟踪,减小了模型内存访问成本,引入模型剪枝方法进一步提高了跟踪速度。在人体姿态估计阶段,基于跟踪阶段获得的准确目标,利用OpenPose算法实现了目标人体的姿态估计。相较于对比方法,改进算法在COCO2017数据集上的FLOPs为4.46 G,检测速度大幅提升,在MOT16数据集、PoseTrack2017数据集上的运行时间有较大优势,分别为85.55 s、81.79 s。 展开更多
关键词 人体姿态跟踪 目标检测 YOLOv5 DeepSORT OpenPose
在线阅读 下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部