期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于改进TSM的船舶驾驶员行为识别方法
1
作者 陈晨 魏月楠 +2 位作者 马枫 胡松涛 王腾飞 《交通信息与安全》 北大核心 2025年第1期120-129,140,共11页
船舶驾驶员不规范操作是诱发水上交通事故重要因素,设计1种实时船舶驾驶员行为检测方法意义重大。相比汽车驾驶、安防监控等,船舶驾驶舱环境更为复杂,存在无法兼顾多个船员、效率低下和准确率不高等问题。针对这种情况,研究了1种多目标... 船舶驾驶员不规范操作是诱发水上交通事故重要因素,设计1种实时船舶驾驶员行为检测方法意义重大。相比汽车驾驶、安防监控等,船舶驾驶舱环境更为复杂,存在无法兼顾多个船员、效率低下和准确率不高等问题。针对这种情况,研究了1种多目标跟踪和行为识别相结合的“两步式”多人行为识别方法。利用YoloV7与ByteTracker建立多目标跟踪器,形成单人的连续特征图。在单目标行为识别算法时间偏移模块(temporal shift module,TSM)的基础上,借助超采样、跨帧拼接等手段处理连续特征图,同时通过EfficientNet-B3与坐标注意力(coordinate attention,CA)模块输出高准确率的识别结果。研究建立了船舶驾驶舱行为数据集“SC-Action”,数据来自不同的船舶驾驶舱监控录像,包含常规行为以及违规行为共计2000例行为样本。在该数据集上对本文提出的模型进行迁移学习和消融实验,实验结果表明:提出的方法可实现3名驾驶员24帧/s的实时行为识别,识别速度和准确率均优于主流算法。在针对单人行为识别的测试中,方法在应用图像增强模块之后,相比基准TSM模型准确率提升了1.3%;结合注意力机制后,准确率进一步提升1.78%,达到了82.1%,而运算量仅增加0.1%。在多目标测试中,方法的实际推理速度和效果,也超越了该领域的主流方法如SlowFast,验证了其有效性。 展开更多
关键词 航行安全 行为识别 目标跟踪 注意力机制 temporal shift module
在线阅读 下载PDF
基于ResNet-TSM和BiGRU网络的移动视频感知质量评价模型 被引量:2
2
作者 杜丽娜 杨硕 +2 位作者 卓力 张菁 李嘉锋 《北京工业大学学报》 CAS CSCD 北大核心 2024年第1期18-26,共9页
考虑到卡顿、质量切换、内容特征等因素对用户体验质量的影响都会直接体现在客户端的失真视频里,提出了一种客户端的移动视频感知质量评价模型。该模型无须对每种影响因素均进行表征和度量,而是基于深度特征提取+回归的思路,直接建立失... 考虑到卡顿、质量切换、内容特征等因素对用户体验质量的影响都会直接体现在客户端的失真视频里,提出了一种客户端的移动视频感知质量评价模型。该模型无须对每种影响因素均进行表征和度量,而是基于深度特征提取+回归的思路,直接建立失真视频与平均意见分数之间的映射模型。首先,构建了ResNet-TSM网络结构,提取失真视频片段的深度时空特征;为了避免维度灾难,采用LargeVis算法对提取的深度特征进行降维,同时提升特征的表达与区分能力。然后,采用双向门控循环单元网络对视频的长时间依赖关系进行建模,得到各视频片段的打分,再利用时间平均池化方法将各片段分数进行聚合,得到整个视频的打分结果。在WaterlooSQoE-Ⅲ和LIVE-NFLX-Ⅱ数据集上的实验结果表明,提出的模型可以获得更高的预测精度。 展开更多
关键词 视频感知质量评价 平均意见分数 卷积神经网络 时间移位模块 双向门控循环单元 深度时空特征
在线阅读 下载PDF
多尺度门控时空增强的唇语识别方法
3
作者 马金林 郭兆伟 +1 位作者 马自萍 吕鑫 《计算机辅助设计与图形学学报》 北大核心 2025年第7期1228-1238,共11页
针对唇语识别模型中的普通卷积对唇部形变缺乏鲁棒性和不能有效地提取时间信息的问题,提出时空增强与多尺度时间卷积网络(MSTCN)结合的唇语识别方法.首先设计沙漏型卷积块(FCB),增强网络对唇部形变的鲁棒性;然后使用门控时移融合(GSF)... 针对唇语识别模型中的普通卷积对唇部形变缺乏鲁棒性和不能有效地提取时间信息的问题,提出时空增强与多尺度时间卷积网络(MSTCN)结合的唇语识别方法.首先设计沙漏型卷积块(FCB),增强网络对唇部形变的鲁棒性;然后使用门控时移融合(GSF)模块提高前端网络的时间信息提取能力;再基于FCB和GSF设计混合3D和2D卷积的时空增强网络STABNet;最后将STABNet作为前端网络,MSTCN作为后端网络,设计唇语识别模型.在LRW数据集上的实验结果表明,与基线模型相比,所提方法的准确率提升4.15个百分点,达到89.45%,而模型的参数量仅增加3.17M.在GRID数据集上准确率达到97.45%,超过大部分对比模型. 展开更多
关键词 唇语识别 多尺度时间卷积网络 时空增强 门控时移融合模块
在线阅读 下载PDF
基于改进TimeSformer算法的人体异常行为识别研究
4
作者 廖晓群 徐清钏 +2 位作者 杨浩东 李丹 薛亚楠 《计算机工程》 北大核心 2025年第11期112-122,共11页
人体异常行为研究是应对人体潜在危险和紧急情况的重要保障任务。针对人体异常行为定义模糊、缺乏标准数据集等问题,基于生活场景定义头痛、摔倒、抽搐、腰痛、拳打、踢踹6种高发生频率的人体异常行为,并自建数据集HABDataset-6。基于... 人体异常行为研究是应对人体潜在危险和紧急情况的重要保障任务。针对人体异常行为定义模糊、缺乏标准数据集等问题,基于生活场景定义头痛、摔倒、抽搐、腰痛、拳打、踢踹6种高发生频率的人体异常行为,并自建数据集HABDataset-6。基于注意力机制的TimeSformer算法在自建数据集HABDataset-6上存在高损失和时间序列建模不全面的问题,难以提取复杂样本的特征。为了更好地处理人体异常行为数据,提出改进算法TS-AT。首先采用加速随机梯度下降(ASGD)优化算法改进交叉熵损失函数来设计CAS模块降低原算法损失值,其次嵌入时间偏移模块(TSM)到原算法的Backbone网络中,提高时间序列的感知能力,提取更优特征用于模型训练。实验结果表明:TS-AT算法在自建数据集HABDataset-6上取得了良好效果,各行为类别的平均推理准确率高于80%;在公开数据集UCF-10和老人异常行为数据上,平均测试准确率分别达到了99%和84%,超过了对比算法。这些结果表明TS-AT算法在人体异常行为识别方面具有更高的精确度和良好的鲁棒性,有望提高应对潜在危险和紧急情况的能力,进一步保障人们的安全与健康。 展开更多
关键词 人体异常行为 TimeSformer算法 时间序列 优化算法 时间偏移模块
在线阅读 下载PDF
基于时移和片组注意力融合的双流行为识别网络 被引量:3
5
作者 肖子凡 刘逸群 +3 位作者 李楚溪 张力 王守岩 肖晓 《计算机系统应用》 2022年第1期204-211,共8页
基于深度学习的行为识别算法往往由于复杂的网络设计而难以在实际应用中达到快速、准确的识别效果.针对以上情况,提出一种轻量型的基于时移和片组注意力融合的端到端双流神经网络模型.算法在RGB与光流分支网络中,采用时间稀疏分组随机... 基于深度学习的行为识别算法往往由于复杂的网络设计而难以在实际应用中达到快速、准确的识别效果.针对以上情况,提出一种轻量型的基于时移和片组注意力融合的端到端双流神经网络模型.算法在RGB与光流分支网络中,采用时间稀疏分组随机采样策略实现长时程建模,利用时移模块在时间维度上置换部分通道从而结合邻帧信息来提升时序表征能力,同时通过多路径及特征图注意融合的片组注意力模块提升网络的识别性能.实验表明,模型在行为识别公共数据集UCF101及HMDB51上分别达到了95.00%和72.55%的识别准确率. 展开更多
关键词 行为识别 双流深度网络 时移模块 片组注意力
在线阅读 下载PDF
基于改进YOWO算法的学生课堂行为识别 被引量:3
6
作者 徐鑫磊 张景异 《计算机系统应用》 2024年第4期113-122,共10页
当前,大部分的学生课堂行为识别工作主要基于单帧图像进行,忽略了行为的连贯性,因此不能充分利用视频信息来对学生的课堂行为进行准确刻画.所以,本文提出一种改进的YOWO算法模型,有效利用视频信息对学生课堂行为进行识别.首先,本文采集... 当前,大部分的学生课堂行为识别工作主要基于单帧图像进行,忽略了行为的连贯性,因此不能充分利用视频信息来对学生的课堂行为进行准确刻画.所以,本文提出一种改进的YOWO算法模型,有效利用视频信息对学生课堂行为进行识别.首先,本文采集某高校真实课堂教学中的授课录像,制作出包含5类学生课堂行为的AVA格式视频数据集;其次,采用时移模块TSM(temporal shift module),用来增强模型获取时间上下文信息的能力;最后,采用非局部操作模块non-local来提高模型提取关键位置信息的能力.实验结果表明,通过对YOWO模型的优化,使得网络的识别性能更佳.在学生课堂行为数据集上,改进后的算法的mAP值为95.7%,相较于原YOWO算法在mAP值上提高了4.6%;模型参数量为81.97×10^(6),计算量为22.6 GFLOPs,参数量和计算量分别降低32.3%和9.6%;检测速度为24.03 f/s,提升了约3 f/s. 展开更多
关键词 YOWO算法 tsm NON-LOCAL 学生课堂行为 行为识别 注意力机制
在线阅读 下载PDF
基于深度学习的人体动作识别算法 被引量:2
7
作者 江励 周鹏飞 汤健华 《机电工程技术》 2023年第11期23-27,80,共6页
针对现有的基于3D卷积神经网络的人体动作识别算法存在实时性较差、训练时间长、计算复杂度高等问题,提出了一种新的人体动作识别算法,采用高精度Transformer风格的骨干网络,并融合时序移位模块和轻量级注意力机制。该算法通过骨干网络C... 针对现有的基于3D卷积神经网络的人体动作识别算法存在实时性较差、训练时间长、计算复杂度高等问题,提出了一种新的人体动作识别算法,采用高精度Transformer风格的骨干网络,并融合时序移位模块和轻量级注意力机制。该算法通过骨干网络CoTNeXt对上下文信息进行挖掘并进行自注意力学习,从而有效地增强动作特征。时序移位模块可以充分提取动作时序信息,而融合注意力机制可以通过增加正则化项来进一步抑制不显著的特征,从而突出显著动作特征。实验结果表明,该算法在Jester数据集和Kinetics-400数据集上的识别准确率分别达到了97.42%和75.94%,与现有的大多数人体动作识别算法相比,该算法在准确性和实时性方面表现更好。 展开更多
关键词 人体动作识别 深度学习 时序移位模块 注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部