期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多尺度可变形图卷积的双人交互行为识别
1
作者 王丽 曹江涛 +1 位作者 谢帅 姬晓飞 《电子测量与仪器学报》 北大核心 2025年第10期61-69,共9页
基于骨架序列数据的双人交互行为识别具有广阔的应用前景,针对目前识别模型中存在双人交互特征表示不充分、动作类内特征表示冗余等问题,提出了一种基于多尺度可变形图卷积网络(multi-scale deformable graph convolutional network, MD... 基于骨架序列数据的双人交互行为识别具有广阔的应用前景,针对目前识别模型中存在双人交互特征表示不充分、动作类内特征表示冗余等问题,提出了一种基于多尺度可变形图卷积网络(multi-scale deformable graph convolutional network, MD-GCN)的双人交互行为识别方法。首先,构建双人交互超图,包括双人超图以及双人交互关系矩阵。与传统图不同,该超图能够更好地表达两人之间的交互关系,充分捕捉双人之间的交互特征。其次,将3流输入分支分别进行数据预处理和特征提取,然后将这些特征信息融合后送入以多尺度可变形图卷积网络为主的主分支中,最后进行动作分类。该网络能够多模态地学习可变形的采样位置,捕捉具有显著交互特征的关键信息,有效避免了特征冗余以及信息丢失。所提出的MD-GCN,在NTU RGB+D 60和NTU RGB+D 120数据集中的26类交互动作的识别任务中,准确率最高达到98.41%,有效地解决了双人交互行为识别中特征表示的挑战。实验结果表明,该方法在保持识别准确率的同时,显著减小了模型运算成本,模型推理性能达到了良好的平衡,具有较高的应用价值。 展开更多
关键词 交互行为识别 骨架序列 图卷积 可变形卷积 多流输入
原文传递
流媒体音视频切换矩阵的设计与实现 被引量:1
2
作者 马跃 高春 +2 位作者 董庆文 杨海波 孙建伟 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2534-2537,共4页
流媒体应用已成为移动互联网的重要组成部分,当前流媒体服务器众多,但支持流媒体音视频切换矩阵的流媒体服务器并不多见.论文以达尔文流媒体服务器(Darwin Streaming Server,DSS)为基础,通过分析DSS二次开发接口以及DSS中文件处理和中... 流媒体应用已成为移动互联网的重要组成部分,当前流媒体服务器众多,但支持流媒体音视频切换矩阵的流媒体服务器并不多见.论文以达尔文流媒体服务器(Darwin Streaming Server,DSS)为基础,通过分析DSS二次开发接口以及DSS中文件处理和中继处理等相关模块的源码,在DSS中添加矩阵切换相关功能模块,并对其原有模块进行扩展,设计实现了一种支持多种输入类型、多通道的流媒体切换矩阵.切换矩阵可通过电子节目单控制矩阵切换输出多种类型的网络频道流.最后,通过对切换矩阵性能参数的实验分析,表明矩阵切换的切换时延和时间精度均符合网络广播的要求. 展开更多
关键词 切换矩阵 多源输入 流媒体 达尔文流媒体服务器
在线阅读 下载PDF
5G-R高铁车站场景MIMO天线阵列结构与传输性能研究 被引量:1
3
作者 刘立海 弓子悦 +3 位作者 李津汉 吴宇 官科 单馨漪 《铁道通信信号》 2024年第4期49-58,共10页
面向5G-R高铁车站应用场景,在2155~2165 MHz频段采用射线跟踪仿真技术,对4种不同天线阵列排布方式的MIMO系统多层传输性能进行对比研究。通过研究采取不同收发端天线阵列排布方式时的信道相关性,计算每个接收点位所能达到的MIMO系统最... 面向5G-R高铁车站应用场景,在2155~2165 MHz频段采用射线跟踪仿真技术,对4种不同天线阵列排布方式的MIMO系统多层传输性能进行对比研究。通过研究采取不同收发端天线阵列排布方式时的信道相关性,计算每个接收点位所能达到的MIMO系统最大传输层数,获取各层数对应的信噪比,计算在不同调制方式、不同天线排布方式下每个接收点位的下行峰值传输速率,确定面向5G-R高铁车站场景的MIMO系统最佳传输层数。仿真验证结果表明,面向5G-R频段高铁车站应用场景,基站端采用线阵、车载端采用方阵排列,可取得最佳峰值传输速率。研究结果可为5G-R专网建设中高铁车站部署MIMO系统提供技术积累和理论依据。 展开更多
关键词 5G-R 天线阵列 多输入多输出 射线跟踪 多层传输 传输速率
在线阅读 下载PDF
基于动态双注意力机制的跨模态行人重识别模型 被引量:2
4
作者 李大伟 曾智勇 《计算机应用》 CSCD 北大核心 2022年第10期3200-3208,共9页
针对跨模态行人重识别图像间模态差异大的问题,大多数现有方法采用像素对齐、特征对齐来实现图像间的匹配。为进一步提高两种模态图像间的匹配的精度,设计了一个基于动态双注意力机制的多输入双流网络模型。首先,在每个批次的训练中通... 针对跨模态行人重识别图像间模态差异大的问题,大多数现有方法采用像素对齐、特征对齐来实现图像间的匹配。为进一步提高两种模态图像间的匹配的精度,设计了一个基于动态双注意力机制的多输入双流网络模型。首先,在每个批次的训练中通过增加同一行人在不同相机下的图片,让神经网络在有限的样本中学习到充分的特征信息;其次,利用齐次增强得到灰度图像作为中间桥梁,在保留了可见光图像结构信息的同时消除了颜色信息,而灰度图像的运用弱化了网络对颜色信息的依赖,从而加强了网络模型挖掘结构信息的能力;最后,提出了适用于3个模态间图像的加权六向三元组排序(WSDR)损失,所提损失充分利用了不同视角下的跨模态三元组关系,优化了多个模态特征间的相对距离,并提高了对模态变化的鲁棒性。实验结果表明,在SYSU-MM01数据集上,与动态双注意聚合(DDAG)学习模型相比,所提模型在评价指标Rank-1和平均精确率均值(mAP)上分别提升了4.66和3.41个百分点。 展开更多
关键词 跨模态 行人重识别 多输入双流网络 齐次增强 加权六向三元组排序损失
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部