期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于3DCNN-DNN的高空视频交通状态预测 被引量:2
1
作者 彭博 唐聚 +3 位作者 蔡晓禹 谢济铭 张媛媛 王玉婷 《交通运输系统工程与信息》 EI CSCD 北大核心 2020年第3期39-46,共8页
为使用高空视频识别和预测道路交通状态,提出基于三维卷积神经网络-深度神经网络(3DCNN-DNN)的交通状态预测方法.将道路切分为D个路段,每个路段视频片段时长m s,基于典型3DCNN结构C3D识别路段视频片段交通状态;建立道路?个历史时段、D... 为使用高空视频识别和预测道路交通状态,提出基于三维卷积神经网络-深度神经网络(3DCNN-DNN)的交通状态预测方法.将道路切分为D个路段,每个路段视频片段时长m s,基于典型3DCNN结构C3D识别路段视频片段交通状态;建立道路?个历史时段、D个路段的交通状态矩阵Φ,将道路交通状态预测问题转化为以Φ为输入,有限交通状态为输出的分类问题,构建基于DNN的短时交通状态预测模型原型;建立交通视频数据集,对DNN预测模型原型的隐藏层数量、神经元数量及训练批大小进行测试优化,提出有4隐藏层,各层神经元数量为64/128/128/64,训练批大小为64的优化模型DNN*.测试结果表明:C3D视频交通态识别平均F1值为95.71%,DNN*道路交通状态预测准确率为91.18%,比DNN线性分类、KMeans、KNN、SVM和线性分类分别高6.86%、57.85%、62.26%、26.47%、43.14%;C3D能提供准确的交通状态矩阵,3DCNN-DNN可有效识别和预测道路视频交通状态. 展开更多
关键词 智能交通 交通状态预测 DNN 高空视频 3dcnn 深度学习
在线阅读 下载PDF
基于3DCNN-TCN的农作物产量预测 被引量:6
2
作者 张凯 龚龙庆 +1 位作者 贺兆 霍鹏程 《微电子学与计算机》 2023年第10期83-89,共7页
得益于遥感技术与相关监测技术的快速发展及应用,通过遥感图像挖掘出波段信息以来进行农作物产量预测在近些年这一领域受到更多的青睐.然而,影响农作物生长的多种波段信息受限于空间大小、时间差异会被各种降维技术处理,从而没有充分利... 得益于遥感技术与相关监测技术的快速发展及应用,通过遥感图像挖掘出波段信息以来进行农作物产量预测在近些年这一领域受到更多的青睐.然而,影响农作物生长的多种波段信息受限于空间大小、时间差异会被各种降维技术处理,从而没有充分利用数据的时空、波段特性.因此提出了一种用于农作物产量预测的深度学习架构用以解决这些问题,该模型结合了三维卷积网络(3DCNN)和时间卷积网络(TCN)以更好的捕捉遥感图像的时空信息和波段信息.此外,在新的损失函数中,还引入一个变量,用以消除作物产量标签分布不平衡的影响.最后,通过中国的玉米的产量数据预测验证了新模型.其结果与主要使用的深度学习方法进行比较.实验结果表明,本文所提出的方法可以提供比其他竞争方法更好的预测性能. 展开更多
关键词 农作物产量预测 3dcnn TCN
在线阅读 下载PDF
基于3DCNN的锅炉再热器管壁减薄预测 被引量:1
3
作者 闫佳瑛 朱希安 《北京信息科技大学学报(自然科学版)》 2021年第1期75-78,共4页
为及时掌握锅炉再热器管壁减薄情况,基于锅炉再热器历史运行数据,结合三维卷积神经网络(3D convolutional neural network,3DCNN),搭建了锅炉再热器厚度损失预测模型。利用某电厂超临界660 MW机组锅炉再热器的运行数据,通过数据预处理... 为及时掌握锅炉再热器管壁减薄情况,基于锅炉再热器历史运行数据,结合三维卷积神经网络(3D convolutional neural network,3DCNN),搭建了锅炉再热器厚度损失预测模型。利用某电厂超临界660 MW机组锅炉再热器的运行数据,通过数据预处理构建三维变量作为模型的输入;通过对比不同结构模型的预测效果,确定3DCNN模型的最优结构;该方法在测试集上的最大绝对误差为12.04%,平均绝对误差为6.77%。结果表明,该方法能够比较准确地预测再热器管壁损失,方便电力企业及时掌握管壁厚度变化情况。 展开更多
关键词 三维卷积神经网络(3dcnn) 锅炉再热器 厚度损失预测
在线阅读 下载PDF
基于3DCNN的动作识别机器人 被引量:1
4
作者 卞玮 李居尚 +3 位作者 曹炳楠 王彬 乔国森 暴晓宁 《电子制作》 2024年第8期41-44,29,共5页
随着科技的不断进步,人工智能应用领域随之拓展。本文设计并实现了基于3DCNN卷积神经网络的动作识别机器人,同时对机器人的硬件设计、软件设计、总体调试、拓展功能等方面进行了详细阐述。本设计根据仿生运动原理,实现了四足机械臂的运... 随着科技的不断进步,人工智能应用领域随之拓展。本文设计并实现了基于3DCNN卷积神经网络的动作识别机器人,同时对机器人的硬件设计、软件设计、总体调试、拓展功能等方面进行了详细阐述。本设计根据仿生运动原理,实现了四足机械臂的运动及抓取,该机器人拥有4个自由度的机械臂,和12个自由度的姿态变换,利用STM32F407的FreeRTOS实时操作系统控制,该系统具有低功耗、响应快、效率高等优点,能够准确完成动作指令。本设计在动作识别控制领域,取得了长足进展。 展开更多
关键词 3dcnn STM32F4 动作识别机器人
在线阅读 下载PDF
基于ML-3DCNN的高光谱遥感图像分类算法
5
作者 闫鹏刚 杨佳佳 《信息与电脑》 2023年第17期93-96,共4页
高光谱遥感图像含有丰富的光谱和空间特征信息,在进行地物分类时这些特征的提取尤为重要。提出了一种基于融合拉普拉斯特征的三维卷积神经网络(Meld Laplace 3D Convolution Neural Network,ML-3DCNN)的高光谱遥感图像分类算法,该算法... 高光谱遥感图像含有丰富的光谱和空间特征信息,在进行地物分类时这些特征的提取尤为重要。提出了一种基于融合拉普拉斯特征的三维卷积神经网络(Meld Laplace 3D Convolution Neural Network,ML-3DCNN)的高光谱遥感图像分类算法,该算法采用主成分分析(Principal Components Analysis,PCA)降维结合空间边缘细节特征提取组成的双分支网络结构对遥感图像进行特征提取,有利于提升分类性能。在公开的3组高光谱遥感图像数据集上,与PCA+3DCNN和PCA+3D-2DCNN算法进行对比,结果表明提出的双分支网络结构提升了高光谱遥感影像的分类精度。 展开更多
关键词 高光谱遥感图像 三维卷积神经网络(3dcnn) 分支结构 网络融合
在线阅读 下载PDF
基于3DCNN与CLSTM混合模型的短期光伏功率预测 被引量:7
6
作者 于丹文 李山 +1 位作者 刘航航 李广磊 《山东电力技术》 2024年第7期10-18,共9页
光伏发电功率预测对于电力系统制定发电计划和协同调度至关重要。然而,由于光伏发电过程的随机性和间歇性,光伏功率预测的准确性仍有较大提升空间。为此,提出了一种基于三维卷积神经网络(three-dimensional convolutional neural networ... 光伏发电功率预测对于电力系统制定发电计划和协同调度至关重要。然而,由于光伏发电过程的随机性和间歇性,光伏功率预测的准确性仍有较大提升空间。为此,提出了一种基于三维卷积神经网络(three-dimensional convolutional neural network,3DCNN)和卷积长短期记忆网络(convolutional long short-term memory network,CLSTM)混合模型的光伏功率预测方法,该方法结合3DCNN和CLSTM两种神经网络模型的优势,提高了预测准确性。采用均方根误差(root mean square error,RMSE)、平均绝对误差(mean absolute error,MAE)以及平均绝对百分比误差(mean absolute percentage error,MAPE)三个指标对预测模型进行评价,通过将基于该混合模型的预测方法应用于某光伏电站的出力预测,验证了模型的适用性和正确性。结果表明,当太阳辐照强度、温度、湿度、风速等输入的时间序列相同时,基于3DCNN和CLSTM混合模型的预测效果最好,相比于单独的3DCNN模型、CLSTM模型、BP神经网络模型,混合模型的MAPE分别提高了54%、61%和64%。说明该混合模型能够更好地适应光伏发电的随机性和间歇性特点,并提高功率预测的准确性。 展开更多
关键词 光伏功率预测 深度学习 三维卷积神经网络 卷积长短期记忆神经网络
在线阅读 下载PDF
基于ResNet-18的三维成矿预测方法研究 被引量:1
7
作者 陈宇恒 李晓晖 +3 位作者 袁峰 薛晨 谢先岗 郑超杰 《合肥工业大学学报(自然科学版)》 北大核心 2025年第10期1357-1363,共7页
目前深部隐伏矿床成为中国东部地区主要找矿目标,利用基于卷积神经网络(convolutional neural network,CNN)的三维成矿预测方法能够更好地圈定找矿靶区,指导进一步勘探。文章以安徽省宣城市茶亭地区为研究实例,开展基于ResNet-18残差网... 目前深部隐伏矿床成为中国东部地区主要找矿目标,利用基于卷积神经网络(convolutional neural network,CNN)的三维成矿预测方法能够更好地圈定找矿靶区,指导进一步勘探。文章以安徽省宣城市茶亭地区为研究实例,开展基于ResNet-18残差网络(residual network,ResNet)的三维成矿预测方法研究。结果表明:基于ResNet-18的深层预测模型的训练准确率为99.62%;相较于逻辑回归模型和基于LeNet-5的预测模型,基于ResNet-18的三维预测模型能够在更小的成矿远景区范围内预测出更多的矿化单元,具备更优异的预测能力,可为三维成矿预测研究提供更强大的数据综合工具。 展开更多
关键词 三维卷积神经网络(3dcnn) 残差网络(ResNet) 三维成矿预测 茶亭地区
在线阅读 下载PDF
三维卷积神经网络方法改进及其应用综述 被引量:2
8
作者 李泽慧 张琳 山显英 《计算机工程与应用》 北大核心 2025年第3期48-61,共14页
三维卷积神经网络作为一种深度神经网络,在计算机视觉领域,特别是视频动作识别方面展现了优异的效果。然而三维卷积神经网络仍存在一些问题,针对这些问题,对现有的基于三维卷积的视频动作识别改进方法进行了总结和分析。在轻量化、特征... 三维卷积神经网络作为一种深度神经网络,在计算机视觉领域,特别是视频动作识别方面展现了优异的效果。然而三维卷积神经网络仍存在一些问题,针对这些问题,对现有的基于三维卷积的视频动作识别改进方法进行了总结和分析。在轻量化、特征提取、计算效率、组合模型等方面对三维卷积神经网络的改进进行归纳,并介绍了三维卷积神经网络的实际应用,总结了流行的数据集,并对这些改进方法的实验结果进行了比较和分析。展望了视频动作识别未来的发展方向。 展开更多
关键词 三维卷积神经网络(3dcnn) 行为识别 深度学习
在线阅读 下载PDF
耦合3DCBLT与CA模型的土地利用格局预测
9
作者 肖金锋 韩玲 《地球信息科学学报》 北大核心 2025年第11期2594-2608,共15页
【目的】预测土地利用变化可以为在资源分配、环境保护、城镇化发展、灾害防范与风险评估等方面提供合理依据,有利于制定科学的政策。现有的元胞自动机(Cellular Automata,CA)模型在预测土地利用变化中,对多时序复杂土地利用变化中时空... 【目的】预测土地利用变化可以为在资源分配、环境保护、城镇化发展、灾害防范与风险评估等方面提供合理依据,有利于制定科学的政策。现有的元胞自动机(Cellular Automata,CA)模型在预测土地利用变化中,对多时序复杂土地利用变化中时空特征提取不足,难以适用于复杂土地利用变化的精准预测。【方法】本文提出了一种融合注意力机制并考虑多尺度驱动因素的深度时空建模网络(3DCBLT),并与CA模型耦合,旨在优化时空特征提取与非线性建模能力。3DCBLT整合了跨通道、空间注意力机制(Convolutional Block Attention Module,CBAM)和三维卷积(3D Convolution,3DCNN)模块旨在强化对土地利用变化关键区域的关注,并提升对时空特征的深层提取能力。同时,采用长短时记忆网络(Long Short Term Memory Network,LSTM)充分挖掘土地利用演化过程中的时间依赖性与长期趋势,得到不同地类发展概率。本文以陕西省作为研究区,选取2000—2020年每5年一期土地利用数据并引入气候、地形、经济等12项指标作为驱动因素,以2020年土地利用数据为验证。【结果】本文提出模型的Kappa系数为0.888,OA系数为0.925,FoM系数为0.336,显著优于ANN-CA、MLP-CA和CAMarko,验证了该模型的在土地利用变化预测的有效性与优越性。【结论】本文提出的3DCBLT-CA模型在复杂土地利用变化预测中表现出较高的精度和优越的时空建模能力,为复杂土地利用情景下的变化模拟提供了一种切实可行的技术路径。 展开更多
关键词 土地利用变化 CA 时空特征提取 3dcnn LSTM CBAM
原文传递
煤矿探水卸杆动作识别研究 被引量:7
10
作者 党伟超 姚远 +2 位作者 白尚旺 高改梅 吴喆峰 《工矿自动化》 北大核心 2020年第7期107-112,共6页
针对煤矿井下探水作业监工人员通过观看视频来监控卸杆作业的方式存在效率低下且极易出错的问题,提出利用三维卷积神经网络(3DCNN)模型对探水作业中的卸杆动作进行识别。3DCNN模型使用3D卷积层自动完成动作特征提取,通过3D池化层对运动... 针对煤矿井下探水作业监工人员通过观看视频来监控卸杆作业的方式存在效率低下且极易出错的问题,提出利用三维卷积神经网络(3DCNN)模型对探水作业中的卸杆动作进行识别。3DCNN模型使用3D卷积层自动完成动作特征提取,通过3D池化层对运动特征进行降维,通过Softmax分类处理来识别卸杆动作,并使用批量归一化层提高模型的收敛速度和识别准确率。采用3DCNN模型对卸杆动作进行识别时,首先对数据集进行预处理,从每段视频中均匀抽取几帧图像作为某动作的代表,并降低分辨率;然后采用训练集对3DCNN模型进行训练,并保存训练好的权重文件;最后采用训练好的3DCNN模型对测试集进行测试,得出分类结果。实验结果表明,设置采样帧数为10帧、分辨率为32×32、学习率为0.0001,3DCNN模型对卸杆动作的识别准确率最高可达98.86%。 展开更多
关键词 煤矿防治水 煤矿探水 卸杆动作识别 三维卷积神经网络 3dcnn 批量归一化层
在线阅读 下载PDF
基于改进Vision Transformer的森林火灾视频识别研究
11
作者 张敏 辛颖 黄天棋 《南京林业大学学报(自然科学版)》 北大核心 2025年第4期186-194,共9页
【目的】针对现有森林火灾图像识别算法存在的效率不足、时序特征利用率低等问题,构建基于视频数据的森林火灾识别模型,以提升林火监测的实时性与识别准确率。【方法】提出融合三维卷积神经网络(3DCNN)与视觉Vision Transformer(ViT)的C... 【目的】针对现有森林火灾图像识别算法存在的效率不足、时序特征利用率低等问题,构建基于视频数据的森林火灾识别模型,以提升林火监测的实时性与识别准确率。【方法】提出融合三维卷积神经网络(3DCNN)与视觉Vision Transformer(ViT)的C3D-ViT算法。该模型通过3DCNN提取视频序列的时空特征,构建时空特征向量;利用ViT编码器的自注意力机制融合局部与全局特征;最终经MLP Head层输出分类结果。通过消融实验验证C3D-ViT模型的有效性,并与原模型3DCNN和ViT,以及ResNet50、LSTM、YOLOv5等深度学习模型进行对比。【结果】C3D-ViT在自建林火数据集上准确率达到96.10%,较ResNet50(89.07%)、LSTM(93.26%)和YOLOv5(91.46%)具有明显优势。模型改进有效,准确率超越3DCNN(93.91%)与ViT(90.43%)。在遮挡、远距离、低浓度烟雾等复杂场景下保持较高的平均置信度,满足实时监测需求。【结论】C3D-ViT通过时空特征联合建模,显著提升林火识别的鲁棒性与时效性,为森林防火系统提供可靠的技术支持。 展开更多
关键词 森林火灾 深度学习 目标检测 三维卷积神经网络 Vision Transformer
原文传递
基于三维特征构建和扩张残差网络的机械故障音频识别方法
12
作者 景源 李孟鼎 《辽宁大学学报(自然科学版)》 CAS 2024年第3期220-231,共12页
已有的基于音频的机械故障识别方法,大多是使用二维神经网络和音频信号的某个单一特征(如功率谱)进行故障检测,然而单一的音频特征在提取过程中可能会存在关键信息丢失的现象,且往往只能提取音频特征的单一维度(如空间上)信息,这极大限... 已有的基于音频的机械故障识别方法,大多是使用二维神经网络和音频信号的某个单一特征(如功率谱)进行故障检测,然而单一的音频特征在提取过程中可能会存在关键信息丢失的现象,且往往只能提取音频特征的单一维度(如空间上)信息,这极大限制了现有设备故障音频算法的有效性.为了探究解决上述问题的方法,本文提出一种包含不同音频特征的三维特征构建方式,利用不同的音频特征弥补特征提取过程中的关键信息;并且构建了三维扩张残差网络模型(DR-3DCNN),采用空洞卷积的方式增大模型对全局的关注,同时获取不同尺度的特征信息;充分利用不同特征之间的相关性,建立特征与原始音频数据的深层次关联;最后,采用公开的故障工业机器调查和检查数据集(MIMII)进行实验.实验结果表明,三维特征和DR-3DCNN相组合的方式,其机械故障识别分类效果有了显著提升,分类准确率好于以往单一音频特征的识别算法. 展开更多
关键词 机械故障识别 三维卷积网络(3dcnn) 三维特征构建 空洞卷积
在线阅读 下载PDF
基于LBP与双时空神经网络的微表情识别 被引量:7
13
作者 姜万 周晓彦 +2 位作者 徐华南 李大鹏 安浩然 《信息与控制》 CSCD 北大核心 2020年第6期673-679,共7页
针对传统微表情识别方法识别率低及过程复杂等问题,设计了一种浅层的双时空多尺度神经网络TSTNet (Two-Stream spatial-Temporal Network)模型.利用局部二值模式(LBP)提取SMIC和CASMEⅡ微表情数据库的纹理特性,将其输入到组合的3维卷积... 针对传统微表情识别方法识别率低及过程复杂等问题,设计了一种浅层的双时空多尺度神经网络TSTNet (Two-Stream spatial-Temporal Network)模型.利用局部二值模式(LBP)提取SMIC和CASMEⅡ微表情数据库的纹理特性,将其输入到组合的3维卷积神经网络(3DCNN)与卷积的长短期记忆网络(ConvLSTM)中同时提取时间和空间信息,在模型中加入丢弃算法并多路提取特征,减小过拟合风险的同时学习更丰富的特征.在SMIC和CASMEⅡ微表情数据库上的识别率分别达到了67.30%和65.34%,与现有的深度学习方法相比,该模型提高了网络的训练速度与微表情的识别率. 展开更多
关键词 局部二值模式(LBP) 深度学习 3维卷积神经网络(3dcnn) 卷积的长短期记忆网络 微表情识别
原文传递
基于RGB-D视频的多模态手势识别 被引量:3
14
作者 马正文 蔡坚勇 +2 位作者 刘磊 欧阳乐峰 李楠 《计算机系统应用》 2018年第12期234-239,共6页
本文是对SKIG RGB-D多模态的孤立手势视频进行手势识别研究.首先将RGB和Depth两种单模态视频提取成图片的形式保存,然后采样成长度为32帧的手势序列分别输入到本文提出的稠密连接的3DCNN组件学习短期的时空域特征,然后将提取的时空域特... 本文是对SKIG RGB-D多模态的孤立手势视频进行手势识别研究.首先将RGB和Depth两种单模态视频提取成图片的形式保存,然后采样成长度为32帧的手势序列分别输入到本文提出的稠密连接的3DCNN组件学习短期的时空域特征,然后将提取的时空域特征输入到卷积GRU网络进行长期的时空域特征学习,最终对单模态训练好的网络进行多模态融合,提升网络识别准确率.本文在SKIG数据集上取得了99.07%的识别准确率,达到了极高的准确率,证明了本文提出的网络模型的有效性. 展开更多
关键词 手势识别 稠密连接的3dcnn 卷积GRU 时空域特征
在线阅读 下载PDF
基于3D卷积神经网络的IR-BCI脑电视频解码研究 被引量:4
15
作者 官金安 汪鹭汐 +2 位作者 赵瑞娟 李东阁 吴欢 《中南民族大学学报(自然科学版)》 CAS 2019年第4期538-546,共9页
采用3D卷积神经网络模型,对脑电信号进行解码研究,旨在挖掘其深层的特征表达,以提高脑-机接口系统的性能.实验在获取“模拟阅读”脑-机接口系统的多维脑电信号后,将原始的通道特征构建成“脑电视频”的格式.其构造方法为:将通道按实际... 采用3D卷积神经网络模型,对脑电信号进行解码研究,旨在挖掘其深层的特征表达,以提高脑-机接口系统的性能.实验在获取“模拟阅读”脑-机接口系统的多维脑电信号后,将原始的通道特征构建成“脑电视频”的格式.其构造方法为:将通道按实际空间排布为二维矩阵,这样某时刻的多通道采样点在空间上形成一个“视频帧”,这些空间信息在连续时间帧上的堆叠,形成“脑电视频”.这种自然表达信息的方法,不仅包含大脑的空间分布信息,还反映了时间信息的关联,丰富了数据所包含的事件相关信息.借鉴图像领域特征学习的“局部感受野”和“权值共享”思想,搭建了自主学习脑电信号特征的3D卷积神经网络模型,将已打标签的脑电视频数据对模型进行训练,之后对测试集进行测试.与经典的卷积神经网络和传统的最佳单通道算法相比,分类正确率有了进一步的提高.实验表明,基于脑电视频的3D卷积神经网络能够更有效地学习脑电特征,改善了模拟阅读脑-机接口系统的性能. 展开更多
关键词 脑-机接口 深度学习 模拟阅读 脑电视频 3D卷积神经网络
在线阅读 下载PDF
基于3D卷积神经网络的阿尔茨海默症及轻度认知功能障碍诊断 被引量:1
16
作者 王聪 袁榕澳 李川 《现代计算机》 2021年第11期120-123,共4页
轻度认知功能障碍(MCI)作为阿尔茨海默病(AD)的预兆,具有相对复杂多变的特点。准确诊断和有效预防MCI具有重要意义。针对AD和正常对照组(CN)、AD和MCI的诊断问题,利用相应核磁共振图像(MRI)影像学数据,提出基于3D卷积神经网络的诊断模... 轻度认知功能障碍(MCI)作为阿尔茨海默病(AD)的预兆,具有相对复杂多变的特点。准确诊断和有效预防MCI具有重要意义。针对AD和正常对照组(CN)、AD和MCI的诊断问题,利用相应核磁共振图像(MRI)影像学数据,提出基于3D卷积神经网络的诊断模型。实验结果表明,AD与CN的分类准确率达96.7%,AUC为0.983,AD与MCI的分类准确率达94.7%,AUC为0.966,该模型在参数量与诊断精度上都具有较高的性能优势。 展开更多
关键词 轻度认知障碍(MCI) 阿尔茨海默症(AD) 3D卷积神经网络(3dcnn) MRI
在线阅读 下载PDF
联合均等采样随机擦除和全局时间特征池化的视频行人重识别方法 被引量:4
17
作者 陈莉 王洪元 +2 位作者 张云鹏 曹亮 殷雨昌 《计算机应用》 CSCD 北大核心 2021年第1期164-169,共6页
针对为解决视频监控中遮挡、背景物干扰,以及行人外观、姿势相似性等因素导致的视频行人重识别准确率较低的问题,提出了联合均等采样随机擦除和全局时间特征池化的视频行人重识别方法。首先针对目标行人被干扰或部分遮挡的情况,采用了... 针对为解决视频监控中遮挡、背景物干扰,以及行人外观、姿势相似性等因素导致的视频行人重识别准确率较低的问题,提出了联合均等采样随机擦除和全局时间特征池化的视频行人重识别方法。首先针对目标行人被干扰或部分遮挡的情况,采用了均等采样随机擦除(ESE)的数据增强方法来有效地缓解遮挡,提高模型的泛化能力,更准确地匹配行人;其次为了进一步提高视频行人重识别的精度,学习更有判别力的特征表示,使用三维卷积神经网络(3DCNN)提取时空特征,并在网络输出行人特征表示前加上全局时间特征池化层(GTFP),这样既能获取上下文的空间信息,又能细化帧与帧之间的时序信息。通过在MARS、DukeMTMC-VideoReID和PRID-2011三个公共视频数据集上的大量实验,证明所提出的联合均等采样随机擦除和全局时间特征池化的方法,相较于目前一些先进的视频行人重识别方法,具有一定的竞争力。 展开更多
关键词 视频行人重识别 三维卷积神经网络 全局时间特征表示 均等采样随机擦除 数据增强
在线阅读 下载PDF
基于深度学习的地下震源定位方法
18
作者 王小亮 苏新彦 +3 位作者 孔庆珊 崔敏 赵飞飞 李剑 《单片机与嵌入式系统应用》 2020年第12期45-48,52,共5页
本文提出了一种基于深度学习的地下震源定位方法。首先,利用稠密连接网络能够促进特征重复利用的优势,设计了稠密连接的3D卷积神经网络(3DCNN);其次,利用空间金字塔池化层(SPP)可以对高层特征进行多尺度提取再聚合的特点,设计了3D空间... 本文提出了一种基于深度学习的地下震源定位方法。首先,利用稠密连接网络能够促进特征重复利用的优势,设计了稠密连接的3D卷积神经网络(3DCNN);其次,利用空间金字塔池化层(SPP)可以对高层特征进行多尺度提取再聚合的特点,设计了3D空间金字塔池化结构(3DSPP);最后,将三维能量场图像输入到设计的稠密连接的3DCNN+3DSPP+全连接层(FC)模型中进行训练和测试,最终输出震源坐标。实验结果表明,本文设计的深度神经网络能够实现能量聚焦点的准确定位。 展开更多
关键词 地下浅层定位 三维能量场图像 深度学习 稠密连接的3dcnn 3D空间金字塔池化
在线阅读 下载PDF
遮挡条件下的步态图像时空修复网络及其应用 被引量:1
19
作者 阳强 罗坚 黄宇琛 《中国图象图形学报》 CSCD 北大核心 2024年第1期179-191,共13页
目的当前,基于视觉的步态识别方法多基于完整的步态序列图像。然而,现实场景拍摄下的行人难免被遮挡,以至于获取的步态图像不完整,对识别结果有很大影响。如何处理大面积遮挡是步态识别中一个具有挑战性且重要的问题。针对此,提出了一... 目的当前,基于视觉的步态识别方法多基于完整的步态序列图像。然而,现实场景拍摄下的行人难免被遮挡,以至于获取的步态图像不完整,对识别结果有很大影响。如何处理大面积遮挡是步态识别中一个具有挑战性且重要的问题。针对此,提出了一种步态时空序列重建网络(gait spatio-temporal reconstruction network,GSTRNet),用于修复被遮挡的步态序列图像。方法使用基于3D卷积神经网络和Transformer的GSTRNet来修复步态序列,在修复每一帧步态图像的空间信息的同时保持帧与帧之间的时空连贯性。GSTRNet通过引入YOLOv5(you only look once)网络来检测步态图像的局部遮挡区域,并将其作为先验知识为遮挡修复区域分配更高的修复权值,实现遮挡区域的局部修复,将局部修复步态图与原始遮挡图像进行融合,生成完整的修复步态图。同时,在GSTRNet中引入三元组特征损失和重建损失组成的联合损失函数来优化修复网络,提升修复效果。最终,以修复完整的步态序列图像为特征进行身份识别。结果本文在大规模步态数据集OU_MVLP(the OU-ISIR gait database,multi-view large population dataset)中人工合成遮挡步态序列数据来进行修复实验。结果表明,该方法在面对步态轮廓大面积遮挡时,识别准确率比现有的步态修复和遮挡识别方法有一定的提升,如在未知遮挡模式时比三元组视频生成对抗网络(sequence video wasserstein generative adversarial network based on triplet hinge loss,sVideoWGAN-hinge)最高提升6.7%,非单一模式遮挡时比Gaitset等方法识别率提高40%左右。结论本文提出的GSTRNet对各种遮挡模式下的步态图像序列有较好的修复效果,使用修复后图像进行步态识别,可有效改善识别率。 展开更多
关键词 步态识别 步态轮廓修复 先验知识 三维卷积神经网络(3dcnn) TRANSFORMER
原文传递
基于学习的自动驾驶LIDAR定位
20
作者 赵璐 宋新萍 姚振鑫 《计算机与数字工程》 2022年第8期1720-1726,共7页
论文提出DL-Net一种新颖的基于学习的LIDAR定位系统,创新地实现了各种深度神经网络结构的使用,建立基于学习的方法。DL-Net学习专门针对不同现实驾驶场景中的匹配而优化的局部描述符,并且高度了解全局上下文,这是深度学习的重要提示。... 论文提出DL-Net一种新颖的基于学习的LIDAR定位系统,创新地实现了各种深度神经网络结构的使用,建立基于学习的方法。DL-Net学习专门针对不同现实驾驶场景中的匹配而优化的局部描述符,并且高度了解全局上下文,这是深度学习的重要提示。在解决方案空间中建立的损失量上的3D卷积显着提高了定位精度,3D CNN通过将堆叠的沙漏网络(hourglass network)与中间监督(intermediate supervision)结合起来,去调整匹配损失量。RNN被证明可以有效地对车辆动力学进行建模,并具有更好的时间平滑性和准确性。为了证明该全球定位系统的性能和有效性,在KITTI数据集与其他算法进行了比较,并在长期的多重区段数据集上进行了评估。结果表明,论文的系统可以达到较高的精度。 展开更多
关键词 深度学习 自动驾驶定位 3dcnn LIDAR
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部