期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于YOLOv5和3D-CNN的视频监控目标检测方法研究
1
作者 李密娜 万斌 《智能物联技术》 2025年第5期81-86,共6页
针对电力行业视频监控系统在人员安全监管、设备状态监测及环境风险预警方面的复杂需求,提出基于人工智能技术的智能监控解决方案,并通过实验验证其有效性。系统采用YOLOv5模型进行目标检测与跟踪,采用三维卷积神经网络(3D-Convolutiona... 针对电力行业视频监控系统在人员安全监管、设备状态监测及环境风险预警方面的复杂需求,提出基于人工智能技术的智能监控解决方案,并通过实验验证其有效性。系统采用YOLOv5模型进行目标检测与跟踪,采用三维卷积神经网络(3D-Convolutional Neural Networks,3D-CNN)模型进行动作识别,结合余弦相似度进行异常行为判断与分级预警。实验结果表明,YOLOv5模型在mAP@0.5指标上达到89.7%,在1080p分辨率视频中处理速度达62 f/s,引入卡尔曼滤波器后跟踪丢失率降至3.2%;3D-CNN模型在设备振动识别中的Top-1准确率为92.4%,单视频处理耗时48 ms,误报率仅4.3%,验证了该方案在安全生产效率提升方面的显著优势。 展开更多
关键词 人工智能 视频监控 YOLOv5 三维卷积神经网络(3d-cnn) 异常行为判断 电力行业
在线阅读 下载PDF
基于3D-CNN和LSTM视觉图像算法的民族传统体育动作识别模型 被引量:2
2
作者 徐社远 朱冰冰 《喀什大学学报》 2024年第6期61-67,共7页
针对民族传统体育中数据识别中存在的准确率较低、实时性较差等问题,研究将虚拟现实技术与基于三维卷积神经网络的动作捕捉技术结合,并通过长短期记忆神经网络来捕捉动作中的时序信息,提出一种民族传统体育动作识别模型.结果表明,所提... 针对民族传统体育中数据识别中存在的准确率较低、实时性较差等问题,研究将虚拟现实技术与基于三维卷积神经网络的动作捕捉技术结合,并通过长短期记忆神经网络来捕捉动作中的时序信息,提出一种民族传统体育动作识别模型.结果表明,所提出的民族传统体育动作识别模型在最优DroPout比率为0.6时,函数损失收敛在0.021左右,识别精度曲线最终收敛于0.989.与其他姿态识别系统相比,模型识别精度提高超过20%,误差精度低于40 mm.该方法较好地实现了太极拳等民族传统体育项目的动作识别,对民族传统体育的现代化传承与训练起到了促进作用. 展开更多
关键词 民族传统体育 动作识别 模型 3d-cnn LSTM 视觉图像算法 虚拟现实技术
在线阅读 下载PDF
基于高光谱图像和3D-CNN的苹果多品质参数无损检测 被引量:15
3
作者 王浩云 李晓凡 +2 位作者 李亦白 孙云晓 徐焕良 《南京农业大学学报》 CAS CSCD 北大核心 2020年第1期178-185,共8页
[目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G... [目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G平滑法对原始图像进行去噪处理,在此基础上,对采集到的高光谱图像通过多感兴趣位置的选取以及间隔波段抽取重组的方法进行样本扩充,再利用三维卷积神经网络建立样本扩充后的苹果高光谱图像与苹果糖度、硬度、含水量的多任务学习模型,通过该模型实现对苹果的糖度、硬度、含水量等品质参数的无损检测。[结果]采集245个苹果的高光谱图像及其对应的品质参数信息,通过样本扩充的方法将原始数据集扩充至9800个样本后进行建模和验证。结果表明:本算法建立的苹果糖度、硬度、水分的分类模型,在糖度类间隔为1°Brix、硬度类间隔为0.5 kg·cm-2、含水量类间隔为10%的情况下,糖度、硬度、水分的预测准确率分别为93.97%、92.29%和93.36%,回归模型糖度、硬度和水分的相关系数最高分别达到0.827、0.775和0.862,比最优的传统算法分别提高15.0%、17.0%和17.2%。[结论]本算法能够较准确实现苹果高光谱多品质参数同时检测,且相对传统方法预测精度有较大提升。 展开更多
关键词 苹果 高光谱 多品质参数 无损检测 三维卷积神经网络(3d-cnn)
在线阅读 下载PDF
结合MRI多模态信息和3D-CNNs特征提取的脑肿瘤分割研究 被引量:5
4
作者 杨新焕 张勇 《中国CT和MRI杂志》 2020年第9期4-6,23,共4页
目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-C... 目的探究结合MRI多模态信息和3D-CNNs特征提取对于脑肿瘤分割的价值。方法分析相比于未加入多模态3D-CNNs特征的方法,并对比2D-CNNs特征方法和3D-CNNs特征方法分割的结果,主要参考dice系数,假阳性率和sensitibity。结果在加入多模态3D-CNNs特征之后,患者的dice系数均有不同程度的提高,sensitibity系数也有改变,假阳性率显著得到改善;加上多模态3D-CNNs特征提取后,dice系数变为(88.26±4.65)%,显著优于多模态2D-CNNs特征提取的(83.67±4.22)%。而多模态2D-CNNs特征提取的运用甚至比单独使用灰度邻域结合haar小波低频系数的分割结果。结论基于多模态3D-CNNs特征提取的MRI脑肿瘤分割准确度高,适应不同患者不同模态之间的多变性和差异性,值得参考。 展开更多
关键词 3d-cnnS特征提取 MRI多模态信息 脑肿瘤分割
暂未订购
快速3D-CNN结合深度可分离卷积对高光谱图像分类 被引量:2
5
作者 王燕 梁琦 《计算机科学与探索》 CSCD 北大核心 2022年第12期2860-2869,共10页
针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成... 针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成分分析(IPCA)对输入的数据进行降维预处理;其次将输入模型的像素分割成小的重叠的三维小卷积块,在分割的小块上基于中心像素形成地面标签,利用三维核函数进行卷积处理,形成连续的三维特征图,保留空谱特征。用3D-CNN同时提取空谱特征,然后在三维卷积中加入深度可分离卷积对空间特征再次提取,丰富空谱特征的同时减少参数量,从而减少计算时间,分类精度也有所提高。所提模型在Indian Pines、Salinas Scene和University of Pavia公开数据集上验证,并且同其他经典的分类方法进行比较。实验结果表明,该方法不仅能大幅度节省可学习的参数,降低模型复杂度,而且表现出较好的分类性能,其中总体精度(OA)、平均分类精度(AA)和Kappa系数均可达99%以上。 展开更多
关键词 高光谱图像分类 空谱特征提取 三维卷积神经网络(3d-cnn) 深度可分离卷积(DSC) 深度学习
在线阅读 下载PDF
双卷积池化结构的3D-CNN高光谱遥感影像分类方法 被引量:26
6
作者 李冠东 张春菊 +1 位作者 高飞 张雪英 《中国图象图形学报》 CSCD 北大核心 2019年第4期639-654,共16页
目的高光谱遥感影像数据包含丰富的空间和光谱信息,但由于信号的高维特性、信息冗余、多种不确定性和地表覆盖的同物异谱及同谱异物现象,导致高光谱数据结构呈高度非线性。3D-CNN(3D convolutional neural network)能够利用高光谱遥感... 目的高光谱遥感影像数据包含丰富的空间和光谱信息,但由于信号的高维特性、信息冗余、多种不确定性和地表覆盖的同物异谱及同谱异物现象,导致高光谱数据结构呈高度非线性。3D-CNN(3D convolutional neural network)能够利用高光谱遥感影像数据立方体的特性,实现光谱和空间信息融合,提取影像分类中重要的有判别力的特征。为此,提出了基于双卷积池化结构的3D-CNN高光谱遥感影像分类方法。方法双卷积池化结构包括两个卷积层、两个BN(batch normalization)层和一个池化层,既考虑到高光谱遥感影像标签数据缺乏的问题,也考虑到高光谱影像高维特性和模型深度之间的平衡问题,模型充分利用空谱联合提供的语义信息,有利于提取小样本和高维特性的高光谱影像特征。基于双卷积池化结构的3D-CNN网络将没有经过特征处理的3D遥感影像作为输入数据,产生的深度学习分类器模型以端到端的方式训练,不需要做复杂的预处理,此外模型使用了BN和Dropout等正则化策略以避免过拟合现象。结果实验对比了SVM(support vector machine)、SAE(stack autoencoder)以及目前主流的CNN方法,该模型在Indian Pines和Pavia University数据集上最高分别取得了99. 65%和99. 82%的总体分类精度,有效提高了高光谱遥感影像地物分类精度。结论讨论了双卷积池化结构的数目、正则化策略、高光谱首层卷积的光谱采样步长、卷积核大小、相邻像素块大小和学习率等6个因素对实验结果的影响,本文提出的双卷积池化结构可以根据数据集特点进行组合复用,与其他深度学习模型相比,需要更少的参数,计算效率更高。 展开更多
关键词 3d-cnn 双卷积池化结构 空谱联合特征 高光谱影像分类 正则化策略
原文传递
联合LiDAR、高光谱数据及3D-CNN方法的树种分类 被引量:6
7
作者 毛英伍 郭颖 +2 位作者 张王菲 苏勇 关塬 《林业科学》 EI CAS CSCD 北大核心 2023年第3期73-83,共11页
【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,... 【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,改进一种结构更简单、分类精度更高且无需对高光谱数据进行预处理的3D-CNN网络结构用于森林树种识别。【结果】相较于常规机器学习分类方法【支持向量机(SVM),随机森林(RF)】、传统二维卷积神经网络模型(2D-CNN)及最新多光谱分辨率三维卷积神经网络(MSR 3D-CNN)模型,本研究提出的3D-CNN模型对树种总体分类精度为99.79%,平均交并比(MIoU)为99.53%。与SVM和RF分类结果相比,本研究构建的3D-CNN模型总体分类精度提高5%左右,且具有对树种边界提取更加准确、椒盐现象更少发生的特点;与2D-CNN相比,总体分类精度提高10%左右,MIoU提高7%左右;与MSR 3D-CNN相比,总体精度相差不大,但在训练和测试过程中,本模型耗时远远小于MSR 3D-CNN模型。【结论】本研究改进的3D-CNN模型结构能够高效对原始高光谱影像进行树种分类并制图,可有效提高树种分类的精度。 展开更多
关键词 高光谱 LIDAR 卷积神经网络 树种分类 3d-cnn
在线阅读 下载PDF
改进的残差3D-CNN的高光谱遥感影像分类 被引量:3
8
作者 苗永庆 赵泉华 孙清 《测绘科学》 CSCD 北大核心 2023年第2期148-156,184,共10页
针对高光谱遥感影像分类中空间特征和光谱特征利用率低问题,该文综合三维卷积神经网络、谷歌神经网络和残差神经网络的优势,提出融合改进Inception模块的残差三维卷积神经网络高光谱遥感影像分类方法。改进后的Inception模块包括4条不... 针对高光谱遥感影像分类中空间特征和光谱特征利用率低问题,该文综合三维卷积神经网络、谷歌神经网络和残差神经网络的优势,提出融合改进Inception模块的残差三维卷积神经网络高光谱遥感影像分类方法。改进后的Inception模块包括4条不同的卷积层分支,用以提取蕴涵在高光谱遥感影像中多尺度的特征;利用了3D卷积核代替2D卷积核能直接同时提取高光谱遥感影像中更丰富的空-谱特征;通过残差结构连接分支提取特征缓解了梯度消失的问题,提取更深层次的特征。实验表明,该文算法不仅提高了条状和线状地物区域的边缘分类准确率,对小目标的分类能力也得到了增强。 展开更多
关键词 3d-cnn Inception模块 残差神经网络 高光谱遥感影像分类
原文传递
Dynamic Hand Gesture Recognition Using 3D-CNN and LSTM Networks 被引量:3
9
作者 Muneeb Ur Rehman Fawad Ahmed +4 位作者 Muhammad Attique Khan Usman Tariq Faisal Abdulaziz Alfouzan Nouf M.Alzahrani Jawad Ahmad 《Computers, Materials & Continua》 SCIE EI 2022年第3期4675-4690,共16页
Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbase... Recognition of dynamic hand gestures in real-time is a difficult task because the system can never know when or from where the gesture starts and ends in a video stream.Many researchers have been working on visionbased gesture recognition due to its various applications.This paper proposes a deep learning architecture based on the combination of a 3D Convolutional Neural Network(3D-CNN)and a Long Short-Term Memory(LSTM)network.The proposed architecture extracts spatial-temporal information from video sequences input while avoiding extensive computation.The 3D-CNN is used for the extraction of spectral and spatial features which are then given to the LSTM network through which classification is carried out.The proposed model is a light-weight architecture with only 3.7 million training parameters.The model has been evaluated on 15 classes from the 20BN-jester dataset available publicly.The model was trained on 2000 video-clips per class which were separated into 80%training and 20%validation sets.An accuracy of 99%and 97%was achieved on training and testing data,respectively.We further show that the combination of 3D-CNN with LSTM gives superior results as compared to MobileNetv2+LSTM. 展开更多
关键词 Convolutional neural networks 3d-cnn LSTM SPATIOTEMPORAL jester real-time hand gesture recognition
在线阅读 下载PDF
3D-CNN在肺癌图像识别中的应用研究 被引量:1
10
作者 李雅迪 韩佳芳 马琳琳 《智能计算机与应用》 2022年第8期161-164,170,共5页
肺癌是长期威胁人类健康的恶性疾病之一,针对传统方法在肺癌CT图像分类中的预处理过程复杂、工作量大的问题,本文提出了基于三维卷积神经网络(3D-CNN)模型的肺部CT图像分类方法。该模型以卷积神经网络模型为基础,并在训练的过程中使用... 肺癌是长期威胁人类健康的恶性疾病之一,针对传统方法在肺癌CT图像分类中的预处理过程复杂、工作量大的问题,本文提出了基于三维卷积神经网络(3D-CNN)模型的肺部CT图像分类方法。该模型以卷积神经网络模型为基础,并在训练的过程中使用特定顺序输入策略,还在公开的Kaggle Data Science Bowl 2017数据集上进行了实验。实验表明,该方法对图像的分类准确率达到76%,比采用随机顺序的输入策略时有所提升,能够为肺部病理图像的分类研究提供有价值的参考。 展开更多
关键词 肺部CT图像分类 3d-cnn 特定顺序输入策略
在线阅读 下载PDF
Attention Based Multi-Patched 3D-CNNs with Hybrid Fusion Architecture for Reducing False Positives during Lung Nodule Detection
11
作者 Vamsi Krishna Vipparla Premith Kumar Chilukuri Giri Babu Kande 《Journal of Computer and Communications》 2021年第4期1-26,共26页
In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous... In lung nodules there is a huge variation in structural properties like Shape, Surface Texture. Even the spatial properties vary, where they can be found attached to lung walls, blood vessels in complex non-homogenous lung structures. Moreover, the nodules are of small size at their early stage of development. This poses a serious challenge to develop a Computer aided diagnosis (CAD) system with better false positive reduction. Hence, to reduce the false positives per scan and to deal with the challenges mentioned, this paper proposes a set of three diverse 3D Attention based CNN architectures (3D ACNN) whose predictions on given low dose Volumetric Computed Tomography (CT) scans are fused to achieve more effective and reliable results. Attention mechanism is employed to selectively concentrate/weigh more on nodule specific features and less weight age over other irrelevant features. By using this attention based mechanism in CNN unlike traditional methods there was a significant gain in the classification performance. Contextual dependencies are also taken into account by giving three patches of different sizes surrounding the nodule as input to the ACNN architectures. The system is trained and validated using a publicly available LUNA16 dataset in a 10 fold cross validation approach where a competition performance metric (CPM) score of 0.931 is achieved. The experimental results demonstrate that either a single patch or a single architecture in a one-to-one fashion that is adopted in earlier methods cannot achieve a better performance and signifies the necessity of fusing different multi patched architectures. Though the proposed system is mainly designed for pulmonary nodule detection it can be easily extended to classification tasks of any other 3D medical diagnostic computed tomography images where there is a huge variation and uncertainty in classification. 展开更多
关键词 3d-cnn Attention Gated Networks Lung Nodules Medical Imaging X-Ray Computed Tomography
在线阅读 下载PDF
基于发动机罩板体素数据的头部碰撞损伤快速预测
12
作者 陈光 尚云龙 +2 位作者 张君媛 唐洪斌 孙秀秀 《汽车技术》 北大核心 2025年第10期52-62,共11页
为了快速评估车辆开发阶段不同车辆发动机罩板结构的行人保护性能,提出了一种基于三维体素数据的机器学习预测方法。首先,基于7辆车的有限元模型构建以罩板头部碰撞点为中心的三维体素数据集,精确表征罩板的复杂三维结构;其次,利用3D-CN... 为了快速评估车辆开发阶段不同车辆发动机罩板结构的行人保护性能,提出了一种基于三维体素数据的机器学习预测方法。首先,基于7辆车的有限元模型构建以罩板头部碰撞点为中心的三维体素数据集,精确表征罩板的复杂三维结构;其次,利用3D-CNN自编码器对三维体素数据进行无监督特征学习,生成1000维的编码数据集;随后,通过PCA线性降维技术过滤噪声特征,得到224维PCA数据集;最后,对比数据集在4种机器学习模型上的性能。试验结果表明:224维PCA数据集的预测效果更优,其中,SVR模型对HIC和a峰的预测决定系数R²分别达到98.86%和98.44%,显著提升了预测精度和泛化能力。此外,单辆车超过100组碰撞点的计算时间缩短至10 s内,大幅提高了汽车安全性能开发效率。 展开更多
关键词 行人保护 机器学习 头部损伤指标 罩板结构 3d-cnn 自编码器
在线阅读 下载PDF
应用多维特征融合的高光谱图像木材树种分类
13
作者 辛志强 褚昱凯 林文树 《东北林业大学学报》 北大核心 2025年第11期74-85,156,共13页
为实现不同木材树种的高效准确识别,根据木材高光谱图像提出一种利用多维特征融合的支持向量机木材树种分类模型。首先通过采集东北地区常见的4类树种,共600张木材高光谱图像,每张图像截取3个感兴趣区域(ROI)扩充数据集,以8∶2的比例划... 为实现不同木材树种的高效准确识别,根据木材高光谱图像提出一种利用多维特征融合的支持向量机木材树种分类模型。首先通过采集东北地区常见的4类树种,共600张木材高光谱图像,每张图像截取3个感兴趣区域(ROI)扩充数据集,以8∶2的比例划分为训练集和测试集。然后选择均值滤波(MF)和标准正态变换(SNV)处理系统噪声和光照变化的影响,通过在空间域利用灰度共生矩阵(GLCM)提取对比度和同质性在4个方向上的纹理特征,在光谱域使用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)提取光谱特征,以及通过三维卷积神经网络(3D-CNN)自动提取空间域与光谱域的通道特征,将纹理特征、光谱特征、通道特征融合成特征向量,对比分析不同特征向量组合在支持向量机(SVM)、灰狼优化算法-支持向量机(GWO-SVM)、粒子群优化算法-支持向量机(PSO-SVM)上木材树种分类的准确率。经过均值滤波-标准正态变换预处理的光谱特征值在全波段上达到了96.66%的分类准确率。在光谱特征方面,竞争性自适应重加权算法提取特征波段的分类准确率均优于连续投影算法,竞争性自适应重加权算法在灰狼优化算法-支持向量机上得到了94.16%的分类准确率。在竞争性自适应重加权算法中融合灰度共生矩阵的纹理特征使模型的平均准确率提高了1.53%,而在纹理与光谱特征中,融入通道特征的灰度共生矩阵-竞争性自适应重加权算法-卷积神经网络特征向量组合,在灰狼优化算法-支持向量机上的准确率达到了98.33%,最后利用五折交叉验证法测试最优模型的泛化能力,结果表明五折平均准确率为97.50%。多维特征融合形成的特征向量能有效表征木材的光谱与空间特性,进一步提高了木材树种分类的准确率。 展开更多
关键词 木材树种分类 高光谱图像 特征融合 机器学习 三维卷积神经网络(3d-cnn)
在线阅读 下载PDF
基于3D-LCRN视频异常行为识别方法 被引量:9
14
作者 胡薰尹 管业鹏 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2019年第11期183-193,共11页
自动准确识别监控视频中的异常行为在安防领域具有广泛的应用前景.本文提出一种基于3D-LCRN(3D Long-short-term Convolutional Recurrent Network)视觉时序模型的视频异常行为识别方法.首先,基于视频图像帧间的结构相似性,结合光照感... 自动准确识别监控视频中的异常行为在安防领域具有广泛的应用前景.本文提出一种基于3D-LCRN(3D Long-short-term Convolutional Recurrent Network)视觉时序模型的视频异常行为识别方法.首先,基于视频图像帧间的结构相似性,结合光照感应与光照补偿机制进行背景建模,获取对光照突变与背景运动不敏感的矫正光流场与矫正运动历史图.同时,针对异常与正常行为视频数据失衡问题,计算三通道矫正光流运动历史图COFMHI(corrected optical flow motion history image),随机提取视觉词块进行聚类,对样本数量与维度进行双向扩充,充分获取样本的微分和积分运动信息.在此基础上,采用3D-CNN深度学习网络模型对COFMHI进行学习,获取局部短时序时空-域特征,结合可学习贡献因子加权的LSTM网络以压制无关、冗余、具有混淆性的视频片段,进一步提取由短时序-长时序,由局部-全局的多层次时-空域特征用于异常行为识别.通过与同类方法的客观定量对比,实验结果表明,本文方法在光照突变与背景运动等复杂场景下具有优异的异常行为识别性能,进一步表明该方法有效、可行. 展开更多
关键词 矫正光流运动历史图 样本扩充 3D-LCRN 3d-cnn LSTM 异常行为识别
在线阅读 下载PDF
3D卷积自编码器高光谱图像分类模型 被引量:7
15
作者 石延新 何进荣 +1 位作者 李照奎 曾志高 《中国图象图形学报》 CSCD 北大核心 2021年第8期2021-2036,共16页
目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模... 目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模型的不足,本文提出了一种无监督范式下的高光谱图像空谱融合方法,建立了3D卷积自编码器(3D convolutional auto-encoder,3D-CAE)高光谱图像分类模型。方法3D卷积自编码器由编码器、解码器和分类器构成。将高光谱数据预处理后,输入到编码器中进行无监督特征提取,得到一组特征图。编码器的网络结构为3个卷积块构成的3D卷积神经网络,卷积块中加入批归一化技术防止过拟合。解码器为逆向的编码器,将提取到的特征图重构为原始数据,用均方误差函数作为损失函数判断重构误差并使用Adam算法进行参数优化。分类器由3层全连接层组成,用于判别编码器提取到的特征。以3D-CNN(three dimensional convolutional neural network)为自编码器的主干网络可以充分利用高光谱图像的空间信息和光谱信息,做到空谱融合。以端到端的方式对模型进行训练可以省去复杂的特征工程和数据预处理,模型的鲁棒性和稳定性更强。结果在Indian Pines、Salinas、Pavia University和Botswana等4个数据集上与7种传统单特征方法及深度学习方法进行了比较,本文方法均取得最优结果,总体分类精度分别为0.9487、0.9866、0.9862和0.9649。对比实验结果表明了空谱融合和无监督学习对于高光谱遥感图像分类的有效性。结论本文模型充分利用了高光谱图像的光谱特征和空间特征,可以做到无监督特征提取,无需大量标注数据的同时分类精度高,是一种有效的高光谱图像分类方法。 展开更多
关键词 遥感图像分类 空谱特征融合 3d-cnn 自编码器 卷积神经网络(CNN) 深度学习
原文传递
A Lightweight Driver Drowsiness Detection System Using 3DCNN With LSTM 被引量:2
16
作者 Sara A.Alameen Areej M.Alhothali 《Computer Systems Science & Engineering》 SCIE EI 2023年第1期895-912,共18页
Today,fatalities,physical injuries,and significant economic losses occur due to car accidents.Among the leading causes of car accidents is drowsiness behind the wheel,which can affect any driver.Drowsiness and sleepin... Today,fatalities,physical injuries,and significant economic losses occur due to car accidents.Among the leading causes of car accidents is drowsiness behind the wheel,which can affect any driver.Drowsiness and sleepiness often have associated indicators that researchers can use to identify and promptly warn drowsy drivers to avoid potential accidents.This paper proposes a spatiotemporal model for monitoring drowsiness visual indicators from videos.This model depends on integrating a 3D convolutional neural network(3D-CNN)and long short-term memory(LSTM).The 3DCNN-LSTM can analyze long sequences by applying the 3D-CNN to extract spatiotemporal features within adjacent frames.The learned features are then used as the input of the LSTM component for modeling high-level temporal features.In addition,we investigate how the training of the proposed model can be affected by changing the position of the batch normalization(BN)layers in the 3D-CNN units.The BN layer is examined in two different placement settings:before the non-linear activation function and after the non-linear activation function.The study was conducted on two publicly available drowsy drivers datasets named 3MDAD and YawDD.3MDAD is mainly composed of two synchronized datasets recorded from the frontal and side views of the drivers.We show that the position of the BN layers increases the convergence speed and reduces overfitting on one dataset but not the other.As a result,the model achieves a test detection accuracy of 96%,93%,and 90%on YawDD,Side-3MDAD,and Front-3MDAD,respectively. 展开更多
关键词 3d-cnn deep learning driver drowsiness detection LSTM spatiotemporal features
在线阅读 下载PDF
3DMKDR:3D Multiscale Kernels CNN Model for Depression Recognition Based on EEG 被引量:1
17
作者 Yun Su Zhixuan Zhang +2 位作者 Qi Cai Bingtao Zhang Xiaohong Li 《Journal of Beijing Institute of Technology》 EI CAS 2023年第2期230-241,共12页
Depression has become a major health threat around the world,especially for older people,so the effective detection method for depression is a great public health challenge.Electroencephalogram(EEG)can be used as a bi... Depression has become a major health threat around the world,especially for older people,so the effective detection method for depression is a great public health challenge.Electroencephalogram(EEG)can be used as a biomarker to effectively explore depression recognition.Motivated by the studies that multiple smaller scale kernels could increase nonlinear expression compared to a larger kernel,this article proposes a model named the three-dimensional multiscale kernels convolutional neural network model for the depression disorder recognition(3DMKDR),which is a three-dimensional convolutional neural network model with multiscale convolutional kernels for depression recognition based on EEG signals.A three-dimensional structure of the EEG is built by extending one-dimensional feature sequences into a two-dimensional electrode matrix to excavate the related spatiotemporal information among electrodes and the collected electrode matrix.By the major depressive disorder(MDD)and the multi-modal open dataset for mental-disorder analysis(MODMA)datasets,the experiment shows that the accuracies of depression recognition are up to99.86%and 98.01%in the subject-dependent experiment,and 95.80%and 82.27%in the subjectindependent experiment,which are higher than alternative competitive methods.The experimental results demonstrate that the proposed 3DMKDR is potentially useful for depression recognition in older persons in the future. 展开更多
关键词 major depression disorder(MDD) electroencephalogram(EEG) three-dimensional convolutional neural network(3d-cnn) spatiotemporal features
在线阅读 下载PDF
Enhanced 3D Point Cloud Reconstruction for Light Field Microscopy Using U-Net-Based Convolutional Neural Networks
18
作者 Shariar Md Imtiaz Ki-Chul Kwon +4 位作者 F.M.Fahmid Hossain MdBiddut Hossain Rupali Kiran Shinde Sang-Keun Gil Nam Kim 《Computer Systems Science & Engineering》 SCIE EI 2023年第12期2921-2937,共17页
This article describes a novel approach for enhancing the three-dimensional(3D)point cloud reconstruction for light field microscopy(LFM)using U-net architecture-based fully convolutional neural network(CNN).Since the... This article describes a novel approach for enhancing the three-dimensional(3D)point cloud reconstruction for light field microscopy(LFM)using U-net architecture-based fully convolutional neural network(CNN).Since the directional view of the LFM is limited,noise and artifacts make it difficult to reconstruct the exact shape of 3D point clouds.The existing methods suffer from these problems due to the self-occlusion of the model.This manuscript proposes a deep fusion learning(DL)method that combines a 3D CNN with a U-Net-based model as a feature extractor.The sub-aperture images obtained from the light field microscopy are aligned to form a light field data cube for preprocessing.A multi-stream 3D CNNs and U-net architecture are applied to obtain the depth feature fromthe directional sub-aperture LF data cube.For the enhancement of the depthmap,dual iteration-based weighted median filtering(WMF)is used to reduce surface noise and enhance the accuracy of the reconstruction.Generating a 3D point cloud involves combining two key elements:the enhanced depth map and the central view of the light field image.The proposed method is validated using synthesized Heidelberg Collaboratory for Image Processing(HCI)and real-world LFM datasets.The results are compared with different state-of-the-art methods.The structural similarity index(SSIM)gain for boxes,cotton,pillow,and pens are 0.9760,0.9806,0.9940,and 0.9907,respectively.Moreover,the discrete entropy(DE)value for LFM depth maps exhibited better performance than other existing methods. 展开更多
关键词 3Dreconstruction 3Dmodeling point cloud depth estimation integral imaging light filedmicroscopy 3d-cnn U-Net deep learning machine intelligence
在线阅读 下载PDF
An improved micro-expression recognition algorithm of 3D convolutional neural network
19
作者 WU Jin SHI Qianwen +2 位作者 XI Meng WANG Lei ZENG Huadie 《High Technology Letters》 EI CAS 2022年第1期63-71,共9页
The micro-expression lasts for a very short time and the intensity is very subtle.Aiming at the problem of its low recognition rate,this paper proposes a new micro-expression recognition algorithm based on a three-dim... The micro-expression lasts for a very short time and the intensity is very subtle.Aiming at the problem of its low recognition rate,this paper proposes a new micro-expression recognition algorithm based on a three-dimensional convolutional neural network(3D-CNN),which can extract two-di-mensional features in spatial domain and one-dimensional features in time domain,simultaneously.The network structure design is based on the deep learning framework Keras,and the discarding method and batch normalization(BN)algorithm are effectively combined with three-dimensional vis-ual geometry group block(3D-VGG-Block)to reduce the risk of overfitting while improving training speed.Aiming at the problem of the lack of samples in the data set,two methods of image flipping and small amplitude flipping are used for data amplification.Finally,the recognition rate on the data set is as high as 69.11%.Compared with the current international average micro-expression recog-nition rate of about 67%,the proposed algorithm has obvious advantages in recognition rate. 展开更多
关键词 micro-expression recognition deep learning three-dimensional convolutional neural network(3d-cnn) batch normalization(BN)algorithm DROPOUT
在线阅读 下载PDF
融合残差模块的CT肺结节检测研究 被引量:1
20
作者 张悦 宋卫东 +1 位作者 王志杰 张丰收 《计算机与数字工程》 2024年第11期3459-3464,共6页
CT是用于获取肺部图像的主要成像工具,论文针对CT检测肺结节灵敏度低的问题,提出一种融合残差模块的网络用于肺结节检测。首先使用ResNet替换U型网络的主干,灵活地添加了残差模块结构,使用跳跃连接更好地融合了上下文的特征信息,同时在... CT是用于获取肺部图像的主要成像工具,论文针对CT检测肺结节灵敏度低的问题,提出一种融合残差模块的网络用于肺结节检测。首先使用ResNet替换U型网络的主干,灵活地添加了残差模块结构,使用跳跃连接更好地融合了上下文的特征信息,同时在一定程度上减少网络退化以及梯度消失问题;另外,在网络的输出层直接采用RPN产生的候选框作为输出结果,同时使用Soft-NMS对冗余框进行抑制,极大保留了结节的有效特征。在LUNA16数据集中验证了论文算法,CPM值达到了0.887,相对于其他三个模型分别提高了4.9%、1.7%、4.8%,肺结节检测的灵敏度得到了一定的提高,为临床检查提供理论参考。 展开更多
关键词 肺结节检测 3d-cnn 残差连接 深度学习
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部