期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于3D ResNet网络的多层螺旋CT在肺结核临床诊断中的应用
1
作者 米日古丽·达毛拉 努尔阿米娜·肉孜 +4 位作者 古丽米热·艾麦提 阿里木江·阿卜杜凯尤木 王洋 麦日耶木姑丽·艾山 马依迪丽·尼加提 《医疗装备》 2025年第20期13-17,共5页
目的 评估基于3D ResNet网络的多层螺旋CT在肺结核诊断中的应用价值。方法 选取2016年1月至2023年8月医院收治的735例肺结核患者和348例肺炎患者的胸部CT影像资料,按7∶2∶1比例分为训练集、验证集和测试集,另选取同期150例肺结核患者与... 目的 评估基于3D ResNet网络的多层螺旋CT在肺结核诊断中的应用价值。方法 选取2016年1月至2023年8月医院收治的735例肺结核患者和348例肺炎患者的胸部CT影像资料,按7∶2∶1比例分为训练集、验证集和测试集,另选取同期150例肺结核患者与130例肺炎患者进行外部验证。使用3D VGG-16、3D EfficientNet和3D ResNet-50深度学习模型完成诊断,采用受试者工作特征(ROC)曲线分析3种模型在训练集、验证集、测试集和外部验证集中的效能,比较有、无采用AI系统辅助阅片对肺结核的诊断效能。结果 3D ResNet-50的分类性能最好,曲线下面积(AUC)和准确度均高于其他2个模型,模型在内部测试集上的AUC为0.822,准确度为0.859。AI系统辅助放射科医师诊断肺结核的特异度、准确度均高于医师独立诊断,阅片时间短于医师独立诊断(P<0.05)。结论 基于3D ResNet网络自动化率的诊断方法可提高肺结核的诊断准确度。 展开更多
关键词 多层螺旋CT 3d resnet网络 肺结核 肺炎 深度学习
暂未订购
3D多重注意力机制下的行为识别 被引量:5
2
作者 吴丽君 李斌斌 +2 位作者 陈志聪 林培杰 程树英 《福州大学学报(自然科学版)》 CAS 北大核心 2022年第1期47-53,共7页
为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效... 为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效通道信息和时间信息;在空间模块中,压缩冗余时间信息以减少计算量.该模块的整体计算量较少,可嵌入到各3D卷积网络中.为验证多重注意力机制模块的性能,基于3D ResNet网络设计部署了该多重注意力机制模块,并在UCF-101和HMDB-51两个行为识别数据集上分别进行训练.结果表明,改进后的3D ResNet在UCF-101上可提升1.50%的精度,在HMDB-51可提升1.24%的精度,而参数量只增加0.24%. 展开更多
关键词 3d卷积网络 注意力机制 行为识别 3d resnet
在线阅读 下载PDF
基于注意力的短视频多模态情感分析 被引量:9
3
作者 黄欢 孙力娟 +2 位作者 曹莹 郭剑 任恒毅 《图学学报》 CSCD 北大核心 2021年第1期8-14,共7页
针对现有的情感分析方法缺乏对短视频中信息的充分考虑,从而导致不恰当的情感分析结果。基于音视频的多模态情感分析(AV-MSA)模型便由此产生,模型通过利用视频帧图像中的视觉特征和音频信息来完成短视频的情感分析。模型分为视觉与音频... 针对现有的情感分析方法缺乏对短视频中信息的充分考虑,从而导致不恰当的情感分析结果。基于音视频的多模态情感分析(AV-MSA)模型便由此产生,模型通过利用视频帧图像中的视觉特征和音频信息来完成短视频的情感分析。模型分为视觉与音频2分支,音频分支采用卷积神经网络(CNN)架构来提取音频图谱中的情感特征,实现情感分析的目的;视觉分支则采用3D卷积操作来增加视觉特征的时间相关性。并在Resnet的基础上,突出情感相关特征,添加了注意力机制,以提高模型对信息特征的敏感性。最后,设计了一种交叉投票机制用于融合视觉分支和音频分支的结果,产生情感分析的最终结果。AV-MSA模型在IEMOCAP和微博视听(WB-AV)数据集上进行了评估,实验结果表明,与现有算法相比,AV-MSA在分类精确度上有了较大的提升。 展开更多
关键词 多模态情感分析 残差网络 3d卷积神经网络 注意力 决策融合
在线阅读 下载PDF
基于ShuffleNet V2算法的三维视线估计 被引量:1
4
作者 王宇 宁媛 陈进军 《计算技术与自动化》 2022年第1期87-92,共6页
为了解决当前视线估计网络复杂度较深、精度不高的问题,同时为了未来将网络部署在移动设备端,提出了一种基于ShuffleNet V2算法的视线估计网络,其由脸部和眼睛两个子网络构成。脸部子网络通过ResNet V2网络对脸部图片进行特征处理,并加... 为了解决当前视线估计网络复杂度较深、精度不高的问题,同时为了未来将网络部署在移动设备端,提出了一种基于ShuffleNet V2算法的视线估计网络,其由脸部和眼睛两个子网络构成。脸部子网络通过ResNet V2网络对脸部图片进行特征处理,并加入人脸对齐算法,减少头部角度误差的影响。眼睛子网络通过ShuffleNet V2与ResNet V2算法进行眼睛图片的并行特征处理。网络对特征图片处理后得到角度参数,最后通过坐标变换得到视线角度。并在MPIIGaze数据集上进行了实验。针对精度的不足对算法进行改进,在ShuffleNet V2中加入注意力机制(逐点平方操作模块),并进行了改进算法的验证实验,最后和多种先进的算法进行了实验对比。实验表明,改进后的算法比其他算法的精度要高。 展开更多
关键词 神经网络 三维视线估计 ShuffleNet V2 resnet V2 坐标变换 人脸对齐 注意力机制 MPIIGaze
在线阅读 下载PDF
星际争霸图像序列的群体行为识别研究
5
作者 白江波 杨阳 张文生 《应用科技》 CAS 2022年第2期63-69,共7页
以星际争霸游戏图像数据的群体目标行为识别为研究目标,构建游戏中群体目标典型行为的数据集,并应用当前主流的行为识别方法对游戏图像序列进行了群体行为识别。群体目标典型行为的数据集共包含战斗、移动、静止这3类典型行为,每个行为... 以星际争霸游戏图像数据的群体目标行为识别为研究目标,构建游戏中群体目标典型行为的数据集,并应用当前主流的行为识别方法对游戏图像序列进行了群体行为识别。群体目标典型行为的数据集共包含战斗、移动、静止这3类典型行为,每个行为样本中包含不同数量、不同背景和不同行为表示形式的目标单元,充分保证了数据样本的多样性。分别使用时间段网络(TSN)、3D卷积(C3D)网络、膨胀3D卷积网络(I3D)以及时间移位模块(TSM)这4种行为识别方法,对构建的星际争霸图像序列群体目标行为识别数据集进行了验证。实验结果表明,本数据集有效,且基于3D卷积网络的C3D模型取得了最好的行为识别效果和最短的计算时间,满足群体目标行为识别任务需求。本文为后续研究遥感图像的群体目标行为识别方法提供了指导和迁移学习的原始数据。 展开更多
关键词 图像序列 群体行为识别 3d卷积 星际争霸 行为数据集 神经网络 深度学习 残差网络
在线阅读 下载PDF
乘务员值乘状态监测技术研究 被引量:1
6
作者 李干涛 朱岸平 李火星 《电视技术》 2022年第12期51-55,共5页
利用多维度视频融合感知技术对机车乘务员值乘状态进行实时分析,通过乘务员前方图像采集设备和后上方图像采集设备实时获取视频,先对视频图像进行动态自适应校正,再利用mobilenet-yolov3轻量级网络检测视频中乘务员的人脸多维特征信息... 利用多维度视频融合感知技术对机车乘务员值乘状态进行实时分析,通过乘务员前方图像采集设备和后上方图像采集设备实时获取视频,先对视频图像进行动态自适应校正,再利用mobilenet-yolov3轻量级网络检测视频中乘务员的人脸多维特征信息、玩手机以及驾驶室车门开闭等特征,采用Hu矩不变量特征辅助分析乘务员的盹睡状态,从而及时提醒司机规范驾驶行为,实时预警,对保障行车安全具有重大意义。 展开更多
关键词 多维度视频融合 轻量级网络 Hu矩不变量 3d-resnet
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部