期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
An Optimized Deep Residual Network with a Depth Concatenated Block for Handwritten Characters Classification 被引量:4
1
作者 Gibrael Abosamra Hadi Oqaibi 《Computers, Materials & Continua》 SCIE EI 2021年第7期1-28,共28页
Even though much advancements have been achieved with regards to the recognition of handwritten characters,researchers still face difficulties with the handwritten character recognition problem,especially with the adv... Even though much advancements have been achieved with regards to the recognition of handwritten characters,researchers still face difficulties with the handwritten character recognition problem,especially with the advent of new datasets like the Extended Modified National Institute of Standards and Technology dataset(EMNIST).The EMNIST dataset represents a challenge for both machine-learning and deep-learning techniques due to inter-class similarity and intra-class variability.Inter-class similarity exists because of the similarity between the shapes of certain characters in the dataset.The presence of intra-class variability is mainly due to different shapes written by different writers for the same character.In this research,we have optimized a deep residual network to achieve higher accuracy vs.the published state-of-the-art results.This approach is mainly based on the prebuilt deep residual network model ResNet18,whose architecture has been enhanced by using the optimal number of residual blocks and the optimal size of the receptive field of the first convolutional filter,the replacement of the first max-pooling filter by an average pooling filter,and the addition of a drop-out layer before the fully connected layer.A distinctive modification has been introduced by replacing the final addition layer with a depth concatenation layer,which resulted in a novel deep architecture having higher accuracy vs.the pure residual architecture.Moreover,the dataset images’sizes have been adjusted to optimize their visibility in the network.Finally,by tuning the training hyperparameters and using rotation and shear augmentations,the proposed model outperformed the state-of-the-art models by achieving average accuracies of 95.91%and 90.90%for the Letters and Balanced dataset sections,respectively.Furthermore,the average accuracies were improved to 95.9%and 91.06%for the Letters and Balanced sections,respectively,by using a group of 5 instances of the trained models and averaging the output class probabilities. 展开更多
关键词 Handwritten character classification deep convolutional neural networks residual networks GoogLeNet ResNet18 DenseNet DROP-OUT L2 regularization factor learning rate
在线阅读 下载PDF
基于改进ResNet-18的红外图像人体行为识别方法研究 被引量:13
2
作者 周啸辉 余磊 +4 位作者 何茜 陈涵 聂宏 欧巧凤 熊邦书 《激光与红外》 CAS CSCD 北大核心 2021年第9期1178-1184,共7页
人体行为识别在安全监护、安防监控、智能家居等诸多领域具有重要的研究意义和广泛的应用价值。由于红外信息具有受光照影响小、保护隐私等特性,因此基于红外信息的人体行为识别方法备受国内外学者关注。本文对包含7种行为类别的红外信... 人体行为识别在安全监护、安防监控、智能家居等诸多领域具有重要的研究意义和广泛的应用价值。由于红外信息具有受光照影响小、保护隐私等特性,因此基于红外信息的人体行为识别方法备受国内外学者关注。本文对包含7种行为类别的红外信息进行连续帧拼接处理,构建红外图像数据集。传统的ResNet-18网络性能较为优异,在可见光图像识别上一直表现良好,但在红外图像识别中效果欠佳。本文根据红外图像特性,对其进行相应改进:首先,构建多分支同构结构,替换7×7卷积,增强网络的表达能力;其次,结合最大池化与平均池化,避免丢失有用信息;最后,引入非对称卷积块构成多重残差结构,并与改进CBAM模块结合对残差块进行优化,从而增加网络多样性,提升网络的特征提取能力。实验结果表明,改进ResNet 18网络识别率达到99.96%,不但高于传统的ResNet 18网络,而且明显优于基于红外图像的其他网络。 展开更多
关键词 人体行为识别 改进ResNe18网络 红外图像 多重残差结构 改进CBAM模块
在线阅读 下载PDF
基于深度学习的传统色彩创新设计方法研究
3
作者 丁满 冯光宇 +1 位作者 王鹏博 谷泽杨 《包装工程》 北大核心 2025年第10期56-67,共12页
目的挖掘文化内涵,提升传统色彩创新设计的创新性和多样性,解决传统色彩创新设计中缺乏文化底蕴,设计效率不高等问题。方法首先采用网络爬虫、聚类算法、自然语言处理等方法构建显性传统色彩库与隐性文化意象库,并结合语意差异法和ResNe... 目的挖掘文化内涵,提升传统色彩创新设计的创新性和多样性,解决传统色彩创新设计中缺乏文化底蕴,设计效率不高等问题。方法首先采用网络爬虫、聚类算法、自然语言处理等方法构建显性传统色彩库与隐性文化意象库,并结合语意差异法和ResNet18构建传统色彩文化数据集;其次,采用C-WGAN构建一个生成传统色彩创新设计方案的模型,该模型能够创造性地生成符合色彩搭配规则且富有文化意象的产品色彩设计方案;最后,以武强年画为传统色彩文化研究对象,以旅游观光车为设计应用对象,进行传统色彩创新设计,并搭建设计系统,以验证论文所提方法的有效性和适用性。结果提出一种基于深度学习的传统色彩创新设计方法,该方法可快速设计出符合文化意象的产品色彩设计方案,实现传统色彩、文化底蕴、现代产品的交融。结论论文验证了深度学习技术在传统色彩创新设计中的应用潜力,为传统色彩创新设计提供一种可行且可靠的思路,促进了传统色彩在现代产品设计中的创新和传承。 展开更多
关键词 传统色彩 创新设计 文化意象 条件Wassertein生成对抗网络(C-WGAN) 残差网络resnet-18
在线阅读 下载PDF
基于双模态融合与深度残差网络的肝脏超声图像分类模型研究
4
作者 叶晓燕 苏星 +1 位作者 厉晓琳 张乐宇 《医疗卫生装备》 2025年第10期9-16,共8页
目的:为了提升肝脏占位性病变诊断的准确率,提出一种基于双模态融合与深度残差网络的肝脏超声图像分类模型。方法:首先,构建包含100例患者164个病灶的肝脏超声数据集,包括患者的B超视频和超声造影视频。其次,引入并联残差块改进ResNet-1... 目的:为了提升肝脏占位性病变诊断的准确率,提出一种基于双模态融合与深度残差网络的肝脏超声图像分类模型。方法:首先,构建包含100例患者164个病灶的肝脏超声数据集,包括患者的B超视频和超声造影视频。其次,引入并联残差块改进ResNet-18网络,并引入简单注意力模块和坐标注意力机制分别提取B超和超声造影的图像特征。最后,融合B超和超声造影的图像特征设计双模态融合网络,与改进ResNet-18网络组成超声图像分类模型。为验证提出的模型的性能,进行消融实验、应用评价、诊断效能评价和手术辅助意义评价,并与现有分类模型的图像分类能力进行对比。结果:消融实验结果显示,提出的模型在分类速度和分类精度上表现最优,浮点运算速度为5.328×109/s、平均精度均值为0.941、计算速度为245.266帧/s。应用评价结果表明,提出的模型损失函数曲线收敛性能最佳,误诊率最低,仅为7.03%。诊断效能评价结果表明,提出的模型诊断效能最佳,敏感度为89.38%、特异度为94.12%、准确率为90.85%、阳性预测值为97.12%、阴性预测值为80.00%。手术辅助意义评价结果表明,提出的模型端到端延迟最短,仅为723 ms;在提出的模型辅助下进行肝腹腔镜切除术较传统腹腔镜辅助下进行手术失血量减少了109.832mL,差异有统计学意义(P<0.05)。结论:提出的模型可提高肝脏超声占位性病变的诊断效率和准确性,为临床诊断及手术辅助提供支持。 展开更多
关键词 肝脏超声 超声造影 肝脏占位性病变 双模态融合 图像分类 resnet-18网络 深度残差网络
在线阅读 下载PDF
基于深度学习的墙式氧气吸入器检定方法
5
作者 黄康 孙斌 +2 位作者 吴燕娟 裘凯军 赵玉晓 《计量学报》 CSCD 北大核心 2024年第5期685-691,共7页
针对墙式氧气吸入器检定时人工读数影响大、检定效率低等问题,提出一种基于深度学习的墙式氧气吸入器检定方法。通过工业相机拍摄墙式氧气吸入器图像,输入到改进后的残差块ResNet-18网络中,实现对浮子流量计的自动读数。残差块结构改进... 针对墙式氧气吸入器检定时人工读数影响大、检定效率低等问题,提出一种基于深度学习的墙式氧气吸入器检定方法。通过工业相机拍摄墙式氧气吸入器图像,输入到改进后的残差块ResNet-18网络中,实现对浮子流量计的自动读数。残差块结构改进策略有:在直联通路中增加Dropout网络层;删除残差块中的1×1卷积层;使用LeakyReLU激活函数代替ReLU激活函数。将数据集按照51的比例划分为训练集和测试集,经过100批次的训练,网络模型在测试集上的准确率为98.37%。将中国计量科学研究院检定合格的墙式氧气吸入器连接至检定装置中检定,计算得到浮子流量计的最大示值误差为±0.2 L/min,误差在允许范围内,检定结果相同。结果表明,该方法可以代替人工读数,有效提高检定效率。 展开更多
关键词 流量计量 墙式氧气吸入器 检定装置 深度学习 残差块 resnet-18网络
在线阅读 下载PDF
基于FFT和CNN的滚动轴承故障诊断方法 被引量:11
6
作者 尹文哲 夏虹 +2 位作者 彭彬森 朱少民 王志超 《应用科技》 CAS 2021年第6期97-101,共5页
为提高滚动轴承故障诊断的识别准确率、摆脱信号处理方法对专家经验的过度依赖,提出一种基于快速傅里叶变换(FFT)和卷积神经网络(CNN)的滚动轴承故障诊断方法。即对滚动轴承原始振动信号进行快速傅里叶变换,再将得到的一维数据转变为二... 为提高滚动轴承故障诊断的识别准确率、摆脱信号处理方法对专家经验的过度依赖,提出一种基于快速傅里叶变换(FFT)和卷积神经网络(CNN)的滚动轴承故障诊断方法。即对滚动轴承原始振动信号进行快速傅里叶变换,再将得到的一维数据转变为二维的特征图,输入到ResNet-18网络中进行学习训练,以实现滚动轴承的故障诊断。通过与其他几种输入方法进行对比分析,验证了该方法的有效性以及优越性。实验结果表明该方法诊断准确率高、收敛速度快,并且信号处理过程不需要设定相关预定义参数,摆脱了对专家经验的过度依赖。 展开更多
关键词 滚动轴承 故障诊断 深度学习 卷积神经网络 残差网络 振动信号 快速傅里叶变换 resnet-18网络
在线阅读 下载PDF
面向机械臂操作的视觉信息实时重建方法 被引量:1
7
作者 贾清玉 常亮 +4 位作者 杨先一 强保华 张世豪 谢武 杨明浩 《计算机应用》 CSCD 北大核心 2023年第4期1255-1260,共6页
现阶段的机械臂技能传授方法主要通过三维实时重建技术搭建虚拟空间进行模拟训练。然而人与机械臂视角不同,传统视觉信息重建方法由于重建误差大、时间长,而且实验环境苛刻、所需传感器较多等原因,导致机械臂在虚拟空间内习得的技能不... 现阶段的机械臂技能传授方法主要通过三维实时重建技术搭建虚拟空间进行模拟训练。然而人与机械臂视角不同,传统视觉信息重建方法由于重建误差大、时间长,而且实验环境苛刻、所需传感器较多等原因,导致机械臂在虚拟空间内习得的技能不能很好地迁移于现实环境。针对以上问题,提出了一种面向机械臂操作的视觉信息实时重建方法。首先,通过Mask-RCNN(Mask-Region Convolutional Neural Network)对实时采集到的RGB图像提取信息;然后,将提取后的RGB图像及其他视觉信息联合编码,并通过ResNet-18将视觉信息映射为机械臂操作空间的三维位置信息;最后,为减小重建误差,提出了一种聚类簇中心距离受限离群值调整方法(CC-DIS),并利用OpenGL(Open Graphics Library)将调整后的位置信息可视化,完成机械臂操作空间三维实时重建。实验结果表明,所提的实时重建方法具有较快的重建速度和较高的重建精度,完成一次三维重建仅需62.92 ms,重建速度高达每秒16帧,重建相对误差约为5.23%,能有效用于机械臂技能传授任务。 展开更多
关键词 技能传授 Mask-RCNN resnet-18 三维实时重建 机械臂
在线阅读 下载PDF
Convolutional Bi-LSTM Based Human Gait Recognition Using Video Sequences 被引量:1
8
作者 Javaria Amin Muhammad Almas Anjum +3 位作者 Muhammad Sharif Seifedine Kadry Yunyoung Nam ShuiHua Wang 《Computers, Materials & Continua》 SCIE EI 2021年第8期2693-2709,共17页
Recognition of human gait is a difficult assignment,particularly for unobtrusive surveillance in a video and human identification from a large distance.Therefore,a method is proposed for the classification and recogni... Recognition of human gait is a difficult assignment,particularly for unobtrusive surveillance in a video and human identification from a large distance.Therefore,a method is proposed for the classification and recognition of different types of human gait.The proposed approach is consisting of two phases.In phase I,the new model is proposed named convolutional bidirectional long short-term memory(Conv-BiLSTM)to classify the video frames of human gait.In this model,features are derived through convolutional neural network(CNN)named ResNet-18 and supplied as an input to the LSTM model that provided more distinguishable temporal information.In phase II,the YOLOv2-squeezeNet model is designed,where deep features are extricated using the fireconcat-02 layer and fed/passed to the tinyYOLOv2 model for recognized/localized the human gaits with predicted scores.The proposed method achieved up to 90%correct prediction scores on CASIA-A,CASIA-B,and the CASIA-C benchmark datasets.The proposed method achieved better/improved prediction scores as compared to the recent existing works. 展开更多
关键词 Bi-LSTM YOLOv2 open neural network resnet-18 GAIT squeezeNet
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部