期刊文献+
共找到522篇文章
< 1 2 27 >
每页显示 20 50 100
基于DLatLRR与VGG Net的红外与可见光图像融合 被引量:5
1
作者 沈瑜 陈小朋 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第6期1105-1114,共10页
针对红外与可见光图像融合中特征损失严重、显著目标不突出的问题,提出了一种低秩表示分解与深度神经网络相结合的图像融合算法。首先,对源图像进行潜在低秩表示分解(DLatLRR),得到相应的低秩部分、显著部分及稀疏噪声。然后,分别采用1... 针对红外与可见光图像融合中特征损失严重、显著目标不突出的问题,提出了一种低秩表示分解与深度神经网络相结合的图像融合算法。首先,对源图像进行潜在低秩表示分解(DLatLRR),得到相应的低秩部分、显著部分及稀疏噪声。然后,分别采用16层的VGG Net模型和联合特征加权算法对低秩部分与显著部分进行融合,舍弃二者的稀疏噪声。最后,对融合得到的低秩部分和显著部分进行图像重建,得到最终的融合图像。实验结果表明:与其他算法进行比较,所提算法能够对图像的深层次细节特征进行融合,突出场景中的感兴趣区域,且融合图像的相关差异和、结构相似性、线性相关度等多种客观指标均有所提升,提升最大值分别为0.73、0.15、0.11,噪声产生率的最大缩减值为0.041 2。 展开更多
关键词 图像处理 图像融合 潜在低秩表示分解(DLatLRR) vgg net 联合特征加权
原文传递
HOG-VGG:VGG Network with HOG Feature Fusion for High-Precision PolSAR Terrain Classification 被引量:1
2
作者 Jiewen Li Zhicheng Zhao +2 位作者 Yanlan Wu Jiaqiu Ai Jun Shi 《Journal of Harbin Institute of Technology(New Series)》 CAS 2024年第5期1-15,共15页
This article proposes a VGG network with histogram of oriented gradient(HOG) feature fusion(HOG-VGG) for polarization synthetic aperture radar(PolSAR) image terrain classification.VGG-Net has a strong ability of deep ... This article proposes a VGG network with histogram of oriented gradient(HOG) feature fusion(HOG-VGG) for polarization synthetic aperture radar(PolSAR) image terrain classification.VGG-Net has a strong ability of deep feature extraction,which can fully extract the global deep features of different terrains in PolSAR images,so it is widely used in PolSAR terrain classification.However,VGG-Net ignores the local edge & shape features,resulting in incomplete feature representation of the PolSAR terrains,as a consequence,the terrain classification accuracy is not promising.In fact,edge and shape features play an important role in PolSAR terrain classification.To solve this problem,a new VGG network with HOG feature fusion was specifically proposed for high-precision PolSAR terrain classification.HOG-VGG extracts both the global deep semantic features and the local edge & shape features of the PolSAR terrains,so the terrain feature representation completeness is greatly elevated.Moreover,HOG-VGG optimally fuses the global deep features and the local edge & shape features to achieve the best classification results.The superiority of HOG-VGG is verified on the Flevoland,San Francisco and Oberpfaffenhofen datasets.Experiments show that the proposed HOG-VGG achieves much better PolSAR terrain classification performance,with overall accuracies of 97.54%,94.63%,and 96.07%,respectively. 展开更多
关键词 PolSAR terrain classification high⁃precision HOG⁃vgg feature representation completeness elevation multi⁃level feature fusion
在线阅读 下载PDF
基于U-Net架构改进VGG19模型的人脸表情识别方法
3
作者 赵小虎 张景怡 +4 位作者 焦明之 谢礼逊 王兰飞 孙维青 张狄 《工程科学学报》 北大核心 2025年第6期1272-1284,共13页
针对传统面部识别技术中存在的诸多问题,如网络模型对关键通道特征的关注不足、参数量过大以及识别准确率不高等,本文提出了一种基于改进Visual Geometry Group 19(VGG19)模型的全新方案.该方案融合了U-Net网络架构的设计理念,并引入了... 针对传统面部识别技术中存在的诸多问题,如网络模型对关键通道特征的关注不足、参数量过大以及识别准确率不高等,本文提出了一种基于改进Visual Geometry Group 19(VGG19)模型的全新方案.该方案融合了U-Net网络架构的设计理念,并引入了改进的SE Attention模块,以期提高模型的收敛速度和对面部细节的关注程度.在保持VGG19深层特征提取能力的基础上,通过特定设计的卷积层和跳跃连接,实现了对特征的高效融合与优化.经过改进的VGG19模型,不仅能更好地提取面部特征,还能在保证准确率的前提下,降低模型参数,提高运算效率.为了验证改进模型的效果,利用FER2013数据集和CK+两个数据集对本文提出的模型进行了测试.实验结果显示,改进后的VGG19网络在表情识别的准确率上分别取得了1.58%和4.04%的提升.这一结果充分证明了本文提出的方法在解决传统面部识别问题方面的优越性,也为面部识别技术的进一步发展提供了新的思路. 展开更多
关键词 面部表情识别 深度学习 卷积神经网络 情感分类 vgg19
在线阅读 下载PDF
基于VGG-NET的特征融合面部表情识别 被引量:18
4
作者 李校林 钮海涛 《计算机工程与科学》 CSCD 北大核心 2020年第3期500-509,共10页
为了解决在面部表情特征提取过程中卷积神经网络CNN和局部二值模式LBP只能提取面部表情图像的单一特征,难以提取与面部变化高度相关的精确特征的问题,提出了一种基于深度学习的特征融合的表情识别方法。该方法将LBP特征和CNN卷积层提取... 为了解决在面部表情特征提取过程中卷积神经网络CNN和局部二值模式LBP只能提取面部表情图像的单一特征,难以提取与面部变化高度相关的精确特征的问题,提出了一种基于深度学习的特征融合的表情识别方法。该方法将LBP特征和CNN卷积层提取的特征通过加权的方式结合在改进的VGG-16网络连接层中,最后将融合特征送入Softmax分类器获取各类特征的概率,完成基本的6种表情分类。实验结果表明,所提方法在CK+和JAFFE数据集上的平均识别准确率分别达到了97.5%和97.62%,利用融合特征得到的识别结果明显优于利用单一特征识别的效果。与其他方法相比较,该方法能有效提高表情识别准确率,对光照变化更加鲁棒。 展开更多
关键词 面部表情识别 特征融合 vgg-net网络 Softmax分类
在线阅读 下载PDF
基于视觉注意VGGNet的中厚板低碳钢多层多道熔池分类模型 被引量:2
5
作者 周浩 陈善本 《焊接学报》 EI CAS CSCD 北大核心 2024年第11期71-76,共6页
重大装备制造中厚板机器人多层多道焊(multi-layer and multi-pass welding,MLMPW)一直是热点和难点,而实现机器人MLMPW的核心是对其熔池的获取、监控并分类.为了提高MLMPW的自动化和智能化,有必要开发一个熔池图像在线分类系统.针对焊... 重大装备制造中厚板机器人多层多道焊(multi-layer and multi-pass welding,MLMPW)一直是热点和难点,而实现机器人MLMPW的核心是对其熔池的获取、监控并分类.为了提高MLMPW的自动化和智能化,有必要开发一个熔池图像在线分类系统.针对焊接过程中的熔池图像提出了一种新的MLMPW熔池分类方法——基于视觉注意的(SENet)VGGNet熔池分类方法.为了提高效率和精度,引入迁移学习中的预训练模型到网络训练过程中.因为针对中厚板多层多道熔池研究较少,导致熔池公开数据集较少,为了应对这一问题,需要对数据集进行增广.结果表明,提出的模型可快速有效的对七类MLMPW熔池进行准确分类,预测精度可达到98.39%. 展开更多
关键词 多层多道焊 熔池 vgg16 视觉注意 分类模型
在线阅读 下载PDF
基于CBAM VGG16-UNet语义分割模型的建筑物提取研究 被引量:3
6
作者 赵兴旺 吴治国 +2 位作者 刘超 刘春阳 陈健 《齐齐哈尔大学学报(自然科学版)》 2024年第3期34-40,共7页
针对在遥感影像建筑物提取中常常出现“漏检”“错检”“空洞”等问题,提出了融合双注意力机制的CBAM VGG16-UNet网络,用于建筑物提取研究。基于U-Net网络架构,在下采样部分,用VGG16前5个卷积块代替U-Net网络的编码器部分,在上采样的每... 针对在遥感影像建筑物提取中常常出现“漏检”“错检”“空洞”等问题,提出了融合双注意力机制的CBAM VGG16-UNet网络,用于建筑物提取研究。基于U-Net网络架构,在下采样部分,用VGG16前5个卷积块代替U-Net网络的编码器部分,在上采样的每个特征融合时引入双注意力机制CBAM,并用双线性插值代替U-Net的转置卷积。使用WHU建筑物数据集以及贵阳建筑物数据集进行了模型验证,与Mobile-UNet、U-Net、VGG16-UNet 3种建筑物提取网络模型进行对比分析。实验表明,CBAM VGG16-UNet在WHU建筑物数据集上精准率、召回率、F1-score、IoU达到了94.90%,95.46%,95.18%,90.80%,在贵阳建筑物数据集上精准率、召回率、F1-score、IoU达到了77.53%,84.46%,80.85%,67.85%,均优于3种对比模型。为解决建筑物提取常见问题提供了新思路,具有一定的工程应用价值。 展开更多
关键词 U-net vgg16 CBAM 建筑物提取 WHU建筑物数据集
在线阅读 下载PDF
基于改进VGG16网络的失能老人表情识别研究 被引量:1
7
作者 何巍 李苏 《四川师范大学学报(自然科学版)》 2025年第3期383-391,共9页
为能更好地关注失能老人的情绪状态,采用VGG16作为表情识别的基础模型,并在此基础上进行优化改进.首先,在特征层上将激活函数改用SiLU函数,并添加批归一化层;然后,在分类层上采用自适应平均池化处理图像,同时利用卷积层实现全连接效果,... 为能更好地关注失能老人的情绪状态,采用VGG16作为表情识别的基础模型,并在此基础上进行优化改进.首先,在特征层上将激活函数改用SiLU函数,并添加批归一化层;然后,在分类层上采用自适应平均池化处理图像,同时利用卷积层实现全连接效果,避免参数过多和过拟合问题;最后,通过SENet通道注意力机制迭代式地融合相同通道数的卷积层,实现浅层与深层特征的交互,丰富人脸表情特征提取.实验结果表明,在FER2013和CK+数据集上的识别准确率分别达到72.50%和98.70%,与基础方法对比分别提高8.20%和3.90%,实验表明改进的方法能够提高表情识别率,具有一定的先进性. 展开更多
关键词 vgg16 表情识别 自适应平均化 通道注意力机制
在线阅读 下载PDF
结合SoftPool的VGG19与CapsNet相级联的表情识别模型研究 被引量:7
8
作者 杨双 王敬东 +1 位作者 姜宜君 廖元晖 《半导体光电》 CAS 北大核心 2021年第6期897-903,共7页
表情识别作为计算机视觉领域的研究热点,在情感识别、人机交互、智能安防等领域有着重要的应用。文章针对VGG19在训练人脸表情数据集时由于全连接层参数量过大而易过拟合的问题,利用胶囊网络CapsNet对VGG19的全连接层进行替换,以实现VG... 表情识别作为计算机视觉领域的研究热点,在情感识别、人机交互、智能安防等领域有着重要的应用。文章针对VGG19在训练人脸表情数据集时由于全连接层参数量过大而易过拟合的问题,利用胶囊网络CapsNet对VGG19的全连接层进行替换,以实现VGG19与CapsNet相级联,从而改善训练时过拟合的问题,同时使得级联后的模型在RAF-DB数据集上的精度提高了5.28%。针对VGG19特征提取网络的MaxPool易丢失人脸特征图信息的问题,利用SoftPool对MaxPool进行替换,从而在最大程度上保留了人脸的细粒度特征。实验结果表明,改进后的模型在RAF-DB数据集上取得了84.21%的精度,在FER2013数据集上取得了73.16%的精度,表情识别效果更优。 展开更多
关键词 表情识别 vgg19 Capsnet SoftPool
原文传递
基于VGG-Net的X射线全脊柱冠状面图像分割方法 被引量:1
9
作者 申学泉 张勇 +3 位作者 张润杰 石琼芳 宋宇锋 张权 《国外电子测量技术》 2024年第1期135-140,共6页
在计算机辅助脊柱图像分析和疾病诊断应用中,从X射线脊柱图像中自动分割脊柱和椎骨是一个关键且具有挑战性的问题。为进一步提升脊柱图像分割精度,提出一种基于VGG-Net改进的模型。首先,将VGG16网络去掉了后面的全连接层,用作U-Net的特... 在计算机辅助脊柱图像分析和疾病诊断应用中,从X射线脊柱图像中自动分割脊柱和椎骨是一个关键且具有挑战性的问题。为进一步提升脊柱图像分割精度,提出一种基于VGG-Net改进的模型。首先,将VGG16网络去掉了后面的全连接层,用作U-Net的特征提取网络;其次,为了增强图像的细节信息,在特征提取网络引入小波分解模块;最后,在上采样网络中设计了一种逐像素相减的自空间注意力模块(SUB-SSAM)机制,进一步提高网络模型识别关键特征的能力。实验结果表明,改进后的模型相较于原VGG-Net模型在平均交并比(mIoU)上提高了2.39%、召回率(recall)提高了0.96%、准确率(accuracy)提高了1.31%,训练的该网络模型可以定位到每一块椎骨,准确分割椎体区域。 展开更多
关键词 图像分割 U-net vgg-net 小波分解 SUB-SSAM
原文传递
基于改进VGG19网络和迁移学习的白术病害识别研究
10
作者 赵强 吴政泽 《无线互联科技》 2025年第22期89-92,共4页
文章针对白术叶片病害诊断中存在的人为误诊率高、实验室诊断条件苛刻等问题,采用迁移学习方法改进、微调VGG19网络模型。构建好的新模型白术病害识别率平均达96.8%,与GoogleNet、ResNet50和DenseNet模型相比较,精确率、召回率和F1值也... 文章针对白术叶片病害诊断中存在的人为误诊率高、实验室诊断条件苛刻等问题,采用迁移学习方法改进、微调VGG19网络模型。构建好的新模型白术病害识别率平均达96.8%,与GoogleNet、ResNet50和DenseNet模型相比较,精确率、召回率和F1值也有了大幅提高,对白术病害识别诊断具有重要意义。 展开更多
关键词 白术病害识别 vgg19模型 迁移学习 卷积神经网络
在线阅读 下载PDF
基于改进的VGG-Net的手写蒙古文字元识别 被引量:3
11
作者 石佳钰 殷雁君 +1 位作者 刁明皓 智敏 《内蒙古师范大学学报(自然科学版)》 CAS 2021年第2期127-133,共7页
现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法。通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别。结果表... 现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法。通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别。结果表明,改进的VGG-Net对字元图像识别的准确率达到96.83%,相比传统VGG-Net模型识别速度更快,准确率更高,占用储存空间更少。 展开更多
关键词 蒙古文字元识别 vgg-net 数据增强
在线阅读 下载PDF
VISPNN:VGG-Inspired Stochastic Pooling Neural Network 被引量:2
12
作者 Shui-Hua Wang Muhammad Attique Khan Yu-Dong Zhang 《Computers, Materials & Continua》 SCIE EI 2022年第2期3081-3097,共17页
Aim Alcoholism is a disease that a patient becomes dependent or addicted to alcohol.This paper aims to design a novel artificial intelligence model that can recognize alcoholism more accurately.Methods We propose the ... Aim Alcoholism is a disease that a patient becomes dependent or addicted to alcohol.This paper aims to design a novel artificial intelligence model that can recognize alcoholism more accurately.Methods We propose the VGG-Inspired stochastic pooling neural network(VISPNN)model based on three components:(i)a VGG-inspired mainstay network,(ii)the stochastic pooling technique,which aims to outperform traditional max pooling and average pooling,and(iii)an improved 20-way data augmentation(Gaussian noise,salt-and-pepper noise,speckle noise,Poisson noise,horizontal shear,vertical shear,rotation,Gamma correction,random translation,and scaling on both raw image and its horizontally mirrored image).In addition,two networks(Net-I and Net-II)are proposed in ablation studies.Net-I is based on VISPNN by replacing stochastic pooling with ordinary max pooling.Net-II removes the 20-way data augmentation.Results The results by ten runs of 10-fold cross-validation show that our VISPNN model gains a sensitivity of 97.98±1.32,a specificity of 97.80±1.35,a precision of 97.78±1.35,an accuracy of 97.89±1.11,an F1 score of 97.87±1.12,an MCC of 95.79±2.22,an FMI of 97.88±1.12,and an AUC of 0.9849,respectively.Conclusion The performance of our VISPNN model is better than two internal networks(Net-I and Net-II)and ten state-of-the-art alcoholism recognition methods. 展开更多
关键词 Deep learning ALCOHOLISM multiple-way data augmentation vgg convolutional neural network stochastic pooling
在线阅读 下载PDF
基于VGG16-Unet算法的扭角式压板分割识别方法 被引量:1
13
作者 罗朝丰 刘平平 +2 位作者 方杰 胡志坚 焦龄霄 《河北电力技术》 2024年第4期36-42,共7页
针对当前变电站人工巡检压板状态工作效率低,且现有扭角式压板图像识别效果不佳的问题,提出了一种基于VGG16 Unet语义分割模型的压板状态识别方法。首先设计了VGG16-Unet的网络模型结构,该模型结构包含主干特征提取网络部分、加强特征... 针对当前变电站人工巡检压板状态工作效率低,且现有扭角式压板图像识别效果不佳的问题,提出了一种基于VGG16 Unet语义分割模型的压板状态识别方法。首先设计了VGG16-Unet的网络模型结构,该模型结构包含主干特征提取网络部分、加强特征提取网络部分和预测网络部分,在网络的下采样和上采样过程中捕捉图像深层次语义特征和浅层次细节特征;其次定义了网络模型的Dice损失函数并分析4种性能评估函数检测压板识别效果;最后在1000张压板数据集试验中,该深度学习方法精确率高达98.6%,召回率92.2%,综合指标95.3%,平均交并比92.4%,与现有主流压板状态识别方法进行对比分析,结果显示本文方法具有更好的识别性能。 展开更多
关键词 扭角式压板 vgg Unet 图像分割 状态识别
在线阅读 下载PDF
基于改进VGG的轻量级香菇品质分类模型 被引量:1
14
作者 孙岩 朱凤武 +2 位作者 张宇清 张伟健 吴铖轩 《中国农机化学报》 北大核心 2025年第2期120-125,共6页
为实现对香菇品质的快速、准确分类,依据大棚种植环境下香菇图像的特性,对VGG16深度卷积网络进行轻量化改进,提出一种香菇品质分类检测模型。首先,对VGG16网络进行轻量化处理,利用均和池化层代替全连接层对特征图进行下采样;然后,在特... 为实现对香菇品质的快速、准确分类,依据大棚种植环境下香菇图像的特性,对VGG16深度卷积网络进行轻量化改进,提出一种香菇品质分类检测模型。首先,对VGG16网络进行轻量化处理,利用均和池化层代替全连接层对特征图进行下采样;然后,在特征提取网络中引入空洞融合分离卷积和通道注意力SE模块提升模型的识别精度;之后,利用数据增强方法将数据集扩充;最后,使用迁移学习训练得到香菇品质分类检测模型。在相同的试验条件下,与VGG16、GoogLeNet、VGG19、ResNet50、MobileNetv1五种深度卷积网络模型相比较。结果表明:该模型的综合性能最好,改进后的VGG16网络的识别准确率为95.5%;模型大小约为原始VGG16模型体量的10.9%;训练时间为原始VGG16模型的55.1%。 展开更多
关键词 香菇 品质分类 vgg16 SE模块 均和池化 空洞融合分离卷积
在线阅读 下载PDF
基于VGG16Net的人体跌倒识别研究 被引量:4
15
作者 罗海峰 佐研 《山西电子技术》 2022年第2期68-70,共3页
伴随着社会的不断发展,老年人口的逐渐增多,全球的大部分国家和地区也都逐步地迈入了老龄化。对于老年人造成最大伤害之一的问题就是跌倒。本文针对于人体跌倒识别进行了一定的研究,通过使用深度学习方法,搭建VGG16卷积神经网络,经过训... 伴随着社会的不断发展,老年人口的逐渐增多,全球的大部分国家和地区也都逐步地迈入了老龄化。对于老年人造成最大伤害之一的问题就是跌倒。本文针对于人体跌倒识别进行了一定的研究,通过使用深度学习方法,搭建VGG16卷积神经网络,经过训练后得到了较好的识别效果。 展开更多
关键词 跌倒识别 深度学习 vgg16net
在线阅读 下载PDF
基于SA改进VGG16算法的YB55包装机喷码图像识别
16
作者 张维琛 金姝彬 +3 位作者 吉鹏 王伟 刘昊喆 付志强 《印刷与数字媒体技术研究》 北大核心 2025年第2期38-46,共9页
为解决YB55包装机喷码过程中字符图像识别精度低问题,本研究采用全局阈值法,对喷码字符图像进行二值化处理。基于最小割算法,对二值化图像进行单一字符提取。利用VGG16算法,进行喷码字符库训练和喷码字符图像识别。通过对比Transformer... 为解决YB55包装机喷码过程中字符图像识别精度低问题,本研究采用全局阈值法,对喷码字符图像进行二值化处理。基于最小割算法,对二值化图像进行单一字符提取。利用VGG16算法,进行喷码字符库训练和喷码字符图像识别。通过对比Transformer算法、RCNN算法以及YOLOv4算法,对VGG16算法的准确性进行评价。利用模拟退火(SA)-VGG16算法,对VGG16算法识别错误的字符进行二次识别。结果表明,基于全阈值和最小割算法,可获得完整的单一喷码字符图像;当VGG16算法迭代27次时,训练模型的准确度可达0.987;利用VGG16算法,对不同喷码字符图像中字符的识别精度均大于0.95;相较于其他三种算法,VGG16算法准确率分别提升了7.87%、5.11%和4.44%,说明该算法可更精准预测喷码字符;该算法还可修正错误的识别,识别精度可达到0.84以上。本研究可为日后喷码设备智能化提供理论基础。 展开更多
关键词 全阈值法 最小割算法 vgg16算法 喷码字符识别
在线阅读 下载PDF
锐化处理和优化器对VGG16在印文种类鉴别中影响的研究 被引量:1
17
作者 张询 于彬 《中国人民公安大学学报(自然科学版)》 2025年第1期7-16,共10页
探讨了图像锐化处理和优化器选择对VGG16模型在印章印文种类鉴别任务中的影响。结合OpenCV进行图像预处理和锐化处理,评估了SGD与Adam优化器的性能表现。实验结果表明,图像锐化显著提升了模型的特征提取能力和分类精度,而SGD优化器在验... 探讨了图像锐化处理和优化器选择对VGG16模型在印章印文种类鉴别任务中的影响。结合OpenCV进行图像预处理和锐化处理,评估了SGD与Adam优化器的性能表现。实验结果表明,图像锐化显著提升了模型的特征提取能力和分类精度,而SGD优化器在验证集和测试集上的准确率均超过95%,且在收敛速度和稳定性方面优于Adam。因此,适当的图像锐化处理和优化器选择能够有效提高VGG16模型的分类性能,未来可通过扩展数据集和优化算法进一步提升印章印文识别的效率和鲁棒性。 展开更多
关键词 印章印文检验 卷积神经网络 OPENCV vgg16模型 图像锐化 优化器
在线阅读 下载PDF
基于改进U-Net模型的高纺锤形苹果树休眠期修剪点识别与定位方法
18
作者 刘龙 王宁 +4 位作者 王嘉成 曹宇恒 张凯 康峰 王亚雄 《智慧农业(中英文)》 2025年第3期120-130,共11页
[目的/意义]针对智能修剪机器人在复杂田间环境下对果树枝干识别精度不足及修剪点定位不准确的问题,提出一种基于图像和点云融合的深度学习方法,以实现休眠期高纺锤形苹果树剪枝点的自动识别与精准定位。[方法]首先,采用Realsense D435... [目的/意义]针对智能修剪机器人在复杂田间环境下对果树枝干识别精度不足及修剪点定位不准确的问题,提出一种基于图像和点云融合的深度学习方法,以实现休眠期高纺锤形苹果树剪枝点的自动识别与精准定位。[方法]首先,采用Realsense D435i相机采集苹果树RGB-D数据。其次,提出一种改进的U-Net模型,以VGG16(Visual Geometry Group 16)作为主干特征提取网络并在上采样阶段引入卷积块注意力模块CBAM(Convolutional Block Attention Module),实现对RGB图像中主干和一级枝的精确分割。然后,基于OpenCV的边缘检测与骨架提取算法,先提取一级枝连接点,再通过坐标平移在局部邻域内搜索潜在修剪点,并利用深度信息估算一级枝几何参数;同时,通过主干掩模与深度图融合,采用颜色筛选获取主干点云,并运用随机采样一致性算法进行圆柱拟合以估计主干直径。最后,基于智能修剪决策算法确定预测修剪点。[结果和讨论]改进的U-Net模型在枝干分割中的平均像素精度(Mean Pixel Accuracy,mPA)为95.52%,在背光和向光条件下表现出良好鲁棒性。相对于人工实测值,一级枝直径、间距和主干直径估计值的平均绝对误差分别为1.33、13.96和5.11 mm。此外,基于智能修剪决策系统识别修剪点的正确率为87.88%,单视角下平均处理时间约为4.2 s。[结论]本研究提出了一种高效且精准的苹果树剪枝点识别方法,为智能修剪机器人在现代农业中的应用提供了重要支持,进一步推动了农业生产向智能化和高效化方向发展。 展开更多
关键词 剪枝点识别 RGB-D U-net 直径估计 三维点云 vgg16 修剪机器人
在线阅读 下载PDF
基于改进VGG16网络模型的人脸疲劳检测方法
19
作者 黄尚安 阮太元 +2 位作者 周昊 蔡雄友 韩冰 《科学技术创新》 2025年第16期105-109,共5页
疲劳驾驶是道路交通安全中的重要隐患,人脸疲劳检测是帮助解决疲劳驾驶的重要方法。当前人脸疲劳检测众多方法存在模型训练复杂、精度低、耗时慢等问题,针对人脸疲劳面部特征的相关特点,提出在原VGG16网络模型基础上,重构模型相关网络层... 疲劳驾驶是道路交通安全中的重要隐患,人脸疲劳检测是帮助解决疲劳驾驶的重要方法。当前人脸疲劳检测众多方法存在模型训练复杂、精度低、耗时慢等问题,针对人脸疲劳面部特征的相关特点,提出在原VGG16网络模型基础上,重构模型相关网络层,并结合Lanczos插值算法增加“人脸疲劳检测感受野增强模块”,使用Focal Loss损失函数,深度提取人脸面部细节特征,再利用MeanShift聚类算法沿着密度梯度上升的特点,完成人脸疲劳检测,在公共数据集上的精度达到了94.3%。 展开更多
关键词 人脸疲劳检测 vgg16 Lanczos插值算法 Focal Loss损失函数 MeanShift聚类
在线阅读 下载PDF
基于深度神经网络VGG19的固有无序蛋白质无序区间预测
20
作者 王煜民 赵加祥 徐朋昌 《南开大学学报(自然科学版)》 北大核心 2025年第3期38-43,共6页
开发了一个基于VGG19的深度神经网络来对固有无序蛋白质进行预测.该深度神经网络通过使用来自数据集DM4229的4 229个蛋白质进行训练,训练后的神经网络在取自DIS1616数据集的166个蛋白质上进行测试,为方便比较,将该网络命名为DMvgg.另外... 开发了一个基于VGG19的深度神经网络来对固有无序蛋白质进行预测.该深度神经网络通过使用来自数据集DM4229的4 229个蛋白质进行训练,训练后的神经网络在取自DIS1616数据集的166个蛋白质上进行测试,为方便比较,将该网络命名为DMvgg.另外还在盲测试集R80和MXD494上对训练好的神经网络进行了测试,进一步验证模型的性能.仿真结果表明提出的深度神经网络模型可以有效预测固有无序蛋白质的无序区间,与其他的算法相比该模型更优. 展开更多
关键词 固有无序蛋白质 深度神经网络 vgg19
原文传递
上一页 1 2 27 下一页 到第
使用帮助 返回顶部