期刊文献+
共找到931篇文章
< 1 2 47 >
每页显示 20 50 100
Pavement Crack Extraction Based on Multi⁃scale Convolutional Neural Network
1
作者 ZHAN Biheng SONG Xiangyu +2 位作者 CHENG Jianrui QIAO Pan WANG Tengfei 《Transactions of Nanjing University of Aeronautics and Astronautics》 2025年第6期749-766,共18页
Cracks represent a significant hazard to pavement integrity,making their efficient and automated extraction essential for effective road health monitoring and maintenance.In response to this challenge,we propose a cra... Cracks represent a significant hazard to pavement integrity,making their efficient and automated extraction essential for effective road health monitoring and maintenance.In response to this challenge,we propose a crack automatic extraction network model that integrates multi⁃scale image features,thereby enhancing the model’s capability to capture crack characteristics and adaptation to complex scenarios.This model is based on the ResUNet architecture,makes modification to the convolutional layer of the model,proposes to construct multiple branches utilizing different convolution kernel sizes,and adds a atrous spatial pyramid pooling module within the intermediate layers.In this paper,comparative experiments on the performance of the basic model,ablation experiments,comparative experiments before and after data augmentation,and generalization verification experiments are conducted.Comparative experimental results indicate that the improved model exhibits superior detail processing capability at crack edges.The overall performance of the model,as measured by the F1⁃score,reaches 71.03%,reflecting a 2.1%improvement over the conventional ResUNet. 展开更多
关键词 road engineering neural networks multiscale convolution pavement cracks
在线阅读 下载PDF
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
2
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight Convolutional neural network Depthwise Dilated Separable Convolution Hierarchical multi-scale Feature Fusion
在线阅读 下载PDF
Pedestrian attribute classification with multi-scale and multi-label convolutional neural networks
3
作者 朱建清 Zeng Huanqiang +2 位作者 Zhang Yuzhao Zheng Lixin Cai Canhui 《High Technology Letters》 EI CAS 2018年第1期53-61,共9页
Pedestrian attribute classification from a pedestrian image captured in surveillance scenarios is challenging due to diverse clothing appearances,varied poses and different camera views. A multiscale and multi-label c... Pedestrian attribute classification from a pedestrian image captured in surveillance scenarios is challenging due to diverse clothing appearances,varied poses and different camera views. A multiscale and multi-label convolutional neural network( MSMLCNN) is proposed to predict multiple pedestrian attributes simultaneously. The pedestrian attribute classification problem is firstly transformed into a multi-label problem including multiple binary attributes needed to be classified. Then,the multi-label problem is solved by fully connecting all binary attributes to multi-scale features with logistic regression functions. Moreover,the multi-scale features are obtained by concatenating those featured maps produced from multiple pooling layers of the MSMLCNN at different scales. Extensive experiment results show that the proposed MSMLCNN outperforms state-of-the-art pedestrian attribute classification methods with a large margin. 展开更多
关键词 PEDESTRIAN ATTRIBUTE CLASSIFICATION multi-scale features multi-LABEL CLASSIFICATION convolutional neural network (CNN)
在线阅读 下载PDF
融合Multi-scale CNN和Bi-LSTM的人脸表情识别研究 被引量:3
4
作者 李军 李明 《北京联合大学学报》 CAS 2021年第1期35-39,44,共6页
为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scal... 为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scale CNN中通过不同尺度的卷积核可以提取到更加丰富的特征信息,并通过加入批标准化(BN)层与特征融合处理,从而加快网络的收敛速度,有利于特征信息的重利用,再将两者提取到的特征信息进行融合,最后将改进的正则化方法应用到目标函数中,减小网络复杂度和过拟合。在JAFFE和FER-2013公开数据集上进行实验,准确率分别达到了95.455%和74.115%,由此证明所提算法的有效性和先进性。 展开更多
关键词 多尺度卷积神经网络 双向长短期记忆 特征融合 批标准化层 正则化
在线阅读 下载PDF
基于改进Multi-Scale AlexNet的番茄叶部病害图像识别 被引量:80
5
作者 郭小清 范涛杰 舒欣 《农业工程学报》 EI CAS CSCD 北大核心 2019年第13期162-169,共8页
番茄同种病害在不同发病阶段表征差异明显,不同病害又表现出一定的相似性,传统模式识别方法不能体现病害病理表征的动态变化,实用性较差。针对该问题,基于卷积神经网络提出一种适用于移动平台的多尺度识别模型,并基于此模型开发了面向... 番茄同种病害在不同发病阶段表征差异明显,不同病害又表现出一定的相似性,传统模式识别方法不能体现病害病理表征的动态变化,实用性较差。针对该问题,基于卷积神经网络提出一种适用于移动平台的多尺度识别模型,并基于此模型开发了面向农业生产人员的番茄叶部病害图像识别系统。该文详细描述了AlexNet的结构,分析其不足,结合番茄病害叶片图像特点,去除局部响应归一化层、修改全连接层、设置不同尺度卷积核提取特征,设计了基于AlexNet的多感受野识别模型,并基于Android实现了使用此模型的番茄叶部病害图像识别系统。Multi-ScaleAlexNet模型运行所耗内存为29.9MB,比原始AlexNet的内存需求652MB降低了95.4%,该模型对番茄叶部病害及每种病害早中晚期的平均识别准确率达到92.7%,基于此模型的Andriod端识别系统在田间的识别率达到89.2%,能够满足生产实践中移动平台下的病害图像识别需求。研究结果可为基于卷积神经网络的作物病害图像识别提供参考,为作物病害的自动化识别和工程化应用参考。 展开更多
关键词 图像处理 病害 图像识别 算法 卷积神经网络 番茄病害 多尺度
在线阅读 下载PDF
基于YOLOv8改进的河道漂浮物检测算法
6
作者 王晓辉 吕方哲 +3 位作者 郭丰娟 宋可欣 刘为群 贾韫硕 《计算机工程与设计》 北大核心 2026年第1期64-72,共9页
为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构... 为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构。同时提出了Wise-Focaler-ShapeIoU损失函数,提升回归精度。实验结果表明,改进模型在公开数据集FloW-Img上mAP@0.5达0.893,mAP@0.5∶0.95达0.465,相较YOLOv8m分别提升了3.3%和2.8%,在map@0.5∶0.95上相较现有算法提升了1.4%,验证了其在河道漂浮物检测任务中的有效性和适应性。 展开更多
关键词 河道漂浮物检测 深度多分支模块 多尺度特征 YOLOv8 神经网络 深度学习 损失函数
在线阅读 下载PDF
基于脑电多尺度特征和图神经网络的紧急制动行为识别
7
作者 闫光辉 黄霄 常文文 《浙江大学学报(工学版)》 北大核心 2026年第2期404-414,共11页
现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接... 现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接测量矩阵构建脑功能网络,得到空间图结构信息;采用图卷积神经网络融合多尺度特征和空间图结构信息,实现对紧急制动脑电信号的分类识别.实验结果表明,所提模型在公开数据集上多被试的准确率均超过93.00%,最高达到95.60%;在单被试条件下,准确率均超过92.00%,最高达到98.94%.消融实验验证了所提模型各模块均对模型性能的提升具有显著贡献.在相同数据集下,所提模型比已有的6种脑电信号分类算法更具优势. 展开更多
关键词 紧急制动 脑电信号(EEG) 多尺度特征 脑功能网络 图卷积神经网络
在线阅读 下载PDF
基于多尺度卷积神经网络的连续手语精准识别研究
8
作者 陈昊飞 狄长安 《现代电子技术》 北大核心 2026年第3期19-22,共4页
为同时捕捉不同尺度的特征,精准区分前景手势和背景干扰,文中提出基于多尺度卷积神经网络的连续手语精准识别方法,旨在解决手势多样性带来的识别难题。利用主导手轨迹信息的手语语句分割算法,检测连续手语视频中的过渡动作,分割连续手... 为同时捕捉不同尺度的特征,精准区分前景手势和背景干扰,文中提出基于多尺度卷积神经网络的连续手语精准识别方法,旨在解决手势多样性带来的识别难题。利用主导手轨迹信息的手语语句分割算法,检测连续手语视频中的过渡动作,分割连续手语视频,得到多个复合视频段;多尺度卷积神经网络通过大小不同的卷积核,同时捕捉每个复合视频段不同尺度的特征,精准区分前景手势和背景干扰;利用多尺度空洞卷积池化金字塔模块融合各复合视频段的多尺度特征,充分利用手语动作的多尺度信息,增强网络对手势多样性的处理能力;采用Softmax分类器处理融合多尺度特征,得到各复合视频段的手语精准识别结果;按照时间先后顺序串联识别结果,得到最终的识别结果。实验结果证明,所提方法可精准识别连续手语,且在不同背景干扰情况下的连续手语识别的决定系数与1较为接近,即连续手语识别精度较高,可以有效解决连续手语识别中的难点。 展开更多
关键词 卷积神经网络 连续手语 精准识别 多尺度特征 语句分割 Softmax分类器
在线阅读 下载PDF
基于多尺度特征融合的航拍小目标检测
9
作者 冯志越 姚涛 贺文伟 《计算机工程与设计》 北大核心 2026年第1期171-179,共9页
针对无人机高空拍摄图像中目标较小且易受遮挡难以检测问题,提出一种基于YOLOv8改进的航拍小目标检测方法:TPO-YOLO。使用三重注意力模块处理特征图,提升上采样后特征图的代表性和区分度;设计多尺度特征融合网络,增强对密集小目标的检... 针对无人机高空拍摄图像中目标较小且易受遮挡难以检测问题,提出一种基于YOLOv8改进的航拍小目标检测方法:TPO-YOLO。使用三重注意力模块处理特征图,提升上采样后特征图的代表性和区分度;设计多尺度特征融合网络,增强对密集小目标的检测能力;使用全维动态卷积在主干与颈部之间搭建过渡层,提升模型对复杂场景的理解力,强化多尺度特征的融合。实验结果表明,相较于YOLOv8s,TPO-YOLO的mAP@0.5提升了8.3%,mAP@0.5∶0.95提升了5.6%,参数量降低64.8%,验证了该方法的有效性。 展开更多
关键词 无人机航拍 小目标检测 三重注意力 多尺度特征融合 全维动态卷积 卷积神经网络 深度学习
在线阅读 下载PDF
基于SVM-MultiCNN模型的视觉感知跌倒检测算法 被引量:7
10
作者 蔡文郁 郑雪晨 +1 位作者 郭嘉豪 阮智祥 《杭州电子科技大学学报(自然科学版)》 2020年第5期59-66,共8页
现有的基于视频的跌倒检测算法大多通过构建人体模型来检测跌倒,对类跌倒行为误判率较高且计算量过大,耗时过长。为此,提出一种基于SVM-MultiCNN模型的视觉感知跌倒检测算法。首先,从原始视频中提取人体关节点数据,从中提取跌倒特征送入... 现有的基于视频的跌倒检测算法大多通过构建人体模型来检测跌倒,对类跌倒行为误判率较高且计算量过大,耗时过长。为此,提出一种基于SVM-MultiCNN模型的视觉感知跌倒检测算法。首先,从原始视频中提取人体关节点数据,从中提取跌倒特征送入SVM分类器进行初次分类;然后,将判决为类跌倒行为的分类数据输入MultiCNN分类器进行跌倒行为的二次分类。实验结果表明:与SVM,CNN,MultiCNN模型相比,改进算法的检测准确度较高,达到96.8%,且单帧检测耗时缩短近一倍,提高了检测效率。 展开更多
关键词 跌倒检测 OpenPose 支持向量机 卷积神经网络 多尺度卷积神经网络
在线阅读 下载PDF
MAC-Net:基于多尺度特征交互的DR分割网络研究
11
作者 张颖 裴亚东 高维 《黑龙江科学》 2026年第2期19-23,共5页
为提高糖尿病性视网膜病变智能诊断的准确性,提出新型DR分割网络MAC-Net。该网络以AttU-Net网络为骨干,动态聚焦病灶区域,抑制背景噪声,通过自多尺度交互模块(SMIM)采用并行结构实现自多尺度特征交互,结合集合信息模块(CIM)融合跨尺度... 为提高糖尿病性视网膜病变智能诊断的准确性,提出新型DR分割网络MAC-Net。该网络以AttU-Net网络为骨干,动态聚焦病灶区域,抑制背景噪声,通过自多尺度交互模块(SMIM)采用并行结构实现自多尺度特征交互,结合集合信息模块(CIM)融合跨尺度特征增强语义,显著提升了多尺度病灶的捕捉能力。基于FGADR数据集实验表明,MAC-Net在分割精度上全面优于基线模型,验证了多尺度特征协同机制的有效性。 展开更多
关键词 糖尿病性视网膜病变分割 注意力U型网络 多尺度特征提取 跨尺度特征融合 神经网络
在线阅读 下载PDF
基于多智能体的大规模场景自适应协同算法研究
12
作者 刘伟 《计算机应用文摘》 2026年第1期88-90,共3页
随着大规模复杂系统中多智能体协作需求的不断增加,如何在动态、不确定、结构多样的环境中实现高效、稳定且自适应的协同控制已成为智能体研究的重要方向。文章围绕大规模场景下的多智能体系统(Multi-Agent System,MAS),提出了一种面向... 随着大规模复杂系统中多智能体协作需求的不断增加,如何在动态、不确定、结构多样的环境中实现高效、稳定且自适应的协同控制已成为智能体研究的重要方向。文章围绕大规模场景下的多智能体系统(Multi-Agent System,MAS),提出了一种面向环境变化、自主学习与策略共享的自适应协同算法框架。该框架融合分布式强化学习、图神经网络(GNN)及层次化策略规划,以实现对复杂任务的快速响应与鲁棒协作。实验结果表明,所提算法在通信开销、收敛速度与任务完成质量方面均具有显著优势,可为智能制造、工厂车间协同调度、工业无人集群作业、产线能源优化等制造领域核心场景提供有效参考。 展开更多
关键词 多智能体系统 自适应协同 大规模场景 强化学习 图神经网络
在线阅读 下载PDF
基于多尺度时空特征的人体运动预测
13
作者 贺吉鹏 刘银华 《自动化与仪表》 2026年第1期36-43,共8页
人体运动预测在人机交互、医疗与运动分析等领域具有广泛应用。然而,由于动作的复杂性与动态变化特性,实现高效且准确的动作预测仍面临诸多挑战。传统方法多局限于单一尺度下的特征提取,难以全面捕捉动作的复杂结构与演化规律。该文提... 人体运动预测在人机交互、医疗与运动分析等领域具有广泛应用。然而,由于动作的复杂性与动态变化特性,实现高效且准确的动作预测仍面临诸多挑战。传统方法多局限于单一尺度下的特征提取,难以全面捕捉动作的复杂结构与演化规律。该文提出一种基于多尺度时空特征的建模方法,通过在时间域引入多尺度的LSTM捕捉不同时间步的动态变化,并在空间域构建人体多尺度图结构,分层提取身体部位间的协同信息,这使模型能够提取身体部位之间的协作关系。并引入差分算子引导模型学习更丰富的动态变化,结合图局部增强模块提升对局部空间结构的建模能力。在Human3.6M和CMU Mocap数据集上的实验结果证明了所提出方法在短期与长期动作预测中的优越性与鲁棒性。 展开更多
关键词 人体运动预测 深度学习 多尺度时空建模 图神经网络
在线阅读 下载PDF
基于Multi-CNN空间特征提取的高光谱遥感影像分类 被引量:8
14
作者 宋海峰 杨巍巍 《测绘工程》 CSCD 2019年第6期10-16,共7页
在遥感影像处理领域,对高光谱遥感影像分类处理的需求日益增长,由于大量的高光谱遥感影像训练样本获得较难,使得卷积神经网络不适合应用到高光谱遥感影像分类中。针对此问题,文中提出一种基于Multi-CNN空间特征提取的高光谱遥感影像分... 在遥感影像处理领域,对高光谱遥感影像分类处理的需求日益增长,由于大量的高光谱遥感影像训练样本获得较难,使得卷积神经网络不适合应用到高光谱遥感影像分类中。针对此问题,文中提出一种基于Multi-CNN空间特征提取的高光谱遥感影像分类模型,该模型将原始高光谱遥感影像作为输入,最终的分类结果作为输出;自动从不同的尺度提取输入数据的空间特征;解决获得大量有标记高光谱遥感影像训练样本的棘手问题;通过伊春凉水林场数据集上的实验结果表明,文中建立的分类模型,在分类正确率上优于其他分类模型,分类正确率达到92.31%。 展开更多
关键词 多尺度 卷积神经网络 空间特征 高光谱林业遥感影像分类
在线阅读 下载PDF
基于MSCNN-GRU神经网络补全测井曲线和可解释性的智能岩性识别 被引量:2
15
作者 王婷婷 王振豪 +2 位作者 赵万春 蔡萌 史晓东 《石油地球物理勘探》 北大核心 2025年第1期1-11,共11页
针对传统岩性识别方法在处理测井曲线缺失、准确性以及模型可解释性等方面的不足,提出了一种基于MSCNN-GRU神经网络补全测井曲线和Optuna超参数优化的XGBoost模型的可解释性的岩性识别方法。首先,针对测井曲线在特定层段丢失或失真的问... 针对传统岩性识别方法在处理测井曲线缺失、准确性以及模型可解释性等方面的不足,提出了一种基于MSCNN-GRU神经网络补全测井曲线和Optuna超参数优化的XGBoost模型的可解释性的岩性识别方法。首先,针对测井曲线在特定层段丢失或失真的问题,引入了基于多尺度卷积神经网络(MSCNN)与门控循环单元(GRU)神经网络相结合的曲线重构方法,为后续的岩性识别提供了准确的数据基础;其次,利用小波包自适应阈值方法对数据进行去噪和归一化处理,以减少噪声对岩性识别的影响;然后,采用Optuna框架确定XGBoost算法的超参数,建立了高效的岩性识别模型;最后,利用SHAP可解释性方法对XGBoost模型进行归因分析,揭示了不同特征对于岩性识别的贡献度,提升了模型的可解释性。结果表明,Optuna-XGBoost模型综合岩性识别准确率为79.91%,分别高于支持向量机(SVM)、朴素贝叶斯、随机森林三种神经网络模型24.89%、12.45%、6.33%。基于Optuna-XGBoost模型的SHAP可解释性的岩性识别方法具有更高的准确性和可解释性,能够更好地满足实际生产需要。 展开更多
关键词 岩性识别 多尺度卷积神经网络 门控循环单元神经网络 XGBoost 超参数优化 可解释性
在线阅读 下载PDF
基于WAAP-YOLO的玉米伴生杂草检测模型 被引量:1
16
作者 孟志永 贾雅微 +4 位作者 张秀清 倪永婧 张明 武琪 吴晨曦 《河北科技大学学报》 北大核心 2025年第4期386-394,共9页
为解决玉米伴生杂草存在样本形态各异、密集遮挡、背景复杂、尺度不一等问题,提出了目标检测模型WAAP-YOLO。首先,改进主干部分,将部分卷积替换为小波池化卷积,有效避免了混叠伪影现象;其次,引入聚合注意力机制构建C2f-AA模块,提升了模... 为解决玉米伴生杂草存在样本形态各异、密集遮挡、背景复杂、尺度不一等问题,提出了目标检测模型WAAP-YOLO。首先,改进主干部分,将部分卷积替换为小波池化卷积,有效避免了混叠伪影现象;其次,引入聚合注意力机制构建C2f-AA模块,提升了模型在复杂背景下对杂草特征的提取能力;最后,以ASF-P2-Net替换原始neck网络,通过尺度序列融合模块引入P2检测头,降低模型复杂度,显著提升小目标检测效果。结果表明,WAAP-YOLO检测算法的mAP@0.5指标、mAP@0.5∶0.95指标、F1、参数量分别为97.2%、85.8%、94.0%、2.1×10^(6),优于YOLOv5s、YOLOv8n、YOLOv10n等常见目标检测模型。所提模型可显著提升玉米田间杂草的精准识别能力,可为促进种植业的智能化和可持续发展提供参考。 展开更多
关键词 计算机神经网络 杂草识别 小波池化 注意力机制 多尺度融合
在线阅读 下载PDF
基于扩展局部二值模式的多尺度人脸表情识别方法 被引量:1
17
作者 胡黄水 戚星烁 +1 位作者 王出航 王玲 《吉林大学学报(理学版)》 北大核心 2025年第5期1427-1436,共10页
针对人脸表情识别在复杂环境下姿态和光照鲁棒性差的问题,提出一种融合扩展局部二值模式和多尺度网络结构的人脸表情识别方法.该方法通过扩展传统局部二值模式的感受野并增强像素间的空间联系,减少光照对人脸表情识别的噪声干扰;通过将... 针对人脸表情识别在复杂环境下姿态和光照鲁棒性差的问题,提出一种融合扩展局部二值模式和多尺度网络结构的人脸表情识别方法.该方法通过扩展传统局部二值模式的感受野并增强像素间的空间联系,减少光照对人脸表情识别的噪声干扰;通过将特征图在通道维度均匀分为若干子集并利用不同数量相同卷积块的方式提取特征图的多尺度特征,有效处理人脸姿态变化.在数据集Fer2013和RAF-DB上的实验结果表明,该方法可有效提高人脸表情识别的准确率和鲁棒性,为复杂环境下的人脸表情识别提供了有效解决方案. 展开更多
关键词 人脸表情识别 局部二值模式 多尺度网络 卷积神经网络
在线阅读 下载PDF
基于单目RGB图像的三维手部姿态估计方法 被引量:1
18
作者 杨冰 徐楚阳 +1 位作者 姚金良 向学勤 《浙江大学学报(工学版)》 北大核心 2025年第1期18-26,共9页
现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度... 现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度特征编码器来融合多尺度特征,强化生成手部姿态;引入图卷积残差模块来挖掘网格顶点间的显式语义联系.为了验证所提方法的有效性,在数据集FreiHAND、HO3D V2和HO3D V3上开展训练及评估实验.结果表明,所提方法的回归精度优于现有先进方法,在FreiHAND、HO3D V2、HO3D V3上的普鲁克对齐-平均关节点误差分别为5.8、10.0、10.5 mm. 展开更多
关键词 三维手部姿态估计 TRANSFORMER 可变形注意力机制 交错更新多尺度特征编码器 神经网络
在线阅读 下载PDF
基于IPOA-MSCNN-BiLSTM-Attention模型的刀具磨损状态识别 被引量:1
19
作者 杨焕峥 崔业梅 +1 位作者 薛洪惠 徐玲 《组合机床与自动化加工技术》 北大核心 2025年第7期158-163,共6页
刀具状态监测直接影响产品加工质量,为了提高刀具磨损状态识别的准确性,构建了IPOA-MSCNN-BiLSTM-Attention模型。首先,采用多尺度卷积神经网络(MSCNN)和双向长短时记忆网络(BiLSTM)来学习数据的时空特征;其次,引入注意力机制(Attention... 刀具状态监测直接影响产品加工质量,为了提高刀具磨损状态识别的准确性,构建了IPOA-MSCNN-BiLSTM-Attention模型。首先,采用多尺度卷积神经网络(MSCNN)和双向长短时记忆网络(BiLSTM)来学习数据的时空特征;其次,引入注意力机制(Attention)以增强对关键信息的关注度;再次,提出了一种改进的鹈鹕优化算法(IPOA),用于优化模型多尺度卷积神经网络的参数。该算法结合自适应惯性权重因子、柯西变异和麻雀警戒机制策略,在CEC2005至CEC2022的众多函数性能测试中综合表现优于传统POA等5种算法;最后,在工业控制计算机(IPC)上运行了模型。结果表明,该模型在刀具磨损状态识别方面表现出较高的识别精度,可提高加工安全与生产效率。 展开更多
关键词 刀具磨损 状态监测 改进的鹈鹕优化算法 多尺度卷积神经网络 双向长短时记忆网络
在线阅读 下载PDF
基于MSCNN-BiGRU-Attention的短期电力负荷预测 被引量:1
20
作者 李科 潘庭龙 许德智 《中国电力》 北大核心 2025年第6期10-18,共9页
为解决电力负荷关键特征难以提取的问题,提出一种结合多尺度卷积神经网络-双向门控循环单元-注意力机制(multi-scale convolutional neural network-bi-directional gated recurrent unit-Attention,MSCNN-BiGRU-Attention)的组合模型... 为解决电力负荷关键特征难以提取的问题,提出一种结合多尺度卷积神经网络-双向门控循环单元-注意力机制(multi-scale convolutional neural network-bi-directional gated recurrent unit-Attention,MSCNN-BiGRU-Attention)的组合模型进行短期电力负荷预测。首先,通过Spearman相关系数分析电力负荷数据集的相关性,筛选出相关性较高的特征,构建电力负荷数据集;其次,将数据输入到多尺度卷积神经网络(multi-scale convolutional neural network,MSCNN),对电力负荷数据进行多尺度的时序提取;然后,将提取后的时序特征输入到双向门控循环单元(bi-directional gated recurrent unit,BiGRU)神经网络进行时序预测,并通过注意力(Attention)机制对时序特征进行过滤和筛选;最后,通过全连接层整合输出预测值。以澳大利亚某地区3年的多维电力负荷数据作为数据集,并设置5种对照组模型。同时选用国内南方某地区2年的多维电力负荷数据作为模型验证数据集。结果表明,相较其他模型,MSCNN-BiGRU-Attention组合模型能够取得更好的预测效果,有效解决区域级电力负荷关键特征难以提取的问题。 展开更多
关键词 电力负荷预测 多尺度卷积神经网络 双向门控循环单元 注意力机制 深度学习 Spearman相关系数
在线阅读 下载PDF
上一页 1 2 47 下一页 到第
使用帮助 返回顶部