期刊文献+
共找到954篇文章
< 1 2 48 >
每页显示 20 50 100
Pavement Crack Extraction Based on Multi⁃scale Convolutional Neural Network
1
作者 ZHAN Biheng SONG Xiangyu +2 位作者 CHENG Jianrui QIAO Pan WANG Tengfei 《Transactions of Nanjing University of Aeronautics and Astronautics》 2025年第6期749-766,共18页
Cracks represent a significant hazard to pavement integrity,making their efficient and automated extraction essential for effective road health monitoring and maintenance.In response to this challenge,we propose a cra... Cracks represent a significant hazard to pavement integrity,making their efficient and automated extraction essential for effective road health monitoring and maintenance.In response to this challenge,we propose a crack automatic extraction network model that integrates multi⁃scale image features,thereby enhancing the model’s capability to capture crack characteristics and adaptation to complex scenarios.This model is based on the ResUNet architecture,makes modification to the convolutional layer of the model,proposes to construct multiple branches utilizing different convolution kernel sizes,and adds a atrous spatial pyramid pooling module within the intermediate layers.In this paper,comparative experiments on the performance of the basic model,ablation experiments,comparative experiments before and after data augmentation,and generalization verification experiments are conducted.Comparative experimental results indicate that the improved model exhibits superior detail processing capability at crack edges.The overall performance of the model,as measured by the F1⁃score,reaches 71.03%,reflecting a 2.1%improvement over the conventional ResUNet. 展开更多
关键词 road engineering neural networks multiscale convolution pavement cracks
在线阅读 下载PDF
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
2
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight Convolutional neural network Depthwise Dilated Separable Convolution Hierarchical multi-scale Feature Fusion
在线阅读 下载PDF
Pedestrian attribute classification with multi-scale and multi-label convolutional neural networks
3
作者 朱建清 Zeng Huanqiang +2 位作者 Zhang Yuzhao Zheng Lixin Cai Canhui 《High Technology Letters》 EI CAS 2018年第1期53-61,共9页
Pedestrian attribute classification from a pedestrian image captured in surveillance scenarios is challenging due to diverse clothing appearances,varied poses and different camera views. A multiscale and multi-label c... Pedestrian attribute classification from a pedestrian image captured in surveillance scenarios is challenging due to diverse clothing appearances,varied poses and different camera views. A multiscale and multi-label convolutional neural network( MSMLCNN) is proposed to predict multiple pedestrian attributes simultaneously. The pedestrian attribute classification problem is firstly transformed into a multi-label problem including multiple binary attributes needed to be classified. Then,the multi-label problem is solved by fully connecting all binary attributes to multi-scale features with logistic regression functions. Moreover,the multi-scale features are obtained by concatenating those featured maps produced from multiple pooling layers of the MSMLCNN at different scales. Extensive experiment results show that the proposed MSMLCNN outperforms state-of-the-art pedestrian attribute classification methods with a large margin. 展开更多
关键词 PEDESTRIAN ATTRIBUTE CLASSIFICATION multi-scale features multi-LABEL CLASSIFICATION convolutional neural network (CNN)
在线阅读 下载PDF
融合Multi-scale CNN和Bi-LSTM的人脸表情识别研究 被引量:3
4
作者 李军 李明 《北京联合大学学报》 CAS 2021年第1期35-39,44,共6页
为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scal... 为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scale CNN中通过不同尺度的卷积核可以提取到更加丰富的特征信息,并通过加入批标准化(BN)层与特征融合处理,从而加快网络的收敛速度,有利于特征信息的重利用,再将两者提取到的特征信息进行融合,最后将改进的正则化方法应用到目标函数中,减小网络复杂度和过拟合。在JAFFE和FER-2013公开数据集上进行实验,准确率分别达到了95.455%和74.115%,由此证明所提算法的有效性和先进性。 展开更多
关键词 多尺度卷积神经网络 双向长短期记忆 特征融合 批标准化层 正则化
在线阅读 下载PDF
基于改进Multi-Scale AlexNet的番茄叶部病害图像识别 被引量:81
5
作者 郭小清 范涛杰 舒欣 《农业工程学报》 EI CAS CSCD 北大核心 2019年第13期162-169,共8页
番茄同种病害在不同发病阶段表征差异明显,不同病害又表现出一定的相似性,传统模式识别方法不能体现病害病理表征的动态变化,实用性较差。针对该问题,基于卷积神经网络提出一种适用于移动平台的多尺度识别模型,并基于此模型开发了面向... 番茄同种病害在不同发病阶段表征差异明显,不同病害又表现出一定的相似性,传统模式识别方法不能体现病害病理表征的动态变化,实用性较差。针对该问题,基于卷积神经网络提出一种适用于移动平台的多尺度识别模型,并基于此模型开发了面向农业生产人员的番茄叶部病害图像识别系统。该文详细描述了AlexNet的结构,分析其不足,结合番茄病害叶片图像特点,去除局部响应归一化层、修改全连接层、设置不同尺度卷积核提取特征,设计了基于AlexNet的多感受野识别模型,并基于Android实现了使用此模型的番茄叶部病害图像识别系统。Multi-ScaleAlexNet模型运行所耗内存为29.9MB,比原始AlexNet的内存需求652MB降低了95.4%,该模型对番茄叶部病害及每种病害早中晚期的平均识别准确率达到92.7%,基于此模型的Andriod端识别系统在田间的识别率达到89.2%,能够满足生产实践中移动平台下的病害图像识别需求。研究结果可为基于卷积神经网络的作物病害图像识别提供参考,为作物病害的自动化识别和工程化应用参考。 展开更多
关键词 图像处理 病害 图像识别 算法 卷积神经网络 番茄病害 多尺度
在线阅读 下载PDF
基于多尺度特征融合的并行神经网络剩余寿命预测方法
6
作者 余萍 王浩年 曹洁 《太阳能学报》 北大核心 2026年第1期785-796,共12页
为更准确预测锂电池的剩余使用寿命(RUL),提高其可靠性,确保稳定运行,提出一种基于多尺度特征融合的并行神经网络预测方法。首先,利用不同尺度的时间卷积网络(TCN)提取锂电池的多尺度特征,从而增强局部和全局特征的提取能力;接着,引入... 为更准确预测锂电池的剩余使用寿命(RUL),提高其可靠性,确保稳定运行,提出一种基于多尺度特征融合的并行神经网络预测方法。首先,利用不同尺度的时间卷积网络(TCN)提取锂电池的多尺度特征,从而增强局部和全局特征的提取能力;接着,引入交叉注意力机制对特征进行筛选与融合,以提取关键的退化信息;随后,构建并行的Bi-LSTM和Bi-GRU网络,以学习退化特征并建立时间尺度上的长期依赖关系,最终实现RUL预测。通过美国航空航天局(NASA)和CALCE锂电池数据集验证,证明了所提方法在不同背景下的有效性。 展开更多
关键词 多尺度特征融合 时间卷积网络 交叉注意力机制 锂电池 剩余使用寿命预测 并行神经网络
原文传递
基于轻量级卷积神经网络的岩石图像岩性识别方法
7
作者 刘善伟 马志伟 +1 位作者 魏世清 魏忠勇 《地质科技通报》 北大核心 2026年第1期360-370,共11页
岩性识别是油气勘探和开发过程中的重要环节,对于油气勘探定位、储层评价以及储层模型建立具有重要的指导意义。但传统的人工岩性识别方法耗时耗力,经典的深度学习模型虽然识别精度高,但模型的参数量较大,为了提高模型识别精度,同时降... 岩性识别是油气勘探和开发过程中的重要环节,对于油气勘探定位、储层评价以及储层模型建立具有重要的指导意义。但传统的人工岩性识别方法耗时耗力,经典的深度学习模型虽然识别精度高,但模型的参数量较大,为了提高模型识别精度,同时降低模型的参数量,使模型适用于岩性实时识别工作,首先收集了白云岩、砂岩等8种岩石共3016张岩石图像构建岩性识别数据集,然后以轻量型卷积神经网络ShuffleNetV2模型为基础网络,提出了一种Rock-ShuffleNetV2岩性识别模型(RSHFNet模型)。模型中将混合注意力机制模块(convolutional block attention module,简称CBAM)以及多尺度特征融合模块(multi-scale feature fusion module,简称MSF)融入基础网络中以加强模型的特征提取能力,提升模型识别性能,并优化模型中ShuffleNetV2单元的堆叠次数以减少模型参数量。结果表明:与基础模型相比,RSHFNet模型的准确率达到了87.21%,提高了4.98%;同时,模型参数量与浮点运算量分别降低到了869702个,0.93×108,分别是基础模型的0.67,0.63倍,模型参数量明显降低;并且RSHFNet模型的综合性能明显优于现有的卷积神经网络。RSHFNet岩性识别模型具有较高的识别精度和较好的泛化能力,同时更加的轻量化,为实现野外实时的岩性识别工作提供了新思路。 展开更多
关键词 岩性识别 ShuffleNetV2网络 混合注意力机制模块 多尺度特征融合模块 卷积神经网络
在线阅读 下载PDF
基于YOLOv8改进的河道漂浮物检测算法
8
作者 王晓辉 吕方哲 +3 位作者 郭丰娟 宋可欣 刘为群 贾韫硕 《计算机工程与设计》 北大核心 2026年第1期64-72,共9页
为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构... 为解决无人水面艇在清理河道垃圾过程中面临的挑战,如目标尺寸多样、形状复杂、光照变化多端以及水面反射干扰等问题,提出一种基于YOLOv8m的改进模型。通过引入RFCBAMConv模块增强多尺度特征提取能力,采用C2f_DeepDBB模块优化模型结构。同时提出了Wise-Focaler-ShapeIoU损失函数,提升回归精度。实验结果表明,改进模型在公开数据集FloW-Img上mAP@0.5达0.893,mAP@0.5∶0.95达0.465,相较YOLOv8m分别提升了3.3%和2.8%,在map@0.5∶0.95上相较现有算法提升了1.4%,验证了其在河道漂浮物检测任务中的有效性和适应性。 展开更多
关键词 河道漂浮物检测 深度多分支模块 多尺度特征 YOLOv8 神经网络 深度学习 损失函数
在线阅读 下载PDF
基于改进随机森林算法与多尺度卷积神经网络的频率选择表面敏捷设计
9
作者 王义富 廖广昕 +7 位作者 李华萍 任燕飞 黄浩然 蒋伟 郑沈理 郭嘉诚 杜力 杜源 《通信学报》 北大核心 2026年第1期267-278,共12页
针对传统频率选择表面(FSS)结合神经网络的设计存在预测偏差大、数据集成本高的问题,提出基于改进随机森林(RF)与多尺度卷积神经网络(MS-CNN)的FSS敏捷设计框架。改进RF通过电磁特性分裂准则与多特征交互评估,优化采样策略,构建高质量... 针对传统频率选择表面(FSS)结合神经网络的设计存在预测偏差大、数据集成本高的问题,提出基于改进随机森林(RF)与多尺度卷积神经网络(MS-CNN)的FSS敏捷设计框架。改进RF通过电磁特性分裂准则与多特征交互评估,优化采样策略,构建高质量数据集,达到均方误差(MSE)<2.0的预测精度仅需1157组样本,较传统采样减少61%;MS-CNN采用3×1、5×1、7×1多尺度卷积核提取电磁响应特征,结合频率梯度损失函数,0°/70°入射角下TE/TM双极化S_(21)曲线预测MSE低至2.2。以MS-CNN为预测代理,结合粒子群优化(PSO)的逆向设计,输出满足25~33 GHz频段S_(21)≥-1.5 dB、0°~70°入射角稳定、双极化适配的FSS参数,经HFSS验证达标,同时在20~28 GHz验证了模型泛化性。 展开更多
关键词 频率选择表面 随机森林算法 多尺度卷积神经网络 粒子群优化
在线阅读 下载PDF
用于土地覆盖分割的多路径多尺度注意力网络
10
作者 李燕 樊新宇 陈芹 《计算机工程与科学》 北大核心 2026年第1期108-118,共11页
近年来,Transformer及其变种在图像识别领域已取得显著进展,但其在像素级分割任务中仍面临挑战,主要原因在于它们对局部偏差的处理不够显式和有效。对此,提出了一种名为DMANet的多路径多尺度注意力网络。该网络在编码阶段结合了卷积神... 近年来,Transformer及其变种在图像识别领域已取得显著进展,但其在像素级分割任务中仍面临挑战,主要原因在于它们对局部偏差的处理不够显式和有效。对此,提出了一种名为DMANet的多路径多尺度注意力网络。该网络在编码阶段结合了卷积神经网络和Transformer的优势,能够同时捕获图像的精细局部信息和广泛的全局上下文信息,有效地提升特征提取能力。提出的交互式双分支结构加强了对特征的整合能力,提高网络模型在密集预测任务中的性能。在解码阶段实施跨层特征融合,增强DMANet对复杂目标的识别能力。通过在Potsdam,GID-15和L8 SPARCS数据集上进行测试,DMANet展示了其在复杂土地覆盖分割任务中的优异性能及广泛适用性。 展开更多
关键词 Transformer结构 语义分割 多路径多尺度 卷积神经网络 土地覆盖
在线阅读 下载PDF
基于脑电多尺度特征和图神经网络的紧急制动行为识别
11
作者 闫光辉 黄霄 常文文 《浙江大学学报(工学版)》 北大核心 2026年第2期404-414,共11页
现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接... 现有技术主要依赖传统的时频域特征,对脑活动空间域特征的研究不足.为了实现对紧急制动意图和正常驾驶的分类识别,提出融合多尺度卷积、脑功能网络和图卷积神经网络的新模型.利用多尺度卷积提取时频域融合的多尺度特征;基于脑功能连接测量矩阵构建脑功能网络,得到空间图结构信息;采用图卷积神经网络融合多尺度特征和空间图结构信息,实现对紧急制动脑电信号的分类识别.实验结果表明,所提模型在公开数据集上多被试的准确率均超过93.00%,最高达到95.60%;在单被试条件下,准确率均超过92.00%,最高达到98.94%.消融实验验证了所提模型各模块均对模型性能的提升具有显著贡献.在相同数据集下,所提模型比已有的6种脑电信号分类算法更具优势. 展开更多
关键词 紧急制动 脑电信号(EEG) 多尺度特征 脑功能网络 图卷积神经网络
在线阅读 下载PDF
基于多尺度卷积-双向门控混合注意力的滚动轴承故障诊断
12
作者 贺颖 张旭岐 +1 位作者 李孟龙 浩泽 《微特电机》 2026年第2期89-96,共8页
针对传统滚动轴承故障诊断方法自适应特征提取能力弱和诊断准确率低的问题,提出一种融合混合注意力机制的多尺度卷积神经网络与双向门控循环单元相结合的深度学习故障诊断方法。该方法使用不同尺寸的卷积核捕捉振动信号的多尺度特征,采... 针对传统滚动轴承故障诊断方法自适应特征提取能力弱和诊断准确率低的问题,提出一种融合混合注意力机制的多尺度卷积神经网络与双向门控循环单元相结合的深度学习故障诊断方法。该方法使用不同尺寸的卷积核捕捉振动信号的多尺度特征,采用混合注意力机制分配特征序列中各部分的权重,以增强特征表示能力,由双向门控循环单元提取特征的前后关系,实现信息的逐层传递。通过不同的轴承数据集对该方法进行实验验证。结果表明,该方法的准确率达到了99.86%,验证了本文提出的轴承故障诊断方法具有显著的可行性和优越性。 展开更多
关键词 滚动轴承 故障诊断 多尺度卷积神经网络 混合注意力机制 双向门控循环单元
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的小目标检测
13
作者 方岩 袁国宏 +1 位作者 孙正宝 岳昆 《云南大学学报(自然科学版)》 北大核心 2026年第1期36-44,共9页
针对目标检测中存在的小目标特征信息提取不足、背景噪声干扰和定位困难导致漏检的问题,提出基于多尺度特征融合和注意力机制的小目标检测模型YOLOv7-BAMFF.首先,将包含丰富语义信息的Conv2层加入特征融合过程,提取更细粒度的低层特征,... 针对目标检测中存在的小目标特征信息提取不足、背景噪声干扰和定位困难导致漏检的问题,提出基于多尺度特征融合和注意力机制的小目标检测模型YOLOv7-BAMFF.首先,将包含丰富语义信息的Conv2层加入特征融合过程,提取更细粒度的低层特征,并在多尺度特征融合过程中进行跨尺度的跳跃连接和上下文信息自适应加权融合;然后,在特征重提取和优化过程中引入改进的协同注意力机制,抑制复杂背景噪声干扰、增强对小目标的关注;最后,通过优化模型的定位损失函数以提高对小目标的定位精度、并增加小目标检测头,从而提升小目标检测能力.在PASCAL VOC和VisDrone2019数据集上的实验结果表明,提出方法的平均检测精度分别从基线方法YOLOv7的82.1%和43.8%提升至85.4%和50.4%,且优于现有主流检测方法. 展开更多
关键词 小目标检测 多尺度特征融合 协同注意力机制 上下文信息 卷积神经网络
在线阅读 下载PDF
基于MSCNN和LiPFormer的锂电池剩余使用寿命预测方法
14
作者 胡陈艳 于丽娅 +2 位作者 李传江 李孝斌 徐兆 《中国测试》 北大核心 2026年第1期35-46,77,共13页
锂离子电池作为航空航天装备和无人系统的核心能源组件,对其剩余使用寿命(Remaining useful life,RUL)进行精准预测已成为设备健康管理的重要课题。针对锂离子电池容量退化过程中存在的原始数据噪声干扰、多物理尺度和长时间依赖等特性... 锂离子电池作为航空航天装备和无人系统的核心能源组件,对其剩余使用寿命(Remaining useful life,RUL)进行精准预测已成为设备健康管理的重要课题。针对锂离子电池容量退化过程中存在的原始数据噪声干扰、多物理尺度和长时间依赖等特性导致的预测挑战,提出一种融合多尺度卷积神经网络(Multi-Scale Convolutional Neural Network,MSCNN)和轻量化补丁变压器(Light Patch-wise Transformer,LiPFormer)的锂离子电池RUL预测方法。首先,针对噪声干扰问题,引入去噪自编码器(Denoising Autoencoders,DAE)对原始容量退化序列进行噪声抑制与特征重建,提升数据质量并降低异常波动对模型的影响。然后,运用MSCNN对时间序列数据进行多尺度特征提取,充分挖掘不同尺度下的特征信息。设计LiPFormer模块并利用层级化补丁划分策略,在降低计算复杂度的同时,有效建模容量衰减过程中的全局时序依赖关系,融合MSCNN与LiPFormer所提取的特征,以捕捉数据中的空间与时间特征。最后,将联合特征输入全连接层,实现RUL的回归预测。通过在NASA和CALCE电池退化数据集上的大量实验,证明了基于MSCNN和LiPFormer融合的锂电池RUL预测模型具有有效的预测性能,相比其他模型具有更好的鲁棒性和预测精度。 展开更多
关键词 锂离子电池 剩余使用寿命预测 去噪自编码器 多尺度卷积神经网络 TRANSFORMER
在线阅读 下载PDF
基于多尺度卷积神经网络的连续手语精准识别研究
15
作者 陈昊飞 狄长安 《现代电子技术》 北大核心 2026年第3期19-22,共4页
为同时捕捉不同尺度的特征,精准区分前景手势和背景干扰,文中提出基于多尺度卷积神经网络的连续手语精准识别方法,旨在解决手势多样性带来的识别难题。利用主导手轨迹信息的手语语句分割算法,检测连续手语视频中的过渡动作,分割连续手... 为同时捕捉不同尺度的特征,精准区分前景手势和背景干扰,文中提出基于多尺度卷积神经网络的连续手语精准识别方法,旨在解决手势多样性带来的识别难题。利用主导手轨迹信息的手语语句分割算法,检测连续手语视频中的过渡动作,分割连续手语视频,得到多个复合视频段;多尺度卷积神经网络通过大小不同的卷积核,同时捕捉每个复合视频段不同尺度的特征,精准区分前景手势和背景干扰;利用多尺度空洞卷积池化金字塔模块融合各复合视频段的多尺度特征,充分利用手语动作的多尺度信息,增强网络对手势多样性的处理能力;采用Softmax分类器处理融合多尺度特征,得到各复合视频段的手语精准识别结果;按照时间先后顺序串联识别结果,得到最终的识别结果。实验结果证明,所提方法可精准识别连续手语,且在不同背景干扰情况下的连续手语识别的决定系数与1较为接近,即连续手语识别精度较高,可以有效解决连续手语识别中的难点。 展开更多
关键词 卷积神经网络 连续手语 精准识别 多尺度特征 语句分割 Softmax分类器
在线阅读 下载PDF
融合CNN与高低频聚焦注意力的TOFD焊缝缺陷识别方法
16
作者 张俊辉 唐东林 +2 位作者 王平杰 胡远遥 李渊博 《工程设计学报》 北大核心 2026年第1期44-55,共12页
针对TOFD(time of flight diffraction,衍射时差法)超声检测技术中焊缝缺陷图像受高噪声和干扰条纹影响的问题,以及当前深度学习模型在处理此类图像时面临的特征信息丢失与计算效率失衡的挑战,创新性地提出了一种融合卷积神经网络(convo... 针对TOFD(time of flight diffraction,衍射时差法)超声检测技术中焊缝缺陷图像受高噪声和干扰条纹影响的问题,以及当前深度学习模型在处理此类图像时面临的特征信息丢失与计算效率失衡的挑战,创新性地提出了一种融合卷积神经网络(convolutional neural network,CNN)与Transformer架构的缺陷识别模型,命名为MHLFNet(multi-scale high-low focused network,多尺度高低聚焦网络)。该模型通过引入多尺度特征融合(multiscale feature fusion,MSFF)模块,显著增强了捕捉局部信息的能力;同时,设计了一种高低频聚焦线性(high-low focused linear,HLFL)模块,利用可调分配比对特征图的高低频信息进行动态注意力分配,并采用聚焦线性注意力代替传统多头自注意力,在有效降低计算复杂度的同时,增强了注意力机制的多样性与特征表达能力。为验证MHLFNet的性能,构建了TOFD焊缝缺陷图像数据集,并进行了系统的实验评估。结果表明,MHLFNet在焊缝缺陷识别任务中实现了98.6%的准确率,同时在模型参数量、浮点运算量以及推理时间方面表现优异。在可视化分析与识别验证中,MHLFNet对高危缺陷(如未熔合和裂纹)展现出卓越的识别能力,证明了其在工业检测中的可靠性与工程价值。 展开更多
关键词 衍射时差法 焊缝缺陷识别 卷积神经网络 Transformer架构 多尺度特征融合
在线阅读 下载PDF
基于多尺度特征融合的航拍小目标检测
17
作者 冯志越 姚涛 贺文伟 《计算机工程与设计》 北大核心 2026年第1期171-179,共9页
针对无人机高空拍摄图像中目标较小且易受遮挡难以检测问题,提出一种基于YOLOv8改进的航拍小目标检测方法:TPO-YOLO。使用三重注意力模块处理特征图,提升上采样后特征图的代表性和区分度;设计多尺度特征融合网络,增强对密集小目标的检... 针对无人机高空拍摄图像中目标较小且易受遮挡难以检测问题,提出一种基于YOLOv8改进的航拍小目标检测方法:TPO-YOLO。使用三重注意力模块处理特征图,提升上采样后特征图的代表性和区分度;设计多尺度特征融合网络,增强对密集小目标的检测能力;使用全维动态卷积在主干与颈部之间搭建过渡层,提升模型对复杂场景的理解力,强化多尺度特征的融合。实验结果表明,相较于YOLOv8s,TPO-YOLO的mAP@0.5提升了8.3%,mAP@0.5∶0.95提升了5.6%,参数量降低64.8%,验证了该方法的有效性。 展开更多
关键词 无人机航拍 小目标检测 三重注意力 多尺度特征融合 全维动态卷积 卷积神经网络 深度学习
在线阅读 下载PDF
基于SVM-MultiCNN模型的视觉感知跌倒检测算法 被引量:7
18
作者 蔡文郁 郑雪晨 +1 位作者 郭嘉豪 阮智祥 《杭州电子科技大学学报(自然科学版)》 2020年第5期59-66,共8页
现有的基于视频的跌倒检测算法大多通过构建人体模型来检测跌倒,对类跌倒行为误判率较高且计算量过大,耗时过长。为此,提出一种基于SVM-MultiCNN模型的视觉感知跌倒检测算法。首先,从原始视频中提取人体关节点数据,从中提取跌倒特征送入... 现有的基于视频的跌倒检测算法大多通过构建人体模型来检测跌倒,对类跌倒行为误判率较高且计算量过大,耗时过长。为此,提出一种基于SVM-MultiCNN模型的视觉感知跌倒检测算法。首先,从原始视频中提取人体关节点数据,从中提取跌倒特征送入SVM分类器进行初次分类;然后,将判决为类跌倒行为的分类数据输入MultiCNN分类器进行跌倒行为的二次分类。实验结果表明:与SVM,CNN,MultiCNN模型相比,改进算法的检测准确度较高,达到96.8%,且单帧检测耗时缩短近一倍,提高了检测效率。 展开更多
关键词 跌倒检测 OpenPose 支持向量机 卷积神经网络 多尺度卷积神经网络
在线阅读 下载PDF
基于改进UNet的图像边缘细节分割算法
19
作者 吕飞雨 闫建红 《现代信息科技》 2026年第4期99-104,111,共7页
针对传统UNet网络在下采样时由于逐步池化,导致边缘信息丢失,无法对图像边缘细节进行精准分割的问题,提出了一种边缘细节增强机制的分割算法。该算法在原有UNet网络结构进行改进,在编码器阶段引入了特征提取模块,模块主要包含多尺度边... 针对传统UNet网络在下采样时由于逐步池化,导致边缘信息丢失,无法对图像边缘细节进行精准分割的问题,提出了一种边缘细节增强机制的分割算法。该算法在原有UNet网络结构进行改进,在编码器阶段引入了特征提取模块,模块主要包含多尺度边缘像素差模块和卷积块。多尺度边缘像素差模块通过提取不同尺度下的图像边缘信息,减少池化造成的信息丢失,增强网络对边缘的分割精度,而卷积块通过两层卷积提取全局信息,将全局信息和边缘信息相融合,提高网络的分割精度。实验分别在公共数据集MSD Spleen和SLIVER07进行验证。结果表明,模型的DICE系数分别达到94.2%和96.4%,IoU分别达到89.2%和92.7%,证明模型有效。 展开更多
关键词 图像分割 多尺度 边缘细节 卷积神经网络
在线阅读 下载PDF
基于多尺度空洞卷积与融合注意力的轴承故障诊断
20
作者 徐雨桐 曾宪文 《上海电机学院学报》 2026年第1期31-38,共8页
针对卷积神经网络在噪声环境下对轴承故障诊断精度不足的问题,本文提出一种结合多尺度空洞卷积与融合注意力机制的抗噪声卷积神经网络模型。首先,该模型通过多尺度空洞卷积提取不同尺度的特征,在不增加卷积层的情况下扩大感受野,从而提... 针对卷积神经网络在噪声环境下对轴承故障诊断精度不足的问题,本文提出一种结合多尺度空洞卷积与融合注意力机制的抗噪声卷积神经网络模型。首先,该模型通过多尺度空洞卷积提取不同尺度的特征,在不增加卷积层的情况下扩大感受野,从而提升模型的泛化性。其次,将提取的特征进行融合后,并行送入通道注意力模块与空间注意力模块,以增强关键特征的表达。最后,通过自适应平均池化进一步融合特征,并由全连接层完成分类。该模型通过融合多层次的特征,有效抑制了噪声干扰。在不同工况与不同信噪比的噪声条件下进行实验,结果表明,与现有方法相比,所提出的MDFA模型展现出更优的轴承故障诊断性能。此外,该方法在大量标记数据下展现了良好的轴承故障诊断能力,然而实际应用中获取特定轴承故障标注数据较为困难,未来将进一步研究数据不平衡情况下的故障诊断问题。 展开更多
关键词 轴承故障诊断 多尺度 空洞率 通道注意力 空间注意力 卷积神经网络
在线阅读 下载PDF
上一页 1 2 48 下一页 到第
使用帮助 返回顶部