期刊文献+
共找到200篇文章
< 1 2 10 >
每页显示 20 50 100
Identification of Key Links in Electric Power Operation Based-Spatiotemporal Mixing Convolution Neural Network
1
作者 Lei Feng Bo Wang +2 位作者 Fuqi Ma Hengrui Ma Mohamed AMohamed 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期1487-1501,共15页
As the scale of the power system continues to expand,the environment for power operations becomes more and more complex.Existing risk management and control methods for power operations can only set the same risk dete... As the scale of the power system continues to expand,the environment for power operations becomes more and more complex.Existing risk management and control methods for power operations can only set the same risk detection standard and conduct the risk detection for any scenario indiscriminately.Therefore,more reliable and accurate security control methods are urgently needed.In order to improve the accuracy and reliability of the operation risk management and control method,this paper proposes a method for identifying the key links in the whole process of electric power operation based on the spatiotemporal hybrid convolutional neural network.To provide early warning and control of targeted risks,first,the video stream is framed adaptively according to the pixel changes in the video stream.Then,the optimized MobileNet is used to extract the feature map of the video stream,which contains both time-series and static spatial scene information.The feature maps are combined and non-linearly mapped to realize the identification of dynamic operating scenes.Finally,training samples and test samples are produced by using the whole process image of a power company in Xinjiang as a case study,and the proposed algorithm is compared with the unimproved MobileNet.The experimental results demonstrated that the method proposed in this paper can accurately identify the type and start and end time of each operation link in the whole process of electric power operation,and has good real-time performance.The average accuracy of the algorithm can reach 87.8%,and the frame rate is 61 frames/s,which is of great significance for improving the reliability and accuracy of security control methods. 展开更多
关键词 Security risk management key links identifications electric power operation spatiotemporal mixing convolution neural network MobileNet network
在线阅读 下载PDF
Mixed Noise Removal by Residual Learning of Deep CNN 被引量:1
2
作者 Kang Yang Jielin Jiang Zhaoqing Pan 《Journal of New Media》 2020年第1期1-10,共10页
Due to the huge difference of noise distribution,the result of a mixture of multiple noises becomes very complicated.Under normal circumstances,the most common type of mixed noise is to add impulse noise(IN)and then w... Due to the huge difference of noise distribution,the result of a mixture of multiple noises becomes very complicated.Under normal circumstances,the most common type of mixed noise is to add impulse noise(IN)and then white Gaussian noise(AWGN).From the reduction of cascaded IN and AWGN to the latest sparse representation,a great deal of methods has been proposed to reduce this form of mixed noise.However,when the mixed noise is very strong,most methods often produce a lot of artifacts.In order to solve the above problems,we propose a method based on residual learning for the removal of AWGN-IN noise in this paper.By training,our model can obtain stable nonlinear mapping from the images with mixed noise to the clean images.After a series of experiments under different noise settings,the results show that our method is obviously better than the traditional sparse representation and patch based method.Meanwhile,the time of model training and image denoising is greatly reduced. 展开更多
关键词 mixed noise denoising residual learning deep convolutional neural
在线阅读 下载PDF
Data Augmentation Using Contour Image for Convolutional Neural Network
3
作者 Seung-Yeon Hwang Jeong-Joon Kim 《Computers, Materials & Continua》 SCIE EI 2023年第6期4669-4680,共12页
With the development of artificial intelligence-related technologies such as deep learning,various organizations,including the government,are making various efforts to generate and manage big data for use in artificia... With the development of artificial intelligence-related technologies such as deep learning,various organizations,including the government,are making various efforts to generate and manage big data for use in artificial intelligence.However,it is difficult to acquire big data due to various social problems and restrictions such as personal information leakage.There are many problems in introducing technology in fields that do not have enough training data necessary to apply deep learning technology.Therefore,this study proposes a mixed contour data augmentation technique,which is a data augmentation technique using contour images,to solve a problem caused by a lack of data.ResNet,a famous convolutional neural network(CNN)architecture,and CIFAR-10,a benchmark data set,are used for experimental performance evaluation to prove the superiority of the proposed method.And to prove that high performance improvement can be achieved even with a small training dataset,the ratio of the training dataset was divided into 70%,50%,and 30%for comparative analysis.As a result of applying the mixed contour data augmentation technique,it was possible to achieve a classification accuracy improvement of up to 4.64%and high accuracy even with a small amount of data set.In addition,it is expected that the mixed contour data augmentation technique can be applied in various fields by proving the excellence of the proposed data augmentation technique using benchmark datasets. 展开更多
关键词 Data augmentation image classification deep learning convolutional neural network mixed contour image benchmark dataset
在线阅读 下载PDF
Sentiment Analysis of Code-Mixed Bambara-French Social Media Text Using Deep Learning Techniques 被引量:3
4
作者 Arouna KONATE DU Ruiying 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2018年第3期237-243,共7页
The global growth of the Internet and the rapid expansion of social networks such as Facebook make multilingual sentiment analysis of social media content very necessary. This paper performs the first sentiment analys... The global growth of the Internet and the rapid expansion of social networks such as Facebook make multilingual sentiment analysis of social media content very necessary. This paper performs the first sentiment analysis on code-mixed Bambara-French Facebook comments. We develop four Long Short-term Memory(LSTM)-based models and two Convolutional Neural Network(CNN)-based models, and use these six models, Na?ve Bayes, and Support Vector Machines(SVM) to conduct experiments on a constituted dataset. Social media text written in Bambara is scarce. To mitigate this weakness, this paper uses dictionaries of character and word indexes to produce character and word embedding in place of pre-trained word vectors. We investigate the effect of comment length on the models and perform a comparison among them. The best performing model is a one-layer CNN deep learning model with an accuracy of 83.23 %. 展开更多
关键词 sentiment analysis code-mixed Bambara-French Facebook comments deep learning Long Short-Term Memory(LSTM) convolutional Neural Network(CNN)
原文传递
3D Data Scattergram Image Classification Based Protection for Transmission Line Connecting BESS Using Depth-wise Separable Convolution Based CNN 被引量:1
5
作者 Yingyu Liang Yi Ren +1 位作者 Xiaoyang Yang Wenting Zha 《Journal of Modern Power Systems and Clean Energy》 2025年第2期609-621,共13页
The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data... The distinctive fault characteristics of battery energy storage stations(BESSs)significantly affect the reliability of conventional protection methods for transmission lines.In this paper,the three-dimensional(3D)data scattergrams are constructed using current data from both sides of the transmission line and their sum.Following a comprehensive analysis of the varying characteristics of 3D data scattergrams under different conditions,a 3D data scattergram image classification based protection method is developed.The depth-wise separable convolution is used to ensure a lightweight convolutional neural network(CNN)structure without compromising performance.In addition,a Bayesian hyperparameter optimization algorithm is used to achieve a hyperparametric search to simplify the training process.Compared with artificial neural networks and CNNs,the depth-wise separable convolution based CNN(DPCNN)achieves a higher recognition accuracy.The 3D data scattergram image classification based protection method using DPCNN can accurately separate internal faults from other disturbances and identify fault phases under different operating states and fault conditions.The proposed protection method also shows first-class tolerability against current transformer(CT)saturation and CT measurement errors. 展开更多
关键词 convolutional neural network(CNN) battery energy storage station(BESS) depth-wise separable convolution hyperparameter optimization fault classification line protection
原文传递
Validation Research on the Application of Depthwise Separable Convolutional Al Facial Expression Recognition in Non-pharmacological Treatment of BPSD
6
作者 Xiangyu Liu 《Journal of Clinical and Nursing Research》 2021年第4期31-37,共7页
One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence... One of the most obvious clinical reasons of dementia or The Behavioral and Psychological Symptoms of Dementia(BPSD)are the lack of emotional expression,the increased frequency of negative emotions,and the impermanence of emotions.Observing the reduction of BPSD in dementia through emotions can be considered effective and widely used in the field of non-pharmacological therapy.At present,this article will verify whether the image recognition artificial intelligence(AI)system can correctly reflect the emotional performance of the elderly with dementia through a questionnaire survey of three professional elderly nursing staff.The ANOVA(sig.=0.50)is used to determine that the judgment given by the nursing staff has no obvious deviation,and then Kendall's test(0.722**)and spearman's test(0.863**)are used to verify the judgment severity of the emotion recognition system and the nursing staff unanimously.This implies the usability of the tool.Additionally,it can be expected to be further applied in the research related to BPSD elderly emotion detection. 展开更多
关键词 depth-wise separable convolution EMOTION BPSD DEMENTIA Nursing
暂未订购
基于自适应GCN与Time-Mixing MLP的多变量时间序列预测模型
7
作者 徐猛猛 吴涛 李振龙 《黑龙江大学自然科学学报》 2025年第2期147-153,共7页
为了更好地处理多变量时间序列中变量交互和尺度交互,提出了多变量时间序列预测模型自适应图卷积网络—时间混合多层感知机(Adaptive graph convolutional network-time-mixing multi-layer perceptron,AGCN-Mixing)。该模型在变量维度... 为了更好地处理多变量时间序列中变量交互和尺度交互,提出了多变量时间序列预测模型自适应图卷积网络—时间混合多层感知机(Adaptive graph convolutional network-time-mixing multi-layer perceptron,AGCN-Mixing)。该模型在变量维度上,利用自适应图卷积网络进行变量交互,有效提取序列间的隐藏特征和模式;在时间维度上,将时间序列下采样为子时间序列,并利用时间混合多层感知机进行多尺度交互,有效捕获序列内的复杂交互关系。在6个公开数据集上进行了实验,结果显示,与现有基准模型相比,AGCN-Mixing的均方误差(Mean squared error,MSE)比多变量时间序列图神经网络(Multivariate time series graph neural network,MTGNN)、频率增强分解Transformer(Frequency enhanced decomposed transformer,FEDformer)、分解线性层网络(Decomposition linear layer network,DLinear)和基于时间二维变化网络(Time-based two dimensional variation network,TimesNet)模型分别平均减少了20.50%、15.64%、15.44%和7.50%,表明AGCN-Mixing有效提升了预测精度。 展开更多
关键词 多变量时间序列预测 图卷积网络 时间混合多层感知机 下采样
在线阅读 下载PDF
基于特征构造的MDconv-GRU刺参养殖水质pH值预测
8
作者 许德昊 王魏 +1 位作者 胡显辉 刘妙男 《控制工程》 北大核心 2026年第2期242-250,共9页
针对养殖水质研究中传统模型数据特征少、预测误差大等问题,提出一种基于特征构造的养殖水质pH值预测模型,模型主体为混合双卷积层门控循环单元(mix double convolutional layer gated recurrent unit, MDconv-GRU)神经网络。首先,通过... 针对养殖水质研究中传统模型数据特征少、预测误差大等问题,提出一种基于特征构造的养殖水质pH值预测模型,模型主体为混合双卷积层门控循环单元(mix double convolutional layer gated recurrent unit, MDconv-GRU)神经网络。首先,通过相关性计算以及特征构造的方法将原有的3个有效特征增加至6个;然后,将特征构造后的数据输入到MDconv-GRU模型中进行训练和预测仿真实验。结果表明,该模型在刺参养殖水质p H值预测实验中的准确率为92.26%,均方根误差为0.083 8,平均绝对误差为0.063 5,平均绝对百分比误差为0.830 2,评价指标均优于GRU等其他模型。该模型不仅可以较为精确地预测刺参养殖水质的p H值,而且能为后续的p H预警以及水质调控奠定基础。 展开更多
关键词 刺参养殖 pH值预测 特征构造 混合卷积层 门控循环单元神经网络
原文传递
CAM-ResNet:基于ResNet的土地利用类型遥感图像分类
9
作者 王梓鉴 方建军 +1 位作者 袁涌博 刘泽宇 《北京联合大学学报》 2026年第1期49-54,共6页
在土地利用类型图像分类领域,传统分类方法在特征提取准确性与分类精度方面存在局限性,难以满足实际应用需求。本文以ResNet50为核心架构,引入卷积块注意力模块(convolutional block attention module,CBAM),强化特征提取,并采用自动混... 在土地利用类型图像分类领域,传统分类方法在特征提取准确性与分类精度方面存在局限性,难以满足实际应用需求。本文以ResNet50为核心架构,引入卷积块注意力模块(convolutional block attention module,CBAM),强化特征提取,并采用自动混合精度(automatic mixed precision,AMP)技术提高计算效率,构建了CAM-ResNet网络。实验结果显示,CAM-ResNet网络的总体精度达98.19%,较原网络高出10.16个百分点。消融实验进一步证明,CBAM注意力机制显著增强了模型的特征提取能力,AMP训练技术提高了模型的收敛速度,CAM-ResNet网络在土地利用类型遥感图像分类中具有一定的有效性和优越性。 展开更多
关键词 土地利用 ResNet50 卷积块注意力模块(CBAM) 自动混合精度(AMP) 图像分类 卷积神经网络(CNN)
在线阅读 下载PDF
基于线性卷积混叠过程的自监督式光纤传感信号分离
10
作者 陈照 刘泽超 《北京航空航天大学学报》 北大核心 2026年第2期463-469,共7页
针对光纤传感信号分离问题,提出一种基于线性卷积混叠过程的自监督式信号分离方法,其主要包含3部分:线性卷积混叠模型、语义特征提取模型和基于查询的信号分离模型。在模型训练过程中,相比于线性叠加模型,线性卷积混叠模型可依据更贴合... 针对光纤传感信号分离问题,提出一种基于线性卷积混叠过程的自监督式信号分离方法,其主要包含3部分:线性卷积混叠模型、语义特征提取模型和基于查询的信号分离模型。在模型训练过程中,相比于线性叠加模型,线性卷积混叠模型可依据更贴合实际传感过程的线性卷积混叠方式对输入的多个子信号进行混叠,动态生成混叠信号,服务于后续基于查询的信号分离模型的自监督式学习;利用语义特征提取模型将某一子信号映射至特征空间;将其特征作为查询因子,并与混叠信号一起输入到基于查询的信号分离模型中,最终输出目标子信号,在可成倍扩充训练样本的同时,也可实现零样本条件下的目标信号分离。为验证所提方法的有效性,在室内环境下开展实验并采集了跑步时及单频正弦振动下的光纤传感信号及两者的混叠信号,且在该实测数据上的实验结果表明了所提方法的有效性。 展开更多
关键词 信号分离 自监督 卷积混叠 光纤传感 零样本
原文传递
结合特征增强注意力的混合卷积去雾网络
11
作者 符程程 魏为民 +1 位作者 杨同 杨天澄 《现代电子技术》 北大核心 2026年第1期27-33,共7页
雾气会对图像造成严重的视觉退化,影响图像的细节和对比度,进而影响图像的可读性和后续处理任务的性能。针对现有图像去雾算法特征提取不全面、去雾图片细节缺失以及对非均匀雾图去雾效果不彻底等问题,文中提出一种结合特征增强注意力... 雾气会对图像造成严重的视觉退化,影响图像的细节和对比度,进而影响图像的可读性和后续处理任务的性能。针对现有图像去雾算法特征提取不全面、去雾图片细节缺失以及对非均匀雾图去雾效果不彻底等问题,文中提出一种结合特征增强注意力的混合卷积去雾网络。将差分卷积与原始卷积结合为混合卷积层,扩大特征信息提取范围;使用像素注意力机制与卷积块注意力模块生成特征增强注意力模块,提高网络的细节处理能力;融合通道、空间和像素三个尺度的特征信息,使网络可以关注雾气分布差异。实验结果表明,所提网络特征提取全面、去雾图像细节清晰、去雾彻底,在客观指标和主观视觉上表现良好,在具有良好去雾效果的同时,保持较强的鲁棒性和泛化能力。 展开更多
关键词 图像去雾 图像处理 注意力机制 特征增强 混合卷积 特征融合
在线阅读 下载PDF
基于ResNet-ACmix融合特征的ECO目标跟踪算法改进
12
作者 张余冉 段喜萍 +1 位作者 李昀松 刘庭圆 《哈尔滨师范大学自然科学学报》 CAS 2023年第1期75-82,共8页
为了结合卷积和自注意力的优势,并提高相关滤波目标跟踪算法的跟踪能力,提出了一种应用自注意力卷积融合残差网络(ResNet-ACmix)改进的ECO目标跟踪算法.该算法在特征提取方面,采用一种轻量级的网络ResNet-ACmix代替原ECO算法中ResNet特... 为了结合卷积和自注意力的优势,并提高相关滤波目标跟踪算法的跟踪能力,提出了一种应用自注意力卷积融合残差网络(ResNet-ACmix)改进的ECO目标跟踪算法.该算法在特征提取方面,采用一种轻量级的网络ResNet-ACmix代替原ECO算法中ResNet特征提取网络,以此来提高ECO目标跟踪算法的时间性能.在VOT2016数据集以及OTB50数据集上测试的结果表明,上述所提算法对比传统ECO算法,在保证较高跟踪准确率的同时,卷积提取过程的参数量和计算量更少,跟踪速度更快. 展开更多
关键词 目标跟踪 应用高效卷积算子(ECO) 自注意力与卷积混合模型
在线阅读 下载PDF
FS-YOLO:基于YOLOv5s改进的火焰烟雾检测算法 被引量:1
13
作者 徐慧英 胥玲玲 +3 位作者 李毅 朱信忠 陶珏强 黄晓 《浙江师范大学学报(自然科学版)》 2025年第3期267-276,共10页
火灾是一种极具破坏性的灾害,对火焰和烟雾的检测有助于及时发现火灾,以便采取有效措施将损失最小化.现有的算法对火焰烟雾的检测精度较低,不能做到精确识别小目标火焰和烟雾.为了进一步提高检测准确率,提出了基于YOLOv5s算法进行改进... 火灾是一种极具破坏性的灾害,对火焰和烟雾的检测有助于及时发现火灾,以便采取有效措施将损失最小化.现有的算法对火焰烟雾的检测精度较低,不能做到精确识别小目标火焰和烟雾.为了进一步提高检测准确率,提出了基于YOLOv5s算法进行改进的火焰烟雾检测算法FS-YOLO.首先,在主干网络的C3模块中融合CA注意力机制来增强模型对图像特征的感知能力;其次,为了实现高效多尺度特征融合,将双向加权特征金字塔网络(BiFPN)用于颈部的多尺度信息融合;此外,在主干网络中加入由混合卷积层和普通卷积层组成的CSPCM模块,以便通过少量计算代价来提取火焰烟雾显著特征;最后,为提高边界框回归准确率,采用了基于最小点的MPDIoU损失函数和ReLU激活函数加速网络的训练和推理.在Fire and Smoke数据集上的实验结果表明:FS-YOLO达到了mAP@0.5上0.606和mAP@0.5-0.95上0.275的检测精度,相较于YOLOv5s分别提升5.21%和8.27%,FS-YOLO在实际运行中的速度为303 FPS,实现了高精度快速的实时火焰烟雾检测. 展开更多
关键词 YOLOv5s BiFPN 火焰烟雾检测 CA注意力机制 混合卷积
在线阅读 下载PDF
基于改进SegFormer的超声影像分割方法研究
14
作者 王高才 杨满 张晓洁 《现代电子技术》 北大核心 2025年第23期17-24,共8页
针对SegFormer网络分层的Transformer编码器逐级递减图像分辨率,提取图像多尺度特征的特点,文中提出一种边缘提取模块(EEM),该模块能更好地注意到超声影像的边界信息。为了解决超声图像中出现的复杂边界问题,在SegFormer编码层和解码层... 针对SegFormer网络分层的Transformer编码器逐级递减图像分辨率,提取图像多尺度特征的特点,文中提出一种边缘提取模块(EEM),该模块能更好地注意到超声影像的边界信息。为了解决超声图像中出现的复杂边界问题,在SegFormer编码层和解码层之间加入空洞空间卷积金字塔池化(ASPP)模块,确保其在获取较大感受野的同时不会发生网格效应。结合EEM和ASPP模块的SegFormer能够在保持低级边缘细节特征的同时进一步提取抽象特征,使得超声影像分割的精度进一步提升。将EEM连接在SegFormer编码器之前,再和解码器进行特征融合之后,与ASPP模块的输出特征做拼接并预测分割掩码,在甲状腺结节超声影像、乳腺结节超声影像和白细胞数据集上取得了较好的效果。经实验验证,该模型的mIoU分别提高了1.25%、2.2%和0.13%,证明了改进方法的有效性。 展开更多
关键词 图像分割 改进的SegFormer 超声影像 混合空洞卷积 混合通道注意力 边缘提取模块
在线阅读 下载PDF
基于SWT和改进CNN的滚动轴承故障诊断方法 被引量:2
15
作者 宋存利 袁晓萌 张雪松 《大连交通大学学报》 2025年第2期52-58,共7页
针对滚动轴承故障分类识别精度低、变负载模型泛化能力差的问题,提出一种基于同步压缩小波变换(SWT)和密集连接混合空洞卷积神经网络(DMCNN)的故障诊断方法。SWT将一维振动信号转换成二维信号时频图;DMCNN在CNN基础上引入密集连接结构... 针对滚动轴承故障分类识别精度低、变负载模型泛化能力差的问题,提出一种基于同步压缩小波变换(SWT)和密集连接混合空洞卷积神经网络(DMCNN)的故障诊断方法。SWT将一维振动信号转换成二维信号时频图;DMCNN在CNN基础上引入密集连接结构和混合空洞卷积来进行特征提取和故障分类,利用密集连接结构来提高特征利用率,并通过混合空洞卷积来减少训练时长。试验与对比分析结果表明,该方法有较高识别精度,在变负载情况下也有更好的泛化能力。 展开更多
关键词 故障诊断 同步压缩小波变换 卷积神经网络 混合空洞卷积 密集连接
在线阅读 下载PDF
基于MOMP-YOLOv8的交通标志检测算法研究
16
作者 王海瑞 贺存龙 朱贵富 《计量学报》 北大核心 2025年第9期1385-1394,共10页
针对交通标志的图像背景较复杂和小目标占比较大的问题,提出了一种基于MOMP-YOLOv8的交通标志检测改进算法。首先,在颈部网络引入混合局部通道注意力模块,其通过结合使用局部信息和全局信息以提高网络检测精度,增强特征提取网络的表达能... 针对交通标志的图像背景较复杂和小目标占比较大的问题,提出了一种基于MOMP-YOLOv8的交通标志检测改进算法。首先,在颈部网络引入混合局部通道注意力模块,其通过结合使用局部信息和全局信息以提高网络检测精度,增强特征提取网络的表达能力;其次,在主干网络使用全维动态卷积,以提升模型的目标特征提取能力;然后,提出一种多层次的自适应空间特征融合检测头,其在检测层增加一个160×160的小目标检测头来提高对小目标的检测能力;最后,通过使用PIoU改进损失函数,进一步提升模型收敛速度与检测性能。在中国交通标志检测数据集CCTSDB 2021进行实验验证,结果表明,改进算法相较于基线YOLOv8n算法检测精确率、召回率、mAP值分别领先了0.9%、1.8%和1.4%,总体检测性能优于其他主流目标检测算法。 展开更多
关键词 交通标志检测 MOMP-YOLOv8 混合局部通道注意力 全维动态卷积 PIoU损失函数
在线阅读 下载PDF
基于二阶混合卷积窗双谱线插值的谐波检测算法 被引量:1
17
作者 龙艳萍 《山东电力技术》 2025年第6期44-51,共8页
在电力系统谐波分析中,频谱泄漏和栅栏效应是影响信号检测精度的关键因素。为有效减少频谱泄漏和栅栏效应对谐波检测的影响,构造基于Hanning窗和五项最大旁瓣衰减(Maximum-sidelobe-decay,MSD)窗的二阶混合卷积窗双谱线插值算法。该算... 在电力系统谐波分析中,频谱泄漏和栅栏效应是影响信号检测精度的关键因素。为有效减少频谱泄漏和栅栏效应对谐波检测的影响,构造基于Hanning窗和五项最大旁瓣衰减(Maximum-sidelobe-decay,MSD)窗的二阶混合卷积窗双谱线插值算法。该算法在保证主瓣宽度满足要求的同时,显著提升了旁瓣特性,并采用双谱线插值算法能够更为精准地检测复杂谐波信号的幅值、相位和频率。采用复杂谐波信号进行仿真分析,结果表明,在处理复杂电力系统谐波信号,尤其是在白噪声干扰条件下,所提方法展现出了更高的检测精度和稳定性。 展开更多
关键词 频谱泄漏 栅栏效应 HANNING窗 五项MSD窗 二阶混合卷积 双谱线插值 谐波信号
在线阅读 下载PDF
基于轻量化改进YOLOv5的金属表面缺陷检测
18
作者 郭北涛 叶盛辉 《机械工程师》 2025年第9期1-4,共4页
针对传统YOLO算法在金属表面缺陷检测任务中出现的性能问题,提出基于YOLOv5的结合混合池化和Ghost模块的金属缺陷检测方法。首先将网络中的空间金字塔池化层的池化方法改为混合池化,提高缺陷提取的能力,以此提高检测的精度。然后将骨干... 针对传统YOLO算法在金属表面缺陷检测任务中出现的性能问题,提出基于YOLOv5的结合混合池化和Ghost模块的金属缺陷检测方法。首先将网络中的空间金字塔池化层的池化方法改为混合池化,提高缺陷提取的能力,以此提高检测的精度。然后将骨干网络中的普通卷积层更换为Ghost卷积层,以达到减小模型大小和加快运行效率。经过验证,轻量化后的网络的平均精度比改进前提高12.01%,模型大小减小61.12%。改进后算法得到了较好的性能提升。 展开更多
关键词 金属表面缺陷 YOLOv5算法 Ghost卷积 混合池化
在线阅读 下载PDF
基于CNN-ViT混合特征优化的小样本高光谱图像分类 被引量:1
19
作者 张津 冯凡 +3 位作者 戴晨光 张振超 于英 刘冰 《测绘学报》 北大核心 2025年第12期2233-2246,共14页
高光谱图像分类是实现地物要素精细识别的关键技术。随着成像技术发展,无人机平台获取的高光谱图像空间分辨率不断提升,给地物精细分类带来了新的机遇和挑战。现有深层网络在小样本条件下对高空间分辨率高光谱图像特征学习不全面。针对... 高光谱图像分类是实现地物要素精细识别的关键技术。随着成像技术发展,无人机平台获取的高光谱图像空间分辨率不断提升,给地物精细分类带来了新的机遇和挑战。现有深层网络在小样本条件下对高空间分辨率高光谱图像特征学习不全面。针对以上问题,本文提出了一种针对卷积神经网络(CNN)和ViT混合特征的优化方法,包括自适应空谱特征学习、双向特征整合和多段特征交互增强3个方面。首先,将多尺度3D空谱特征和局部2D自注意力特征纳入级联残差结构,完成全局-局部多尺度空谱特征提取,增强特征的丰富性。然后,从两个方向整合空间特征和通道特征,提取两个维度的相关性,实现对CNN和ViT提取特征的补充和增强。将上述多段特征融合后,输入分解二阶池化层,解决多段特征之间差异大、缺乏交互的问题。最后,将细粒度融合特征输入全连接层,完成分类。在3个高空间分辨率高光谱图像数据集LongKou、HanChuan、HongHu上进行了小样本分类试验。每类地物仅使用5个样本训练模型,本文方法分类精度分别为94.00%、83.24%和87.63%,验证了本文方法在小样本条件下的有效性。 展开更多
关键词 高光谱图像分类 混合卷积网络 局部自注意力 分解二阶池化 多特征优化 小样本
在线阅读 下载PDF
采用多尺度特征增强的路面病害检测模型 被引量:3
20
作者 胡鹏 夏晓华 +3 位作者 钟预全 段智威 姚运仕 成高立 《西安交通大学学报》 北大核心 2025年第2期156-169,共14页
针对现有网络多尺度特征提取能力不足造成路面病害因尺寸差异难以完全识别的问题,提出了一种多尺度特征增强的路面病害检测模型。构建基于混合空洞卷积的快速空间金字塔池化模块,通过堆叠不同膨胀系数的空洞卷积进一步扩大网络感受野,... 针对现有网络多尺度特征提取能力不足造成路面病害因尺寸差异难以完全识别的问题,提出了一种多尺度特征增强的路面病害检测模型。构建基于混合空洞卷积的快速空间金字塔池化模块,通过堆叠不同膨胀系数的空洞卷积进一步扩大网络感受野,以实现更大范围上下文信息的捕捉,并保留更多的空间信息;设计多路径特征融合网络,通过多分支和跳跃连接实现跨层级的特征捕捉,并减少特征融合过程中的信息丢失;采用K-means聚类算法结合交叉比获得合理的瞄点框;在损失函数中,设计一种面积惩罚项并设置下降梯度,提高预测框回归精度与效率;通过引入跨通道交互的高效注意力实现模型重要通道间的交互。实验结果表明:所提模型的检测精度比原模型YOLOv5s提高了4.0%;与Faster R-CNN、CenterNet等经典模型和YOLOv8s、YOLOv7n-tiny等先进模型相比,检测精度提高了1.0%~17.9%。模型经TensorRT加速引擎优化加速后,在NVIDIA Jetson TX2与NVIDIA Jetson Nano平台上的检测速率提高近1倍,同时不影响检测精度。 展开更多
关键词 路面病害检测 多尺度特征增强 混合空洞卷积 特征融合网络 高效通道注意力 嵌入式平台
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部