期刊文献+
共找到265篇文章
< 1 2 14 >
每页显示 20 50 100
Feature Extraction by Multi-Scale Principal Component Analysis and Classification in Spectral Domain 被引量:2
1
作者 Shengkun Xie Anna T. Lawnizak +1 位作者 Pietro Lio Sridhar Krishnan 《Engineering(科研)》 2013年第10期268-271,共4页
Feature extraction of signals plays an important role in classification problems because of data dimension reduction property and potential improvement of a classification accuracy rate. Principal component analysis (... Feature extraction of signals plays an important role in classification problems because of data dimension reduction property and potential improvement of a classification accuracy rate. Principal component analysis (PCA), wavelets transform or Fourier transform methods are often used for feature extraction. In this paper, we propose a multi-scale PCA, which combines discrete wavelet transform, and PCA for feature extraction of signals in both the spatial and temporal domains. Our study shows that the multi-scale PCA combined with the proposed new classification methods leads to high classification accuracy for the considered signals. 展开更多
关键词 multi-scale Principal Component Analysis Discrete WAVELET TRANSFORM feature extraction Signal CLASSIFICATION Empirical CLASSIFICATION
在线阅读 下载PDF
A multi-scale convolutional auto-encoder and its application in fault diagnosis of rolling bearings 被引量:12
2
作者 Ding Yunhao Jia Minping 《Journal of Southeast University(English Edition)》 EI CAS 2019年第4期417-423,共7页
Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on ... Aiming at the difficulty of fault identification caused by manual extraction of fault features of rotating machinery,a one-dimensional multi-scale convolutional auto-encoder fault diagnosis model is proposed,based on the standard convolutional auto-encoder.In this model,the parallel convolutional and deconvolutional kernels of different scales are used to extract the features from the input signal and reconstruct the input signal;then the feature map extracted by multi-scale convolutional kernels is used as the input of the classifier;and finally the parameters of the whole model are fine-tuned using labeled data.Experiments on one set of simulation fault data and two sets of rolling bearing fault data are conducted to validate the proposed method.The results show that the model can achieve 99.75%,99.3%and 100%diagnostic accuracy,respectively.In addition,the diagnostic accuracy and reconstruction error of the one-dimensional multi-scale convolutional auto-encoder are compared with traditional machine learning,convolutional neural networks and a traditional convolutional auto-encoder.The final results show that the proposed model has a better recognition effect for rolling bearing fault data. 展开更多
关键词 fault diagnosis deep learning convolutional auto-encoder multi-scale convolutional kernel feature extraction
在线阅读 下载PDF
Multi-Scale Mixed Attention Tea Shoot Instance Segmentation Model 被引量:1
3
作者 Dongmei Chen Peipei Cao +5 位作者 Lijie Yan Huidong Chen Jia Lin Xin Li Lin Yuan Kaihua Wu 《Phyton-International Journal of Experimental Botany》 SCIE 2024年第2期261-275,共15页
Tea leaf picking is a crucial stage in tea production that directly influences the quality and value of the tea.Traditional tea-picking machines may compromise the quality of the tea leaves.High-quality teas are often... Tea leaf picking is a crucial stage in tea production that directly influences the quality and value of the tea.Traditional tea-picking machines may compromise the quality of the tea leaves.High-quality teas are often handpicked and need more delicate operations in intelligent picking machines.Compared with traditional image processing techniques,deep learning models have stronger feature extraction capabilities,and better generalization and are more suitable for practical tea shoot harvesting.However,current research mostly focuses on shoot detection and cannot directly accomplish end-to-end shoot segmentation tasks.We propose a tea shoot instance segmentation model based on multi-scale mixed attention(Mask2FusionNet)using a dataset from the tea garden in Hangzhou.We further analyzed the characteristics of the tea shoot dataset,where the proportion of small to medium-sized targets is 89.9%.Our algorithm is compared with several mainstream object segmentation algorithms,and the results demonstrate that our model achieves an accuracy of 82%in recognizing the tea shoots,showing a better performance compared to other models.Through ablation experiments,we found that ResNet50,PointRend strategy,and the Feature Pyramid Network(FPN)architecture can improve performance by 1.6%,1.4%,and 2.4%,respectively.These experiments demonstrated that our proposed multi-scale and point selection strategy optimizes the feature extraction capability for overlapping small targets.The results indicate that the proposed Mask2FusionNet model can perform the shoot segmentation in unstructured environments,realizing the individual distinction of tea shoots,and complete extraction of the shoot edge contours with a segmentation accuracy of 82.0%.The research results can provide algorithmic support for the segmentation and intelligent harvesting of premium tea shoots at different scales. 展开更多
关键词 Tea shoots attention mechanism multi-scale feature extraction instance segmentation deep learning
在线阅读 下载PDF
Gender-Specific Multi-Task Micro-Expression Recognition Using Pyramid CGBP-TOP Feature
4
作者 Chunlong Hu Jianjun Chen +3 位作者 Xin Zuo Haitao Zou Xing Deng Yucheng Shu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2019年第3期547-559,共13页
Micro-expression recognition has attracted growing research interests in the field of compute vision.However,micro-expression usually lasts a few seconds,thus it is difficult to detect.This paper presents a new framew... Micro-expression recognition has attracted growing research interests in the field of compute vision.However,micro-expression usually lasts a few seconds,thus it is difficult to detect.This paper presents a new framework to recognize micro-expression using pyramid histogram of Centralized Gabor Binary Pattern from Three Orthogonal Panels(CGBP-TOP)which is an extension of Local Gabor Binary Pattern from Three Orthogonal Panels feature.CGBP-TOP performs spatial and temporal analysis to capture the local facial characteristics of micro-expression image sequences.In order to keep more local information of the face,CGBP-TOP is extracted based on pyramid subregions of the micro-expression video frame.The combination of CGBP-TOP and spatial pyramid can represent well and truly the facial movements of the micro-expression image sequences.However,the dimension of our pyramid CGBP-TOP tends to be very high,which may lead to high data redundancy problem.In addition,it is clear that people of different genders usually have different ways of micro-expression.Therefore,in this paper,in order to select the relevant features of micro-expression,the gender-specific sparse multi-task learning method with adaptive regularization term is adopted to learn a compact subset of pyramid CGBP-TOP feature for micro-expression classification of different sexes.Finally,extensive experiments on widely used CASME II and SMIC databases demonstrate that our method can efficiently extract micro-expression motion features in the micro-expression video clip.Moreover,our proposed approach achieves comparable results with the state-of-the-art methods. 展开更多
关键词 Micro-expression recognition feature extraction spatial PYRAMID MULTI-TASK learning REGULARIZATION
在线阅读 下载PDF
Ship recognition based on HRRP via multi-scale sparse preserving method
5
作者 YANG Xueling ZHANG Gong SONG Hu 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期599-608,共10页
In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) ba... In order to extract the richer feature information of ship targets from sea clutter, and address the high dimensional data problem, a method termed as multi-scale fusion kernel sparse preserving projection(MSFKSPP) based on the maximum margin criterion(MMC) is proposed for recognizing the class of ship targets utilizing the high-resolution range profile(HRRP). Multi-scale fusion is introduced to capture the local and detailed information in small-scale features, and the global and contour information in large-scale features, offering help to extract the edge information from sea clutter and further improving the target recognition accuracy. The proposed method can maximally preserve the multi-scale fusion sparse of data and maximize the class separability in the reduced dimensionality by reproducing kernel Hilbert space. Experimental results on the measured radar data show that the proposed method can effectively extract the features of ship target from sea clutter, further reduce the feature dimensionality, and improve target recognition performance. 展开更多
关键词 ship target recognition high-resolution range profile(HRRP) multi-scale fusion kernel sparse preserving projection(MSFKSPP) feature extraction dimensionality reduction
在线阅读 下载PDF
RealFuVSR:Feature enhanced real-world video super-resolution
6
作者 Zhi LI Xiongwen PANG +1 位作者 Yiyue JIANG Yujie WANG 《Virtual Reality & Intelligent Hardware》 EI 2023年第6期523-537,共15页
Background Recurrent recovery is a common method for video super-resolution(VSR)that models the correlation between frames via hidden states.However,the application of this structure in real-world scenarios can lead t... Background Recurrent recovery is a common method for video super-resolution(VSR)that models the correlation between frames via hidden states.However,the application of this structure in real-world scenarios can lead to unsatisfactory artifacts.We found that in real-world VSR training,the use of unknown and complex degradation can better simulate the degradation process in the real world.Methods Based on this,we propose the RealFuVSR model,which simulates real-world degradation and mitigates artifacts caused by the VSR.Specifically,we propose a multiscale feature extraction module(MSF)module that extracts and fuses features from multiple scales,thereby facilitating the elimination of hidden state artifacts.To improve the accuracy of the hidden state alignment information,RealFuVSR uses an advanced optical flow-guided deformable convolution.Moreover,a cascaded residual upsampling module was used to eliminate noise caused by the upsampling process.Results The experiment demonstrates that RealFuVSR model can not only recover high-quality videos but also outperforms the state-of-the-art RealBasicVSR and RealESRGAN models. 展开更多
关键词 Video super-resolution Deformable convolution Cascade residual upsampling Second-order degradation multi-scale feature extraction
在线阅读 下载PDF
Underwater Image Enhancement Based on Multi-scale Adversarial Network
7
作者 ZENG Jun-yang SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第5期70-77,共8页
In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of ea... In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of each layer were enhanced into the global features by the proposed residual dense block,which ensured that the generated images retain more details.Secondly,a multi-scale structure was adopted to extract multi-scale semantic features of the original images.Finally,the features obtained from the dual channels were fused by an adaptive fusion module to further optimize the features.The discriminant network adopted the structure of the Markov discriminator.In addition,by constructing mean square error,structural similarity,and perceived color loss function,the generated image is consistent with the reference image in structure,color,and content.The experimental results showed that the enhanced underwater image deblurring effect of the proposed algorithm was good and the problem of underwater image color bias was effectively improved.In both subjective and objective evaluation indexes,the experimental results of the proposed algorithm are better than those of the comparison algorithm. 展开更多
关键词 Underwater image enhancement Generative adversarial network multi-scale feature extraction Residual dense block
在线阅读 下载PDF
Spectral-spatial target detection based on data field modeling for hyperspectral data 被引量:4
8
作者 Da LIU Jianxun LI 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2018年第4期795-805,共11页
Target detection is always an important application in hyperspectral image processing field. In this paper, a spectral-spatial target detection algorithm for hyperspectral data is proposed.The spatial feature and spec... Target detection is always an important application in hyperspectral image processing field. In this paper, a spectral-spatial target detection algorithm for hyperspectral data is proposed.The spatial feature and spectral feature were unified based on the data filed theory and extracted by weighted manifold embedding. The novelties of the proposed method lie in two aspects. One is the way in which the spatial features and spectral features were fused as a new feature based on the data field theory, and the other is that local information was introduced to describe the decision boundary and explore the discriminative features for target detection. The extracted features based on data field modeling and manifold embedding techniques were considered for a target detection task.Three standard hyperspectral datasets were considered in the analysis. The effectiveness of the proposed target detection algorithm based on data field theory was proved by the higher detection rates with lower False Alarm Rates(FARs) with respect to those achieved by conventional hyperspectral target detectors. 展开更多
关键词 Data field modeling feature extraction Hyperspectral data Spectral-spatial Target detection
原文传递
多阶段渐进处理的图像去雨方法
9
作者 廉继红 王平 +1 位作者 李英 李云红 《西北大学学报(自然科学版)》 北大核心 2025年第2期297-308,共12页
针对现有图像去雨方法中存在雨纹去除不彻底、纹理信息丢失等问题,提出一种多阶段渐进式处理的图像去雨算法,可以同时将上下阶段的特征融合,使去雨算法的性能有很大的提高。该去雨网络模型由3个阶段构成。前2个阶段采用改进后的U-Net编... 针对现有图像去雨方法中存在雨纹去除不彻底、纹理信息丢失等问题,提出一种多阶段渐进式处理的图像去雨算法,可以同时将上下阶段的特征融合,使去雨算法的性能有很大的提高。该去雨网络模型由3个阶段构成。前2个阶段采用改进后的U-Net编码器解码器结构学习多尺度上下文特征信息,特征提取部分采用有效通道注意力机制(efficient channel attention network,ECANet),使网络模型参数变小,更加轻量级;第3阶段加入并行注意力机制(parallel attention subnetwork,PASNet),在学习上下文信息和空间细节特征的同时还能生成高分辨率特征,更好地保留图像的输出细节。此外,还引入监督注意力模块(supervised attention module,SAM)以加强特征学习。实验结果表明,在数据集Rain100H上PSNR达到29.37 dB,SSIM为0.88;在Test1200上PSNR达到32.50 dB,SSIM为0.93,验证了所提方法在图像去雨任务上的有效性。 展开更多
关键词 图像去雨 特征提取 监督注意力 并行注意力机制 空间细节
在线阅读 下载PDF
基于CoordEF−YOLOv9t的煤矿井下人员行为识别
10
作者 潘红光 卫泽尘 +3 位作者 雷心宇 姚超修 蒋泽 张立斌 《工矿自动化》 北大核心 2025年第8期59-66,共8页
基于深度学习的人员行为识别方法在煤矿井下应用存在对多类别行为识别缺乏系统性分类架构、光线昏暗和低清晰度图像导致细节丢失、矿工姿态和视角差异引发特征形变等问题。提出一种煤矿井下人员行为识别模型CoordEF−YOLOv9t。该模型分... 基于深度学习的人员行为识别方法在煤矿井下应用存在对多类别行为识别缺乏系统性分类架构、光线昏暗和低清晰度图像导致细节丢失、矿工姿态和视角差异引发特征形变等问题。提出一种煤矿井下人员行为识别模型CoordEF−YOLOv9t。该模型分别从边缘细节与空间位置特征提取2个方面对YOLOv9t进行改进:YOLOv9t中RepNCSPELAN4模块的卷积操作在捕捉细微或模糊边缘时易导致细节模糊,针对该问题,设计了融合Sobel算子的边缘特征提取模块(EFEM),在RepNCSPELAN4模块中嵌入EFEM,增强主干网络与颈部网络对人体边缘细节的感知能力。传统卷积神经网络难以感知位置信息并充分学习人员位置与动作的空间特征,针对该问题,在颈部网络末端引入坐标卷积,提升模型对人员行为位置信息的感知能力。实验结果表明,CoordEF−YOLOv9t精确率P为73.4%,召回率R为73.7%,mAP@0.5为74.8%,mAP@0.5:0.95为61.1%,相较于YOLOv9t分别提升1.2%,3.2%,1.0%,2.1%;与RT−DETR,YOLOv11,YOLOv12等主流模型相比,CoordEF−YOLOv9t综合性能更优,能更精准地识别煤矿井下人员行为。 展开更多
关键词 井下人员行为识别 YOLOv9t 边缘特征提取 空间位置特征提取 SOBEL算子 坐标卷积
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
11
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 自注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于航拍图像的自适应感知目标检测网络 被引量:2
12
作者 袁玲玲 陈春梅 +2 位作者 朱天鑫 邓豪 刘桂华 《电子测量技术》 北大核心 2025年第2期57-65,共9页
由于无人机拍摄高度和角度的多样性,其图像往往呈现背景复杂且小目标居多的特征,这导致了相关检测算法性能较差。针对此问题,本文提出了一种基于自适应感知网络的航拍图像车辆检测方法,旨在从提高车辆特征显著度和改善特征信息损失两个... 由于无人机拍摄高度和角度的多样性,其图像往往呈现背景复杂且小目标居多的特征,这导致了相关检测算法性能较差。针对此问题,本文提出了一种基于自适应感知网络的航拍图像车辆检测方法,旨在从提高车辆特征显著度和改善特征信息损失两个方面来提升小目标的检测性能。首先,为了提取更高效的特征表征,提出了自适应感知特征提取模块,该模块通过捕捉长程依赖关系和更强的几何特征表示,能够自适应地对物体的形状进行建模。其次,为了减少下采样和连续池化造成的信息损失,设计了双分支空间感知下采样模块,该模块混合不同通道的特征图,以最大限度地保留小目标特征信息。然后,在特征融合网络中,引入了具有丰富空间信息的浅层特征图,以增强小目标的检测能力。最后,设计了新的动态回归损失函数DEIoU,该函数引入惩罚项来度量真实框与检测框之间横纵比的相关性,从而进一步提高网络的预测精度。在Visdrone数据集上的实验结果表明,所提方法的平均精度均值mAP达到了70%,推理速度达到了99.26 fps,实现了较好的速度与精度的平衡,并且所提方法在UCAS-AOD数据集上取得了最佳的检测精度,具有较强的泛化能力。 展开更多
关键词 无人机 目标检测 自适应感知特征提取 特征融合网络 双分支空间感知下采样
原文传递
基于高阶空间特征提取的无人机航拍小目标检测算法 被引量:3
13
作者 张轩宇 周思航 +1 位作者 黄健 王冬 《计算机工程与应用》 北大核心 2025年第12期210-221,共12页
针对视觉算法在检测航拍图像中密集小目标时容易受到目标重叠、遮挡等情况干扰的现象,提出了一种基于高阶空间特征(目标形状、位置等信息的高级表示)提取的Transformer检测头HSF-TPH(Transformer prediction head with high-order spati... 针对视觉算法在检测航拍图像中密集小目标时容易受到目标重叠、遮挡等情况干扰的现象,提出了一种基于高阶空间特征(目标形状、位置等信息的高级表示)提取的Transformer检测头HSF-TPH(Transformer prediction head with high-order spatial feature extraction)。所提检测头中将自注意力机制中的二阶交互扩展到三阶以生成高阶空间特征,提取更有区分度的空间关系,突出每一个小目标在空间上的语义信息。同时,为了缓解骨干网络过度下采样对小目标信息的压缩,设计了一种高分辨率特征图生成机制,增加头部网络的输入特征分辨率,以提升HSFTPH检测密集小目标的效果。设计了新的损失函数USIoU,降低算法位置偏差敏感性。在VisDrone2019数据集上开展实验证明,所提算法在面积最小、密度最高的人类目标的检测任务中实现了mAP50指标10个百分点以上的性能提升。 展开更多
关键词 无人机航拍 小目标检测 高阶空间特征提取 注意力机制 损失函数
在线阅读 下载PDF
通道与空间特征协同提取的抗噪手势识别方法
14
作者 逯英航 仇大伟 +2 位作者 刘静 李仝伟 王锡城 《电子测量技术》 北大核心 2025年第21期15-30,共16页
表面肌电信号作为肌肉活动的直接反映,能够有效捕捉肌肉收缩的模式和强度信息,因此在手势识别中被广泛应用。然而,其稀疏性、非线性和噪声干扰对特征提取提出了严峻挑战。为此,本文提出了RASTNet模型,以ResNet50为主干网络,将每层最后一... 表面肌电信号作为肌肉活动的直接反映,能够有效捕捉肌肉收缩的模式和强度信息,因此在手势识别中被广泛应用。然而,其稀疏性、非线性和噪声干扰对特征提取提出了严峻挑战。为此,本文提出了RASTNet模型,以ResNet50为主干网络,将每层最后一个block中的3×3卷积替换为空洞空间金字塔池化模块,通过不同空洞率的空洞卷积捕获sEMG多尺度信息。然后在每一层的连接处加入STConv模块,该模块在SCConv模块的基础上创新性地融入了三重注意力机制,在提取精细化通道与空间特征后进一步强化三维特征融合。本研究分别在用4种方法进行数据增强的ninapro DB1和DB5数据集上进行实验。结果表明,RASTNet较原模型准确率平均提升了1.83%和1.57%。与ResNeXt、Swin Transformer、CnovNeXt等主流经典模型在拟真噪声下横向对比,其召回率、F1分数等指标均表现更优。并且在面对最新的无噪声闭源模型时仍保持领先,展现出在复杂手势识别任务中的抗噪性。此外,RASTNet在跨数据集的泛化性验证中表现出色,进一步增强了其在实际应用中的适用性和鲁棒性。 展开更多
关键词 表面肌电信号 手势识别 通道与空间特征提取 抗噪
原文传递
基于多重注意力机制和空间变换网络的换衣行人重识别
15
作者 李鹏辉 王洪元 +1 位作者 张继 陈海琴 《南京大学学报(自然科学版)》 北大核心 2025年第2期202-213,共12页
换衣行人重识别(Cloth-Changing Person Re-Identification,CC Re-ID)技术旨在监控视频或图像中针对同一行人在长时间跨度中进行识别,现有方法主要利用多模态信息来建模体型以减轻服装的影响,但其泛化能力差且需大量额外工作,而且,仅利... 换衣行人重识别(Cloth-Changing Person Re-Identification,CC Re-ID)技术旨在监控视频或图像中针对同一行人在长时间跨度中进行识别,现有方法主要利用多模态信息来建模体型以减轻服装的影响,但其泛化能力差且需大量额外工作,而且,仅利用RGB图像的方法无法充分提取与服装无关的信息.针对以上问题,提出一种基于多重注意力机制和空间变换网络的换衣行人重识别方法,通过在主干网络中融入CBAM(Convolutional Block Attention Module)和STN(Spatial Transformer Network,STN)模块,分别提升网络对于不同通道和空间位置重要性的感知能力以及对于不同角度图像的适应能力.为了进一步提高网络对行人细粒度特征的提取能力,融入三重注意力机制来关注不同维度上的信息,引入一个自适应特征提取模块来学习特征中不同区域的重要性.此外,还采用服装分类损失和服装对抗损失等多种损失函数来引导模型学习与服装无关的信息.在四个换衣行人重识别数据集(LTCC,PRCC,VC-Clothes和DeepChange)上进行了大量实验,实验结果表明,提出的方法的Rank-1和mAP指标优于一些先进的换衣行人重识别方法. 展开更多
关键词 换衣行人重识别 基于服装的对抗性损失 三重注意力机制 空间变换网络 自适应特征提取
在线阅读 下载PDF
基于高阶空间交互作用的姿态估计网络
16
作者 黄晓宇 陈佳艺 +2 位作者 吴艺玮 吴胜昔 王学武 《华东理工大学学报(自然科学版)》 北大核心 2025年第4期514-521,共8页
人体姿态估计是计算机视觉领域的一个重要研究方向。随着深度学习技术的进步,现有的姿态估计模型在预测人体关键点方面已经取得了显著成效,然而,在处理复杂场景如严重遮挡、复杂背景、极端姿态、多尺度变化和光照变化时,这些模型仍然面... 人体姿态估计是计算机视觉领域的一个重要研究方向。随着深度学习技术的进步,现有的姿态估计模型在预测人体关键点方面已经取得了显著成效,然而,在处理复杂场景如严重遮挡、复杂背景、极端姿态、多尺度变化和光照变化时,这些模型仍然面临挑战,准确度往往受到影响。为解决这个问题,本文提出了一种改进的基于高分辨率网络(High-Resolution Network,HRNet)的人体姿态估计方法,该方法通过引入高阶空间交互和注意力机制,显著提升了模型在复杂场景中的表现;并采用递归门控卷积和卷积注意力模块以增强模型在高阶空间特征提取的能力。结果表明,提出的方法在COCO2017数据集上超越了现有主流方法,实现了更高的姿态估计精度。 展开更多
关键词 姿态估计 高分辨率网络 高阶空间交互 CBAM注意力机制 特征提取
在线阅读 下载PDF
基于改进YOLOv7的多尺度特征提取绝缘子缺陷检测算法 被引量:1
17
作者 孙虹 郭乂菡 +3 位作者 雷经发 赵汝海 李永玲 张淼 《高压电器》 北大核心 2025年第6期102-112,共11页
针对绝缘子图像缺陷尺寸小、背景干扰因素多、难易样本不平衡等问题,提出了一种多尺度融合的YOLOv7(MSF-YOLOv7)算法,并将其应用于输电线路绝缘子的缺陷检测。首先,通过多尺度卷积块注意力模块(multi scale-convolution block attention... 针对绝缘子图像缺陷尺寸小、背景干扰因素多、难易样本不平衡等问题,提出了一种多尺度融合的YOLOv7(MSF-YOLOv7)算法,并将其应用于输电线路绝缘子的缺陷检测。首先,通过多尺度卷积块注意力模块(multi scale-convolution block attention module,MS-CBAM),深度聚合带有丰富语义信息的特征图,提升网络对不同尺度目标的检测性能;其次,在主干网络利用新开发的全局空间金字塔池化(global spatial pyramid pooling-fast,GSPPF)模块增加全局背景信息,以减轻复杂背景所带来的影响;针对样本分布不平衡的问题,引入Focaler-CIoU损失函数聚焦不同缺陷目标,加快模型的收敛速度。实验结果表明,文中提出的MSF-YOLOv7模型mAP50达到88.1%,精确度和召回率达到90.3%和83.1%,较YOLOv7算法分别提升了6.3%、7.9%和6.3%,同时参数量与浮点计算量分别降低了13.38%和2.95%。 展开更多
关键词 YOLOv7 绝缘子缺陷检测 多尺度特征提取 注意力机制 空间金字塔池化
在线阅读 下载PDF
基于EESP与ODConv的多尺度轴承故障诊断方法
18
作者 任义 陈大鹏 +1 位作者 栾方军 袁帅 《机电工程》 北大核心 2025年第5期832-844,920,共14页
为了解决轴承故障诊断中多尺度特征提取准确性和稳定性不足的问题,提出了一种融合增强高效空间金字塔(EESP)与全维动态卷积(ODConv)的多尺度轴承诊断方法,即基于多尺度全维动态卷积网络(MSODConvNet)的轴承故障诊断模型。首先,采用了基... 为了解决轴承故障诊断中多尺度特征提取准确性和稳定性不足的问题,提出了一种融合增强高效空间金字塔(EESP)与全维动态卷积(ODConv)的多尺度轴承诊断方法,即基于多尺度全维动态卷积网络(MSODConvNet)的轴承故障诊断模型。首先,采用了基于EESP的空洞卷积金字塔模块,利用了多尺度空洞卷积结构增强了特征提取能力,有效地捕捉了不同尺度的特征信息,从而提升了模型对复杂信号的感知能力;其次,采用的ODConv模块使卷积核在多个维度上同时进行了高效运作,使用动态调整卷积核结构提升了模型的灵活性和适应性,使其能够更好地应对复杂数据中的多样化模式和特征;最后,在ODConv模块中引入了双跳跃连接机制,进一步强化了信息在深层网络中的传递效果,确保了特征信息的完整性和高效传递。研究结果表明:基于EESP和ODConv的多尺度模型在分类准确率方面得到较大的提高,在凯斯西储大学(CWRU)数据集上的准确率可达99.50%,表现出较高的准确性和稳定性,并在与其他对比方法的比较中展现出较高的优势。该研究可为工业设备的智能维护和故障诊断提供新的方法和思路,为实现更精确和更高效的故障诊断提供理论依据。 展开更多
关键词 轴承故障诊断 多尺度特征提取 增强高效空间金字塔 多尺度全维动态卷积网络 双跳跃连接机制 故障诊断模型
在线阅读 下载PDF
基于DenseNet与优化特征空间的水体提取与时空变化分析
19
作者 杨羽轩 张婷慧 +2 位作者 高忱 林怡 宇洁 《测绘科学技术学报》 2025年第2期212-220,共9页
随着卫星遥感技术与深度学习技术的飞速发展,遥感影像的智能提取能力得到了显著提高。然而面对不同区域复杂土地覆被和地理环境下湖泊提取研究,现有的方法仍然存在精度不足、稳定性差的问题。提出一种基于密集连接网络(DenseNet)与优化... 随着卫星遥感技术与深度学习技术的飞速发展,遥感影像的智能提取能力得到了显著提高。然而面对不同区域复杂土地覆被和地理环境下湖泊提取研究,现有的方法仍然存在精度不足、稳定性差的问题。提出一种基于密集连接网络(DenseNet)与优化特征空间的湖泊水体提取算法(OFS-DN)。该算法以DenseNet为基础,采用多种光谱指数及最佳波段组合,共同构建水体提取的理想特征空间。并将提出的算法与传统聚类算法、机器学习算法和普通卷积神经网络方法进行精度对比验证。与其他水体提取算法相比,提出的多特征空间DenseNet算法稳定性和精度都更好,在多种不同区域和影像上均达到了更好的提取精度和分类效果,总体精度最高达到0.989,实现了对不同纬度带和气候条件水体的高效、准确提取。此外,利用OFS-DN算法,实现了非洲维多利亚湖2000—2021年间的水体范围精确提取与水表面积计算,分析了湖岸线变化和湖泊淹没区的淹没频率,发现了湖泊岸线变动最频繁的区域,并揭示了其时空特征与演变规律。该研究为湖泊水文监测提供了一种高效精确的技术手段,对湖泊生态环境保护、水资源管理以及可持续发展规划具有重要意义。 展开更多
关键词 密集连接网络 优化特征空间 水体提取 时空变化 深度学习
在线阅读 下载PDF
基于双路时空特征融合的步态识别方法
20
作者 关迪元 谢谢 霍焱 《沈阳大学学报(自然科学版)》 2025年第3期231-238,共8页
为了增强步态特征的表达能力,充分利用步态图像的外观信息和时序信息,提出了一种基于双路时空特征融合的步态识别方法。在空间上,分别对全局和局部的空间特征进行提取:全局特征采用2D CNN的方法提取,关注整个视觉步态外观;局部特征采用... 为了增强步态特征的表达能力,充分利用步态图像的外观信息和时序信息,提出了一种基于双路时空特征融合的步态识别方法。在空间上,分别对全局和局部的空间特征进行提取:全局特征采用2D CNN的方法提取,关注整个视觉步态外观;局部特征采用焦点卷积的方法提取,关注步态细节。在时间上,对于步态帧的全局和局部信息,分别引入注意力机制来获取长短期时间中最具判别力的特征。最后将全局、局部和长短期特征进行自适应融合,把双路的自适应时空特征进行拼接,从而构成基于双路时空特征融合的步态识别网络。采用三元损失函数和交叉熵损失函数进行联合训练。实验表明,在CASIA-B数据集上,本方法在正常行走、携带行李和穿着外衣的情况下,分别实现了97.1%、93.3%和82.0%的Rank-1精度,优于其他算法;同时,在mini-OUMVLP数据集上也获得了较高的步态识别率。 展开更多
关键词 步态识别 双路网络 时空特征提取 注意力机制 自适应时间特征融合
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部