期刊文献+
共找到211篇文章
< 1 2 11 >
每页显示 20 50 100
LP-YOLO:Enhanced Smoke and Fire Detection via Self-Attention and Feature Pyramid Integration
1
作者 Qing Long Bing Yi +2 位作者 Haiqiao Liu Zhiling Peng Xiang Liu 《Computers, Materials & Continua》 2026年第3期1490-1509,共20页
Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and comple... Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and complex environmental conditions,which often reduce detection accuracy and real-time performance.To address these limitations,we propose Lightweight and Precise YOLO(LP-YOLO),a high-precision detection framework that integrates a self-attention mechanism with a feature pyramid,built upon YOLOv8.First,to overcome the restricted receptive field and parameter redundancy of conventional Convolutional Neural Networks(CNNs),we design an enhanced backbone based on Wavelet Convolutions(WTConv),which expands the receptive field through multifrequency convolutional processing.Second,a Bidirectional Feature Pyramid Network(BiFPN)is employed to achieve bidirectional feature fusion,enhancing the representation of smoke features across scales.Third,to mitigate the challenge of ambiguous object boundaries,we introduce the Frequency-aware Feature Fusion(FreqFusion)module,in which the Adaptive Low-Pass Filter(ALPF)reduces intra-class inconsistencies,the offset generator refines boundary localization,and the Adaptive High-Pass Filter(AHPF)recovers high-frequency details lost during down-sampling.Experimental evaluations demonstrate that LP-YOLO significantly outperforms the baseline YOLOv8,achieving an improvement of 9.3%in mAP@50 and 9.2%in F1-score.Moreover,the model is 56.6%and 32.4%smaller than YOLOv7-tiny and EfficientDet,respectively,while maintaining real-time inference speed at 238 frames per second(FPS).Validation on multiple benchmark datasets,including D-Fire,FIRESENSE,and BoWFire,further confirms its robustness and generalization ability,with detection accuracy consistently exceeding 82%.These results highlight the potential of LP-YOLO as a practical solution with high accuracy,robustness,and real-time performance for smoke and fire source detection. 展开更多
关键词 Deep learning smoke detection feature pyramid boundary refinement
在线阅读 下载PDF
面向四面体网格生成的Delaunay refinement器官表面重建 被引量:1
2
作者 周筠 樊晓平 廖志芳 《小型微型计算机系统》 CSCD 北大核心 2012年第8期1816-1820,共5页
为满足生物医学仿真系统对器官几何模型在Delaunay表面重构和四面体建模两方面的需求,提出一种面向四面体网格生成的Delaunay refinement表面重构算法.算法将从医学体数据中经过等值面提取和简化的初始表面作为输入和边界限定条件,为每... 为满足生物医学仿真系统对器官几何模型在Delaunay表面重构和四面体建模两方面的需求,提出一种面向四面体网格生成的Delaunay refinement表面重构算法.算法将从医学体数据中经过等值面提取和简化的初始表面作为输入和边界限定条件,为每个限定点计算局部特征尺寸并构建保护球,计算保护球与限定线段的交点并与限定点一起作为初始点集,生成Delaunay辅助四面体网格,引入一个迭代细分过程恢复边界,最终获得Delaunay重构表面.针对细分过程中的收敛性问题,文中给出了详细的理论证明和算法实例.此外,通过Delaunay四面体生成的对比实验表明该算法在Delaunay器官表面重构和四面体建模两方面兼具有效性和优越性. 展开更多
关键词 DELAUNAY refinement 器官表面重构 局部特征尺寸 收敛性
在线阅读 下载PDF
Product Image Classification Based on Fusion Features
3
作者 杨晓慧 刘静静 杨利军 《Chinese Quarterly Journal of Mathematics》 2015年第3期429-441,共13页
Two key challenges raised by a product images classification system are classification precision and classification time. In some categories, classification precision of the latest techniques, in the product images cl... Two key challenges raised by a product images classification system are classification precision and classification time. In some categories, classification precision of the latest techniques, in the product images classification system, is still low. In this paper, we propose a local texture descriptor termed fan refined local binary pattern, which captures more detailed information by integrating the spatial distribution into the local binary pattern feature. We compare our approach with different methods on a subset of product images on Amazon/e Bay and parts of PI100 and experimental results have demonstrated that our proposed approach is superior to the current existing methods. The highest classification precision is increased by 21% and the average classification time is reduced by 2/3. 展开更多
关键词 product image CLASSIFICATION FAN refined local binary pattern(FRLBP) PYRAMID HISTOGRAM of orientated gradients(PHOG) FUSION featureS
在线阅读 下载PDF
Learning a Discriminative Feature Attention Network for pancreas CT segmentation
4
作者 HUANG Mei-xiang WANG Yuan-jin +2 位作者 HUANG Chong-fei YUAN Jing KONG De-xing 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 2022年第1期73-90,共18页
Accurate pancreas segmentation is critical for the diagnosis and management of diseases of the pancreas. It is challenging to precisely delineate pancreas due to the highly variations in volume, shape and location. In... Accurate pancreas segmentation is critical for the diagnosis and management of diseases of the pancreas. It is challenging to precisely delineate pancreas due to the highly variations in volume, shape and location. In recent years, coarse-to-fine methods have been widely used to alleviate class imbalance issue and improve pancreas segmentation accuracy. However,cascaded methods could be computationally intensive and the refined results are significantly dependent on the performance of its coarse segmentation results. To balance the segmentation accuracy and computational efficiency, we propose a Discriminative Feature Attention Network for pancreas segmentation, to effectively highlight pancreas features and improve segmentation accuracy without explicit pancreas location. The final segmentation is obtained by applying a simple yet effective post-processing step. Two experiments on both public NIH pancreas CT dataset and abdominal BTCV multi-organ dataset are individually conducted to show the effectiveness of our method for 2 D pancreas segmentation. We obtained average Dice Similarity Coefficient(DSC) of 82.82±6.09%, average Jaccard Index(JI) of 71.13± 8.30% and average Symmetric Average Surface Distance(ASD) of 1.69 ± 0.83 mm on the NIH dataset. Compared to the existing deep learning-based pancreas segmentation methods, our experimental results achieve the best average DSC and JI value. 展开更多
关键词 attention mechanism Discriminative feature Attention Network Improved refinement Residual Block pancreas CT segmentation
在线阅读 下载PDF
Sem-iNeRF:Camera Pose Refinement by Inverting Neural Radiance Fields with Semantic Feature Consistency
5
作者 Anran Liu Xiaoxiao Long +2 位作者 Yuan Liu Ping Luo Wenping Wang 《Computational Visual Media》 2025年第3期513-530,共18页
This paper presents a novel approach for camera pose refinement based on neural radiance fields(NeRF)by introducing semantic feature consistency to enhance robustness.NeRF has been successfully applied to camera pose ... This paper presents a novel approach for camera pose refinement based on neural radiance fields(NeRF)by introducing semantic feature consistency to enhance robustness.NeRF has been successfully applied to camera pose estimation by inverting the rendering process given an observed RGB image and an initial pose estimate.However,previous methods only adopted photometric consistency for pose optimization,which is prone to be trapped in local minima.To address this problem,we introduce semantic feature consistency into the existing framework.Specifically,we utilize high-level features extracted from a convolutional neural network(CNN)pre-trained for image recognition,and maintain consistency of such features between observed and rendered images during the optimization procedure.Unlike the color values at each pixel,these features contain rich semantic information shared within local regions and can be more robust to appearance changes from different viewpoints.Since it is computationally expensive to render a full image with NeRF for feature extraction from CNN,we propose an efficient way to estimate the features of individually rendered pixels by projecting them to a nearby reference image and interpolating its feature maps.Extensive experiments show that our method greatly outperforms the baseline method on both synthetic objects and real-world large indoor scenes,increasing the accuracy of pose estimation by over 6.4%. 展开更多
关键词 camera pose refinement neural radiance fields analysis-by-synthesis semantic features
原文传递
基于局部特征匹配和伪标签细化的纯无监督行人重识别
6
作者 刘国权 陈尚良 +3 位作者 秦晨旭 周书民 周焕银 王小刚 《现代电子技术》 北大核心 2026年第6期174-183,共10页
针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特... 针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特征匹配模块,通过对齐样本的局部特征并进行相似度排序,合理表征样本之间全局与局部特征的相关性。随后,引入相关性评分模块,在综合考虑样本的全局特征和局部特征之间的相关性的基础上,对聚类生成的伪标签的合理性进行打分。在此基础上,通过伪标签细化模块,依据评分结果分别对样本的全局和局部特征伪标签进行细化。最后,使用细化后的伪标签训练网络,并在训练过程中持续更新伪标签。在Market-1501、DukeMTMC-ReID和MSMT17公开行人重识别数据集上对所提方法进行实验验证,结果表明,该方法的mAP分别达到81.9%、71.1%和31.6%,效果良好。 展开更多
关键词 行人重识别 无监督 伪标签细化 局部特征匹配 神经网络 消融实验 相关性评分
在线阅读 下载PDF
一种抗行人干扰的车辆重识别算法
7
作者 曹仰杰 蔡吉灏 +1 位作者 王沛祺 杨聪 《郑州大学学报(工学版)》 北大核心 2026年第2期35-40,共6页
车辆重识别是实现车辆跟踪的基础,然而,行人干扰会显著影响车辆特征的提取,进而降低车辆重识别的准确性和精度。针对这一问题,提出一种名为轨迹优化与背景抑制的车辆重识别算法TRaBS。首先,使用ResNeXt101-IBN-a网络对车辆图像进行特征... 车辆重识别是实现车辆跟踪的基础,然而,行人干扰会显著影响车辆特征的提取,进而降低车辆重识别的准确性和精度。针对这一问题,提出一种名为轨迹优化与背景抑制的车辆重识别算法TRaBS。首先,使用ResNeXt101-IBN-a网络对车辆图像进行特征提取,得到车辆初始特征,同时应用背景抑制算法对摄像头画面进行特征计算,生成经过背景抑制处理的车辆特征;其次,为了降低行人对特征提取的干扰,采用欧几里得距离和高斯核函数,将车辆图像特征替换为更加稳定的轨迹特征,通过这些技术,TRaBS算法有效解决了车辆重识别中的行人干扰问题;最后,为全面验证TRaBS算法在应对行人干扰方面的有效性以及在无干扰环境下的通用性,设计并进行了对比实验与消融实验。实验结果表明:融合轨迹优化与背景抑制算法的车辆重识别模型在基准数据集以及引入行人干扰的衍生数据集上均取得了显著的效果。在VeRi-776数据集上,平均精度均值mAP达到了83.6%,Rank-1准确率达到了97.6%,显著优于现有方法。 展开更多
关键词 车辆重识别 行人干扰 轨迹优化 背景抑制 特征提取
在线阅读 下载PDF
VIFusion:低光场景下可见光与红外图像的互补融合模型
8
作者 张晓滨 牛燕皓 陈金广 《西安工程大学学报》 2026年第1期126-135,共10页
针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual tem... 针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual temporal feature aggregation,DTFA)模块、特征细化前馈网络(feature refinement feedforward network,FRFN)模块和空间通道注意力机制(spatial channel attention,SCA)模块提升了融合图像的质量和信息表达能力。其中,DTFA模块使用分组卷积保持特征空间完整性,然后进行时序对齐与融合,以增强时序一致性并减少信息损失。FRFN模块对提取的特征进行逐层优化,减少通道冗余。SCA模块通过自适应建模图像空间和通道关系,突出关键特征,提高信息表达能力、增强边缘、纹理等细节信息。实验结果表明:在LLVIP数据集上,VIFusion模型在客观指标(AG、CC、EN、SF、SSIM、VIF、MI)上优于传统方法和深度学习模型(如GTF、TarDAL、DenseFuse等)。在数据集TNO上的泛化实验中,生成的融合图像在细节保留和目标突出上也表现更佳。VIFusion模型为低光场景下的多模态图像融合提供了一种高效实用的解决方案。 展开更多
关键词 双时态特征聚合 特征细化前馈网络 空间通道注意力 图像融合
在线阅读 下载PDF
融合交叉注意力和双特征交互的红外船舶目标检测模型
9
作者 邹少华 刘笑嶂 李修来 《计算机工程》 北大核心 2026年第1期390-399,共10页
为了应对红外图像目标检测中目标像素低、背景复杂以及硬件资源有限等问题,提出一种融合位置编码的多头交叉注意力机制和双特征交互细化结构的目标检测模型。在骨干网络中,引入基于位置编码的交叉注意力(CCA)模块和空间金字塔池跨阶段局... 为了应对红外图像目标检测中目标像素低、背景复杂以及硬件资源有限等问题,提出一种融合位置编码的多头交叉注意力机制和双特征交互细化结构的目标检测模型。在骨干网络中,引入基于位置编码的交叉注意力(CCA)模块和空间金字塔池跨阶段局部(SPCP)模块。CCA模块通过行和列的相关矩阵变换,在水平和垂直方向上聚合上下文信息,并通过共享递归交错模块的参数,减少自注意力机制所需的参数数量,增强特征提取能力。SPCP模块通过统一不同大小和尺度的特征映射,采用跨阶段局部(CSP)结构降低参数和计算量,并引入挤压激励注意力机制选择对目标检测更有利的通道。在颈部网络中,引入频域信息和双特征交互细化(DIR)模块,进一步提取小型目标船舶的细化特征,增强模型的特征融合能力。实验结果表明,改进后的模型在红外船舶检测数据集(ISDD)上的精确度为89.5%,召回率为97%,F1值为93.1%,与基准模型相比,显著提高了检测性能。此外,与其他检测模型相比,所提出的模型减少了计算参数量,融合位置编码的多头交叉注意力机制和双特征交互细化结构可有效提升红外船舶目标检测的准确性。 展开更多
关键词 红外图像 目标检测 多头交叉注意力 多尺度重塑 双特征交互细化
在线阅读 下载PDF
基于改进YOLOv12的煤矸石智能识别方法
10
作者 周伟 李广棵 《工矿自动化》 北大核心 2026年第1期106-113,139,共9页
针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石... 针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石目标区域的关注力与空间感知能力;设计了多条件特征精炼(MCFR)机制,对深层和浅层特征进行条件引导融合,有效增强煤炭与煤矸石的类别差异性表达;构建了动态多任务平衡损失(DMTBL)函数,实现位置、类别与置信度之间的权重自适应调节,从而增强模型对难样本区域的学习能力。实验结果表明,改进YOLOv12在煤矸石识别任务中的识别精准率、召回率和mAP分别达96.5%,94.9%,95.8%,较原始YOLOv12分别提升了3.8%,4.5%,4.5%,有效解决了煤矸石漏检、误检和边界模糊等问题,且保持高达47.7帧/s的推理速度。可视化激活热力图表明,改进YOLOv12在处理不同结构与纹理复杂度的煤矸石时,均能准确聚焦于目标本体区域,无明显背景干扰,激活区域基本覆盖了煤块与煤矸石的主要轮廓。 展开更多
关键词 煤矸石识别 改进YOLOv12 双尺度稀疏注意力 多条件特征精炼 动态多任务平衡损失
在线阅读 下载PDF
基于Decoupled-FR Net的伪造图像检测模型
11
作者 杨桃 张乾 +1 位作者 文露露 彭杉 《湖北民族大学学报(自然科学版)》 2026年第1期69-74,共6页
针对伪造图像检测中细粒度特征感知与跨区域依赖建模的挑战,提出解耦频率细化网络(decoupled frequency refinement network, Decoupled-FR Net)检测模型。该模型设计了空间-通道解耦注意力机制,有效避免了传统混合注意力中的特征耦合问... 针对伪造图像检测中细粒度特征感知与跨区域依赖建模的挑战,提出解耦频率细化网络(decoupled frequency refinement network, Decoupled-FR Net)检测模型。该模型设计了空间-通道解耦注意力机制,有效避免了传统混合注意力中的特征耦合问题,提升了特征表示的独立性与判别力;引入了特征细化模块,通过层级特征校准与融合功能增强对细微篡改的感知能力;结合上下文感知机制,捕捉跨区域的长距离依赖关系,从而提升整体检测性能。结果表明,Decoupled-FR Net模型在伪造合成(forensic synthetics, ForenSynths)数据集上的准确率、平均精确率分别比块间依赖网络(inter-patch dependency network, IPD-Net)模型提高了2.4、0.5个百分点,在生成式对抗网络(generative adversarial network, GAN)的生成图像检测(GAN generation detection, GANGen-Detection)数据集上的平均精确率比频域网络(frequency domain network, FreqNet)模型提高了0.1个百分点。该模型为细粒度伪造图像检测提供了新的解决方案,在多媒体取证领域具有重要的应用价值。 展开更多
关键词 空间-通道注意力解耦 特征细化 频域增强 上下文感知 跨模型伪造图像检测 生成式对抗网络
在线阅读 下载PDF
Supporting feature model refinement with updatable view 被引量:1
12
作者 Bo WANG Zhenjiang HU +4 位作者 Qiang SUN Haiyan ZHAO Yingfei XIONG WeiZHANG Hong MEI 《Frontiers of Computer Science》 SCIE EI CSCD 2013年第2期257-271,共15页
In the research of software reuse, feature models have been widely adopted to capture, organize and reuse the requirements of a set of similar applications in a software do- main. However, the construction, especially... In the research of software reuse, feature models have been widely adopted to capture, organize and reuse the requirements of a set of similar applications in a software do- main. However, the construction, especially the refinement, of feature models is a labor-intensive process, and there lacks an effective way to aid domain engineers in refining feature models. In this paper, we propose a new approach to support interactive refinement of feature models based on the view updating technique. The basic idea of our approach is to first extract features and relationships of interest from a possibly large and complicated feature model, then organize them into a comprehensible view, and finally refine the feature model through modifications on the view. The main characteristics of this approach are twofold: a set of powerful rules (as the slicing criterion) to slice the feature model into a view auto- matically, and a novel use of a bidirectional transformation language to make the view updatable. We have successfully developed a tool, and a nontrivial case study shows the feasi- bility of this approach. 展开更多
关键词 feature model refinement SLICING bidrectionaltransformation
原文传递
Siamese Dense Pixel-Level Fusion Network for Real-Time UAV Tracking 被引量:1
13
作者 Zhenyu Huang Gun Li +4 位作者 Xudong Sun Yong Chen Jie Sun Zhangsong Ni Yang Yang 《Computers, Materials & Continua》 SCIE EI 2023年第9期3219-3238,共20页
Onboard visual object tracking in unmanned aerial vehicles(UAVs)has attractedmuch interest due to its versatility.Meanwhile,due to high precision,Siamese networks are becoming hot spots in visual object tracking.Howev... Onboard visual object tracking in unmanned aerial vehicles(UAVs)has attractedmuch interest due to its versatility.Meanwhile,due to high precision,Siamese networks are becoming hot spots in visual object tracking.However,most Siamese trackers fail to balance the tracking accuracy and time within onboard limited computational resources of UAVs.To meet the tracking precision and real-time requirements,this paper proposes a Siamese dense pixel-level network for UAV object tracking named SiamDPL.Specifically,the Siamese network extracts features of the search region and the template region through a parameter-shared backbone network,then performs correlationmatching to obtain the candidate regionwith high similarity.To improve the matching effect of template and search features,this paper designs a dense pixel-level feature fusion module to enhance the matching ability by pixel-wise correlation and enrich the feature diversity by dense connection.An attention module composed of self-attention and channel attention is introduced to learn global context information and selectively emphasize the target feature region in the spatial and channel dimensions.In addition,a target localization module is designed to improve target location accuracy.Compared with other advanced trackers,experiments on two public benchmarks,which are UAV123@10fps and UAV20L fromthe unmanned air vehicle123(UAV123)dataset,show that SiamDPL can achieve superior performance and low complexity with a running speed of 100.1 fps on NVIDIA TITAN RTX. 展开更多
关键词 Siamese network UAV object tracking dense pixel-level feature fusion attention module target localization
在线阅读 下载PDF
Substation rotational object detection based on multi-scale feature fusion and refinement 被引量:1
14
作者 Bin Li Yalin Li +4 位作者 Xinshan Zhu Luyao Qu Shuai Wang Yangyang Tian Dan Xu 《Energy and AI》 2023年第4期490-499,共10页
In modern energy systems,substations are the core of electricity transmission and distribution.However,similar appearance and small size pose significant challenges for automatic identification of electrical devices.T... In modern energy systems,substations are the core of electricity transmission and distribution.However,similar appearance and small size pose significant challenges for automatic identification of electrical devices.To address these issues,we collect and annotate the substation rotated device dataset(SRDD).Further,feature fusion and feature refinement network(F3RNet)are constructed based on the classic structure pattern of backbone-neck-head.Considering the similar appearance of electrical devices,the deconvolution fusion module(DFM)is designed to enhance the expression of feature information.The balanced feature pyramid(BFP)is embedded to aggregate the global feature.The feature refinement is constructed to adjust the original feature maps by considering the feature alignment between the anchors and devices.It can generate more accurate feature vectors.To address the problem of sample imbalance between electrical devices,the gradient harmonized mechanism(GHM)loss is utilized to adjust the weight of each sample.The ablation experiments are conducted on the SRDD dataset.F3RNet achieves the best detection performance compared with classical object detection networks.Also,it is verified that the features from global feature maps can effectively recognize the similar and small devices. 展开更多
关键词 SUBSTATION Rotated device Object detection feature fusion feature refinement
在线阅读 下载PDF
FaSRnet:a feature and semantics refinement network for human pose estimation
15
作者 Yuanhong ZHONG Qianfeng XU +2 位作者 Daidi ZHONG Xun YANG Shanshan WANG 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2024年第4期513-526,共14页
Due to factors such as motion blur,video out-of-focus,and occlusion,multi-frame human pose estimation is a challenging task.Exploiting temporal consistency between consecutive frames is an efficient approach for addre... Due to factors such as motion blur,video out-of-focus,and occlusion,multi-frame human pose estimation is a challenging task.Exploiting temporal consistency between consecutive frames is an efficient approach for addressing this issue.Currently,most methods explore temporal consistency through refinements of the final heatmaps.The heatmaps contain the semantics information of key points,and can improve the detection quality to a certain extent.However,they are generated by features,and feature-level refinements are rarely considered.In this paper,we propose a human pose estimation framework with refinements at the feature and semantics levels.We align auxiliary features with the features of the current frame to reduce the loss caused by different feature distributions.An attention mechanism is then used to fuse auxiliary features with current features.In terms of semantics,we use the difference information between adjacent heatmaps as auxiliary features to refine the current heatmaps.The method is validated on the large-scale benchmark datasets PoseTrack2017 and PoseTrack2018,and the results demonstrate the effectiveness of our method. 展开更多
关键词 Human pose estimation Multi-frame refinement Heatmap and offset estimation feature alignment Multi-person
原文传递
基于大内核自适应融合的小目标检测算法 被引量:1
16
作者 王磊 胡君红 任洋 《计算机工程》 北大核心 2025年第6期65-73,共9页
针对当前基于卷积神经网络的单阶段目标检测算法(YOLO系列、VFNet等)在高空拍摄场景下目标背景复杂、检测精度低、特征混叠等问题,提出一种端到端的目标检测算法CSPENet。首先,采用基于大内核深度卷积CSPNeXt作为模型主干,提高模型捕捉... 针对当前基于卷积神经网络的单阶段目标检测算法(YOLO系列、VFNet等)在高空拍摄场景下目标背景复杂、检测精度低、特征混叠等问题,提出一种端到端的目标检测算法CSPENet。首先,采用基于大内核深度卷积CSPNeXt作为模型主干,提高模型捕捉全局上下文的能力;其次,通过引入特征细化模块(FRM)在空间和通道维度上生成自适应权重,可有效抑制混叠特征,并在特征融合阶段添加基于移动网络的感受野注意力(RFA)机制解决大内核参数共享问题;最后,采用EIoU损失函数作为模型的回归损失函数,并拆分预测框和真实框纵横比的影响因子,以提高模型收敛速度并改善定位效果。实验结果表明,CSPENet在VisDrone-DET数据集上相对于DINO算法平均准确率均值提升4.4百分点,为小目标检测算法的研究及其应用提供新的参考方案。 展开更多
关键词 大内核 小目标 上下文信息 特征细化 自适应融合 感受野
在线阅读 下载PDF
基于MobileGStereo的低复杂度立体匹配算法
17
作者 伍云霞 邹正阳 徐倩 《华中科技大学学报(自然科学版)》 北大核心 2025年第5期78-84,共7页
针对目前的先进立体匹配模型通过堆叠深度模块不断提高域内训练精度,导致计算成本提高且难以兼顾跨域数据的模型退化问题,对立体匹配的特征提取、代价计算与聚合、视差细化等子流程进行模型重构,并借助传统模型弥补深度网络缺陷,提出一... 针对目前的先进立体匹配模型通过堆叠深度模块不断提高域内训练精度,导致计算成本提高且难以兼顾跨域数据的模型退化问题,对立体匹配的特征提取、代价计算与聚合、视差细化等子流程进行模型重构,并借助传统模型弥补深度网络缺陷,提出一种兼顾跨域数据泛化能力和快速推理能力的低复杂度立体匹配模型——MobileGStereo.在特征提取阶段,深度网络旨在提取像素之间的差异特征而非复杂的语义特征,同时特征图的表征分布应注重本身而非整个批次,因此采用基于层归一化的MobileNet作为特征提取骨干.在代价计算与聚合阶段,提出一种跳跃代价体以降低高分辨率特征在代价聚合阶段的计算复杂度;为聚合不同尺度特征计算的代价体,通过拟合传统聚合方法提出基于3D深度可分离卷积的跨尺度聚合方法;最后以轻量沙漏型结构对跨尺度聚合后的代价进行多维信息融合并用于回归初始视差.采用基于ConvGRU的循环结构,借助特征信息循环细化初始视差.在基准数据集上进行验证,实验结果表明:所提方法推理1226×370分辨率立体图片仅耗时75 ms,在显著提高模型推理速度的同时能够在跨域数据泛化能力测试中取得与最先进算法相当的量化性能. 展开更多
关键词 深度学习 立体匹配 特征提取 代价计算与聚合 视差细化
原文传递
基于细分多尺度和并行注意力的密集人群检测算法
18
作者 张欣 亢世宁 +2 位作者 杨寓淇 王珺 马致远 《计算机工程与应用》 北大核心 2025年第23期161-172,共12页
人群检测在自动驾驶、交通管理和智能安防等领域有着广泛的应用。其具有检测人群密度大、行人遮挡多、尺度变化大和人群分布不规则的特点,是计算机视觉中具有挑战性的问题之一。为了进一步挖掘密集场景下人群丰富的多尺度信息,以及应对... 人群检测在自动驾驶、交通管理和智能安防等领域有着广泛的应用。其具有检测人群密度大、行人遮挡多、尺度变化大和人群分布不规则的特点,是计算机视觉中具有挑战性的问题之一。为了进一步挖掘密集场景下人群丰富的多尺度信息,以及应对人群分布和形状不规则的挑战,在SparseR-CNN的基础上提出了一种基于细分多尺度和并行注意力的人群检测算法,命名为RMFR-CNN(refined multiscale feature R-CNN),其通过并行多个不同尺度的膨胀卷积构建感受野融合模块以提取细化的尺度信息。基于膨胀卷积注意力和可变形卷积注意力构建并行注意力模块,以从不同的尺度感知人群的分布与形状信息。为了缓解因数据误标注和行人尺度所导致的损失敏感,在原有损失函数的基础上加入了动态损失权重,使损失因行人尺度和预测准度而动态变化,提升模型的泛化能力。实验结果表明,所提算法在CrowdHuman、CityPersons等数据集中的AP为91.1%,MR−2为44.5%,Recall为96.7%。该算法能够在一定程度上提升密集场景中人群检测的性能。 展开更多
关键词 人群检测 细分多尺度 注意力机制 SparseR-CNN 动态损失权重
在线阅读 下载PDF
基于特征精炼网络的绝缘子缺陷检测
19
作者 姜香菊 王瑞彤 马彦鸿 《北京交通大学学报》 北大核心 2025年第3期79-89,共11页
定期巡检绝缘子状态是保障电网安全运行的重要环节.针对航拍图像中绝缘子缺陷区域占比小和目标大小不一致造成的检测效果不理想的问题,提出一种基于特征精炼网络的绝缘子缺陷检测算法.首先,采用焦点调制网络(Focal Modulation Network,F... 定期巡检绝缘子状态是保障电网安全运行的重要环节.针对航拍图像中绝缘子缺陷区域占比小和目标大小不一致造成的检测效果不理想的问题,提出一种基于特征精炼网络的绝缘子缺陷检测算法.首先,采用焦点调制网络(Focal Modulation Network,FocalNet)对不同粒度级别的空间上下文进行编码,并使用其与跨级部分通道的快速空间金字塔池化(Spatial Pyramid Pooling Faster Cross Stage Partial Channel,SPPFCSPC)共同构建特征提取主干,提高网络的特征提取能力;然后,设计增强特征自适应融合金字塔,提出定位信息补充分支以解决缺陷特征丢失问题,同时引入高效的多尺度注意力(Efficient Multi-Scale Attention,EMA)构建不同分辨率的丰富语义特征图;最后,采用特征精炼检测头提取和聚合绝缘子及缺陷的多尺度特征信息,生成更具辨别力的特征以用于检测不同尺度的目标.研究结果表明,特征精炼网络的均值平均精度(mean Average Pre-cision,mAP)达到98.2%,能够对多尺度绝缘子及缺陷进行有效识别,为绝缘子航拍图像的多尺度检测提供参考. 展开更多
关键词 绝缘子缺陷检测 智能巡检 多尺度目标检测 特征精炼 深度学习
在线阅读 下载PDF
基于RCMFFDE和SSA-RVM的旋转机械损伤检测模型 被引量:2
20
作者 王显彬 孙阳 《机电工程》 北大核心 2025年第3期510-519,共10页
针对旋转机械系统的振动信号具有明显的非线性,严重影响故障特征提取从而导致其识别精度不佳的问题,建立了一种基于精细复合多尺度分数波动散布熵(RCMFFDE)、t-分布随机邻域嵌入(t-SNE)和麻雀搜索算法优化相关向量机(SSA-RVM)的旋转机... 针对旋转机械系统的振动信号具有明显的非线性,严重影响故障特征提取从而导致其识别精度不佳的问题,建立了一种基于精细复合多尺度分数波动散布熵(RCMFFDE)、t-分布随机邻域嵌入(t-SNE)和麻雀搜索算法优化相关向量机(SSA-RVM)的旋转机械损伤检测模型。首先,进行了基于RCMFFDE方法的特征提取,生成了特征样本,以定量反映旋转机械的不同损伤情况;然后,采用t-SNE方法,将原始高维故障特征映射至低维空间,获得了对故障更敏感的低维特征;最后,将敏感的低维故障特征向量输入至SSA-RVM多分类器中,进行了训练和测试,实现了旋转机械样本的故障识别目的;采用两种旋转机械数据集进行了实验,并从准确率、效率和抗噪性方面,将RCMFFDE-SSA-SVM方法与多种特征提取方法进行了对比。研究结果表明:RCMFFDE能用于有效提取旋转机械的故障特征,分别取得99.2%和100%的识别精度;而对敏感特征进行分类所获得的精度优于对原始特征进行分类的情形,前者比后者提高了4%;在模式识别中,SSA-RVM优于其他分类器;自制数据集的诊断精度达到了97%,特征提取的时间为16.05 s。 展开更多
关键词 非线性振动信号 特征提取时间 故障识别精度(诊断精度) 精细复合多尺度分数波动散布熵 t-分布随机邻域嵌入 麻雀搜索算法优化相关向量机
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部