期刊文献+
共找到215篇文章
< 1 2 11 >
每页显示 20 50 100
LP-YOLO:Enhanced Smoke and Fire Detection via Self-Attention and Feature Pyramid Integration
1
作者 Qing Long Bing Yi +2 位作者 Haiqiao Liu Zhiling Peng Xiang Liu 《Computers, Materials & Continua》 2026年第3期1490-1509,共20页
Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and comple... Accurate detection of smoke and fire sources is critical for early fire warning and environmental monitoring.However,conventional detection approaches are highly susceptible to noise,illumination variations,and complex environmental conditions,which often reduce detection accuracy and real-time performance.To address these limitations,we propose Lightweight and Precise YOLO(LP-YOLO),a high-precision detection framework that integrates a self-attention mechanism with a feature pyramid,built upon YOLOv8.First,to overcome the restricted receptive field and parameter redundancy of conventional Convolutional Neural Networks(CNNs),we design an enhanced backbone based on Wavelet Convolutions(WTConv),which expands the receptive field through multifrequency convolutional processing.Second,a Bidirectional Feature Pyramid Network(BiFPN)is employed to achieve bidirectional feature fusion,enhancing the representation of smoke features across scales.Third,to mitigate the challenge of ambiguous object boundaries,we introduce the Frequency-aware Feature Fusion(FreqFusion)module,in which the Adaptive Low-Pass Filter(ALPF)reduces intra-class inconsistencies,the offset generator refines boundary localization,and the Adaptive High-Pass Filter(AHPF)recovers high-frequency details lost during down-sampling.Experimental evaluations demonstrate that LP-YOLO significantly outperforms the baseline YOLOv8,achieving an improvement of 9.3%in mAP@50 and 9.2%in F1-score.Moreover,the model is 56.6%and 32.4%smaller than YOLOv7-tiny and EfficientDet,respectively,while maintaining real-time inference speed at 238 frames per second(FPS).Validation on multiple benchmark datasets,including D-Fire,FIRESENSE,and BoWFire,further confirms its robustness and generalization ability,with detection accuracy consistently exceeding 82%.These results highlight the potential of LP-YOLO as a practical solution with high accuracy,robustness,and real-time performance for smoke and fire source detection. 展开更多
关键词 Deep learning smoke detection feature pyramid boundary refinement
在线阅读 下载PDF
Product Image Classification Based on Fusion Features
2
作者 杨晓慧 刘静静 杨利军 《Chinese Quarterly Journal of Mathematics》 2015年第3期429-441,共13页
Two key challenges raised by a product images classification system are classification precision and classification time. In some categories, classification precision of the latest techniques, in the product images cl... Two key challenges raised by a product images classification system are classification precision and classification time. In some categories, classification precision of the latest techniques, in the product images classification system, is still low. In this paper, we propose a local texture descriptor termed fan refined local binary pattern, which captures more detailed information by integrating the spatial distribution into the local binary pattern feature. We compare our approach with different methods on a subset of product images on Amazon/e Bay and parts of PI100 and experimental results have demonstrated that our proposed approach is superior to the current existing methods. The highest classification precision is increased by 21% and the average classification time is reduced by 2/3. 展开更多
关键词 product image CLASSIFICATION FAN refined local binary pattern(FRLBP) PYRAMID HISTOGRAM of orientated gradients(PHOG) FUSION featureS
在线阅读 下载PDF
Learning a Discriminative Feature Attention Network for pancreas CT segmentation
3
作者 HUANG Mei-xiang WANG Yuan-jin +2 位作者 HUANG Chong-fei YUAN Jing KONG De-xing 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 2022年第1期73-90,共18页
Accurate pancreas segmentation is critical for the diagnosis and management of diseases of the pancreas. It is challenging to precisely delineate pancreas due to the highly variations in volume, shape and location. In... Accurate pancreas segmentation is critical for the diagnosis and management of diseases of the pancreas. It is challenging to precisely delineate pancreas due to the highly variations in volume, shape and location. In recent years, coarse-to-fine methods have been widely used to alleviate class imbalance issue and improve pancreas segmentation accuracy. However,cascaded methods could be computationally intensive and the refined results are significantly dependent on the performance of its coarse segmentation results. To balance the segmentation accuracy and computational efficiency, we propose a Discriminative Feature Attention Network for pancreas segmentation, to effectively highlight pancreas features and improve segmentation accuracy without explicit pancreas location. The final segmentation is obtained by applying a simple yet effective post-processing step. Two experiments on both public NIH pancreas CT dataset and abdominal BTCV multi-organ dataset are individually conducted to show the effectiveness of our method for 2 D pancreas segmentation. We obtained average Dice Similarity Coefficient(DSC) of 82.82±6.09%, average Jaccard Index(JI) of 71.13± 8.30% and average Symmetric Average Surface Distance(ASD) of 1.69 ± 0.83 mm on the NIH dataset. Compared to the existing deep learning-based pancreas segmentation methods, our experimental results achieve the best average DSC and JI value. 展开更多
关键词 attention mechanism Discriminative feature Attention Network Improved refinement Residual Block pancreas CT segmentation
在线阅读 下载PDF
Global context-aware multi-scale feature iterative refinement for aviation-road traffic semantic segmentation
4
作者 Mengyue ZHANG Shichun YANG +1 位作者 Xinjie FENG Yaoguang CAO 《Chinese Journal of Aeronautics》 2026年第2期429-441,共13页
Semantic segmentation for mixed scenes of aerial remote sensing and road traffic is one of the key technologies for visual perception of flying cars.The State-of-the-Art(SOTA)semantic segmentation methods have made re... Semantic segmentation for mixed scenes of aerial remote sensing and road traffic is one of the key technologies for visual perception of flying cars.The State-of-the-Art(SOTA)semantic segmentation methods have made remarkable achievements in both fine-grained segmentation and real-time performance.However,when faced with the huge differences in scale and semantic categories brought about by the mixed scenes of aerial remote sensing and road traffic,they still face great challenges and there is little related research.Addressing the above issue,this paper proposes a semantic segmentation model specifically for mixed datasets of aerial remote sensing and road traffic scenes.First,a novel decoding-recoding multi-scale feature iterative refinement structure is proposed,which utilizes the re-integration and continuous enhancement of multi-scale information to effectively deal with the huge scale differences between cross-domain scenes,while using a fully convolutional structure to ensure the lightweight and real-time requirements.Second,a welldesigned cross-window attention mechanism combined with a global information integration decoding block forms an enhanced global context perception,which can effectively capture the long-range dependencies and multi-scale global context information of different scenes,thereby achieving fine-grained semantic segmentation.The proposed method is tested on a large-scale mixed dataset of aerial remote sensing and road traffic scenes.The results confirm that it can effectively deal with the problem of large-scale differences in cross-domain scenes.Its segmentation accuracy surpasses that of the SOTA methods,which meets the real-time requirements. 展开更多
关键词 Aviation-road traffic Flying cars Global context-aware Multi-scale feature iterative refinement Semantic segmentation
原文传递
基于局部特征匹配和伪标签细化的纯无监督行人重识别
5
作者 刘国权 陈尚良 +3 位作者 秦晨旭 周书民 周焕银 王小刚 《现代电子技术》 北大核心 2026年第6期174-183,共10页
针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特... 针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特征匹配模块,通过对齐样本的局部特征并进行相似度排序,合理表征样本之间全局与局部特征的相关性。随后,引入相关性评分模块,在综合考虑样本的全局特征和局部特征之间的相关性的基础上,对聚类生成的伪标签的合理性进行打分。在此基础上,通过伪标签细化模块,依据评分结果分别对样本的全局和局部特征伪标签进行细化。最后,使用细化后的伪标签训练网络,并在训练过程中持续更新伪标签。在Market-1501、DukeMTMC-ReID和MSMT17公开行人重识别数据集上对所提方法进行实验验证,结果表明,该方法的mAP分别达到81.9%、71.1%和31.6%,效果良好。 展开更多
关键词 行人重识别 无监督 伪标签细化 局部特征匹配 神经网络 消融实验 相关性评分
在线阅读 下载PDF
一种抗行人干扰的车辆重识别算法
6
作者 曹仰杰 蔡吉灏 +1 位作者 王沛祺 杨聪 《郑州大学学报(工学版)》 北大核心 2026年第2期35-40,共6页
车辆重识别是实现车辆跟踪的基础,然而,行人干扰会显著影响车辆特征的提取,进而降低车辆重识别的准确性和精度。针对这一问题,提出一种名为轨迹优化与背景抑制的车辆重识别算法TRaBS。首先,使用ResNeXt101-IBN-a网络对车辆图像进行特征... 车辆重识别是实现车辆跟踪的基础,然而,行人干扰会显著影响车辆特征的提取,进而降低车辆重识别的准确性和精度。针对这一问题,提出一种名为轨迹优化与背景抑制的车辆重识别算法TRaBS。首先,使用ResNeXt101-IBN-a网络对车辆图像进行特征提取,得到车辆初始特征,同时应用背景抑制算法对摄像头画面进行特征计算,生成经过背景抑制处理的车辆特征;其次,为了降低行人对特征提取的干扰,采用欧几里得距离和高斯核函数,将车辆图像特征替换为更加稳定的轨迹特征,通过这些技术,TRaBS算法有效解决了车辆重识别中的行人干扰问题;最后,为全面验证TRaBS算法在应对行人干扰方面的有效性以及在无干扰环境下的通用性,设计并进行了对比实验与消融实验。实验结果表明:融合轨迹优化与背景抑制算法的车辆重识别模型在基准数据集以及引入行人干扰的衍生数据集上均取得了显著的效果。在VeRi-776数据集上,平均精度均值mAP达到了83.6%,Rank-1准确率达到了97.6%,显著优于现有方法。 展开更多
关键词 车辆重识别 行人干扰 轨迹优化 背景抑制 特征提取
在线阅读 下载PDF
VIFusion:低光场景下可见光与红外图像的互补融合模型
7
作者 张晓滨 牛燕皓 陈金广 《西安工程大学学报》 2026年第1期126-135,共10页
针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual tem... 针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual temporal feature aggregation,DTFA)模块、特征细化前馈网络(feature refinement feedforward network,FRFN)模块和空间通道注意力机制(spatial channel attention,SCA)模块提升了融合图像的质量和信息表达能力。其中,DTFA模块使用分组卷积保持特征空间完整性,然后进行时序对齐与融合,以增强时序一致性并减少信息损失。FRFN模块对提取的特征进行逐层优化,减少通道冗余。SCA模块通过自适应建模图像空间和通道关系,突出关键特征,提高信息表达能力、增强边缘、纹理等细节信息。实验结果表明:在LLVIP数据集上,VIFusion模型在客观指标(AG、CC、EN、SF、SSIM、VIF、MI)上优于传统方法和深度学习模型(如GTF、TarDAL、DenseFuse等)。在数据集TNO上的泛化实验中,生成的融合图像在细节保留和目标突出上也表现更佳。VIFusion模型为低光场景下的多模态图像融合提供了一种高效实用的解决方案。 展开更多
关键词 双时态特征聚合 特征细化前馈网络 空间通道注意力 图像融合
在线阅读 下载PDF
基于精细地形与DBSCAN-PCA算法的山区铁路排水设施选址
8
作者 陈柳廷 张璇钰 +3 位作者 董秀军 刘桂卫 孙琪皓 邓博 《测绘通报》 北大核心 2026年第2期118-125,共8页
铁路水毁灾害是铁路线路危情中发生频率最高、范围最广、危害程度最大、中断行车最长的一类,而山区铁路因地形复杂和气候多变导致水毁灾害频发,对铁路安全运输造成严重影响,而传统人工选址耗时费力且难以进行区域宏观优化调配。为解决... 铁路水毁灾害是铁路线路危情中发生频率最高、范围最广、危害程度最大、中断行车最长的一类,而山区铁路因地形复杂和气候多变导致水毁灾害频发,对铁路安全运输造成严重影响,而传统人工选址耗时费力且难以进行区域宏观优化调配。为解决山区铁路排水设施智能选址问题,本文通过提取三维精细化地形特征,在DBSCAN密度聚类算法和主成分分析(PCA)基础上,提出一种“空间聚类-降维联合”排水设施选择智能优化分配算法,并以湖南省某山区铁路为例,对铁路排水设施的选址进行预测。结果表明,预测结果与实际工程布设的涵洞位置吻合度达92%,排水沟设计覆盖高风险区域,优化后的排水系统可减少路基积水概率,显著提升铁路抗水毁能力。研究结果验证了基于该分配算法的排水设施选址方法,在复杂地形条件下的适用性,为山区铁路排水设施选址设计和优化提供了一定的参考依据。 展开更多
关键词 精细化地形特征 水文分析 排水设施选址 DBSCAN聚类 PCA SCS-CN模型
原文传递
面向四面体网格生成的Delaunay refinement器官表面重建 被引量:1
9
作者 周筠 樊晓平 廖志芳 《小型微型计算机系统》 CSCD 北大核心 2012年第8期1816-1820,共5页
为满足生物医学仿真系统对器官几何模型在Delaunay表面重构和四面体建模两方面的需求,提出一种面向四面体网格生成的Delaunay refinement表面重构算法.算法将从医学体数据中经过等值面提取和简化的初始表面作为输入和边界限定条件,为每... 为满足生物医学仿真系统对器官几何模型在Delaunay表面重构和四面体建模两方面的需求,提出一种面向四面体网格生成的Delaunay refinement表面重构算法.算法将从医学体数据中经过等值面提取和简化的初始表面作为输入和边界限定条件,为每个限定点计算局部特征尺寸并构建保护球,计算保护球与限定线段的交点并与限定点一起作为初始点集,生成Delaunay辅助四面体网格,引入一个迭代细分过程恢复边界,最终获得Delaunay重构表面.针对细分过程中的收敛性问题,文中给出了详细的理论证明和算法实例.此外,通过Delaunay四面体生成的对比实验表明该算法在Delaunay器官表面重构和四面体建模两方面兼具有效性和优越性. 展开更多
关键词 DELAUNAY refinEMENT 器官表面重构 局部特征尺寸 收敛性
在线阅读 下载PDF
基于特征细化与注意力增强重构的水下图像增强算法
10
作者 万刚 王小波 +3 位作者 石纲 叶德震 朱思思 司帆 《浙江大学学报(工学版)》 北大核心 2026年第4期800-811,832,共13页
针对水下图像因光传播衰减、散射和水中溶解悬浮物等因素导致的图像质量退化问题,提出基于空间细化特征自注意力(SRFT)与通道特征注意力增强重构Transformer(CFART)模块的水下图像增强网络模型.SRFT模块对水下图像进行序列化处理和位置... 针对水下图像因光传播衰减、散射和水中溶解悬浮物等因素导致的图像质量退化问题,提出基于空间细化特征自注意力(SRFT)与通道特征注意力增强重构Transformer(CFART)模块的水下图像增强网络模型.SRFT模块对水下图像进行序列化处理和位置编码,采用4层空间自注意力提取全局退化差异,建立长程特征依赖关系.CFART模块采用异构卷积核投影特征,随后经通道融合输入至多头自注意力模块,并利用多层感知机与残差结构重构特征信息.实验结果表明,本研究算法能有效改善水下图像中存在的颜色偏移、模糊以及低对比问题.在客观评价指标方面,本算法的MSE(253.558)、PSNR(25.421)、Entropy(7.488)和UIQM(4.461)均优于同类方法;在SSIM(0.893)和UCIQE(0.592)上也表现出明显优势;主观视觉评价进一步证实本研究算法对退化的水下图像具有良好的色彩校正与细节恢复能力.本研究算法可以优化水下图像质量,有助于提升海底调查与评估工作的精度与效率. 展开更多
关键词 水下图像增强 图像质量退化 自注意力机制 空间细化特征 增强重构Transformer模型
在线阅读 下载PDF
融合交叉注意力和双特征交互的红外船舶目标检测模型
11
作者 邹少华 刘笑嶂 李修来 《计算机工程》 北大核心 2026年第1期390-399,共10页
为了应对红外图像目标检测中目标像素低、背景复杂以及硬件资源有限等问题,提出一种融合位置编码的多头交叉注意力机制和双特征交互细化结构的目标检测模型。在骨干网络中,引入基于位置编码的交叉注意力(CCA)模块和空间金字塔池跨阶段局... 为了应对红外图像目标检测中目标像素低、背景复杂以及硬件资源有限等问题,提出一种融合位置编码的多头交叉注意力机制和双特征交互细化结构的目标检测模型。在骨干网络中,引入基于位置编码的交叉注意力(CCA)模块和空间金字塔池跨阶段局部(SPCP)模块。CCA模块通过行和列的相关矩阵变换,在水平和垂直方向上聚合上下文信息,并通过共享递归交错模块的参数,减少自注意力机制所需的参数数量,增强特征提取能力。SPCP模块通过统一不同大小和尺度的特征映射,采用跨阶段局部(CSP)结构降低参数和计算量,并引入挤压激励注意力机制选择对目标检测更有利的通道。在颈部网络中,引入频域信息和双特征交互细化(DIR)模块,进一步提取小型目标船舶的细化特征,增强模型的特征融合能力。实验结果表明,改进后的模型在红外船舶检测数据集(ISDD)上的精确度为89.5%,召回率为97%,F1值为93.1%,与基准模型相比,显著提高了检测性能。此外,与其他检测模型相比,所提出的模型减少了计算参数量,融合位置编码的多头交叉注意力机制和双特征交互细化结构可有效提升红外船舶目标检测的准确性。 展开更多
关键词 红外图像 目标检测 多头交叉注意力 多尺度重塑 双特征交互细化
在线阅读 下载PDF
基于改进YOLOv12的煤矸石智能识别方法
12
作者 周伟 李广棵 《工矿自动化》 北大核心 2026年第1期106-113,139,共9页
针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石... 针对矿井粉尘浓度大、光照多变等复杂环境因素导致难以准确、高效识别煤矸石的问题,在YOLOv12网络模型基础上进行改进,提出了一种基于改进YOLOv12的煤矸石智能识别方法。通过设计双尺度稀疏注意力(DSSA)机制,提升了模型对多尺度煤矸石目标区域的关注力与空间感知能力;设计了多条件特征精炼(MCFR)机制,对深层和浅层特征进行条件引导融合,有效增强煤炭与煤矸石的类别差异性表达;构建了动态多任务平衡损失(DMTBL)函数,实现位置、类别与置信度之间的权重自适应调节,从而增强模型对难样本区域的学习能力。实验结果表明,改进YOLOv12在煤矸石识别任务中的识别精准率、召回率和mAP分别达96.5%,94.9%,95.8%,较原始YOLOv12分别提升了3.8%,4.5%,4.5%,有效解决了煤矸石漏检、误检和边界模糊等问题,且保持高达47.7帧/s的推理速度。可视化激活热力图表明,改进YOLOv12在处理不同结构与纹理复杂度的煤矸石时,均能准确聚焦于目标本体区域,无明显背景干扰,激活区域基本覆盖了煤块与煤矸石的主要轮廓。 展开更多
关键词 煤矸石识别 改进YOLOv12 双尺度稀疏注意力 多条件特征精炼 动态多任务平衡损失
在线阅读 下载PDF
基于中间特征细化网络的时空域视频超分辨率重建
13
作者 吴学致 陈培辉 刘雨戈 《计算机时代》 2026年第3期37-42,共6页
视频超分辨率重建在计算机视觉领域具有重要研究价值,但处理快速动作、遮挡视频时存在空间一致性差、运动模糊难处理、计算效率低等问题。本文构建一种中间特征细化网络模型,实现时空域视频超分辨率重建。在时间域,模型采用中间特征细... 视频超分辨率重建在计算机视觉领域具有重要研究价值,但处理快速动作、遮挡视频时存在空间一致性差、运动模糊难处理、计算效率低等问题。本文构建一种中间特征细化网络模型,实现时空域视频超分辨率重建。在时间域,模型采用中间特征细化网络对输入帧执行多尺度特征编码,以充分保留帧间的全局信息与局部纹理细节。解码器同步完成特征细化与光流估计两个任务,实现二者信息的相互促进,达成高效帧间插值。空间域采用帧组注意力机制,聚焦不同时段帧特征以增强超分辨率性能,借助互补信息恢复细节,采用3D残差密集网络提升融合效果,同时通过单应性对齐算法提高计算效率。通过与其他基准模型对比实验,该模型在不同数据集上超分辨效果良好,且计算效率更优。 展开更多
关键词 视频超分辨率重建 中间特征细化 帧组注意力机制 残差密集网络
在线阅读 下载PDF
基于Decoupled-FR Net的伪造图像检测模型
14
作者 杨桃 张乾 +1 位作者 文露露 彭杉 《湖北民族大学学报(自然科学版)》 2026年第1期69-74,共6页
针对伪造图像检测中细粒度特征感知与跨区域依赖建模的挑战,提出解耦频率细化网络(decoupled frequency refinement network, Decoupled-FR Net)检测模型。该模型设计了空间-通道解耦注意力机制,有效避免了传统混合注意力中的特征耦合问... 针对伪造图像检测中细粒度特征感知与跨区域依赖建模的挑战,提出解耦频率细化网络(decoupled frequency refinement network, Decoupled-FR Net)检测模型。该模型设计了空间-通道解耦注意力机制,有效避免了传统混合注意力中的特征耦合问题,提升了特征表示的独立性与判别力;引入了特征细化模块,通过层级特征校准与融合功能增强对细微篡改的感知能力;结合上下文感知机制,捕捉跨区域的长距离依赖关系,从而提升整体检测性能。结果表明,Decoupled-FR Net模型在伪造合成(forensic synthetics, ForenSynths)数据集上的准确率、平均精确率分别比块间依赖网络(inter-patch dependency network, IPD-Net)模型提高了2.4、0.5个百分点,在生成式对抗网络(generative adversarial network, GAN)的生成图像检测(GAN generation detection, GANGen-Detection)数据集上的平均精确率比频域网络(frequency domain network, FreqNet)模型提高了0.1个百分点。该模型为细粒度伪造图像检测提供了新的解决方案,在多媒体取证领域具有重要的应用价值。 展开更多
关键词 空间-通道注意力解耦 特征细化 频域增强 上下文感知 跨模型伪造图像检测 生成式对抗网络
在线阅读 下载PDF
Sem-iNeRF:Camera Pose Refinement by Inverting Neural Radiance Fields with Semantic Feature Consistency
15
作者 Anran Liu Xiaoxiao Long +2 位作者 Yuan Liu Ping Luo Wenping Wang 《Computational Visual Media》 2025年第3期513-530,共18页
This paper presents a novel approach for camera pose refinement based on neural radiance fields(NeRF)by introducing semantic feature consistency to enhance robustness.NeRF has been successfully applied to camera pose ... This paper presents a novel approach for camera pose refinement based on neural radiance fields(NeRF)by introducing semantic feature consistency to enhance robustness.NeRF has been successfully applied to camera pose estimation by inverting the rendering process given an observed RGB image and an initial pose estimate.However,previous methods only adopted photometric consistency for pose optimization,which is prone to be trapped in local minima.To address this problem,we introduce semantic feature consistency into the existing framework.Specifically,we utilize high-level features extracted from a convolutional neural network(CNN)pre-trained for image recognition,and maintain consistency of such features between observed and rendered images during the optimization procedure.Unlike the color values at each pixel,these features contain rich semantic information shared within local regions and can be more robust to appearance changes from different viewpoints.Since it is computationally expensive to render a full image with NeRF for feature extraction from CNN,we propose an efficient way to estimate the features of individually rendered pixels by projecting them to a nearby reference image and interpolating its feature maps.Extensive experiments show that our method greatly outperforms the baseline method on both synthetic objects and real-world large indoor scenes,increasing the accuracy of pose estimation by over 6.4%. 展开更多
关键词 camera pose refinement neural radiance fields analysis-by-synthesis semantic features
原文传递
基于大内核自适应融合的小目标检测算法 被引量:1
16
作者 王磊 胡君红 任洋 《计算机工程》 北大核心 2025年第6期65-73,共9页
针对当前基于卷积神经网络的单阶段目标检测算法(YOLO系列、VFNet等)在高空拍摄场景下目标背景复杂、检测精度低、特征混叠等问题,提出一种端到端的目标检测算法CSPENet。首先,采用基于大内核深度卷积CSPNeXt作为模型主干,提高模型捕捉... 针对当前基于卷积神经网络的单阶段目标检测算法(YOLO系列、VFNet等)在高空拍摄场景下目标背景复杂、检测精度低、特征混叠等问题,提出一种端到端的目标检测算法CSPENet。首先,采用基于大内核深度卷积CSPNeXt作为模型主干,提高模型捕捉全局上下文的能力;其次,通过引入特征细化模块(FRM)在空间和通道维度上生成自适应权重,可有效抑制混叠特征,并在特征融合阶段添加基于移动网络的感受野注意力(RFA)机制解决大内核参数共享问题;最后,采用EIoU损失函数作为模型的回归损失函数,并拆分预测框和真实框纵横比的影响因子,以提高模型收敛速度并改善定位效果。实验结果表明,CSPENet在VisDrone-DET数据集上相对于DINO算法平均准确率均值提升4.4百分点,为小目标检测算法的研究及其应用提供新的参考方案。 展开更多
关键词 大内核 小目标 上下文信息 特征细化 自适应融合 感受野
在线阅读 下载PDF
基于MobileGStereo的低复杂度立体匹配算法
17
作者 伍云霞 邹正阳 徐倩 《华中科技大学学报(自然科学版)》 北大核心 2025年第5期78-84,共7页
针对目前的先进立体匹配模型通过堆叠深度模块不断提高域内训练精度,导致计算成本提高且难以兼顾跨域数据的模型退化问题,对立体匹配的特征提取、代价计算与聚合、视差细化等子流程进行模型重构,并借助传统模型弥补深度网络缺陷,提出一... 针对目前的先进立体匹配模型通过堆叠深度模块不断提高域内训练精度,导致计算成本提高且难以兼顾跨域数据的模型退化问题,对立体匹配的特征提取、代价计算与聚合、视差细化等子流程进行模型重构,并借助传统模型弥补深度网络缺陷,提出一种兼顾跨域数据泛化能力和快速推理能力的低复杂度立体匹配模型——MobileGStereo.在特征提取阶段,深度网络旨在提取像素之间的差异特征而非复杂的语义特征,同时特征图的表征分布应注重本身而非整个批次,因此采用基于层归一化的MobileNet作为特征提取骨干.在代价计算与聚合阶段,提出一种跳跃代价体以降低高分辨率特征在代价聚合阶段的计算复杂度;为聚合不同尺度特征计算的代价体,通过拟合传统聚合方法提出基于3D深度可分离卷积的跨尺度聚合方法;最后以轻量沙漏型结构对跨尺度聚合后的代价进行多维信息融合并用于回归初始视差.采用基于ConvGRU的循环结构,借助特征信息循环细化初始视差.在基准数据集上进行验证,实验结果表明:所提方法推理1226×370分辨率立体图片仅耗时75 ms,在显著提高模型推理速度的同时能够在跨域数据泛化能力测试中取得与最先进算法相当的量化性能. 展开更多
关键词 深度学习 立体匹配 特征提取 代价计算与聚合 视差细化
原文传递
基于细分多尺度和并行注意力的密集人群检测算法
18
作者 张欣 亢世宁 +2 位作者 杨寓淇 王珺 马致远 《计算机工程与应用》 北大核心 2025年第23期161-172,共12页
人群检测在自动驾驶、交通管理和智能安防等领域有着广泛的应用。其具有检测人群密度大、行人遮挡多、尺度变化大和人群分布不规则的特点,是计算机视觉中具有挑战性的问题之一。为了进一步挖掘密集场景下人群丰富的多尺度信息,以及应对... 人群检测在自动驾驶、交通管理和智能安防等领域有着广泛的应用。其具有检测人群密度大、行人遮挡多、尺度变化大和人群分布不规则的特点,是计算机视觉中具有挑战性的问题之一。为了进一步挖掘密集场景下人群丰富的多尺度信息,以及应对人群分布和形状不规则的挑战,在SparseR-CNN的基础上提出了一种基于细分多尺度和并行注意力的人群检测算法,命名为RMFR-CNN(refined multiscale feature R-CNN),其通过并行多个不同尺度的膨胀卷积构建感受野融合模块以提取细化的尺度信息。基于膨胀卷积注意力和可变形卷积注意力构建并行注意力模块,以从不同的尺度感知人群的分布与形状信息。为了缓解因数据误标注和行人尺度所导致的损失敏感,在原有损失函数的基础上加入了动态损失权重,使损失因行人尺度和预测准度而动态变化,提升模型的泛化能力。实验结果表明,所提算法在CrowdHuman、CityPersons等数据集中的AP为91.1%,MR−2为44.5%,Recall为96.7%。该算法能够在一定程度上提升密集场景中人群检测的性能。 展开更多
关键词 人群检测 细分多尺度 注意力机制 SparseR-CNN 动态损失权重
在线阅读 下载PDF
基于特征精炼网络的绝缘子缺陷检测
19
作者 姜香菊 王瑞彤 马彦鸿 《北京交通大学学报》 北大核心 2025年第3期79-89,共11页
定期巡检绝缘子状态是保障电网安全运行的重要环节.针对航拍图像中绝缘子缺陷区域占比小和目标大小不一致造成的检测效果不理想的问题,提出一种基于特征精炼网络的绝缘子缺陷检测算法.首先,采用焦点调制网络(Focal Modulation Network,F... 定期巡检绝缘子状态是保障电网安全运行的重要环节.针对航拍图像中绝缘子缺陷区域占比小和目标大小不一致造成的检测效果不理想的问题,提出一种基于特征精炼网络的绝缘子缺陷检测算法.首先,采用焦点调制网络(Focal Modulation Network,FocalNet)对不同粒度级别的空间上下文进行编码,并使用其与跨级部分通道的快速空间金字塔池化(Spatial Pyramid Pooling Faster Cross Stage Partial Channel,SPPFCSPC)共同构建特征提取主干,提高网络的特征提取能力;然后,设计增强特征自适应融合金字塔,提出定位信息补充分支以解决缺陷特征丢失问题,同时引入高效的多尺度注意力(Efficient Multi-Scale Attention,EMA)构建不同分辨率的丰富语义特征图;最后,采用特征精炼检测头提取和聚合绝缘子及缺陷的多尺度特征信息,生成更具辨别力的特征以用于检测不同尺度的目标.研究结果表明,特征精炼网络的均值平均精度(mean Average Pre-cision,mAP)达到98.2%,能够对多尺度绝缘子及缺陷进行有效识别,为绝缘子航拍图像的多尺度检测提供参考. 展开更多
关键词 绝缘子缺陷检测 智能巡检 多尺度目标检测 特征精炼 深度学习
在线阅读 下载PDF
基于RCMFFDE和SSA-RVM的旋转机械损伤检测模型 被引量:2
20
作者 王显彬 孙阳 《机电工程》 北大核心 2025年第3期510-519,共10页
针对旋转机械系统的振动信号具有明显的非线性,严重影响故障特征提取从而导致其识别精度不佳的问题,建立了一种基于精细复合多尺度分数波动散布熵(RCMFFDE)、t-分布随机邻域嵌入(t-SNE)和麻雀搜索算法优化相关向量机(SSA-RVM)的旋转机... 针对旋转机械系统的振动信号具有明显的非线性,严重影响故障特征提取从而导致其识别精度不佳的问题,建立了一种基于精细复合多尺度分数波动散布熵(RCMFFDE)、t-分布随机邻域嵌入(t-SNE)和麻雀搜索算法优化相关向量机(SSA-RVM)的旋转机械损伤检测模型。首先,进行了基于RCMFFDE方法的特征提取,生成了特征样本,以定量反映旋转机械的不同损伤情况;然后,采用t-SNE方法,将原始高维故障特征映射至低维空间,获得了对故障更敏感的低维特征;最后,将敏感的低维故障特征向量输入至SSA-RVM多分类器中,进行了训练和测试,实现了旋转机械样本的故障识别目的;采用两种旋转机械数据集进行了实验,并从准确率、效率和抗噪性方面,将RCMFFDE-SSA-SVM方法与多种特征提取方法进行了对比。研究结果表明:RCMFFDE能用于有效提取旋转机械的故障特征,分别取得99.2%和100%的识别精度;而对敏感特征进行分类所获得的精度优于对原始特征进行分类的情形,前者比后者提高了4%;在模式识别中,SSA-RVM优于其他分类器;自制数据集的诊断精度达到了97%,特征提取的时间为16.05 s。 展开更多
关键词 非线性振动信号 特征提取时间 故障识别精度(诊断精度) 精细复合多尺度分数波动散布熵 t-分布随机邻域嵌入 麻雀搜索算法优化相关向量机
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部