期刊文献+
共找到148篇文章
< 1 2 8 >
每页显示 20 50 100
Implicit Feature Contrastive Learning for Few-Shot Object Detection
1
作者 Gang Li Zheng Zhou +6 位作者 Yang Zhang Chuanyun Xu Zihan Ruan Pengfei Lv Ru Wang Xinyu Fan Wei Tan 《Computers, Materials & Continua》 2025年第7期1615-1632,共18页
Although conventional object detection methods achieve high accuracy through extensively annotated datasets,acquiring such large-scale labeled data remains challenging and cost-prohibitive in numerous real-world appli... Although conventional object detection methods achieve high accuracy through extensively annotated datasets,acquiring such large-scale labeled data remains challenging and cost-prohibitive in numerous real-world applications.Few-shot object detection presents a new research idea that aims to localize and classify objects in images using only limited annotated examples.However,the inherent challenge in few-shot object detection lies in the insufficient sample diversity to fully characterize the sample feature distribution,which consequently impacts model performance.Inspired by contrastive learning principles,we propose an Implicit Feature Contrastive Learning(IFCL)module to address this limitation and augment feature diversity for more robust representational learning.This module generates augmented support sample features in a mixed feature space and implicitly contrasts them with query Region of Interest(RoI)features.This approach facilitates more comprehensive learning of both intra-class feature similarity and inter-class feature diversity,thereby enhancing the model’s object classification and localization capabilities.Extensive experiments on PASCAL VOC show that our method achieves a respective improvement of 3.2%,1.8%,and 2.3%on 10-shot of three Novel Sets compared to the baseline model FPD. 展开更多
关键词 few-shot learning object detection implicit contrastive learning feature mixing feature aggregation
在线阅读 下载PDF
A Category-Agnostic Hybrid Contrastive Learning Method for Few-Shot Point Cloud Object Detection
2
作者 Xuejing Li 《Computers, Materials & Continua》 2025年第5期1667-1681,共15页
Few-shot point cloud 3D object detection(FS3D)aims to identify and locate objects of novel classes within point clouds using knowledge acquired from annotated base classes and a minimal number of samples from the nove... Few-shot point cloud 3D object detection(FS3D)aims to identify and locate objects of novel classes within point clouds using knowledge acquired from annotated base classes and a minimal number of samples from the novel classes.Due to imbalanced training data,existing FS3D methods based on fully supervised learning can lead to overfitting toward base classes,which impairs the network’s ability to generalize knowledge learned from base classes to novel classes and also prevents the network from extracting distinctive foreground and background representations for novel class objects.To address these issues,this thesis proposes a category-agnostic contrastive learning approach,enhancing the generalization and identification abilities for almost unseen categories through the construction of pseudo-labels and positive-negative sample pairs unrelated to specific classes.Firstly,this thesis designs a proposal-wise context contrastive module(CCM).By reducing the distance between foreground point features and increasing the distance between foreground and background point features within a region proposal,CCM aids the network in extracting more discriminative foreground and background feature representations without reliance on categorical annotations.Secondly,this thesis utilizes a geometric contrastive module(GCM),which enhances the network’s geometric perception capability by employing contrastive learning on the foreground point features associated with various basic geometric components,such as edges,corners,and surfaces,thereby enabling these geometric components to exhibit more distinguishable representations.This thesis also combines category-aware contrastive learning with former modules to maintain categorical distinctiveness.Extensive experimental results on FS-SUNRGBD and FS-ScanNet datasets demonstrate the effectiveness of this method with average precision exceeding the baseline by up to 8%. 展开更多
关键词 Contrastive learning few-shot learning point cloud object detection
在线阅读 下载PDF
MSO-DETR: Metric space optimization for few-shot object detection 被引量:1
3
作者 Haifeng Sima Manyang Wang +2 位作者 Lanlan Liu Yudong Zhang Junding Sun 《CAAI Transactions on Intelligence Technology》 2024年第6期1515-1533,共19页
In the metric-based meta-learning detection model,the distribution of training samples in the metric space has great influence on the detection performance,and this influence is usually ignored by traditional meta-det... In the metric-based meta-learning detection model,the distribution of training samples in the metric space has great influence on the detection performance,and this influence is usually ignored by traditional meta-detectors.In addition,the design of metric space might be interfered with by the background noise of training samples.To tackle these issues,we propose a metric space optimisation method based on hyperbolic geometry attention and class-agnostic activation maps.First,the geometric properties of hyperbolic spaces to establish a structured metric space are used.A variety of feature samples of different classes are embedded into the hyperbolic space with extremely low distortion.This metric space is more suitable for representing tree-like structures between categories for image scene analysis.Meanwhile,a novel similarity measure function based on Poincarédistance is proposed to evaluate the distance of various types of objects in the feature space.In addition,the class-agnostic activation maps(CCAMs)are employed to re-calibrate the weight of foreground feature information and suppress background information.Finally,the decoder processes the high-level feature information as the decoding of the query object and detects objects by predicting their locations and corresponding task encodings.Experimental evaluation is conducted on Pascal VOC and MS COCO datasets.The experiment results show that the effectiveness of the authors’method surpasses the performance baseline of the excellent few-shot detection models. 展开更多
关键词 few-shot object detection hyperbolic space META-LEARNING metric space
在线阅读 下载PDF
Few-shot object detection based on positive-sample improvement 被引量:1
4
作者 Yan Ouyang Xin-qing Wang +1 位作者 Rui-zhe Hu Hong-hui Xu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2023年第10期74-86,共13页
Traditional object detectors based on deep learning rely on plenty of labeled samples,which are expensive to obtain.Few-shot object detection(FSOD)attempts to solve this problem,learning detection objects from a few l... Traditional object detectors based on deep learning rely on plenty of labeled samples,which are expensive to obtain.Few-shot object detection(FSOD)attempts to solve this problem,learning detection objects from a few labeled samples,but the performance is often unsatisfactory due to the scarcity of samples.We believe that the main reasons that restrict the performance of few-shot detectors are:(1)the positive samples is scarce,and(2)the quality of positive samples is low.Therefore,we put forward a novel few-shot object detector based on YOLOv4,starting from both improving the quantity and quality of positive samples.First,we design a hybrid multivariate positive sample augmentation(HMPSA)module to amplify the quantity of positive samples and increase positive sample diversity while suppressing negative samples.Then,we design a selective non-local fusion attention(SNFA)module to help the detector better learn the target features and improve the feature quality of positive samples.Finally,we optimize the loss function to make it more suitable for the task of FSOD.Experimental results on PASCAL VOC and MS COCO demonstrate that our designed few-shot object detector has competitive performance with other state-of-the-art detectors. 展开更多
关键词 few-shot learning object detection Sample augmentation Attention mechanism
在线阅读 下载PDF
Few-Shot Object Detection via Dual-Domain Feature Fusion and Patch-Level Attention
5
作者 Guangli Ren Jierui Liu +3 位作者 Mengyao Wang Peiyu Guan Zhiqiang Cao Junzhi Yu 《Tsinghua Science and Technology》 2025年第3期1237-1250,共14页
Few-shot object detection receives much attention with the ability to detect novel class objects using limited annotated data.The transfer learning-based solution becomes popular due to its simple training with good a... Few-shot object detection receives much attention with the ability to detect novel class objects using limited annotated data.The transfer learning-based solution becomes popular due to its simple training with good accuracy,however,it is still challenging to enrich the feature diversity during the training process.And fine-grained features are also insufficient for novel class detection.To deal with the problems,this paper proposes a novel few-shot object detection method based on dual-domain feature fusion and patch-level attention.Upon original base domain,an elementary domain with more category-agnostic features is superposed to construct a two-stream backbone,which benefits to enrich the feature diversity.To better integrate various features,a dual-domain feature fusion is designed,where the feature pairs with the same size are complementarily fused to extract more discriminative features.Moreover,a patch-wise feature refinement termed as patch-level attention is presented to mine internal relations among the patches,which enhances the adaptability to novel classes.In addition,a weighted classification loss is given to assist the fine-tuning of the classifier by combining extra features from FPN of the base training model.In this way,the few-shot detection quality to novel class objects is improved.Experiments on PASCAL VOC and MS COCO datasets verify the effectiveness of the method. 展开更多
关键词 few-shot object detection dual-domain feature fusion patch-level attention
原文传递
Adversarial Attack on Object Detection via Object Feature-Wise Attention and Perturbation Extraction
6
作者 Wei Xue Xiaoyan Xia +2 位作者 Pengcheng Wan Ping Zhong Xiao Zheng 《Tsinghua Science and Technology》 2025年第3期1174-1189,共16页
Deep neural networks are commonly used in computer vision tasks,but they are vulnerable to adversarial samples,resulting in poor recognition accuracy.Although traditional algorithms that craft adversarial samples have... Deep neural networks are commonly used in computer vision tasks,but they are vulnerable to adversarial samples,resulting in poor recognition accuracy.Although traditional algorithms that craft adversarial samples have been effective in attacking classification models,the attacking performance degrades when facing object detection models with more complex structures.To address this issue better,in this paper we first analyze the mechanism of multi-scale feature extraction of object detection models,and then by constructing the object feature-wise attention module and the perturbation extraction module,a novel adversarial sample generation algorithm for attacking detection models is proposed.Specifically,in the first module,based on the multi-scale feature map,we reduce the range of perturbation and improve the stealthiness of adversarial samples by computing the noise distribution in the object region.Then in the second module,we feed the noise distribution into the generative adversarial networks to generate adversarial perturbation with strong attack transferability.By doing so,the proposed approach possesses the ability to better confuse the judgment of detection models.Experiments carried out on the DroneVehicle dataset show that our method is computationally efficient and works well in attacking detection models measured by qualitative analysis and quantitative analysis. 展开更多
关键词 adversarial attack transfer attack object detection generative adversarial networks multi-scale feature map
原文传递
基于对比学习的水下图像增强和检测方法 被引量:1
7
作者 张帆 黄丹 +2 位作者 丁璐 王勇 宋磊 《机器人》 北大核心 2025年第1期64-75,共12页
水下图像因存在色彩失真和细节损失,严重影响了水下机器人的视觉感知能力。为实现图像增强,同时提高检测精度,提出了一种基于对比学习的水下图像增强与目标检测多任务学习框架,既生成视觉友好图像,又提高目标检测精度,实现面向目标检测... 水下图像因存在色彩失真和细节损失,严重影响了水下机器人的视觉感知能力。为实现图像增强,同时提高检测精度,提出了一种基于对比学习的水下图像增强与目标检测多任务学习框架,既生成视觉友好图像,又提高目标检测精度,实现面向目标检测任务的图像增强。针对目标纹理特征不清晰的问题,通过检测任务的区域生成模块构建对比学习的正负图像块,保证目标区域与原始图像在特征空间更加接近,同时利用检测的梯度信息引导图像增强朝着有利于目标检测的方向进行。此外,通过基于循环生成式对抗网络的图像翻译方法来学习并保留清晰图像特征实现图像增强,不需要成对的水下图像,降低了对数据的要求。最后,在EUVP、U45和UIEB数据集上进行了增强算法验证,在RUOD、URPC2020和RUIE数据集上进行了检测算法验证。实验结果表明,本文算法在主观视觉上可以有效修正颜色失真问题,同时保留了原始图像及目标的结构纹理;在客观指标上,峰值信噪比达到24.57 dB,结构相似度达到0.88。图像增强后在Faster R-CNN和YOLOv7算法上检测精度平均提升了2%。 展开更多
关键词 水下图像增强 对比学习 循环生成式对抗网络 目标检测
原文传递
迭代伪点云生成的3D目标检测 被引量:2
8
作者 孙立辉 王楚遥 《计算机应用研究》 北大核心 2025年第6期1894-1899,共6页
3D目标检测是自动驾驶环境感知的关键任务。然而,在复杂场景中因距离和遮挡问题,激光雷达往往难以获取目标的完整点云,这极大地影响了目标检测的精度。为了应对这一问题,提出迭代伪点云生成的三维目标检测方法(IG-RCNN)。首先,在三维体... 3D目标检测是自动驾驶环境感知的关键任务。然而,在复杂场景中因距离和遮挡问题,激光雷达往往难以获取目标的完整点云,这极大地影响了目标检测的精度。为了应对这一问题,提出迭代伪点云生成的三维目标检测方法(IG-RCNN)。首先,在三维体素骨干网络中构建了一种通道部分稀疏卷积模块CSPConv(channel sparse partial convolution),在减少通道冗杂的同时融合不同感受野下的语义信息,提高模型的特征融合能力。其次,采用多次迭代的方式生成高质量的伪点云信息,为建议框的细化提供有效的指导,提高模型的检测精度。在KITTI数据集上的实验结果显示,所提算法相较于典型两阶段算法PVRCNN,在困难难度下,行人类别和骑行者类别的检测精度提升幅度达3.89%和2.73%。实验结果表明,该算法在处理稀疏点云数据时表现出显著的优越性,尤其在处理行人和骑行者等小目标时,表现出更强的鲁棒性和准确性。 展开更多
关键词 自动驾驶 驾驶辅助系统 三维目标检测 伪点云生成
在线阅读 下载PDF
自监督的两阶段广义小样本目标检测算法 被引量:1
9
作者 段立娟 张子晨 张广勇 《信号处理》 北大核心 2025年第2期370-381,共12页
深度学习技术在目标检测领域取得了巨大进展,但其优异的性能建立在大量精确标注的数据集之上。在样本稀缺的特定领域,如国防海上安全和医学等领域,获取具有标注的数据尤为困难。因此,小样本目标检测领域因其能够应对样本稀疏性所带来的... 深度学习技术在目标检测领域取得了巨大进展,但其优异的性能建立在大量精确标注的数据集之上。在样本稀缺的特定领域,如国防海上安全和医学等领域,获取具有标注的数据尤为困难。因此,小样本目标检测领域因其能够应对样本稀疏性所带来的挑战而得到学术界的广泛研究。该领域的研究目标是得到能够从极其有限的样本中提取知识并实现高效目标检测的算法框架。然而,由于新类样本的稀缺性,其与基类之间存在着显著的分布差异,导致了小样本目标检测任务的准确度受限。此外,在对模型应用新类进行微调的过程中,由于新类与基类的不重叠性,模型学习新类的特征知识的过程中会存在大量的梯度更新,导致基类的特征知识被遗忘的问题,从而降低模型的整体性能。针对新类别样本稀缺的问题,本研究采用自监督学习策略。自监督学习,无须依赖标注信息,便于构建代理任务以进行模型训练,是缓解小样本目标检测样本稀缺问题的有效方案。为了避免模型在学习新类特征知识后出现基类灾难性遗忘的问题,本文将自监督学习与两阶段的目标检测器相结合。通过在类别域应用潜在特征来表示各个类别的特征信息,通过动态更新策略在学习新类别的过程中进一步优化特征,并借助检测框域构建良好的代理任务提升回归框的精准度。本研究在PASCAL VOC数据集和MS COCO数据集上进行大量的实验验证,实验结果表明,无论是在新类性能方面还是总体性能方面,本研究所提出的方法相较于其他多个小样本目标检测模型均展现出更加优越的性能表现。 展开更多
关键词 深度学习 自监督学习 小样本目标检测 广义小样本目标检测
在线阅读 下载PDF
空间定位与特征泛化增强的铁路异物跟踪检测 被引量:2
10
作者 陈永 王镇 周方春 《北京航空航天大学学报》 北大核心 2025年第1期9-18,共10页
针对现有深度学习异物跟踪检测算法易受复杂环境、目标遮挡等影响,导致出现漏检及检测精度低等问题,提出了一种空间定位与特征泛化增强的铁路异物跟踪检测算法。提出改进多尺度级联GhostNet特征提取网络,提升对红外目标的特征提取能力;... 针对现有深度学习异物跟踪检测算法易受复杂环境、目标遮挡等影响,导致出现漏检及检测精度低等问题,提出了一种空间定位与特征泛化增强的铁路异物跟踪检测算法。提出改进多尺度级联GhostNet特征提取网络,提升对红外目标的特征提取能力;利用异物空间位置定位与泛化形态信息,设计空间定位与特征泛化增强模块,增强对复杂场景下位置移动与跟踪轨迹变化目标的检测精度;构建金字塔预测网络,得到红外铁路异物的检测锚框、类别及置信度信息;通过改进类别和置信度显示的DeepSORT跟踪算法,结合卡尔曼滤波与匈牙利算法实现红外弱光环境下铁路异物跟踪检测。实验结果表明:所提算法对铁路异物的跟踪检测精确度达到83.3%,平均检测速度为11.3帧/s;与比较算法相比,所提算法检测精度更高,对红外弱光场景下铁路异物跟踪检测具有较好的性能。 展开更多
关键词 机器视觉 异物检测 红外弱光 空间定位 特征泛化增强 目标跟踪
原文传递
基于高贴合旋转框的复杂环境玉米株心定位方法 被引量:1
11
作者 徐艳蕾 郭丽丽 +2 位作者 黄东岩 周阳 李陈孝 《农业机械学报》 北大核心 2025年第4期129-138,共10页
为解决玉米株心定位困难及定位精度低的问题,针对复杂自然环境玉米叶冠数据,本文开发了一种基于高贴合旋转框的玉米株心定位方法,并提出了一种能有效减少边缘精度损失的标注策略。该定位方法首先通过使用高精度标注策略和构建具有自适... 为解决玉米株心定位困难及定位精度低的问题,针对复杂自然环境玉米叶冠数据,本文开发了一种基于高贴合旋转框的玉米株心定位方法,并提出了一种能有效减少边缘精度损失的标注策略。该定位方法首先通过使用高精度标注策略和构建具有自适性的轻量化渐进特征金字塔网络LC-AFPN,得到LCA-YOLO v7OBB玉米叶冠目标检测算法,然后利用色彩空间滤波算法分割叶冠区域,并使用间隙填充算法提升图像质量,最后利用图像矩原理准确计算株心坐标。实验结果表明,模型抗干扰能力强,株心定位准确度高。LCA-YOLO v7OBB模型平均检测精度可达85.19%,精确率和召回率达到91.83%和83.04%。与Rotated-FasterRCNN等12种旋转目标检测模型相比,LCA-YOLO v7OBB在准确性和召回率等综合性能方面表现最佳。模型泛化能力强,在自建黄瓜、茄子2种数据集上进行验证,其平均精度、精确率、召回率和F1值均有明显提升。本文方法能够为精准施肥、农机视觉导航等提供理论基础和技术支持。 展开更多
关键词 玉米株心定位 旋转目标检测 复杂环境 叶冠检测 特征提取 泛化能力
在线阅读 下载PDF
风格迁移增强的机场目标检测方法研究
12
作者 王欣 李屹 +1 位作者 孟天宇 黄佳琪 《计算机应用与软件》 北大核心 2025年第5期146-154,共9页
在基于图像的目标检测中,机场是一类非常重要的目标,对其进行自动识别具有重要意义。针对一般检测算法难以使用复杂的近地航拍图像中边缘信息的问题,提出一种融合风格迁移增强边缘特征提取的目标检测算法。使用生成对抗网络抑制图像噪声... 在基于图像的目标检测中,机场是一类非常重要的目标,对其进行自动识别具有重要意义。针对一般检测算法难以使用复杂的近地航拍图像中边缘信息的问题,提出一种融合风格迁移增强边缘特征提取的目标检测算法。使用生成对抗网络抑制图像噪声,使用边缘检测算法突出图像边缘特征,将突出边缘信息的图像经由目标检测算法完成机场位置检测。在机场目标检测数据集实验中,结合所提出的边缘特征提取方法的目标检测算法相比原始目标检测算法有精度上的提升,其中结合该特征提取方法的YOLOv5算法的平均精度达到97.7%,验证了该特征提取方法对机场目标检测具有很好的效果。 展开更多
关键词 风格迁移 生成对抗网络 目标检测 机场检测 边缘增强
在线阅读 下载PDF
基于条件扩散模型样本生成的小样本目标检测
13
作者 梅天灿 王亚茹 陈元豪 《电子与信息学报》 北大核心 2025年第4期1182-1191,共10页
利用生成模型为小样本目标检测提供额外样本是解决样本稀缺问题的方法之一。现有生成额外样本的方法,多关注于生成样本的多样性,而忽略了生成样本的质量和代表性。为解决这一问题,该文提出了一个新的基于数据生成的小样本目标检测框架F... 利用生成模型为小样本目标检测提供额外样本是解决样本稀缺问题的方法之一。现有生成额外样本的方法,多关注于生成样本的多样性,而忽略了生成样本的质量和代表性。为解决这一问题,该文提出了一个新的基于数据生成的小样本目标检测框架FQRS。首先,构造类间条件控制模块使得数据生成器能够学习不同类别间的关系,利用基类和新类的类间关系信息辅助模型估计新类的分布,从而提高生成样本的质量。其次,设计类内条件控制模块,利用交并比(IOU)信息限制生成样本在特征空间的位置,通过控制生成的样本更聚集于类别的中心,确保它们能够捕捉对应类别的关键特征,从而提高生成样本的代表性。在PASCAL VOC和MS COCO数据集上进行测试,在不同小样本条件下,该文提出的模型均超过当前最好的两阶段微调目标检测模型—解耦的更快区域卷积神经网络(DeFRCN)。实验验证了该文方法在小样本目标检测上具有出色的检测效果。 展开更多
关键词 小样本目标检测 深度学习 数据增强 样本生成
在线阅读 下载PDF
改进YOLOv8n模型对复杂农业场景下西红柿目标的检测 被引量:2
14
作者 戈刚 杨珺 +2 位作者 刘毅 胡逸轩 刘昊辉 《农业工程学报》 北大核心 2025年第9期143-153,共11页
针对复杂农业场景下西红柿果实大量重叠,叶片、背景遮挡干扰严重,现有模型检测时鲁棒性、检测精度、效果欠佳等问题,提出一种基于改进YOLOv8n的西红柿目标检测模型:TOMO-YOLO。首先,提出了WAFF特征融合策略,替换YOLOv8n的多尺度特征融... 针对复杂农业场景下西红柿果实大量重叠,叶片、背景遮挡干扰严重,现有模型检测时鲁棒性、检测精度、效果欠佳等问题,提出一种基于改进YOLOv8n的西红柿目标检测模型:TOMO-YOLO。首先,提出了WAFF特征融合策略,替换YOLOv8n的多尺度特征融合方法,优化不同尺度特征的权重分配,增强特征图的表达能力。其次,为解决YOLOv8n在面对复杂农业场景时鲁棒性和泛化能力弱、精度不佳的问题,设计了AWD检测头,提升模型在复杂农业场景的鲁棒性和检测性能。最后,在公共西红柿数据集、自建西红柿数据集上进行模型对比试验。试验结果表明,TOMO-YOLO的整体性能优于YOLO系列模型:YOLOv8n、YOLOv10n、YOLOv6n、YOLOv5n,其中TOMO-YOLO在公共西红柿数据集、自建西红柿数据集上的边框精度分别为88.6%和77.2%,召回率分别为85.0%和59.1%,mAP_(0.5)分别为90.9%和66.7%,mAP_(0.5~0.95)分别为55.0%和37.9%,F1分数分别为85.0%和68.0%,相较于YOLOv8n,边框精度分别提升0.7和3.9个百分点,召回率分别提升5.8和2.6个百分点,mAP_(0.5)分别提升1.4和3.0个百分点、mAP_(0.5~0.95)分别提升1.6和1.2个百分点,F1分数分别提升2.0和4.0个百分点,证明了改进模型的有效性,为西红柿自动化检测与识别提供技术支持。 展开更多
关键词 西红柿 复杂农业场景 YOLOv8n 目标检测 特征融合 鲁棒性 泛化能力
在线阅读 下载PDF
生成式模型赋能飞行器技术应用研究进展与展望 被引量:2
15
作者 陈树生 贾苜梁 +7 位作者 林家豪 金世轶 高正红 王岳青 马志强 李铮 段辰龙 李佳伟 《航空学报》 北大核心 2025年第10期40-93,共54页
在自然语言处理和计算机视觉领域取得颠覆性应用的生成式模型正成为数智化的新型技术基座,是未来驱动飞行器技术智能化发展的重要引擎。综述了生成式模型赋能飞行器技术应用进展。首先,总结了生成式模型架构的发展历程,详细介绍了变分... 在自然语言处理和计算机视觉领域取得颠覆性应用的生成式模型正成为数智化的新型技术基座,是未来驱动飞行器技术智能化发展的重要引擎。综述了生成式模型赋能飞行器技术应用进展。首先,总结了生成式模型架构的发展历程,详细介绍了变分自编码器、生成对抗网络、扩散模型、Transformer等基本原理架构和改进方向。其次,归纳了生成式模型在飞行器空气动力学、航迹预测和目标检测等领域的典型应用和变革情况;关注了参数化建模、气动预测模型、反设计等飞行器空气动力设计关键技术的发展趋势;探讨了实时航迹预测、完整航迹预测、协同航迹预测和预测误差补偿的智能实现方法;从现有目标检测方法改进角度分析了生成式模型在多尺度融合、超分辨率增强和数据增强中的作用。最后,从模型方法和应用场景拓展角度展望了生成式模型赋能飞行器技术未来的研究方向,针对构建可解释的通用大模型和推动垂直领域应用等方面提出了发展建议。 展开更多
关键词 生成式人工智能 飞行器技术 空气动力设计 航迹预测 目标检测
原文传递
基于YOLO-Unet组合网络的牛只个体识别方法研究 被引量:1
16
作者 周意 毛宽民 《计算机科学》 北大核心 2025年第4期194-201,共8页
非接触式牛只个体识别方法在节约识别成本、简化识别流程和提升识别精度方面具有一定的优势,近年来在牛只个体识别领域有了充分的发展。但现有的研究中存在着识别准确率受环境和天气等外部因素影响过大、模型迁移训练困难等问题。针对... 非接触式牛只个体识别方法在节约识别成本、简化识别流程和提升识别精度方面具有一定的优势,近年来在牛只个体识别领域有了充分的发展。但现有的研究中存在着识别准确率受环境和天气等外部因素影响过大、模型迁移训练困难等问题。针对上述问题,基于YOLO-Unet组合网络提出了包含3个模块的牛只个体识别模型。首先,根据YOLOv5模型构建图像提取模块,用以提取牛只面部图像;随后,采用Unet模型构建背景消去模块,用以去除牛只面部图像背景,以消除环境影响,进而提升模型泛化性能;最后,使用MobileNetV3构建个体分类模块,对经背景消去后的牛只面部图像进行分类。对背景消去模块进行了消融实验,实验结果表明,引入背景消去模块能极大地提升模型泛化性能。引入背景消去模块的模型在测试集上的识别准确率为90.48%,相较于未引入背景消去模块的模型提升了11.99%。 展开更多
关键词 牛只个体识别 深度学习 目标检测 语义分割 目标识别 泛化能力
在线阅读 下载PDF
基于多层次特征融合的蒸汽发生器二次侧异物检测方法
17
作者 王可庆 周新翔 +2 位作者 周翔 薛国强 张强 《核电子学与探测技术》 北大核心 2025年第10期1585-1591,共7页
针对蒸汽发生器二次侧异物检测主要依赖人工、存在效率低及可靠性有限等问题。本课题基于现场检查视频构建专用数据集,提出一种改进YOLOv11n的异物检测方法。该方法通过融合动态卷积与Ghost Conv,设计C3k2_GhostDynConv模块以增强特征... 针对蒸汽发生器二次侧异物检测主要依赖人工、存在效率低及可靠性有限等问题。本课题基于现场检查视频构建专用数据集,提出一种改进YOLOv11n的异物检测方法。该方法通过融合动态卷积与Ghost Conv,设计C3k2_GhostDynConv模块以增强特征自适应能力;在颈部网络中设计多层次注意力融合模块,结合局部-全局注意力机制与层次化特征融合策略,提升多尺度特征提取能力,强化对二次侧异物微观纹理的捕捉和对背景干扰的抑制能力;采用WIo Uv3(Wise-IoUv3)损失函数优化边界框回归,提升复杂场景中的检测稳定性。实验结果表明,该方法的m AP@0.5达到82.72%,较基线模型提升4.11%,整体性能优于其他典型检测模型,能够有效实现对二次侧异物的精确识别。 展开更多
关键词 深度学习 蒸汽发生器 异物检测 动态卷积 多层次注意力融合
在线阅读 下载PDF
多粒度遮挡特征增强的行人搜索算法
18
作者 苗春玲 张红云 +2 位作者 吴卓嘉 张齐贤 苗夺谦 《智能系统学报》 北大核心 2025年第1期230-242,共13页
现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了... 现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。 展开更多
关键词 深度学习 计算机视觉 行人搜索 目标检测 粒计算 数据处理 特征提取 生成对抗网络 对齐
在线阅读 下载PDF
一种改进YOLOv8的水下声呐图像目标检测方法 被引量:1
19
作者 刘凡诚 邢传玺 +2 位作者 魏光春 崔晶 董赛蒙 《应用科技》 2025年第1期34-40,共7页
为解决水下声呐图像中目标形状小、信息少等识别精度低带来的漏检、误检问题,本文提出一种改进YOLOv8水下声呐图像目标检测方法(YOLOv8-Underwater Sonar Image,YOLOv8-USI)。首先对水下声呐图像进行图像增强、图像降噪等预处理,并利用... 为解决水下声呐图像中目标形状小、信息少等识别精度低带来的漏检、误检问题,本文提出一种改进YOLOv8水下声呐图像目标检测方法(YOLOv8-Underwater Sonar Image,YOLOv8-USI)。首先对水下声呐图像进行图像增强、图像降噪等预处理,并利用生成对抗网络对水下声呐图像训练集进行扩充,防止过拟合现象;其次,引入GhostNet模块解决YOLOv8网络结构参数量多的问题,从而提高水下目标识别速度;接着根据预处理后声呐图像的特征,提取水下声呐图像中的目标特征信息。最后,根据识别到的目标物体置信度,验证声呐图像中目标物体的漏检与误检情况。实验结果表明,输出结果图的目标识别效果与整个检测过程速度均有所提高,时间加快0.08 s,因此YOLOv8-USI网络结构可有效提高水下声呐图像目标检测精度与速度。 展开更多
关键词 侧扫声呐图像 图像降噪 目标检测 YOLOv8-USI 过拟合 数据增强 生成对抗网络 GhostNet模块
在线阅读 下载PDF
面向暗光条件下行人识别的生成检测一体化方法
20
作者 沈羽翔 郭鑫 +2 位作者 王昊 胡柯彦 陶超 《中国图象图形学报》 北大核心 2025年第10期3319-3334,共16页
目的 暗光环境下的行人检测是计算机视觉领域的一项重大挑战,其难点在于光照不充分会导致行人特征模糊不可辨识。传统方法一般通过图像增强或生成红外图像提供补充信息解决这一问题。但由于其增强过程与下游检测任务存在分离,限制其应... 目的 暗光环境下的行人检测是计算机视觉领域的一项重大挑战,其难点在于光照不充分会导致行人特征模糊不可辨识。传统方法一般通过图像增强或生成红外图像提供补充信息解决这一问题。但由于其增强过程与下游检测任务存在分离,限制其应用性能。针对这一问题,提出一种面向暗光条件下行人识别的生成检测一体化方法,旨在解决传统范式中暗光图像数据增强和下游检测任务间的割裂问题。方法 提出一种端到端生成检测一体化架构,利用条件扩散模型从暗光图像生成辅助红外模态图像,并通过生成的多尺度特征提升目标检测性能。此外,为了避免梯度无法经过VAE(variational autoencoder)解码器传递的问题,进一步提出生成检测端到端联合优化策略。结果 在LLVIP(low-light visible-infrared paired dataset)和VTMOT(visible-thermal multiple object tracking dataset)数据集上的实验结果表明,本文方法在总体精度指标上显著优于传统方法和其他先进方法。在LLVIP数据集上,本文方法的F1值为85.75%,平均精度均值(mAP)为75.35%,优于传统方法中结果最佳的SCI(self-calibrated illumination)方法(F1值82.05%,mAP值72.30%)和其他先进方法中结果最佳的Faster_RCNN_hrnet(F1值82.91%,mAP值70.02%)。在VTMOT数据集上,本文方法同样表现优异,F1值为90.01%,mAP为73.44%,优于SCI方法(F1值85.91%,mAP值72.19%)和Faster_RCNN_hrnet(F1值84.48%,mAP值71.16%)。此外,消融实验验证了生成模块和联合优化策略在整体框架中的有效性。结论 本文证明了生成检测一体化框架在复杂低光环境下的优越性,有效解决了生成过程与检测任务割裂的问题。未来研究将进一步优化生成效率,并扩展该方法至更多多模态应用领域。 展开更多
关键词 暗光行人识别 生成检测一体化 条件扩散模型 目标检测 红外图像生成 端到端联合优化 多模态融合
原文传递
上一页 1 2 8 下一页 到第
使用帮助 返回顶部