期刊文献+
共找到457篇文章
< 1 2 23 >
每页显示 20 50 100
A Complex Background Image Registration Method Based on the Optical Flow Field Algorithm
1
作者 Zhentao Liu Lei Xu Shiyao Jiang 《国际计算机前沿大会会议论文集》 2022年第1期240-248,共9页
An effective nonrigid image registrationmethod is developed based on the optical flow field(OFF)framework for the complex registration of structure images.In our method,a new force is modeled and integrated into the o... An effective nonrigid image registrationmethod is developed based on the optical flow field(OFF)framework for the complex registration of structure images.In our method,a new force is modeled and integrated into the original optical flow equation to jointly drive the motion direction of pixels.At any point in the offset field,in addition to the force generated by the OFF model derived from local gradient information to drive the pixels in the floating image to infiltrate into the reference pixel set,a new“guiding force”derived from the global grayscale overall trend in a given neighborhood system helps the pixels to more properly spread into the corresponding reference pixel set,particularly when the gradient field of the reference image is unstable.In the experiment,a data set containing several images with complex structures was employed to validate the performance of our registration model.The test results show that our method can quickly and efficiently register complex images and is robust to noise in images. 展开更多
关键词 Target tracking Image registration complex background High noise
原文传递
The Lateral Occipital Complex is Activated by Melody with Accompaniment: Foreground and Background Segregation in Auditory Processing
2
作者 Masayuki Satoh Katsuhiko Takeda +1 位作者 Ken Nagata Hidekazu Tomimoto 《Journal of Behavioral and Brain Science》 2011年第3期94-101,共8页
Objective: Most of the western music consists of a melody and an accompaniment. The melody is referred to as the foreground, with the accompaniment the background. In visual processing, the lateral occipital complex (... Objective: Most of the western music consists of a melody and an accompaniment. The melody is referred to as the foreground, with the accompaniment the background. In visual processing, the lateral occipital complex (LOC) is known to participate in foreground and background segregation. We investigated the role of LOC in music processing with use of positron emission tomography (PET). Method: Musically na?ve subjects listened to unfamiliar novel melodies with (accompaniment condition) and without the accompaniment (melodic condition). Using a PET subtraction technique, we studied changes in regional cerebral blood flow (rCBF) during the accompaniment condition compared to the melodic condition. Results: The accompanyment condition was associated with bilateral increase of rCBF at the lateral and medial surfaces of both occipital lobes, medial parts of fusiform gyri, cingulate gyri, precentral gyri, insular cortices, and cerebellum. During the melodic condition, the activation at the anterior and posterior portions of the temporal lobes, medial surface of the frontal lobes, inferior frontal gyri, orbitofrontal cortices, inferior parietal lobules, and cerebellum was observed. Conclusions: The LOC participates in recognition of melody with accompaniment, a phenomenon that can be regarded as foreground and background segregation in auditory processing. The fusiform cortex which was known to participate in the color recognition might be activated by the recognition of flourish sounds by the accompaniment, compared to melodic condition. It is supposed that the LOC and fusiform cortex play similar functions beyond the difference of sensory modalities. 展开更多
关键词 Music Positron Emission Tomography (PET) MELODY ACCOMPANIMENT Foreground and background SEGREGATION Lateral OCCIPITAL complex (LOC)
暂未订购
复杂背景下合金钢电镀工件表面缺陷机器视觉挖掘
3
作者 赵海燕 王婧 +2 位作者 刘晓宇 刘琨 肖楷乐 《电镀与精饰》 北大核心 2025年第11期128-134,共7页
合金钢电镀工件加工环境中,机械设备、传送带、夹具等元素会形成复杂背景,同时光照不均、尘埃、油污等因素也会干扰图像质量,导致工件图像缺陷边缘信息不显著,增加了前景与背景区域分割难度,直接进行工件缺陷识别难以准确区分缺陷区域,... 合金钢电镀工件加工环境中,机械设备、传送带、夹具等元素会形成复杂背景,同时光照不均、尘埃、油污等因素也会干扰图像质量,导致工件图像缺陷边缘信息不显著,增加了前景与背景区域分割难度,直接进行工件缺陷识别难以准确区分缺陷区域,影响缺陷挖掘效果。针对这一问题,本文提出了一种复杂背景下合金钢电镀工件表面缺陷的机器视觉挖掘方法。通过引导滤波和直方图均衡化对合金钢电镀工件图像进行预处理,消除背景干扰并提高对比度,获取包含更多细节的细粒图像。采用拉普拉斯变换方法对细粒图像进行边缘增强处理,突出缺陷边缘信息,显著提升图像边缘清晰度和对比度。使用自适应阈值算法对增强后的图像进行前景与背景分割,提取仅包含工件及其缺陷的前景图像,减少数据处理复杂性。应用谱多流形聚类技术,将分类器中的相似点分配到不同的缺陷流形结构中,对缺陷区域进行精准划分,更准确地识别微小缺陷,实现复杂背景下合金钢电镀工件表面缺陷的机器视觉挖掘。通过实验证明,应用本文所提方法对图像边缘进行处理后,图像边缘清晰度为3.2 lp/mm,对比度方差为0.96,图像分割后的IoU值为99.6%,说明该方法在工件表面缺陷视觉挖掘中具有较好的效果。 展开更多
关键词 复杂背景 合金钢电镀工件 表面缺陷 机器视觉挖掘
在线阅读 下载PDF
联合全局注意力的自然环境下草莓果实检测算法研究
4
作者 秦培亮 秦昌友 +2 位作者 王晓拓 刘勇 梁正龙 《中国农机化学报》 北大核心 2025年第9期91-96,103,共7页
为克服草莓采摘机器在作业过程中存在采摘点定位精度低、遮挡草莓识别困难以及复杂背景干扰等问题,对现有的YOLOv5检测模型进行改进,通过引入全局注意力机制(GAM),增强模型对全局特征感知能力,更专注于草莓显著特征,减少误检同时提升对... 为克服草莓采摘机器在作业过程中存在采摘点定位精度低、遮挡草莓识别困难以及复杂背景干扰等问题,对现有的YOLOv5检测模型进行改进,通过引入全局注意力机制(GAM),增强模型对全局特征感知能力,更专注于草莓显著特征,减少误检同时提升对小目标特征提取和强化被遮挡区域特征,旨在提升模型自然环境背景下草莓果实定位准确率和遮挡识别的预测精确率;优化损失函数,使用软交并比(SIoU)作为损失函数,以增强尺度不变性和角度敏感性,确保正负样本的有效平衡。试验结果显示,相比于原始模型,经过改进后的模型在草莓果实检测精确率、召回率、平均精度、平均精度均值上分别提高2.20%、5.78%、5.11%、3.11%,在与SSD、YOLOv5s、YOLOv5m、YOLOv7—tiny、YOLOv8n以及YOLOv9c的对比试验中,在各项指标上均有很大优势,具有强鲁棒性,为机器人精准采摘的实现提供重要的技术支撑。 展开更多
关键词 草莓果实 深度学习 YOLOv5s 目标检测 复杂背景
在线阅读 下载PDF
基于YOLO算法的农作物病害检测研究进展
5
作者 乔世成 赵晨雨 +3 位作者 白明宇 党珊珊 潘春宇 张明月 《内蒙古农业大学学报(自然科学版)》 北大核心 2025年第6期86-93,共8页
农作物病害是指由病原体、环境因素或营养失衡引起的植物疾病。以YOLO系列算法为代表的农作物病害检测模型利用计算机视觉和深度学习技术,可以自动识别和分类农作物病害,以达到提高农业生产效率的目的。首先,本文概述了YOLO算法历代版... 农作物病害是指由病原体、环境因素或营养失衡引起的植物疾病。以YOLO系列算法为代表的农作物病害检测模型利用计算机视觉和深度学习技术,可以自动识别和分类农作物病害,以达到提高农业生产效率的目的。首先,本文概述了YOLO算法历代版本的演进过程,重点分析其在叶片与果实病害检测中的创新应用,包括多尺度特征融合(BiFPN、RepFPN)、轻量化网络(GhostNetV2、GSConv)及注意力机制(CBAM、EMA)等改进策略;其次,针对该领域所面临的挑战进行了总结,如复杂环境适应性不足、小目标特征提取难度大、小样本标注成本高等;最后,对未来研究方向进行了展望,为农作物病害检测技术的进一步发展提供参考,以提升农作物病害检测的智能化与普适化水平。 展开更多
关键词 YOLO算法 农作物病害检测 复杂背景 小目标 小样本
原文传递
一种复杂背景下的多策略MSVI-CFAR检测算法
6
作者 曾献芳 刘聪 +1 位作者 杨作宾 钱锋 《火力与指挥控制》 北大核心 2025年第7期161-167,共7页
为了进一步提高复杂背景下雷达目标恒虚警(CFAR)检测能力,提出了一种基于SVI-CFAR的改进型多策略CFAR(MSVI-CFAR)检测器。该检测器能够估计参考窗口中的杂波背景,并从单元平均CFAR(CA-CFAR)、最大CFAR(GO-CFAR)、开关型CFAR(S-CFAR)和... 为了进一步提高复杂背景下雷达目标恒虚警(CFAR)检测能力,提出了一种基于SVI-CFAR的改进型多策略CFAR(MSVI-CFAR)检测器。该检测器能够估计参考窗口中的杂波背景,并从单元平均CFAR(CA-CFAR)、最大CFAR(GO-CFAR)、开关型CFAR(S-CFAR)和有序统计与单元平均CFAR(OSCA-CFAR)中自适应选择最优检测策略。实验结果表明,MSVI-CFAR在均匀背景、杂波边缘和多目标干扰背景下保持着良好的鲁棒性,并且相对于SVI-CFAR具有更小的CFAR损失和更强的抗多目标干扰性能。 展开更多
关键词 恒虚警检测 多策略恒虚警检测 自适应检测 复杂环境
在线阅读 下载PDF
SDH-DETR轻量化绝缘子缺陷检测算法
7
作者 周景 刘心 +1 位作者 唐振洋 董晖 《电子测量技术》 北大核心 2025年第11期88-104,共17页
为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线... 为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线算法,降低优化难度并提高鲁棒性;其次,采用轻量级StarNet作为主干网络,在显著降低模型复杂度的同时提升特征提取能力;接着,引入DySample动态上采样模块,通过基于采样点的自适应上采样方法,有效减少细节丢失与图像失真;最后,利用Harr小波变换下采样模块(HWD),实现低频与高频信息的高效融合,抑制复杂背景干扰并增强对小目标的检测能力。在复杂背景数据集上的验证实验表明,SDH-DETR的平均精度达98.5%,较基线算法提升0.9%,参数量和计算量分别减少43%和46.1%,检测速度达78.6 fps。这表明该算法在保证高准确性的同时,实现了轻量化设计,满足了输电线路巡检对效率和性能的实际需求。 展开更多
关键词 输电线路 目标检测 绝缘子缺陷检测 复杂背景 轻量化 RT-DETR算法
原文传递
BEDiff:denoising diffusion probabilistic models for building extraction
8
作者 LEI Yanjing WANG Yuan +3 位作者 CHAN Sixian HU Jie ZHOU Xiaolong ZHANG Hongkai 《Optoelectronics Letters》 2025年第5期298-305,共8页
Accurately identifying building distribution from remote sensing images with complex background information is challenging.The emergence of diffusion models has prompted the innovative idea of employing the reverse de... Accurately identifying building distribution from remote sensing images with complex background information is challenging.The emergence of diffusion models has prompted the innovative idea of employing the reverse denoising process to distill building distribution from these complex backgrounds.Building on this concept,we propose a novel framework,building extraction diffusion model(BEDiff),which meticulously refines the extraction of building footprints from remote sensing images in a stepwise fashion.Our approach begins with the design of booster guidance,a mechanism that extracts structural and semantic features from remote sensing images to serve as priors,thereby providing targeted guidance for the diffusion process.Additionally,we introduce a cross-feature fusion module(CFM)that bridges the semantic gap between different types of features,facilitating the integration of the attributes extracted by booster guidance into the diffusion process more effectively.Our proposed BEDiff marks the first application of diffusion models to the task of building extraction.Empirical evidence from extensive experiments on the Beijing building dataset demonstrates the superior performance of BEDiff,affirming its effectiveness and potential for enhancing the accuracy of building extraction in complex urban landscapes. 展开更多
关键词 booster guidance building extraction reverse denoising process diffusion model bediff which remote sensing images complex background diffusion models
原文传递
子公司协调复杂性能提升企业数字化注意力吗?——基于注意力基础观的实证研究 被引量:1
9
作者 宋渊洋 徐峰 胡艳 《外国经济与管理》 北大核心 2025年第2期20-37,共18页
本文基于注意力基础观探讨子公司协调复杂性对企业数字化注意力的影响。通过理论分析和实证检验发现:(1)数字化是解决子公司协调复杂性带来的管理问题的合法的、有价值的方案,因此子公司协调复杂性能够提升企业数字化注意力。(2)行业数... 本文基于注意力基础观探讨子公司协调复杂性对企业数字化注意力的影响。通过理论分析和实证检验发现:(1)数字化是解决子公司协调复杂性带来的管理问题的合法的、有价值的方案,因此子公司协调复杂性能够提升企业数字化注意力。(2)行业数字化注意力越强,企业采用数字化来缓解子公司协调复杂性上升带来的管理问题的合法性越高,越有可能关注数字化以缓解子公司协调问题,导致子公司协调复杂性对数字化注意力的正向影响越强。(3)高管持股越高,高管短视程度越低,用数字化缓解子公司协调困难对高管的价值越大,子公司协调复杂性对数字化注意力的正向影响就越强。(4)CEO技术背景能够提升数字化解决方案的相关性,强化子公司协调复杂性对数字化注意力的正向影响。进一步分析表明,子公司协调复杂性对数字化注意力的影响在民营企业和创新程度高的企业更强,数字化注意力对企业数字化投入有正向影响。上述结论拓展了企业数字化前因的研究,对企业和政府推进数字化转型有启示意义。 展开更多
关键词 子公司协调复杂性 数字化 注意力 高管持股 高管短视 技术背景
原文传递
基于注意力机制改进DeepLabV3+网络的拉索检测方法
10
作者 蒋田勇 胡淳俊 郑力之 《交通科学与工程》 2025年第3期73-81,共9页
【目的】基于计算机视觉进行拉索振动测量时,背景图像中物体的运动会影响拉索振动识别的精度。因此,提出一种引入有效通道注意力(ECA)机制的改进DeepLabV3+网络方法,以去除复杂图像背景并提取图像前景中的拉索目标。【方法】在DeepLabV3... 【目的】基于计算机视觉进行拉索振动测量时,背景图像中物体的运动会影响拉索振动识别的精度。因此,提出一种引入有效通道注意力(ECA)机制的改进DeepLabV3+网络方法,以去除复杂图像背景并提取图像前景中的拉索目标。【方法】在DeepLabV3+网络的编码阶段增设特征提取模块以增强拉索图像的深层特征,从而获得更精细的拉索边缘;在解码阶段引入浅层特征融合模块过滤背景信息并减少细节信息的损失。【结果】在采集的离散拉索图像数据上对模型的精度进行评估,结果表明:改进后的DeepLabV3+网络的平均交互比(MIoU)、类别像素精度(PA)和平均像素精度(MPA)均有提高,分别达到0.9901、0.9984和0.9949。【结论】改进后的DeepLabV3+网络对拉索像素识别的精度更高,对背景图像的分割更完全,可有效去除拉索的复杂图像背景。 展开更多
关键词 计算机视觉 注意力机制 复杂图像背景 前景拉索 DeepLabV3+网络
在线阅读 下载PDF
复杂云背景下红外运动小目标检测在军事值勤中的应用
11
作者 李华 尤刚 +3 位作者 董茂科 黄永钦 李春和 陆振奎 《网络安全与数据治理》 2025年第S1期450-460,共11页
在现代军事值勤过程中,对空中目标的搜索与追踪至关重要。复杂云背景下红外运动小目标检测是红外搜索与跟踪(IRST)系统的关键技术之一。在执行空中巡逻、边境监控等军事值勤任务时,准确检测红外运动小目标能有效提升我方对潜在威胁的预... 在现代军事值勤过程中,对空中目标的搜索与追踪至关重要。复杂云背景下红外运动小目标检测是红外搜索与跟踪(IRST)系统的关键技术之一。在执行空中巡逻、边境监控等军事值勤任务时,准确检测红外运动小目标能有效提升我方对潜在威胁的预警与防御能力。提出了一种基于帧内和帧间信息的红外运动小目标精确检测新方法。对于单帧,在空间域中,考虑到军事值勤时复杂多变的云背景干扰以及目标快速识别的需求,开发了一个方向最大中值滤波器进行预处理,并在去噪图像上使用背景抑制滤波模板来突出显示目标。其次,根据云判别方法,通过不同的阈值提取云区域和非云区域中的目标,从而获取空间域图(SDM)。在频域中,设计了一个带通滤波器进行粗略的显著性检测,并通过平滑处理的幅度变换进行精细显著性检测。此外,通过自适应二进制分割方法获取频域图(FDM)。最后,通过基于强度和空间距离标准的判别来提取单帧中的候选目标。对于连续帧,由于在实际军事值勤中运动目标和误报之间的运动特征存在差异,进行了误报抑制,以再次提高检测精度。大量实验表明,所提出的方法对复杂云背景下的红外运动小目标检测具有较好的检测效果和鲁棒性,能在多种军事值勤场景下发挥重要作用,提升红外检测系统的性能。 展开更多
关键词 军事值勤 红外运动小目标检测 复杂云背景 帧内帧间信息
在线阅读 下载PDF
DTI-YOLO:改进YOLOv10s的交通标志检测模型
12
作者 刘美辰 李杰 陈廷伟 《计算机工程与应用》 北大核心 2025年第17期112-122,共11页
针对交通标志检测中,远景小目标特征易被弱化,难以与复杂背景区分的问题,提出了一种基于改进YOLOv10s的交通标志检测模型(DTI-YOLO)。提出膨胀卷积融合膨胀注意力模块(DDFM)替换PSA模块,设计局部和全局特征提取分支,通过聚焦局部细节与... 针对交通标志检测中,远景小目标特征易被弱化,难以与复杂背景区分的问题,提出了一种基于改进YOLOv10s的交通标志检测模型(DTI-YOLO)。提出膨胀卷积融合膨胀注意力模块(DDFM)替换PSA模块,设计局部和全局特征提取分支,通过聚焦局部细节与全局语义,抑制噪声干扰,增强模型在复杂背景中分离小目标特征的能力。构建基于二检测层的跨尺度特征融合网络(TDL-CCFN),利用跨尺度特征融合结构和针对小目标设计的二检测层结构,增强深浅层特征间的融合和小目标特征的保留,同时减少了模型的参数量。引入InnerMPDIoU损失函数替换CIoU损失函数,通过融合可调节尺度因子和顶点几何距离度量,增强模型对小目标位置和视角变化的敏感性,提升边界框回归效率与模型泛化能力。实验结果表明,DTI-YOLO模型具有良好的检测性能,相较于YOLOv10s,DTI-YOLO在TT100K和CCTSDB数据集上的mAP50分别提升5.5和4.8个百分点,分别达到90.9%和86.6%;同时,参数量减少约33.3%,降至5.4×10^(6),实现了模型轻量化。 展开更多
关键词 交通标志检测 DTI-YOLO 复杂背景 小目标特征 多尺度特征
在线阅读 下载PDF
基于SIRA的红外和可见光图像未爆弹目标配准方法
13
作者 张子军 赵旭 +1 位作者 李连鹏 刘子玉 《红外技术》 北大核心 2025年第3期376-384,共9页
针对红外和可见光成像技术在未爆弹(Unexploded Ordnance,UXO)探测中图像背景复杂、互信息度低、有效特征点少导致配准困难的问题,在Imregtform算法基础上提出了一种稳定的交互式配准算法(Stable Interactive Registration Algorithm, S... 针对红外和可见光成像技术在未爆弹(Unexploded Ordnance,UXO)探测中图像背景复杂、互信息度低、有效特征点少导致配准困难的问题,在Imregtform算法基础上提出了一种稳定的交互式配准算法(Stable Interactive Registration Algorithm, SIRA)。首先结合Cpselect算法实现图像关键节点的精确配准,通过算术平均聚合作为初始矩阵。同时融合对比度受限自适应直方图均衡化算法(Contrast Limited Adaptive Histogram Equalization, CLAHE)对图像进行自适应分割并均衡化,限制对比度避免过度增强,结合双线性插值保证区域之间的平滑连续,以保证配准迭代过程中的稳定性。引入矩阵弗罗贝尼乌斯接近度(Matrix Frobenius Proximity, MFP)作为配准评估指标,缓解传统评估指标的波动性。实验结果表明,SIRA与Imregtform算法相比,配准效率提升4.72倍,MFP提升15.47倍,该算法对UXO图像配准具有更高的精度与稳定性。 展开更多
关键词 未爆弹目标 多模图像 图像配准 复杂背景 变换矩阵
在线阅读 下载PDF
基于语义分割网络模型的核桃叶片焦枯程度估计研究
14
作者 司恒山 何子奇 +2 位作者 李志鹏 陆森 张劲松 《林业科学研究》 北大核心 2025年第1期28-38,共11页
[目的]实现核桃叶片焦叶程度的准确定量化,为科学精准治理焦叶症提供科学依据。[方法]以核桃叶片复杂背景图像为研究对象,提出基于语义分割网络模型的核桃叶片焦叶症分级方法。首先对焦叶叶片图像进行分割,主要包括两个阶段,第一阶段采... [目的]实现核桃叶片焦叶程度的准确定量化,为科学精准治理焦叶症提供科学依据。[方法]以核桃叶片复杂背景图像为研究对象,提出基于语义分割网络模型的核桃叶片焦叶症分级方法。首先对焦叶叶片图像进行分割,主要包括两个阶段,第一阶段采用Segment Anything(SAM)模型在复杂自然背景下提取目标叶片的边缘轮廓,第二阶段分别使用SAM和Mask R-CNN模型,对焦叶叶片进行分割。然后,提出了核桃叶片焦叶程度的分级标准与方法。[结果]SAM和Mask R-CNN模型都具有较好地核桃焦叶叶片识别和分割能力。SAM模型虽然分割时需点选标识目标区域,但该模型无需再次训练即可直接运行,具有较好的可操作性和交互性。相比之下,经训练后的Mask R-CNN模型分割精度更高,其像素精度、平均像素精度、平均交并比分别为98.95%、98.19%、95.94%。同时,基于Mask R-CNN模型的核桃叶片焦叶程度的分级平均准确率达到91.29%。[结论]在复杂自然背景下,采用基于语义分割网络模型的两阶段核桃叶片焦叶程度分级方法,能够准确地对核桃叶片焦叶部位进行识别和分割,为核桃焦叶程度等级划分提供了理论依据,对核桃焦叶症的精准防控提供了技术支撑。 展开更多
关键词 核桃叶片 焦叶症 严重程度分级 复杂背景 语义分割
在线阅读 下载PDF
基于YOLOv8-RFL模型的电力绝缘子缺陷检测方法
15
作者 聂凯 李泽 +3 位作者 高文豪 李诚真 刘永鹏 李清泉 《电网技术》 北大核心 2025年第9期3948-3957,I0140,共11页
在电力巡检过程中,无人机等边端智能检测设备往往面临输电线路绝缘子缺陷目标小、背景因素复杂等难点,且边端设备的硬件条件限制了模型的规模,导致设备算力有限,模型准确率偏低。针对上述问题,该文提出了一种基于YOLOv8-RFL(You only lo... 在电力巡检过程中,无人机等边端智能检测设备往往面临输电线路绝缘子缺陷目标小、背景因素复杂等难点,且边端设备的硬件条件限制了模型的规模,导致设备算力有限,模型准确率偏低。针对上述问题,该文提出了一种基于YOLOv8-RFL(You only look once version 8-RFL)模型的输电线路绝缘子缺陷检测方法。首先,通过对原有主干网络C2f(CSPDarknet53 to 2-Stage FPN)模块进行改进,增强模型对于绝缘子缺陷的特征提取能力;其次,构建基于特征聚焦的泛化特征金字塔网络(focusing generalized feature pyramid networks,FGFPN),采用“特征聚焦-扩散”的思想,精细化小缺陷目标的特征表达;然后,设计基于交叉注意机制的特征语义融合模块(feature semantic fusion module,FSFM),优化了对关键特征信息的捕获和利用;最后,提出轻量化权重共享检测头(Lightweight weight sharing detection head,LWSD),在保证检测精度的同时提高模型的计算效率和实时性。实验表明,改进后的YOLOv8-RFL模型均值平均精度(mean average precision,mAP)达到了93.2%,相较于基准模型提升了5.9%,在降低模型参数量和所需计算量的同时,实现了更好的绝缘子小目标缺陷检测效果,对于复杂背景下的输电线路绝缘子缺陷检测具有一定的现实意义。 展开更多
关键词 绝缘子缺陷检测 电力巡检 复杂背景 小目标检测 改进YOLOv8
原文传递
复杂背景下的红外运动目标语义分割算法研究
16
作者 吉浩宇 孟卫华 +2 位作者 张新朝 段静菲 张蒙 《航空兵器》 北大核心 2025年第2期80-86,共7页
红外弱小目标的语义分割对于细节纹理特征的依赖更强,较深的网络结构对红外目标的语义分割不适用,难以将弱小目标从复杂背景中准确分割出来。本文针对复杂背景下红外运动目标的语义分割任务需求,在公开目标检测跟踪数据集的基础上,标注... 红外弱小目标的语义分割对于细节纹理特征的依赖更强,较深的网络结构对红外目标的语义分割不适用,难以将弱小目标从复杂背景中准确分割出来。本文针对复杂背景下红外运动目标的语义分割任务需求,在公开目标检测跟踪数据集的基础上,标注构建了红外图像语义分割数据集,基于STDC-Seg模型针对红外图像特点进行了优化,提出了一种红外目标语义分割算法STDC-Infrared。重新设计网络下采样结构,增加空间注意力模块和多尺度自适应融合模块。实验结果表明,本算法相比STDC-Seg,在红外图像语义分割数据集上平均交并比和平均像素精度分别提升了12.47%和12.55%,特别是空中飞机目标的交并比和像素精度分别提升了31.53%和35.82%,有效提升了复杂背景红外运动目标场景下语义分割准确性。 展开更多
关键词 语义分割 红外运动目标 复杂背景 STDC-Seg 多尺度自适应融合
在线阅读 下载PDF
基于改进YOLOv8的SAR图像飞机目标检测算法 被引量:2
17
作者 邱琳琳 朱卫纲 +2 位作者 李永刚 邱磊 李炫潮 《电光与控制》 北大核心 2025年第3期101-110,共10页
合成孔径雷达(SAR)图像飞机目标检测面临背景复杂、飞机目标较为微弱且尺度较小、不同成像条件下目标差异较大、目标结构不连续等挑战,提出一种新的飞机目标检测算法ATDM,用于提高复杂背景下SAR图像飞机目标的检测精度。使用YOLOv8s作... 合成孔径雷达(SAR)图像飞机目标检测面临背景复杂、飞机目标较为微弱且尺度较小、不同成像条件下目标差异较大、目标结构不连续等挑战,提出一种新的飞机目标检测算法ATDM,用于提高复杂背景下SAR图像飞机目标的检测精度。使用YOLOv8s作为基线模型并改进了损失函数,算法包含三个重要的模块,即卷积注意力模块(CBAM)、全维度特征提取(ODFE)模块和可变形全局特征融合(DGFF)模块。为了增强网络在复杂背景下对飞机目标特征的提取能力,在基线网络的Backbone插入CBAM,从空间和通道两个维度学习飞机目标的特征;ODFE利用卷积核空间四个维度的动态性,通过并行策略沿核空间的四个维度学习不同类型飞机目标的特征,提升复杂背景下对散射特性较弱的飞机目标及小目标的检测能力;DGFF自适应调整卷积核的形状以适应不同成像条件下得到的飞机目标,并进行全局信息特征融合。最后,改进边界框回归损失函数为动态非单调聚焦损失函数WIoU,采用动态非单调聚焦机制,使用离群度评估锚框质量,降低SAR图像中可能存在的错误标注产生的影响。为了评估所提ATDM的性能,在SADD和高分三号SAR飞机数据集上开展实验,在两个数据集上得到的平均准确率(AP)分别达到95.4%和98.2%;消融实验结果与分析验证了所提出的三个模块及损失函数的有效性。此外,在与其他目标检测算法的对比中,所提算法也得到了最高的平均准确率。 展开更多
关键词 合成孔径雷达 飞机检测 复杂背景 全维度特征提取 可变形全局特征融合
在线阅读 下载PDF
实时视频监控中复杂背景人脸识别研究
18
作者 邹峰 《现代电子技术》 北大核心 2025年第23期65-68,共4页
为了提升实时视频监控中背景复杂、光照多变、遮挡和姿态变化等严峻环境下的人脸识别性能,文中提出一种基于自组织映射(SOM)的识别方法。首先,采用AdaBoost算法从复杂背景中精准定位人脸区域,减少背景干扰;其次,通过局部二值法(LBP)对... 为了提升实时视频监控中背景复杂、光照多变、遮挡和姿态变化等严峻环境下的人脸识别性能,文中提出一种基于自组织映射(SOM)的识别方法。首先,采用AdaBoost算法从复杂背景中精准定位人脸区域,减少背景干扰;其次,通过局部二值法(LBP)对人脸区域进行校正,消除姿态偏差;最后,利用SOM将高维LBP特征映射到低维空间,通过无监督学习实现快速、准确的人脸识别。实验结果表明,所提方法在正常光照、低光照、遮挡、姿态变化和复杂背景等场景下的误识率均显著低于对比方法,尤其在低光照和遮挡场景中,误识率分别降低至0.06和0.08,展现出更强的鲁棒性和适应性。所提方法有效解决了复杂背景下人脸识别的难题,为高校智能化管理提供了可靠的技术支持。 展开更多
关键词 视频监控 复杂背景 人脸定位 人脸校正 人脸识别 ADABOOST SOM
在线阅读 下载PDF
双向多尺度特征融合的无人机检测算法
19
作者 汤栎 贾渊 张玉宁 《计算机工程与应用》 北大核心 2025年第10期267-278,共12页
针对在公园、学校、机场等公共区域的复杂背景中,“黑飞”无人机目标尺度多变、模糊和遮挡等导致不易识别的问题,提出一种改进YOLOv8n的无人机目标检测算法。通过在C2f模块中融合RepViTBlock结构和高效多尺度注意力机制EMA(efficient mu... 针对在公园、学校、机场等公共区域的复杂背景中,“黑飞”无人机目标尺度多变、模糊和遮挡等导致不易识别的问题,提出一种改进YOLOv8n的无人机目标检测算法。通过在C2f模块中融合RepViTBlock结构和高效多尺度注意力机制EMA(efficient multi-scale attention)改进Bottleneck块,设计了C2f-RVB模块,在减少参数的情况下增强模型对多尺度特征信息的提取能力;在颈部特征融合网络中构建动态边界融合模块DBFFPN(dynamic boundary fusion feature pyramid network),并新增小目标检测层,聚合浅层的边界信息和深层的语义信息,提高模型抗遮挡检测能力;在损失函数部分,提出MFShape-IoU替换原模型CIoU,使得模型更关注边界框自身形状和尺度信息,聚集困难样本,提高目标定位精度。在公开数据集CBD上进行实验,结果表明,改进后的算法相比YOLOv8n,mAP@0.5提升4.1个百分点达到93.0%,mAP@0.5:0.95提升4.2个百分点达到57.1%。同时算法精度高于YOLOv8s,复杂度远低于YOLOv8s,符合在移动设备上部署的需求。 展开更多
关键词 复杂背景 反无人机 小目标检测 YOLOv8 注意力机制
在线阅读 下载PDF
基于Sim—YOLO的复杂背景下樱桃番茄多目标检测 被引量:1
20
作者 张俊宁 闫英 +2 位作者 胡欢 毕泽洋 邢宇 《中国农机化学报》 北大核心 2025年第3期238-245,F0002,共9页
为满足复杂场景下樱桃番茄采摘机器人精准识别和定位的需求,提出一种复杂背景下单果及成簇樱桃番茄果实的检测方法,采用注意力机制结合目标检测算法(Sim—YOLO)来解决番茄采摘多目标识别的难点问题。首先,结合GAN生成对抗网络和传统的... 为满足复杂场景下樱桃番茄采摘机器人精准识别和定位的需求,提出一种复杂背景下单果及成簇樱桃番茄果实的检测方法,采用注意力机制结合目标检测算法(Sim—YOLO)来解决番茄采摘多目标识别的难点问题。首先,结合GAN生成对抗网络和传统的图像增强如mosaic、旋转90°和Hue方法扩充数据集,提高模型的泛化能力。其次,对扩充后的番茄图像在Lab颜色空间下利用K—means聚类算法并结合Canny算子对其进行边缘检测,以初步区分复杂背景与检测目标。并在YOLOv5的骨干网络中加入SimAM注意力机制,增加算法的特征提取能力,提升果梗在相似颜色背景中的定位精度。试验结果表明,Sim—YOLO模型对不同成熟期的温室樱桃番茄的平均检测精确率及召回率分别为84.1%、98.0%,对果实及果梗多目标的平均检测精度为48.9%。果实及果梗多目标的检测精度均高于Faster R—CNN模型、YOLOv2模型和YOLOv3模型。最后,将Sim—YOLO模型通过模型转换部署到边缘计算设备,优化模型推理过程,减轻嵌入式端边缘计算压力,达到25 FPS的检测速率。 展开更多
关键词 樱桃番茄 复杂背景 GAN网络 多目标识别 嵌入式端部署
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部