期刊文献+
共找到474篇文章
< 1 2 24 >
每页显示 20 50 100
A Complex Background Image Registration Method Based on the Optical Flow Field Algorithm
1
作者 Zhentao Liu Lei Xu Shiyao Jiang 《国际计算机前沿大会会议论文集》 2022年第1期240-248,共9页
An effective nonrigid image registrationmethod is developed based on the optical flow field(OFF)framework for the complex registration of structure images.In our method,a new force is modeled and integrated into the o... An effective nonrigid image registrationmethod is developed based on the optical flow field(OFF)framework for the complex registration of structure images.In our method,a new force is modeled and integrated into the original optical flow equation to jointly drive the motion direction of pixels.At any point in the offset field,in addition to the force generated by the OFF model derived from local gradient information to drive the pixels in the floating image to infiltrate into the reference pixel set,a new“guiding force”derived from the global grayscale overall trend in a given neighborhood system helps the pixels to more properly spread into the corresponding reference pixel set,particularly when the gradient field of the reference image is unstable.In the experiment,a data set containing several images with complex structures was employed to validate the performance of our registration model.The test results show that our method can quickly and efficiently register complex images and is robust to noise in images. 展开更多
关键词 Target tracking Image registration complex background High noise
原文传递
The Lateral Occipital Complex is Activated by Melody with Accompaniment: Foreground and Background Segregation in Auditory Processing
2
作者 Masayuki Satoh Katsuhiko Takeda +1 位作者 Ken Nagata Hidekazu Tomimoto 《Journal of Behavioral and Brain Science》 2011年第3期94-101,共8页
Objective: Most of the western music consists of a melody and an accompaniment. The melody is referred to as the foreground, with the accompaniment the background. In visual processing, the lateral occipital complex (... Objective: Most of the western music consists of a melody and an accompaniment. The melody is referred to as the foreground, with the accompaniment the background. In visual processing, the lateral occipital complex (LOC) is known to participate in foreground and background segregation. We investigated the role of LOC in music processing with use of positron emission tomography (PET). Method: Musically na?ve subjects listened to unfamiliar novel melodies with (accompaniment condition) and without the accompaniment (melodic condition). Using a PET subtraction technique, we studied changes in regional cerebral blood flow (rCBF) during the accompaniment condition compared to the melodic condition. Results: The accompanyment condition was associated with bilateral increase of rCBF at the lateral and medial surfaces of both occipital lobes, medial parts of fusiform gyri, cingulate gyri, precentral gyri, insular cortices, and cerebellum. During the melodic condition, the activation at the anterior and posterior portions of the temporal lobes, medial surface of the frontal lobes, inferior frontal gyri, orbitofrontal cortices, inferior parietal lobules, and cerebellum was observed. Conclusions: The LOC participates in recognition of melody with accompaniment, a phenomenon that can be regarded as foreground and background segregation in auditory processing. The fusiform cortex which was known to participate in the color recognition might be activated by the recognition of flourish sounds by the accompaniment, compared to melodic condition. It is supposed that the LOC and fusiform cortex play similar functions beyond the difference of sensory modalities. 展开更多
关键词 Music Positron Emission Tomography (PET) MELODY ACCOMPANIMENT Foreground and background SEGREGATION Lateral OCCIPITAL complex (LOC)
暂未订购
基于改进YOLOv8n的辣椒穴盘漏播检测方法
3
作者 李旭 王浩 +4 位作者 邬备 刘青 匡敏球 刘大为 谢方平 《沈阳农业大学学报》 北大核心 2026年第2期117-127,共11页
[目的]辣椒穴盘育苗是辣椒种植常用的方法和手段,漏播会导致减产,而影响收益。针对辣椒种子与穴盘内基质颗粒颜色和形状相近的特点,开展复杂背景下小目标辣椒种子漏播检测方法研究,提出一种基于改进YOLOv8的辣椒种子检测模型YOLOv8-PS。... [目的]辣椒穴盘育苗是辣椒种植常用的方法和手段,漏播会导致减产,而影响收益。针对辣椒种子与穴盘内基质颗粒颜色和形状相近的特点,开展复杂背景下小目标辣椒种子漏播检测方法研究,提出一种基于改进YOLOv8的辣椒种子检测模型YOLOv8-PS。[方法]首先,在主干特征提取网络的3个检测头之前引入CBAM注意力机制,实现模型根据辣椒种子在图像中不同区域自适应地分配通道和像素的权重,抑制背景噪声并突出关键纹理、边缘与形态特征,从而提高复杂背景下的辣椒种子信息提取的精确性;其次,替换主干网络中的前两个C2f模块为融合EMA高效多尺度注意力机制的C2f_EMA模块,通过全局平均池化和分组归一化操作,重新校准特征权重,突出辣椒种子的关键特征,提高模型对辣椒种子多尺度信息提取能力和检测精度;最后,为改善CIoU损失函数在检测任务中收敛慢和定位偏差大的问题,使用DIoU损失函数加速边界框回归,提高模型检测性能。[结果]改进后的YOLOv8-PS模型的平均精度均值和帧率值分别达到90%和191帧·s^(-1),较基线模型YOLOv8n分别提升3.1个百分点和62帧·s^(-1),漏播检测试验中改进前后的模型误差下降率显著。[结论]所提出的YOLOv8-PS模型在保证实时性的同时显著提升了复杂背景下辣椒穴盘漏播检测的准确性与鲁棒性,能够有效满足实际生产中播种质量在线检测与漏播识别的需求,为辣椒种子的播种质量检测提供了技术参考。 展开更多
关键词 穴盘育苗 漏播检测 小目标 复杂背景 YOLOv8
在线阅读 下载PDF
多尺度信息增强的遥感图像目标检测算法
4
作者 杨路 刘俊杰 余翔 《计算机工程》 北大核心 2026年第4期200-213,共14页
针对复杂背景遥感图像中小目标密集、目标尺度变化大等因素给目标检测带来的特征提取困难、精度不佳的问题,在YOLOv5s基础上提出一种多尺度信息增强的目标检测算法——深度学习YOLO(DL-YOLO)。首先,改进算法在主干网络顶部采用基于快速... 针对复杂背景遥感图像中小目标密集、目标尺度变化大等因素给目标检测带来的特征提取困难、精度不佳的问题,在YOLOv5s基础上提出一种多尺度信息增强的目标检测算法——深度学习YOLO(DL-YOLO)。首先,改进算法在主干网络顶部采用基于快速空间金字塔池化设计的空洞卷积快速空间金字塔池化,通过其中的感受野增强模块(RFEB)融合多尺度目标的细节信息与语义信息,提高网络的特征提取能力。其次,改进算法的检测头部分采用以YOLOv6s解耦头(DH)为基础设计的轻量高效解耦头(LEDH)来替换原有的检测头,在该解耦头中设计了轻量化空洞全局深度卷积(GDConv)模块来增强分类与回归任务关联信息的学习,以及引用轻量化卷积实现轻量化,在提高各尺度目标检测精度的同时,降低解耦头参数量。在DIOR数据集上的实验结果表明,与YOLOv5s相比,提出的DL-YOLO算法在精确率、召回率、mAP@0.5、mAP上分别提高了1.6、2.1、2.1和4.7百分点,综合指标超过了现有优秀的目标检测算法,对遥感图像中多尺度目标检测具有实际应用意义。 展开更多
关键词 遥感图像 复杂背景 YOLOv5s算法 多尺度目标检测 解耦头
在线阅读 下载PDF
高分辨率SAR车辆目标识别数据集
5
作者 王威 张会强 +7 位作者 范红旗 吴中杰 回丙伟 刘天鹏 吴舒捷 项德良 卫朝富 马营兵 《中国科学数据(中英文网络版)》 2026年第1期419-436,共18页
SAR车辆目标识别在战场态势感知、目标精确打击等方面具有非常重要的研究和应用价值。针对当前SAR车辆目标实测数据较为匮乏、背景单一、样本多样性不足等情况,通过典型场景布设、外场无人机挂飞试验、SAR数据成像处理、SAR目标切片制... SAR车辆目标识别在战场态势感知、目标精确打击等方面具有非常重要的研究和应用价值。针对当前SAR车辆目标实测数据较为匮乏、背景单一、样本多样性不足等情况,通过典型场景布设、外场无人机挂飞试验、SAR数据成像处理、SAR目标切片制备等步骤构建了一个高分辨率SAR车辆目标识别数据集。本数据集涵盖7大类21型车辆目标,包括水泥地面、草地与树丛3种背景,Ku与X两个波段,5个俯仰角以及多达72个方位角,共计3308张SAR幅度图像数据以及对应的复数据。所有样本均结合专家判读与图像质量评估双重校验,确保了成像质量与标注信息的可靠性。本数据集可为SAR车辆目标特性分析、车辆细粒度识别、小样本识别、域适应目标识别等研究提供基础数据支撑,提升SAR目标识别领域研究水平以及应用效果。 展开更多
关键词 SAR图像 车辆目标 地面背景 目标识别 复数据
在线阅读 下载PDF
复杂背景下基于YOLO-insulator模型的绝缘子小目标缺陷检测研究
6
作者 董朋林 陈久朋 +2 位作者 王森 伞红军 胡宏伟 《电力科学与技术学报》 北大核心 2026年第1期262-276,共15页
基于计算机视觉的航拍绝缘子缺陷检测方法被广泛应用于电力巡检。针对绝缘子缺陷易受背景复杂、目标尺度较小等因素的影响而导致漏检、误检的问题,提出了一种旨在提高绝缘子缺陷检测精度的绝缘子缺陷检测模型YOLO-insulator。首先,引入... 基于计算机视觉的航拍绝缘子缺陷检测方法被广泛应用于电力巡检。针对绝缘子缺陷易受背景复杂、目标尺度较小等因素的影响而导致漏检、误检的问题,提出了一种旨在提高绝缘子缺陷检测精度的绝缘子缺陷检测模型YOLO-insulator。首先,引入基于通道混洗的重参数化卷积(reparameterized convolution based on channel shuffle-one-shot aggregation, RCS-OSA)替换传统的二维卷积C2f,以增强网络的特征提取能力;其次,在颈部网络使用RCS-OSA模块替换部分的C2f卷积,同时引入挤压激励网络(squeeze and excitation network,SENet),以增强模型对通道间关系的捕捉和整体特征的表达能力;最后,针对多种缺陷区域小导致难以检测的问题,提出小目标检测层方法,该层包含更多的缺陷细节信息,有利于缺陷的检测。在自制绝缘子数据集上进行实验验证的结果表明,相对于基线YOLOv8n,YOLO-insulator模型在查准率、召回率、平均精度均值上都实现了提升,有效提高了模型的综合性能。 展开更多
关键词 绝缘子缺陷检测 复杂背景 注意力机制 挤压激励 小目标检测层
在线阅读 下载PDF
复杂背景下反无人机红外目标鲁棒跟踪算法
7
作者 冯子成 张文龙 +1 位作者 刘冬辉 于起峰 《航空学报》 北大核心 2026年第4期258-277,共20页
面向复杂背景下反无人机任务,红外目标跟踪面临着目标多尺度、遮挡、移出视野、背景干扰等诸多挑战。针对这些问题,提出了一种红外无人机鲁棒跟踪算法。首先,提出了一个全局跟踪模型,采用高效的一阶段无锚框框架,通过全局搜索以应对因... 面向复杂背景下反无人机任务,红外目标跟踪面临着目标多尺度、遮挡、移出视野、背景干扰等诸多挑战。针对这些问题,提出了一种红外无人机鲁棒跟踪算法。首先,提出了一个全局跟踪模型,采用高效的一阶段无锚框框架,通过全局搜索以应对因遮挡和移出视野导致的无人机目标消失问题,并使用多层级结构跟踪不同尺寸的目标。其次,提出一个基于记忆网络的时空特征融合模块,利用视频中的时空域特征来提高目标的可判别性。然后,提出了一个目标增强与干扰抑制模块,通过记录和匹配帧间的目标和干扰特征以生成权重,并与得分图加权以提升算法的抗背景干扰能力。最后,提出了一个动态层级加速方法,通过删除冗余层级以提高运行效率。实验结果表明:该算法在2nd和3rd AntiUAV数据集上分别取得92.4%和78.7%的精度以及69.4%和56.5%的成功率,并能够以26.9帧/s的速度运行,其性能均明显超过了现有算法,实现了在复杂场景中对无人机的实时和鲁棒跟踪。 展开更多
关键词 红外目标跟踪 反无人机 复杂背景 抗干扰 实时跟踪 深度学习
原文传递
遥感卫星图像船舶检测样本数据集研究综述
8
作者 周玉明 张一鸣 +1 位作者 刘圆圆 黄山 《数据与计算发展前沿(中英文)》 2026年第2期215-226,共12页
【目的】系统梳理卫星遥感图像船舶检测样本数据集的研究进展和应用现状。【文献范围】本文分析了2017—2024年文献发布的29个遥感图像船舶数据集。【方法】从技术角度,按照遥感卫星成像载荷所采用不同波段,对可见光图像船舶检测数据集... 【目的】系统梳理卫星遥感图像船舶检测样本数据集的研究进展和应用现状。【文献范围】本文分析了2017—2024年文献发布的29个遥感图像船舶数据集。【方法】从技术角度,按照遥感卫星成像载荷所采用不同波段,对可见光图像船舶检测数据集、SAR图像船舶检测数据集、红外图像船舶检测数据集,从船舶类别、船舶数量、标注方式、分辨率、数据来源、获取方式等方面进行了详细论述。在应用角度下,针对数据集特点、元数据、检测效果等三个方面进行了归纳分析。【结果】现有数据集在船舶检测应用中发挥了重要作用,但存在着样本类别不均衡、场景不够丰富、分辨率不够高和数据规模不够大等问题,后续数据集朝着高质量、大规模、多模态融合等方向发展。本文能够为后续开展基于深度学习方法的遥感卫星图像船舶样本数据集检测与识别研究提供有价值的数据参考和指导。 展开更多
关键词 深度学习 数据集 船舶检测 精确识别 复杂场景
在线阅读 下载PDF
使用结构相似性指数的可逆信息隐藏算法
9
作者 郭可馨 项世军 《应用科学学报》 北大核心 2026年第2期224-233,共10页
可逆信息隐藏(reversible data hiding,RDH)失真包括像素失真和结构失真。考虑到人类视觉系统(human visual system,HVS)对图像结构失真的高敏感性,本文提出使用结构相似性指数(structural similarity index measure,SSIM)作为RDH的评... 可逆信息隐藏(reversible data hiding,RDH)失真包括像素失真和结构失真。考虑到人类视觉系统(human visual system,HVS)对图像结构失真的高敏感性,本文提出使用结构相似性指数(structural similarity index measure,SSIM)作为RDH的评价指标。首先,通过分析峰值信噪比(peak signal-to-noise ratio,PSNR)与SSIM的理论增益关系,实现对两个指标的动态同步评估。随后,提出一种基于纹理区域优先选择的高SSIM的RDH方法。将载体图像划分为4个独立像素集进行图像预处理,精准找到纹理区域,进而按照背景复杂度由高到低的顺序嵌入信息。实验结果表明,优先在纹理区域中嵌入信息的策略减小了图像结构失真。在相同的嵌入率下,SSIM值及图像视觉质量均得到了提高。 展开更多
关键词 可逆信息隐藏 结构相似性指数 人类视觉系统 纹理区域 背景复杂度
在线阅读 下载PDF
基于深度学习的SAR图像目标检测综述
10
作者 邱琳琳 朱卫纲 +2 位作者 李永刚 邱磊 李炫潮 《兵工自动化》 北大核心 2026年第3期72-76,共5页
针对大场景多类别合成孔径雷达(synthetic aperture radar,SAR)图像目标检测存在的问题,对基于深度学习的SAR图像目标检测进行分析。从多尺度、复杂背景和大场景3方面综述现有SAR图像目标检测的现状;总结当前SAR图像目标检测存在的问题... 针对大场景多类别合成孔径雷达(synthetic aperture radar,SAR)图像目标检测存在的问题,对基于深度学习的SAR图像目标检测进行分析。从多尺度、复杂背景和大场景3方面综述现有SAR图像目标检测的现状;总结当前SAR图像目标检测存在的问题,并对下一步工作进行展望。结果表明,该研究可为相关工作提供参考。 展开更多
关键词 合成孔径雷达 目标检测 深度学习 多类目标 复杂背景 大场景
在线阅读 下载PDF
基于SCCG-YOLO模型的面包干燥剂检测方法
11
作者 姜阔胜 甘礼丰 +1 位作者 张成松 应文龙 《齐齐哈尔大学学报(自然科学版)》 2026年第1期17-23,共7页
针对当前面包包装袋中干燥剂识别过程中背景复杂、存在遮挡问题,提出一种基于SCCG-YOLO的干燥剂识别方法。首先通过预处理增强采集干燥剂图像的关键特征和减少复杂背景影响。然后在模型改进过程中,采用基于SCC的C2f模块简化原YOLO的主... 针对当前面包包装袋中干燥剂识别过程中背景复杂、存在遮挡问题,提出一种基于SCCG-YOLO的干燥剂识别方法。首先通过预处理增强采集干燥剂图像的关键特征和减少复杂背景影响。然后在模型改进过程中,采用基于SCC的C2f模块简化原YOLO的主干网络和颈部网络,提高模型检测精度和效率;加入GAM模块,提高特征保存能力和检测精度,增强模型对遮挡物体的检测能力。最后采用Focal-EIoU Loss损失函数解决干燥剂样本不均衡和边界框尺度敏感性不足问题。结果表明,改进的模型对干燥剂识别的平均准确率mAP50和mAP50-95分别为99.1%和68.1%,显著提升面包包装袋内干燥剂的精确识别能力。 展开更多
关键词 干燥剂 机器视觉 深度学习 复杂背景
在线阅读 下载PDF
基于均值漂移算法的复杂背景篮球比赛视频多目标识别
12
作者 文宜进 《成都大学学报(自然科学版)》 2026年第1期51-57,共7页
对复杂背景篮球比赛视频展开分析时,如果依据的是多目标浅层特征,将导致最终识别结果F1值较低,因此,提出基于均值漂移算法的复杂背景篮球比赛视频多目标识别方法.利用加速稳健特征描述子算法实现兴趣点配准,补偿视频帧图像运动背景,解... 对复杂背景篮球比赛视频展开分析时,如果依据的是多目标浅层特征,将导致最终识别结果F1值较低,因此,提出基于均值漂移算法的复杂背景篮球比赛视频多目标识别方法.利用加速稳健特征描述子算法实现兴趣点配准,补偿视频帧图像运动背景,解决篮球比赛视频不断运动的复杂背景中目标信息模糊的问题;利用自适应形态学滤波处理消除复杂背景中的干扰噪声,以提升多目标识别质量;构建基于深度残差网络—快速区域提议网络—快速区域卷积神经网络的多目标检测模型,标注出单个视频帧内的多个目标;创新性地引入均值漂移算法分析多目标的深层特征变化,对视频中的运动目标进行更准确的跟踪与分割,优化篮球比赛视频多目标识别结果.实验结果表明,该方法建立的多目标检测模型的目标检测损失函数值低于0.1,可以应用到后续多目标识别工作中,完成对复杂背景篮球比赛视频的多目标识别,在每个视频帧中成功捕捉到所有篮球运动员,多目标识别结果F1值超过了0.9,目标跟踪延迟时间最高仅为0.2 s,面对复杂场景视频表现出了优越的目标识别性能,且通过引入自适应形态学滤波算法消除画面中噪声信息,提升了画面质量,为篮球比赛视频分析提供了助力与支持. 展开更多
关键词 均值漂移算法 篮球比赛 视频帧 复杂背景 图像分割 多目标识别
在线阅读 下载PDF
Text Extraction in Complex Color Document Images for Enhanced Readability
13
作者 P. Nagabhushan S. Nirmala 《Intelligent Information Management》 2010年第2期120-133,共14页
Often we encounter documents with text printed on complex color background. Readability of textual contents in such documents is very poor due to complexity of the background and mix up of color(s) of foreground text ... Often we encounter documents with text printed on complex color background. Readability of textual contents in such documents is very poor due to complexity of the background and mix up of color(s) of foreground text with colors of background. Automatic segmentation of foreground text in such document images is very much essential for smooth reading of the document contents either by human or by machine. In this paper we propose a novel approach to extract the foreground text in color document images having complex background. The proposed approach is a hybrid approach which combines connected component and texture feature analysis of potential text regions. The proposed approach utilizes Canny edge detector to detect all possible text edge pixels. Connected component analysis is performed on these edge pixels to identify candidate text regions. Because of background complexity it is also possible that a non-text region may be identified as a text region. This problem is overcome by analyzing the texture features of potential text region corresponding to each connected component. An unsupervised local thresholding is devised to perform foreground segmentation in detected text regions. Finally the text regions which are noisy are identified and reprocessed to further enhance the quality of retrieved foreground. The proposed approach can handle document images with varying background of multiple colors and texture;and foreground text in any color, font, size and orientation. Experimental results show that the proposed algorithm detects on an average 97.12% of text regions in the source document. Readability of the extracted foreground text is illustrated through Optical character recognition (OCR) in case the text is in English. The proposed approach is compared with some existing methods of foreground separation in document images. Experimental results show that our approach performs better. 展开更多
关键词 Color Document Image complex background Connected Component ANALYSIS Segmentation of Text Texture ANALYSIS UNSUPERVISED THRESHOLDING OCR
在线阅读 下载PDF
基于YOLO算法的农作物病害检测研究进展 被引量:1
14
作者 乔世成 赵晨雨 +3 位作者 白明宇 党珊珊 潘春宇 张明月 《内蒙古农业大学学报(自然科学版)》 北大核心 2025年第6期86-93,共8页
农作物病害是指由病原体、环境因素或营养失衡引起的植物疾病。以YOLO系列算法为代表的农作物病害检测模型利用计算机视觉和深度学习技术,可以自动识别和分类农作物病害,以达到提高农业生产效率的目的。首先,本文概述了YOLO算法历代版... 农作物病害是指由病原体、环境因素或营养失衡引起的植物疾病。以YOLO系列算法为代表的农作物病害检测模型利用计算机视觉和深度学习技术,可以自动识别和分类农作物病害,以达到提高农业生产效率的目的。首先,本文概述了YOLO算法历代版本的演进过程,重点分析其在叶片与果实病害检测中的创新应用,包括多尺度特征融合(BiFPN、RepFPN)、轻量化网络(GhostNetV2、GSConv)及注意力机制(CBAM、EMA)等改进策略;其次,针对该领域所面临的挑战进行了总结,如复杂环境适应性不足、小目标特征提取难度大、小样本标注成本高等;最后,对未来研究方向进行了展望,为农作物病害检测技术的进一步发展提供参考,以提升农作物病害检测的智能化与普适化水平。 展开更多
关键词 YOLO算法 农作物病害检测 复杂背景 小目标 小样本
原文传递
复杂背景下合金钢电镀工件表面缺陷机器视觉挖掘
15
作者 赵海燕 王婧 +2 位作者 刘晓宇 刘琨 肖楷乐 《电镀与精饰》 北大核心 2025年第11期128-134,共7页
合金钢电镀工件加工环境中,机械设备、传送带、夹具等元素会形成复杂背景,同时光照不均、尘埃、油污等因素也会干扰图像质量,导致工件图像缺陷边缘信息不显著,增加了前景与背景区域分割难度,直接进行工件缺陷识别难以准确区分缺陷区域,... 合金钢电镀工件加工环境中,机械设备、传送带、夹具等元素会形成复杂背景,同时光照不均、尘埃、油污等因素也会干扰图像质量,导致工件图像缺陷边缘信息不显著,增加了前景与背景区域分割难度,直接进行工件缺陷识别难以准确区分缺陷区域,影响缺陷挖掘效果。针对这一问题,本文提出了一种复杂背景下合金钢电镀工件表面缺陷的机器视觉挖掘方法。通过引导滤波和直方图均衡化对合金钢电镀工件图像进行预处理,消除背景干扰并提高对比度,获取包含更多细节的细粒图像。采用拉普拉斯变换方法对细粒图像进行边缘增强处理,突出缺陷边缘信息,显著提升图像边缘清晰度和对比度。使用自适应阈值算法对增强后的图像进行前景与背景分割,提取仅包含工件及其缺陷的前景图像,减少数据处理复杂性。应用谱多流形聚类技术,将分类器中的相似点分配到不同的缺陷流形结构中,对缺陷区域进行精准划分,更准确地识别微小缺陷,实现复杂背景下合金钢电镀工件表面缺陷的机器视觉挖掘。通过实验证明,应用本文所提方法对图像边缘进行处理后,图像边缘清晰度为3.2 lp/mm,对比度方差为0.96,图像分割后的IoU值为99.6%,说明该方法在工件表面缺陷视觉挖掘中具有较好的效果。 展开更多
关键词 复杂背景 合金钢电镀工件 表面缺陷 机器视觉挖掘
在线阅读 下载PDF
BEDiff:denoising diffusion probabilistic models for building extraction 被引量:1
16
作者 LEI Yanjing WANG Yuan +3 位作者 CHAN Sixian HU Jie ZHOU Xiaolong ZHANG Hongkai 《Optoelectronics Letters》 2025年第5期298-305,共8页
Accurately identifying building distribution from remote sensing images with complex background information is challenging.The emergence of diffusion models has prompted the innovative idea of employing the reverse de... Accurately identifying building distribution from remote sensing images with complex background information is challenging.The emergence of diffusion models has prompted the innovative idea of employing the reverse denoising process to distill building distribution from these complex backgrounds.Building on this concept,we propose a novel framework,building extraction diffusion model(BEDiff),which meticulously refines the extraction of building footprints from remote sensing images in a stepwise fashion.Our approach begins with the design of booster guidance,a mechanism that extracts structural and semantic features from remote sensing images to serve as priors,thereby providing targeted guidance for the diffusion process.Additionally,we introduce a cross-feature fusion module(CFM)that bridges the semantic gap between different types of features,facilitating the integration of the attributes extracted by booster guidance into the diffusion process more effectively.Our proposed BEDiff marks the first application of diffusion models to the task of building extraction.Empirical evidence from extensive experiments on the Beijing building dataset demonstrates the superior performance of BEDiff,affirming its effectiveness and potential for enhancing the accuracy of building extraction in complex urban landscapes. 展开更多
关键词 booster guidance building extraction reverse denoising process diffusion model bediff which remote sensing images complex background diffusion models
原文传递
联合全局注意力的自然环境下草莓果实检测算法研究
17
作者 秦培亮 秦昌友 +2 位作者 王晓拓 刘勇 梁正龙 《中国农机化学报》 北大核心 2025年第9期91-96,103,共7页
为克服草莓采摘机器在作业过程中存在采摘点定位精度低、遮挡草莓识别困难以及复杂背景干扰等问题,对现有的YOLOv5检测模型进行改进,通过引入全局注意力机制(GAM),增强模型对全局特征感知能力,更专注于草莓显著特征,减少误检同时提升对... 为克服草莓采摘机器在作业过程中存在采摘点定位精度低、遮挡草莓识别困难以及复杂背景干扰等问题,对现有的YOLOv5检测模型进行改进,通过引入全局注意力机制(GAM),增强模型对全局特征感知能力,更专注于草莓显著特征,减少误检同时提升对小目标特征提取和强化被遮挡区域特征,旨在提升模型自然环境背景下草莓果实定位准确率和遮挡识别的预测精确率;优化损失函数,使用软交并比(SIoU)作为损失函数,以增强尺度不变性和角度敏感性,确保正负样本的有效平衡。试验结果显示,相比于原始模型,经过改进后的模型在草莓果实检测精确率、召回率、平均精度、平均精度均值上分别提高2.20%、5.78%、5.11%、3.11%,在与SSD、YOLOv5s、YOLOv5m、YOLOv7—tiny、YOLOv8n以及YOLOv9c的对比试验中,在各项指标上均有很大优势,具有强鲁棒性,为机器人精准采摘的实现提供重要的技术支撑。 展开更多
关键词 草莓果实 深度学习 YOLOv5s 目标检测 复杂背景
在线阅读 下载PDF
一种复杂背景下的多策略MSVI-CFAR检测算法
18
作者 曾献芳 刘聪 +1 位作者 杨作宾 钱锋 《火力与指挥控制》 北大核心 2025年第7期161-167,共7页
为了进一步提高复杂背景下雷达目标恒虚警(CFAR)检测能力,提出了一种基于SVI-CFAR的改进型多策略CFAR(MSVI-CFAR)检测器。该检测器能够估计参考窗口中的杂波背景,并从单元平均CFAR(CA-CFAR)、最大CFAR(GO-CFAR)、开关型CFAR(S-CFAR)和... 为了进一步提高复杂背景下雷达目标恒虚警(CFAR)检测能力,提出了一种基于SVI-CFAR的改进型多策略CFAR(MSVI-CFAR)检测器。该检测器能够估计参考窗口中的杂波背景,并从单元平均CFAR(CA-CFAR)、最大CFAR(GO-CFAR)、开关型CFAR(S-CFAR)和有序统计与单元平均CFAR(OSCA-CFAR)中自适应选择最优检测策略。实验结果表明,MSVI-CFAR在均匀背景、杂波边缘和多目标干扰背景下保持着良好的鲁棒性,并且相对于SVI-CFAR具有更小的CFAR损失和更强的抗多目标干扰性能。 展开更多
关键词 恒虚警检测 多策略恒虚警检测 自适应检测 复杂环境
在线阅读 下载PDF
SDH-DETR轻量化绝缘子缺陷检测算法
19
作者 周景 刘心 +1 位作者 唐振洋 董晖 《电子测量技术》 北大核心 2025年第11期88-104,共17页
为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线... 为解决无人机在输电线路绝缘子巡检中目标检测算法面临的模型复杂度高、小目标缺陷检测精度不足和上下采样过程中容易造成特征丢失等挑战,本文提出了一种基于轻量化改进的RT-DETR绝缘子缺陷检测算法(SDH-DETR)。首先,以RT-DETR作为基线算法,降低优化难度并提高鲁棒性;其次,采用轻量级StarNet作为主干网络,在显著降低模型复杂度的同时提升特征提取能力;接着,引入DySample动态上采样模块,通过基于采样点的自适应上采样方法,有效减少细节丢失与图像失真;最后,利用Harr小波变换下采样模块(HWD),实现低频与高频信息的高效融合,抑制复杂背景干扰并增强对小目标的检测能力。在复杂背景数据集上的验证实验表明,SDH-DETR的平均精度达98.5%,较基线算法提升0.9%,参数量和计算量分别减少43%和46.1%,检测速度达78.6 fps。这表明该算法在保证高准确性的同时,实现了轻量化设计,满足了输电线路巡检对效率和性能的实际需求。 展开更多
关键词 输电线路 目标检测 绝缘子缺陷检测 复杂背景 轻量化 RT-DETR算法
原文传递
子公司协调复杂性能提升企业数字化注意力吗?——基于注意力基础观的实证研究 被引量:1
20
作者 宋渊洋 徐峰 胡艳 《外国经济与管理》 北大核心 2025年第2期20-37,共18页
本文基于注意力基础观探讨子公司协调复杂性对企业数字化注意力的影响。通过理论分析和实证检验发现:(1)数字化是解决子公司协调复杂性带来的管理问题的合法的、有价值的方案,因此子公司协调复杂性能够提升企业数字化注意力。(2)行业数... 本文基于注意力基础观探讨子公司协调复杂性对企业数字化注意力的影响。通过理论分析和实证检验发现:(1)数字化是解决子公司协调复杂性带来的管理问题的合法的、有价值的方案,因此子公司协调复杂性能够提升企业数字化注意力。(2)行业数字化注意力越强,企业采用数字化来缓解子公司协调复杂性上升带来的管理问题的合法性越高,越有可能关注数字化以缓解子公司协调问题,导致子公司协调复杂性对数字化注意力的正向影响越强。(3)高管持股越高,高管短视程度越低,用数字化缓解子公司协调困难对高管的价值越大,子公司协调复杂性对数字化注意力的正向影响就越强。(4)CEO技术背景能够提升数字化解决方案的相关性,强化子公司协调复杂性对数字化注意力的正向影响。进一步分析表明,子公司协调复杂性对数字化注意力的影响在民营企业和创新程度高的企业更强,数字化注意力对企业数字化投入有正向影响。上述结论拓展了企业数字化前因的研究,对企业和政府推进数字化转型有启示意义。 展开更多
关键词 子公司协调复杂性 数字化 注意力 高管持股 高管短视 技术背景
原文传递
上一页 1 2 24 下一页 到第
使用帮助 返回顶部