期刊文献+
共找到454篇文章
< 1 2 23 >
每页显示 20 50 100
The Fusion of Temporal Sequence with Scene Priori Information in Deep Learning Object Recognition
1
作者 Yongkang Cao Fengjun Liu +2 位作者 Xian Wang Wenyun Wang Zhaoxin Peng 《Open Journal of Applied Sciences》 2024年第9期2610-2627,共18页
For some important object recognition applications such as intelligent robots and unmanned driving, images are collected on a consecutive basis and associated among themselves, besides, the scenes have steady prior fe... For some important object recognition applications such as intelligent robots and unmanned driving, images are collected on a consecutive basis and associated among themselves, besides, the scenes have steady prior features. Yet existing technologies do not take full advantage of this information. In order to take object recognition further than existing algorithms in the above application, an object recognition method that fuses temporal sequence with scene priori information is proposed. This method first employs YOLOv3 as the basic algorithm to recognize objects in single-frame images, then the DeepSort algorithm to establish association among potential objects recognized in images of different moments, and finally the confidence fusion method and temporal boundary processing method designed herein to fuse, at the decision level, temporal sequence information with scene priori information. Experiments using public datasets and self-built industrial scene datasets show that due to the expansion of information sources, the quality of single-frame images has less impact on the recognition results, whereby the object recognition is greatly improved. It is presented herein as a widely applicable framework for the fusion of information under multiple classes. All the object recognition algorithms that output object class, location information and recognition confidence at the same time can be integrated into this information fusion framework to improve performance. 展开更多
关键词 Computer Vison object Recognition Deep Learning Consecutive scene Information Fusion
在线阅读 下载PDF
面向遥感影像目标检测的场景关联无锚框YOLO网络
2
作者 黄鸿 李静 +3 位作者 江澄 马中祺 郑福建 周新尧 《光学精密工程》 北大核心 2026年第6期990-1005,共16页
目标检测是遥感影像解译当中最重要的任务之一。当前,基于深度学习的遥感目标检测模型大多依赖于预定义的锚框,且往往忽略了场景中的上下文信息,导致检测性能和泛化能力受限。基于此,本文提出了一种面向遥感影像目标检测的场景关联无锚... 目标检测是遥感影像解译当中最重要的任务之一。当前,基于深度学习的遥感目标检测模型大多依赖于预定义的锚框,且往往忽略了场景中的上下文信息,导致检测性能和泛化能力受限。基于此,本文提出了一种面向遥感影像目标检测的场景关联无锚框YOLO网络(Scene Related Anchor-Free YOLO,SRAF-YOLO)。SRAF-YOLO首先引入了一种场景增强的多尺度特征提取模块,通过将场景特征与目标特征融合,生成富含场景上下文信息的场景增强特征,并进一步利用多尺度操作提取包含场景语义的多尺度特征,有效引入场景上下文信息。在此基础上,设计了一种场景辅助无锚框检测头,利用特征图中的场景信息对目标类别预测进行约束,以提升检测精度,同时无锚框结构有效减少了锚框相关参数的计算量。在RSOD和NWPU VHR-10数据集上的实验结果表明,SRAF-YOLO通过融合场景信息和无锚框机制提升了目标检测精度,平均精度均值(mAP)分别达到94.58%和95.95%,相较于基线模型YOLOv8分别提升了1.51%和3.0%,并优于其他对比方法。在外部数据集上的验证结果进一步证实,该算法具备良好的泛化能力。 展开更多
关键词 遥感影像 目标检测 无锚框检测 场景上下文 多尺度特征融合
在线阅读 下载PDF
多视角贴近摄影测量技术在复杂地貌实景三维建模中的应用
3
作者 陈荣 《科技创新与生产力》 2026年第1期150-152,共3页
传统地形、地质调查依赖人工拍照和正射影像,存在工作量大、成本高、空间维度低等问题;倾斜摄影测量技术能多角度采集地面影像,克服传统航测视角局限,但仍然存在传统航线飞行方式不适用于复杂地貌等问题。为了解决以上问题,结合实际工... 传统地形、地质调查依赖人工拍照和正射影像,存在工作量大、成本高、空间维度低等问题;倾斜摄影测量技术能多角度采集地面影像,克服传统航测视角局限,但仍然存在传统航线飞行方式不适用于复杂地貌等问题。为了解决以上问题,结合实际工程案例,应用多视角贴近摄影测量技术进行复杂地貌实景三维建模,并基于实景三维模型进行定量分析和定性分析。研究结果表明,本文方法能够有效提高复杂地形模型精度。 展开更多
关键词 倾斜摄影测量 贴近摄影测量 复杂地貌 实景三维建模 定量分析
在线阅读 下载PDF
基于单目图像的多目标三维视觉定位方法
4
作者 黄舒雯 郭柯宇 +3 位作者 宋翔宇 韩锋 孙士杰 宋焕生 《计算机应用》 北大核心 2026年第1期207-215,共9页
针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,... 针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,构建一个多目标视觉定位数据集Mmo3DRefer,并设计跨模态匹配网络TextVizNet。TextVizNet通过预训练的单目检测器生成目标的三维边界框,并借助信息融合模块与信息对齐模块实现视觉与语言信息的深度整合,进而实现文本指导下的多目标三维检测。与CORE-3DVG(Contextual Objects and RElations for 3D Visual Grounding)、3DVG-Transformer和Multi3DRefer(Multiple 3D object Referencing dataset and task)等5种方法对比的实验结果表明,与次优方法Multi3DRefer相比,TextVizNet在Mmo3DRefer数据集上的F1-score、精确度和召回率分别提升了8.92%、8.39%和9.57%,显著提升了复杂场景下基于文本的多目标定位精度,为自动驾驶和智能机器人等实际应用提供了有效支持。 展开更多
关键词 三维视觉定位 单目图像 多模态技术 目标检测 场景理解
在线阅读 下载PDF
基于S-PGA-YOLOv12的复杂场景小目标火灾检测方法
5
作者 李海 孙鹏 +1 位作者 张志佳 沈喆 《控制与决策》 北大核心 2026年第3期728-740,共13页
基于深度学习的复杂场景下小目标火灾检测方法主要面临两方面挑战:其一,在复杂场景中采集小目标火灾视频图像成本高昂且难度颇大,导致模型的泛化能力和鲁棒性受限;其二,复杂场景下小目标火灾检测易受火灾尺度、场景类型、光照条件等因... 基于深度学习的复杂场景下小目标火灾检测方法主要面临两方面挑战:其一,在复杂场景中采集小目标火灾视频图像成本高昂且难度颇大,导致模型的泛化能力和鲁棒性受限;其二,复杂场景下小目标火灾检测易受火灾尺度、场景类型、光照条件等因素影响,导致检测精度不高.对此,提出一种基于S-PGA-YOLOv12的复杂场景下小目标火灾检测模型.首先,基于YOLOv12融合了用于突出小目标关键信息的并行补丁感知注意(PPA)模块、用于平衡速度与精度的GOLD模块、用于通过自适应学习不同尺度特征图的空间融合权重的小目标检测头(Detect-ASFF)模块;然后,针对复杂场景下小目标火灾图像采集成本高、难度大等问题,提出一种基于模拟仿真的数据集构建方法;最后,基于模拟仿真构建的复杂场景小目标火灾数据集,通过消融实验、对比实验、鲁棒性和泛化性分析来验证S-PGA-YOLOv12模型的有效性.在所构建的3个数据集上进行大量实验,表明所提出方法具有有效性和优越性. 展开更多
关键词 复杂场景 小目标火灾 目标检测 注意力机制 仿真技术
原文传递
DarkTiny-YOLO:低光照场景下无人机航拍小目标检测算法
6
作者 赵森 赵健康 +1 位作者 龙海辉 刘传奇 《电光与控制》 北大核心 2026年第2期20-26,34,共8页
针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,... 针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,利用轻量化特征金字塔网络(Tiny-FPN),通过引入上下文锚点注意力机制和优化C3k2模块,降低计算成本的同时提高检测精度;最后,采用优化的多尺度小目标动态检测头(MSD-ODHead),加强小目标的识别能力并提升模型在多尺度场景下的检测性能。实验结果表明,DarkTiny-YOLO在VisDrone2019数据集上,相比YOLOv11s算法,mAP指标提升超过0.1,对低光照场景下的小目标检测性能显著提高。 展开更多
关键词 小目标检测 低光照场景 无人机航拍 YOLOv11s
在线阅读 下载PDF
面向变电站数字孪生的三维对象匹配方法研究
7
作者 王兴华 董晗拓 +3 位作者 蒙彦锡 王流火 王彦峰 贾涛 《南京信息工程大学学报》 北大核心 2026年第2期278-288,共11页
在变电站运行阶段,实景点云模型与设计阶段BIM设备三维模型在数量、位置、分布上的不一致,会阻碍BIM模型在变电站数字孪生中的实际应用.为此,本文提出一种基于一阶距离-拓扑相似性与空间位置自适应纠正的三维对象匹配方法.首先,构建三... 在变电站运行阶段,实景点云模型与设计阶段BIM设备三维模型在数量、位置、分布上的不一致,会阻碍BIM模型在变电站数字孪生中的实际应用.为此,本文提出一种基于一阶距离-拓扑相似性与空间位置自适应纠正的三维对象匹配方法.首先,构建三维对象一阶距离-拓扑兼容性指标,提升三维对象定位特征的表达效果;其次,提出了一种三维对象相似度计算方法,以识别和提取精准匹配对与潜在匹配对;最后,构建多视线约束方程组,实现潜在匹配对中BIM模型空间位置的迭代式自纠正.本文方法在两处变电站场景三维数据集上分别进行了实验,匹配总体精度分别达到97.92%与98.54%.实验结果表明,与当前先进方法相比,本文方法在变电站数字孪生三维对象匹配任务上具有更高的精度与可靠性. 展开更多
关键词 实景点云对象 BIM三维模型 三维对象匹配 一阶距离-拓扑兼容性指标 位置迭代纠正
在线阅读 下载PDF
动态环境下基于贝叶斯多视图估计的视觉惯性SLAM方法
8
作者 宁一鹏 范金龙 +3 位作者 王坚 郭郑伟 贾祥 柴大帅 《中国惯性技术学报》 北大核心 2026年第2期134-141,共8页
针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,... 针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,构建特征点动态概率模型,实现对特征点动态概率的精确估计;其次,提出特征点权重优化算法,动态调整特征点权重,提升系统在动态场景下的定位精度;最后,构建基于加权优化的位姿估计,实现相机与惯性测量装置的紧耦合。实验结果表明,相较于ORB-SLAM3算法,所提方法在TUM RGB-D和KITTI数据集上的绝对轨迹均方根误差分别平均降低了96.68%和27.80%,提升了系统在动态场景下的定位精度与鲁棒性。 展开更多
关键词 视觉惯性SLAM 多视图估计 特征点权重 动态场景 目标检测
在线阅读 下载PDF
无人机视角下施工场景目标检测性能评估
9
作者 宋琢 卢德辉 +3 位作者 黄志超 田时雨 颜嵘龙 邓逸川 《图学学报》 北大核心 2026年第1期68-77,共10页
施工现场的组织管理是工程管理的关键环节,但传统的人力监管方法限制多、效率低。近年国家多部委发布有关政策,呼吁促进人工智能与实体经济深度融合,以人工智能推动经济高质高效发展。计算机视觉(CV)技术的准确性、高效性和自动化等优点... 施工现场的组织管理是工程管理的关键环节,但传统的人力监管方法限制多、效率低。近年国家多部委发布有关政策,呼吁促进人工智能与实体经济深度融合,以人工智能推动经济高质高效发展。计算机视觉(CV)技术的准确性、高效性和自动化等优点使CV技术在施工监理领域的应用逐渐广泛,特别是无人机能高效获取复杂多变的施工场景视觉数据的特性显示出其在基于CV技术的施工监管任务中的应用潜力。但当前基于无人机的施工场景目标检测研究有限,且稀缺的无人机视角下的施工场景图像数据集限制着有关研究的深入发展。因此,采用大疆Mavic 3T无人机用于获取施工现场图像,以建立开源的施工场景俯拍图像数据集UB-CSD。选用多种先进目标检测算法在UB-CSD数据集上进行对比实验,从模型流程设计、计算原理和任务场景特性等维度分析各算法性能差异原因。各算法的mAP检测结果为YOLOv8和YOLOv10(96.1%),YOLOv9(96.0%),YOLO11(95.7%),DETR(95.3%),Faster-RCNN(76.3%)和RetinaNet(72.1%)。分析结果表明,YOLO系列算法是基于无人机的施工场景目标检测任务算法的最优选。通过构建全新的开源专用数据集和开展对比实验得出的以上数据及结论,将为建筑业安全生产管理与日后相关检测研究提供有效数据与实验案例。 展开更多
关键词 施工场景 无人机 目标检测 YOLO Faster-RCNN DETR RetinaNet
在线阅读 下载PDF
基于无人机视觉信息的消防炮预瞄准系统
10
作者 张晓光 陈润泽 +1 位作者 赵桔贤 李伟 《仪器仪表学报》 北大核心 2026年第1期325-339,共15页
无人机可以高效感知火灾环境,获得火场信息。为提高消防工作的智能化水平,提出了一种基于无人机视觉信息的消防炮预瞄准系统,预瞄准是由火场感知、位姿解算、角度调整这3个阶段构成的控制过程。在火场感知阶段,针对消防场景中无人机图... 无人机可以高效感知火灾环境,获得火场信息。为提高消防工作的智能化水平,提出了一种基于无人机视觉信息的消防炮预瞄准系统,预瞄准是由火场感知、位姿解算、角度调整这3个阶段构成的控制过程。在火场感知阶段,针对消防场景中无人机图像存在的目标尺寸小和烟雾干扰问题,考虑消防救援工作的实时性要求,提出了一种联合轻量化去雾处理与目标检测的感知模型。在图像去雾方面,考虑消防场景中烟雾具有非均匀分布和灰度值多样的特点,改进大气散射模型,设计一个编码器-解码器结构的神经网络求解透射图和烟雾灰度值,实现图像质量增强。在目标检测方面,以YOLOv8s为基线,在骨干网络中,将浅层的卷积运算替换为具有集中感受野的PSConv模块,保留更多小目标信息;将深层的卷积模块替换为GhostConv,采用SimA-former模块替代最深层C2f结构,进行模型轻量化。在颈部网络特征融合阶段,结合坐标注意力机制(CA)与小目标检测头构建高分辨率多尺度特征融合模块。基于感知的火场信息,采用相机成像模型解算消防炮与火源的相对位姿,据此计算消防炮应调整的水平与俯仰角度。在工业厂房外部自制消防场景进行实验,感知模型的mAP50指标达到了92.3%,相较不使用去雾处理的YOLOv8s算法提升了6.2%,测得预瞄准的水平角度误差在±4°,火源距离误差在6%以内,验证了所提方法的有效性和实用性。 展开更多
关键词 目标检测 图像去雾 无人机 消防场景
原文传递
改进型YOLOv8及其水下和雾天目标检测
11
作者 易锌鑫 张著洪 《计算机工程与设计》 北大核心 2026年第1期29-37,共9页
鉴于水下、雾天场景下目标检测易出现漏检、误检、定位差、目标检测准确率低等问题,提出一种基于YOLOv8的改进型目标检测模型IYOLOv8。模型设计中,经构建双骨干特征提取网络增强主干网络的特征提取能力;引入动态上采样提高特征图的利用... 鉴于水下、雾天场景下目标检测易出现漏检、误检、定位差、目标检测准确率低等问题,提出一种基于YOLOv8的改进型目标检测模型IYOLOv8。模型设计中,经构建双骨干特征提取网络增强主干网络的特征提取能力;引入动态上采样提高特征图的利用效率;结合倒置残差移动和高效多尺度注意力,设计处理长距离信息的CIE模块;借助改进损失函数提高边界框回归的性能;利用知识蒸馏提升目标检测的准确率。比较性的实验结果表明,IYOLOv8在目标检测的性能方面具有明显优势。 展开更多
关键词 双骨干网络 知识蒸馏 动态上采样 复杂场景 视频目标检测 YOLOv8 注意力机制
在线阅读 下载PDF
面向雾天车辆的YOLO-DCL检测算法研究
12
作者 潘宗友 纪琪 +1 位作者 方虹苏 杨炜 《机械设计与制造》 北大核心 2026年第4期185-190,共6页
针对雾天图像模糊及光照不均进而影响车辆检测精度的问题,提出了一种改进YOLOv8的车辆检测算法YOLODCL。首先引入Dysample轻量动态上采样模块,以增强算法抗干扰能力;其后将部分原C2f模块替换为C2f-DWR,以增强算法特征表征能力;最后引入... 针对雾天图像模糊及光照不均进而影响车辆检测精度的问题,提出了一种改进YOLOv8的车辆检测算法YOLODCL。首先引入Dysample轻量动态上采样模块,以增强算法抗干扰能力;其后将部分原C2f模块替换为C2f-DWR,以增强算法特征表征能力;最后引入轻量级共享卷积检测头LSCD,以轻量化网络并且改善检测性能。此外,构建了雾天车辆检测数据集,以精确率P、召回率R、平均精度AP50及AP50-95为评价指标进行消融及对比实验,结果表明,改进算法相较基础算法,P提升1.2%,R提高6.9%,AP50提高7.1%,AP50-95提高5.8%,为最优算法,进而论证了YOLO-DCl在雾天场景下对车辆检测的有效性。 展开更多
关键词 深度学习 目标检测 车辆检测 YOLOv8 雾天场景
在线阅读 下载PDF
场景流与推理辅助的多帧点云目标检测模型
13
作者 赵芃康 李翔宇 +4 位作者 齐洪钢 邓永强 李娟娟 梁浩 苗军 《微电子学与计算机》 2026年第1期11-21,共11页
随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提... 随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提高检测性能。为了有效利用多帧信息,所提模型引入了匹配推理模块和场景流模块。其中,匹配推理模块根据目标的初始位置推断其运动方向和速度,更新目标的后续位置。场景流模块则整合了点云中各点的位置信息、速度和方向,为推理过程提供更准确的数据支持。实验表明:所提模型在nuScencs数据集中达到了59.2%的mAP和67.4%的NDS,在KITTI数据集中重要的车类别中等难度评价中取得了89.03%的平均精度,优于大部分目标检测模型。同时,将检测结果可视化,通过多种消融实验进一步验证了该模型的有效性和所提出改进的可行性。 展开更多
关键词 目标检测 多帧检测 激光雷达点云 场景流 融合推理
在线阅读 下载PDF
基于GBVS改进的Object Bank场景分类方法 被引量:2
14
作者 陈梦婷 陈思喜 《计算机与现代化》 2017年第1期61-64,70,共5页
Object Bank(OB)是一种基于物体的高层语义图像特征表示,该方法所提取的高层特征具有较丰富的场景语义。然而,该方法所采用的物体检测器检测物体的准确率并不高,从而影响高层特征的提取效果。针对OB方法中物体检测器准确率较低的缺点,... Object Bank(OB)是一种基于物体的高层语义图像特征表示,该方法所提取的高层特征具有较丰富的场景语义。然而,该方法所采用的物体检测器检测物体的准确率并不高,从而影响高层特征的提取效果。针对OB方法中物体检测器准确率较低的缺点,提出一种基于Graph-Based Visual Saliency(GBVS)显著性分析算法改进的OB方法。先通过GBVS方法对图像进行显著性处理,计算图像中的显著性区域,然后结合OB方法中的物体检测器对显著区域进行检测,提取更具有场景语义的高层特征。实验结果表明,该方法突出了具有显著性的物体,提高了OB方法中目标检测器的准确率,在OB方法的基础上提取出了更具有显著性的图像特征,并在分类准确率上比OB方法提高了4%。 展开更多
关键词 object BANK GBVS 场景分类 视觉显著性 高层特征
在线阅读 下载PDF
基于不确定场景下的分布式储能系统随机优化模型
15
作者 顾阳 顾佳琪 +4 位作者 李光熹 刘晗 任飞 岳付昌 李红 《电力信息与通信技术》 2026年第2期38-49,共12页
大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不... 大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不确定性,提出一种基于K-means算法多场景模拟的分布式储能系统随机优化运行模型,采用拉丁超立方采样法建立光-荷时序模型,并开展场景模拟。在K-means聚类算法基础上结合Kantorovich思想提出改进的场景削减方法的2个过程。以经济效益、电压偏差和负荷波动为指标建立多目标双层运行-规划模型,运用改进的多目标粒子群优化算法对模型求解,将模拟退火算法中的接收准则嵌入到粒子群算法更新规则中避免其早熟收敛,求得全局最优配置方案。最后,通过IEEE33节点的配电网仿真测试,分析验证了所建模型和所提方法的有效性与合理性。 展开更多
关键词 分布式储能系统 源荷不确定性 多场景模拟 随机优化运行 多目标优化
在线阅读 下载PDF
预训练模型范式迁移视角下的遥感影像技术分析
16
作者 李冰 侯锐 +3 位作者 杨晓艳 石涛 孟令通 赵琛浩 《计算机技术与发展》 2026年第1期212-220,211,共10页
遥感影像分析作为地理信息科学的核心领域,经历了从专家分析到半自动分析,再到融合多维度、多层次的高分辨率遥感图像自动化分析技术的阶段式跃迁。在计算机视觉与深度学习的驱动下,遥感图像分析领域的研究呈现方法多样化与领域专精化... 遥感影像分析作为地理信息科学的核心领域,经历了从专家分析到半自动分析,再到融合多维度、多层次的高分辨率遥感图像自动化分析技术的阶段式跃迁。在计算机视觉与深度学习的驱动下,遥感图像分析领域的研究呈现方法多样化与领域专精化趋势。该文通过对58篇高水平文献开展系统性荟萃分析,聚焦场景分类、图像检索与分割三大方向,从特征提取、语义分析等维度对比核心数据集、方法差异及评价体系。研究发现:当前研究存在多模态数据融合效率不足、任务集成度有限等瓶颈,提出构建开源共享平台、优化大模型驱动下的特征提取精度、强化多任务协同框架等发展路径。该文不仅填补了GIS领域遥感影像荟萃分析的空白,更为技术迭代提供理论依据与优化方向。 展开更多
关键词 遥感影像分析 场景分类 特征提取 语义分析 图像检索 目标分割 荟萃分析
在线阅读 下载PDF
基于YOLOv8的雾天车辆行人实时检测方法 被引量:1
17
作者 汤亮 陈博文 +1 位作者 牛一森 马荣庚 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期72-83,共12页
随着智能通信技术在智能交通场景的广泛运用,行人、车辆目标检测已成为保障道路安全的重要基础。针对在雾天恶劣环境中检测网络漏检率高、检测速度慢的问题,本文提出基于YOLOv8的实时雾天目标检测方法。该模型将输入图片加入去雾网络模... 随着智能通信技术在智能交通场景的广泛运用,行人、车辆目标检测已成为保障道路安全的重要基础。针对在雾天恶劣环境中检测网络漏检率高、检测速度慢的问题,本文提出基于YOLOv8的实时雾天目标检测方法。该模型将输入图片加入去雾网络模块对输入图像进行预处理,保留原图片的细节特征并去除雾气的遮挡,再使用改进后的YOLOv8n进行检测。在YOLOv8n上基于FasterNet改进C2f模块,降低模型参数量及模型大小,增加模型计算效率,并设计SE-ResNeXt检测头,避免了因堆积神经网络层数带来的负面影响。最后运用知识蒸馏的方式,进一步提高检测精度。将所提出模型在reside rtts数据集和合成有雾数据集上进行验证。与原网络相比,平均精度(mAP@50_95)提升5.2个百分点,检测帧数达到170 frame/s。 展开更多
关键词 雾天场景 目标检测 信息交互 FasterNet SENet ResNeXt
在线阅读 下载PDF
Infrared image simulation of ground maneuver target and scene
18
作者 穆成坡 彭明松 +2 位作者 高翔 张睿恒 董清先 《Journal of Beijing Institute of Technology》 EI CAS 2016年第2期247-253,共7页
Infrared scene simulation has extensive applications in military and civil fields. Based on a certain experimental environment,object-oriented graphics rendering engine( OGRE) is utilized to simulate a real three-di... Infrared scene simulation has extensive applications in military and civil fields. Based on a certain experimental environment,object-oriented graphics rendering engine( OGRE) is utilized to simulate a real three-dimensional infrared complex scene. First,the target radiation of each part is calculated based on our experimental data. Then through the analysis of the radiation characteristics of targets and related material,an infrared texture library is established and the 3ds Max software is applied to establish an infrared radiation model.Finally,a real complex infrared scene is created by using the OGRE engine image rendering technology and graphic processing unit( GPU) programmable pipeline technology. The results show that the simulation images are very similar to real images and are good supplements to real data. 展开更多
关键词 maneuver target target scene image simulation infrared image object-orientedgraphics rendering engine (OGRE)
在线阅读 下载PDF
基于PSMD-YOLOv5的自动泊车复杂场景多目标检测
19
作者 梁列全 何永华 +1 位作者 李想 周璇 《科学技术与工程》 北大核心 2025年第31期13509-13518,共10页
针对自动泊车过程中复杂环境所导致的模型目标检测精确度低、漏检率高等问题,提出一种基于YOLOv5(you only look once version 5)改进的自动泊车场景多目标检测模型:PSMD(parking scene multi-target detection)-YOLOv5。采用混合池化... 针对自动泊车过程中复杂环境所导致的模型目标检测精确度低、漏检率高等问题,提出一种基于YOLOv5(you only look once version 5)改进的自动泊车场景多目标检测模型:PSMD(parking scene multi-target detection)-YOLOv5。采用混合池化的方法对SPPF(spatial pyramid pooling-fast)进行改进,提升模型对全局信息的提取能力,从而增强模型检测的性能;引入BiFPN(bidirectional feature pyramid network)网络结构,调整不同尺度特征的重要性程度,加强模型的特征融合能力;加入结合了大卷积核的CA(coordinate attention)注意力机制,增强感兴趣的目标区域,进一步提升模型的特征提取能力;将CIoU(complete intersection over union)的损失函数替换为MPDIoU(minimum point distance based intersection over union)损失函数,加快模型的收敛以及提升定位能力。实验结果表明,PSMD-YOLOv5模型在自动泊车场景数据集上检测的查准率、召回率和mAP分别为81.8%、80.3%和85.3%,相比于原始YOLOv5模型整体的查准率、召回率和mAP分别提升了1%、6.5%和5.2%。并通过与其他目标检测模型的比较,验证了本文模型的有效性。 展开更多
关键词 自动泊车场景 目标检测 YOLOv5 注意力机制
在线阅读 下载PDF
High Quality Audio Object Coding Framework Based on Non-Negative Matrix Factorization 被引量:1
20
作者 Tingzhao Wu Ruimin Hu +2 位作者 Xiaochen Wang Shanfa Ke Jinshan Wang 《China Communications》 SCIE CSCD 2017年第9期32-41,共10页
Object-based audio coding is the main technique of audio scene coding. It can effectively reconstruct each object trajectory, besides provide sufficient flexibility for personalized audio scene reconstruction. So more... Object-based audio coding is the main technique of audio scene coding. It can effectively reconstruct each object trajectory, besides provide sufficient flexibility for personalized audio scene reconstruction. So more and more attentions have been paid to the object-based audio coding. However, existing object-based techniques have poor sound quality because of low parameter frequency domain resolution. In order to achieve high quality audio object coding, we propose a new coding framework with introducing the non-negative matrix factorization(NMF) method. We extract object parameters with high resolution to improve sound quality, and apply NMF method to parameter coding to reduce the high bitrate caused by high resolution. And the experimental results have shown that the proposed framework can improve the coding quality by 25%, so it can provide a better solution to encode audio scene in a more flexible and higher quality way. 展开更多
关键词 object-based AUDIO CODING non-negative matrix FACTORIZATION AUDIO scenecoding
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部