期刊文献+
共找到445篇文章
< 1 2 23 >
每页显示 20 50 100
The Fusion of Temporal Sequence with Scene Priori Information in Deep Learning Object Recognition
1
作者 Yongkang Cao Fengjun Liu +2 位作者 Xian Wang Wenyun Wang Zhaoxin Peng 《Open Journal of Applied Sciences》 2024年第9期2610-2627,共18页
For some important object recognition applications such as intelligent robots and unmanned driving, images are collected on a consecutive basis and associated among themselves, besides, the scenes have steady prior fe... For some important object recognition applications such as intelligent robots and unmanned driving, images are collected on a consecutive basis and associated among themselves, besides, the scenes have steady prior features. Yet existing technologies do not take full advantage of this information. In order to take object recognition further than existing algorithms in the above application, an object recognition method that fuses temporal sequence with scene priori information is proposed. This method first employs YOLOv3 as the basic algorithm to recognize objects in single-frame images, then the DeepSort algorithm to establish association among potential objects recognized in images of different moments, and finally the confidence fusion method and temporal boundary processing method designed herein to fuse, at the decision level, temporal sequence information with scene priori information. Experiments using public datasets and self-built industrial scene datasets show that due to the expansion of information sources, the quality of single-frame images has less impact on the recognition results, whereby the object recognition is greatly improved. It is presented herein as a widely applicable framework for the fusion of information under multiple classes. All the object recognition algorithms that output object class, location information and recognition confidence at the same time can be integrated into this information fusion framework to improve performance. 展开更多
关键词 Computer Vison object Recognition Deep Learning Consecutive scene Information Fusion
在线阅读 下载PDF
多视角贴近摄影测量技术在复杂地貌实景三维建模中的应用
2
作者 陈荣 《科技创新与生产力》 2026年第1期150-152,共3页
传统地形、地质调查依赖人工拍照和正射影像,存在工作量大、成本高、空间维度低等问题;倾斜摄影测量技术能多角度采集地面影像,克服传统航测视角局限,但仍然存在传统航线飞行方式不适用于复杂地貌等问题。为了解决以上问题,结合实际工... 传统地形、地质调查依赖人工拍照和正射影像,存在工作量大、成本高、空间维度低等问题;倾斜摄影测量技术能多角度采集地面影像,克服传统航测视角局限,但仍然存在传统航线飞行方式不适用于复杂地貌等问题。为了解决以上问题,结合实际工程案例,应用多视角贴近摄影测量技术进行复杂地貌实景三维建模,并基于实景三维模型进行定量分析和定性分析。研究结果表明,本文方法能够有效提高复杂地形模型精度。 展开更多
关键词 倾斜摄影测量 贴近摄影测量 复杂地貌 实景三维建模 定量分析
在线阅读 下载PDF
基于单目图像的多目标三维视觉定位方法
3
作者 黄舒雯 郭柯宇 +3 位作者 宋翔宇 韩锋 孙士杰 宋焕生 《计算机应用》 北大核心 2026年第1期207-215,共9页
针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,... 针对现有的三维视觉定位方法依赖昂贵传感器设备、系统成本高且在复杂多目标定位中准确度和鲁棒性不足的问题,提出一种基于单目图像的多目标三维视觉定位方法。该方法结合自然语言描述,在单个RGB图像中实现对多个三维目标的识别。为此,构建一个多目标视觉定位数据集Mmo3DRefer,并设计跨模态匹配网络TextVizNet。TextVizNet通过预训练的单目检测器生成目标的三维边界框,并借助信息融合模块与信息对齐模块实现视觉与语言信息的深度整合,进而实现文本指导下的多目标三维检测。与CORE-3DVG(Contextual Objects and RElations for 3D Visual Grounding)、3DVG-Transformer和Multi3DRefer(Multiple 3D object Referencing dataset and task)等5种方法对比的实验结果表明,与次优方法Multi3DRefer相比,TextVizNet在Mmo3DRefer数据集上的F1-score、精确度和召回率分别提升了8.92%、8.39%和9.57%,显著提升了复杂场景下基于文本的多目标定位精度,为自动驾驶和智能机器人等实际应用提供了有效支持。 展开更多
关键词 三维视觉定位 单目图像 多模态技术 目标检测 场景理解
在线阅读 下载PDF
DarkTiny-YOLO:低光照场景下无人机航拍小目标检测算法
4
作者 赵森 赵健康 +1 位作者 龙海辉 刘传奇 《电光与控制》 北大核心 2026年第2期20-26,34,共8页
针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,... 针对无人机在低光照场景下航拍任务中目标检测面临的光照不足、目标尺寸小以及背景复杂等挑战,提出了基于YOLOv11s的改进模型DarkTiny-YOLO。该模型首先通过轻量化自校正亮度增强模块(Li-SCBM)动态调整图像亮度,增强目标特征表达;其次,利用轻量化特征金字塔网络(Tiny-FPN),通过引入上下文锚点注意力机制和优化C3k2模块,降低计算成本的同时提高检测精度;最后,采用优化的多尺度小目标动态检测头(MSD-ODHead),加强小目标的识别能力并提升模型在多尺度场景下的检测性能。实验结果表明,DarkTiny-YOLO在VisDrone2019数据集上,相比YOLOv11s算法,mAP指标提升超过0.1,对低光照场景下的小目标检测性能显著提高。 展开更多
关键词 小目标检测 低光照场景 无人机航拍 YOLOv11s
在线阅读 下载PDF
动态环境下基于贝叶斯多视图估计的视觉惯性SLAM方法
5
作者 宁一鹏 范金龙 +3 位作者 王坚 郭郑伟 贾祥 柴大帅 《中国惯性技术学报》 北大核心 2026年第2期134-141,共8页
针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,... 针对动态环境下视觉惯性同步定位与建图(SLAM)系统定位精度下降与鲁棒性不足的问题,提出了一种基于贝叶斯多视图估计的动态惯性视觉SLAM方法。首先,设计了一种基于贝叶斯的多视图动态特征点估计方法,通过贝叶斯滤波融合历史帧观测信息,构建特征点动态概率模型,实现对特征点动态概率的精确估计;其次,提出特征点权重优化算法,动态调整特征点权重,提升系统在动态场景下的定位精度;最后,构建基于加权优化的位姿估计,实现相机与惯性测量装置的紧耦合。实验结果表明,相较于ORB-SLAM3算法,所提方法在TUM RGB-D和KITTI数据集上的绝对轨迹均方根误差分别平均降低了96.68%和27.80%,提升了系统在动态场景下的定位精度与鲁棒性。 展开更多
关键词 视觉惯性SLAM 多视图估计 特征点权重 动态场景 目标检测
在线阅读 下载PDF
改进型YOLOv8及其水下和雾天目标检测
6
作者 易锌鑫 张著洪 《计算机工程与设计》 北大核心 2026年第1期29-37,共9页
鉴于水下、雾天场景下目标检测易出现漏检、误检、定位差、目标检测准确率低等问题,提出一种基于YOLOv8的改进型目标检测模型IYOLOv8。模型设计中,经构建双骨干特征提取网络增强主干网络的特征提取能力;引入动态上采样提高特征图的利用... 鉴于水下、雾天场景下目标检测易出现漏检、误检、定位差、目标检测准确率低等问题,提出一种基于YOLOv8的改进型目标检测模型IYOLOv8。模型设计中,经构建双骨干特征提取网络增强主干网络的特征提取能力;引入动态上采样提高特征图的利用效率;结合倒置残差移动和高效多尺度注意力,设计处理长距离信息的CIE模块;借助改进损失函数提高边界框回归的性能;利用知识蒸馏提升目标检测的准确率。比较性的实验结果表明,IYOLOv8在目标检测的性能方面具有明显优势。 展开更多
关键词 双骨干网络 知识蒸馏 动态上采样 复杂场景 视频目标检测 YOLOv8 注意力机制
在线阅读 下载PDF
场景流与推理辅助的多帧点云目标检测模型
7
作者 赵芃康 李翔宇 +4 位作者 齐洪钢 邓永强 李娟娟 梁浩 苗军 《微电子学与计算机》 2026年第1期11-21,共11页
随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提... 随着自动驾驶技术的进步,基于激光雷达点云的3D目标检测已成为关键任务。然而,现有方法大多依赖单帧检测,未充分利用时序信息,导致检测精度不高,存在遮挡和目标丢失等问题。为此,提出了一种新型多帧目标检测模型,通过集成多帧信息来提高检测性能。为了有效利用多帧信息,所提模型引入了匹配推理模块和场景流模块。其中,匹配推理模块根据目标的初始位置推断其运动方向和速度,更新目标的后续位置。场景流模块则整合了点云中各点的位置信息、速度和方向,为推理过程提供更准确的数据支持。实验表明:所提模型在nuScencs数据集中达到了59.2%的mAP和67.4%的NDS,在KITTI数据集中重要的车类别中等难度评价中取得了89.03%的平均精度,优于大部分目标检测模型。同时,将检测结果可视化,通过多种消融实验进一步验证了该模型的有效性和所提出改进的可行性。 展开更多
关键词 目标检测 多帧检测 激光雷达点云 场景流 融合推理
在线阅读 下载PDF
基于GBVS改进的Object Bank场景分类方法 被引量:2
8
作者 陈梦婷 陈思喜 《计算机与现代化》 2017年第1期61-64,70,共5页
Object Bank(OB)是一种基于物体的高层语义图像特征表示,该方法所提取的高层特征具有较丰富的场景语义。然而,该方法所采用的物体检测器检测物体的准确率并不高,从而影响高层特征的提取效果。针对OB方法中物体检测器准确率较低的缺点,... Object Bank(OB)是一种基于物体的高层语义图像特征表示,该方法所提取的高层特征具有较丰富的场景语义。然而,该方法所采用的物体检测器检测物体的准确率并不高,从而影响高层特征的提取效果。针对OB方法中物体检测器准确率较低的缺点,提出一种基于Graph-Based Visual Saliency(GBVS)显著性分析算法改进的OB方法。先通过GBVS方法对图像进行显著性处理,计算图像中的显著性区域,然后结合OB方法中的物体检测器对显著区域进行检测,提取更具有场景语义的高层特征。实验结果表明,该方法突出了具有显著性的物体,提高了OB方法中目标检测器的准确率,在OB方法的基础上提取出了更具有显著性的图像特征,并在分类准确率上比OB方法提高了4%。 展开更多
关键词 object BANK GBVS 场景分类 视觉显著性 高层特征
在线阅读 下载PDF
基于不确定场景下的分布式储能系统随机优化模型
9
作者 顾阳 顾佳琪 +4 位作者 李光熹 刘晗 任飞 岳付昌 李红 《电力信息与通信技术》 2026年第2期38-49,共12页
大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不... 大规模可再生能源及柔性负荷的接入使得配电网源荷侧的不确定性问题不容忽视,同时高渗透率的分布式光伏也对配电网的安全稳定运行带来了更大的挑战。文章以配电台区分布式光伏与储能系统为研究对象,针对分布式光伏以及用户负荷预测的不确定性,提出一种基于K-means算法多场景模拟的分布式储能系统随机优化运行模型,采用拉丁超立方采样法建立光-荷时序模型,并开展场景模拟。在K-means聚类算法基础上结合Kantorovich思想提出改进的场景削减方法的2个过程。以经济效益、电压偏差和负荷波动为指标建立多目标双层运行-规划模型,运用改进的多目标粒子群优化算法对模型求解,将模拟退火算法中的接收准则嵌入到粒子群算法更新规则中避免其早熟收敛,求得全局最优配置方案。最后,通过IEEE33节点的配电网仿真测试,分析验证了所建模型和所提方法的有效性与合理性。 展开更多
关键词 分布式储能系统 源荷不确定性 多场景模拟 随机优化运行 多目标优化
在线阅读 下载PDF
预训练模型范式迁移视角下的遥感影像技术分析
10
作者 李冰 侯锐 +3 位作者 杨晓艳 石涛 孟令通 赵琛浩 《计算机技术与发展》 2026年第1期212-220,211,共10页
遥感影像分析作为地理信息科学的核心领域,经历了从专家分析到半自动分析,再到融合多维度、多层次的高分辨率遥感图像自动化分析技术的阶段式跃迁。在计算机视觉与深度学习的驱动下,遥感图像分析领域的研究呈现方法多样化与领域专精化... 遥感影像分析作为地理信息科学的核心领域,经历了从专家分析到半自动分析,再到融合多维度、多层次的高分辨率遥感图像自动化分析技术的阶段式跃迁。在计算机视觉与深度学习的驱动下,遥感图像分析领域的研究呈现方法多样化与领域专精化趋势。该文通过对58篇高水平文献开展系统性荟萃分析,聚焦场景分类、图像检索与分割三大方向,从特征提取、语义分析等维度对比核心数据集、方法差异及评价体系。研究发现:当前研究存在多模态数据融合效率不足、任务集成度有限等瓶颈,提出构建开源共享平台、优化大模型驱动下的特征提取精度、强化多任务协同框架等发展路径。该文不仅填补了GIS领域遥感影像荟萃分析的空白,更为技术迭代提供理论依据与优化方向。 展开更多
关键词 遥感影像分析 场景分类 特征提取 语义分析 图像检索 目标分割 荟萃分析
在线阅读 下载PDF
基于YOLOv8的雾天车辆行人实时检测方法 被引量:1
11
作者 汤亮 陈博文 +1 位作者 牛一森 马荣庚 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期72-83,共12页
随着智能通信技术在智能交通场景的广泛运用,行人、车辆目标检测已成为保障道路安全的重要基础。针对在雾天恶劣环境中检测网络漏检率高、检测速度慢的问题,本文提出基于YOLOv8的实时雾天目标检测方法。该模型将输入图片加入去雾网络模... 随着智能通信技术在智能交通场景的广泛运用,行人、车辆目标检测已成为保障道路安全的重要基础。针对在雾天恶劣环境中检测网络漏检率高、检测速度慢的问题,本文提出基于YOLOv8的实时雾天目标检测方法。该模型将输入图片加入去雾网络模块对输入图像进行预处理,保留原图片的细节特征并去除雾气的遮挡,再使用改进后的YOLOv8n进行检测。在YOLOv8n上基于FasterNet改进C2f模块,降低模型参数量及模型大小,增加模型计算效率,并设计SE-ResNeXt检测头,避免了因堆积神经网络层数带来的负面影响。最后运用知识蒸馏的方式,进一步提高检测精度。将所提出模型在reside rtts数据集和合成有雾数据集上进行验证。与原网络相比,平均精度(mAP@50_95)提升5.2个百分点,检测帧数达到170 frame/s。 展开更多
关键词 雾天场景 目标检测 信息交互 FasterNet SENet ResNeXt
在线阅读 下载PDF
Infrared image simulation of ground maneuver target and scene
12
作者 穆成坡 彭明松 +2 位作者 高翔 张睿恒 董清先 《Journal of Beijing Institute of Technology》 EI CAS 2016年第2期247-253,共7页
Infrared scene simulation has extensive applications in military and civil fields. Based on a certain experimental environment,object-oriented graphics rendering engine( OGRE) is utilized to simulate a real three-di... Infrared scene simulation has extensive applications in military and civil fields. Based on a certain experimental environment,object-oriented graphics rendering engine( OGRE) is utilized to simulate a real three-dimensional infrared complex scene. First,the target radiation of each part is calculated based on our experimental data. Then through the analysis of the radiation characteristics of targets and related material,an infrared texture library is established and the 3ds Max software is applied to establish an infrared radiation model.Finally,a real complex infrared scene is created by using the OGRE engine image rendering technology and graphic processing unit( GPU) programmable pipeline technology. The results show that the simulation images are very similar to real images and are good supplements to real data. 展开更多
关键词 maneuver target target scene image simulation infrared image object-orientedgraphics rendering engine (OGRE)
在线阅读 下载PDF
基于PSMD-YOLOv5的自动泊车复杂场景多目标检测
13
作者 梁列全 何永华 +1 位作者 李想 周璇 《科学技术与工程》 北大核心 2025年第31期13509-13518,共10页
针对自动泊车过程中复杂环境所导致的模型目标检测精确度低、漏检率高等问题,提出一种基于YOLOv5(you only look once version 5)改进的自动泊车场景多目标检测模型:PSMD(parking scene multi-target detection)-YOLOv5。采用混合池化... 针对自动泊车过程中复杂环境所导致的模型目标检测精确度低、漏检率高等问题,提出一种基于YOLOv5(you only look once version 5)改进的自动泊车场景多目标检测模型:PSMD(parking scene multi-target detection)-YOLOv5。采用混合池化的方法对SPPF(spatial pyramid pooling-fast)进行改进,提升模型对全局信息的提取能力,从而增强模型检测的性能;引入BiFPN(bidirectional feature pyramid network)网络结构,调整不同尺度特征的重要性程度,加强模型的特征融合能力;加入结合了大卷积核的CA(coordinate attention)注意力机制,增强感兴趣的目标区域,进一步提升模型的特征提取能力;将CIoU(complete intersection over union)的损失函数替换为MPDIoU(minimum point distance based intersection over union)损失函数,加快模型的收敛以及提升定位能力。实验结果表明,PSMD-YOLOv5模型在自动泊车场景数据集上检测的查准率、召回率和mAP分别为81.8%、80.3%和85.3%,相比于原始YOLOv5模型整体的查准率、召回率和mAP分别提升了1%、6.5%和5.2%。并通过与其他目标检测模型的比较,验证了本文模型的有效性。 展开更多
关键词 自动泊车场景 目标检测 YOLOv5 注意力机制
在线阅读 下载PDF
High Quality Audio Object Coding Framework Based on Non-Negative Matrix Factorization 被引量:1
14
作者 Tingzhao Wu Ruimin Hu +2 位作者 Xiaochen Wang Shanfa Ke Jinshan Wang 《China Communications》 SCIE CSCD 2017年第9期32-41,共10页
Object-based audio coding is the main technique of audio scene coding. It can effectively reconstruct each object trajectory, besides provide sufficient flexibility for personalized audio scene reconstruction. So more... Object-based audio coding is the main technique of audio scene coding. It can effectively reconstruct each object trajectory, besides provide sufficient flexibility for personalized audio scene reconstruction. So more and more attentions have been paid to the object-based audio coding. However, existing object-based techniques have poor sound quality because of low parameter frequency domain resolution. In order to achieve high quality audio object coding, we propose a new coding framework with introducing the non-negative matrix factorization(NMF) method. We extract object parameters with high resolution to improve sound quality, and apply NMF method to parameter coding to reduce the high bitrate caused by high resolution. And the experimental results have shown that the proposed framework can improve the coding quality by 25%, so it can provide a better solution to encode audio scene in a more flexible and higher quality way. 展开更多
关键词 object-based AUDIO CODING non-negative matrix FACTORIZATION AUDIO scenecoding
在线阅读 下载PDF
NLOT3D:单目视角下自然语言描述驱动的三维目标跟踪研究
15
作者 杨洋 魏弘凯 +4 位作者 孙士杰 宋翔宇 胡红利 郭柯宇 宋焕生 《电子学报》 北大核心 2025年第6期2038-2049,共12页
自然语言描述驱动的目标跟踪是指通过自然语言描述引导视觉目标跟踪,通过融合文本描述和图像视觉信息,使机器能够“像人类一样”感知和理解真实的三维世界.随着深度学习的发展,自然语言描述驱动的视觉目标跟踪领域不断涌现新的方法.但... 自然语言描述驱动的目标跟踪是指通过自然语言描述引导视觉目标跟踪,通过融合文本描述和图像视觉信息,使机器能够“像人类一样”感知和理解真实的三维世界.随着深度学习的发展,自然语言描述驱动的视觉目标跟踪领域不断涌现新的方法.但现有方法大多局限于二维空间,未能充分利用三维空间的位姿信息,因此无法像人类一样自然地进行三维感知;而传统三维目标跟踪任务又依赖于昂贵的传感器,并且数据采集和处理存在局限性,这使得三维目标跟踪变得更加复杂.针对上述挑战,本文提出了单目视角下自然语言描述驱动的三维目标跟踪(Natural Language-driven Object Tracking in 3D,NLOT3D)新任务,并构建了对应的数据集NLOT3D-SPD.此外,本文还设计了一个端到端的NLOT3D-TR(Natural Language-driven Object Tracking in 3D based on Transformer)模型,该模型融合了视觉与文本的跨模态特征,在NLOT3D-SPD数据集上取得了优异的实验结果.本文为NLOT3D任务提供了全面的基准测试,并进行了对比实验与消融研究,为三维目标跟踪领域的进一步发展提供了支持. 展开更多
关键词 场景理解 三维目标跟踪 单目标跟踪 多模态学习 机器视觉
在线阅读 下载PDF
面向复杂动态场景的无人移动视觉技术研究进展
16
作者 张艳宁 王昊宇 +5 位作者 闫庆森 杨佳琪 刘婷 符梦芹 吴鹏 张磊 《中国图象图形学报》 北大核心 2025年第6期1828-1871,共44页
随着人类活动范围的不断扩大和国家利益的持续发展,新域新质无人系统已成为世界各大国科技战略竞争的制高点和制胜未来的关键力量。无人移动视觉技术是无人系统辅助人类透彻感知理解物理世界的核心关键之一,旨在基于无人移动平台捕获的... 随着人类活动范围的不断扩大和国家利益的持续发展,新域新质无人系统已成为世界各大国科技战略竞争的制高点和制胜未来的关键力量。无人移动视觉技术是无人系统辅助人类透彻感知理解物理世界的核心关键之一,旨在基于无人移动平台捕获的视觉数据,精准感知理解复杂动态场景与目标特性。深度神经网络凭借其超强的非线性拟合能力和区分能力,已经成为无人移动视觉技术的基准模型。然而,实际应用中无人系统通常面临成像环境复杂动态、成像目标高速机动—伪装对抗、成像任务需求多样,导致基于深度神经网络的无人移动视觉模型成像质量大幅退化,场景重建解译与目标识别分析精度显著下降,从而严重制约无人系统在复杂动态场景下对物理世界的感知解译能力与应用前景。针对这一挑战,本文深入探讨面向复杂动态场景的无人移动视觉技术发展现状,从图像增强处理、三维重建、场景分割、目标检测识别以及异常检测与行为分析等5个关键技术入手,介绍每项技术的基本研究思路与发展现状,分析每项技术中典型算法的优缺点,探究该技术目前依然面临的问题与挑战,并展望未来研究方向,为面向复杂动态场景的无人移动视觉技术长远发展与落地奠定基础。 展开更多
关键词 无人移动视觉 复杂动态场景 图像增强 三维重建 场景分割 目标检测 异常检测
原文传递
改进YOLOv5s的自然场景下茶叶嫩芽检测
17
作者 胡永光 金矿 +3 位作者 刘益航 鹿永宗 张志 潘庆民 《中国农机化学报》 北大核心 2025年第8期103-111,共9页
茶叶嫩芽采摘是茶叶生产中的重要环节,智能化采茶需要基于深度学习的茶叶嫩芽检测算法作为技术保障。为提高茶叶嫩芽检测速度和精度,提出一种改进YOLOv5s网络模型的检测算法TN—YOLOv5s。首先引入GhostNet网络结构中的深度可分离卷积Gho... 茶叶嫩芽采摘是茶叶生产中的重要环节,智能化采茶需要基于深度学习的茶叶嫩芽检测算法作为技术保障。为提高茶叶嫩芽检测速度和精度,提出一种改进YOLOv5s网络模型的检测算法TN—YOLOv5s。首先引入GhostNet网络结构中的深度可分离卷积GhostConv,替代原有YOLOv5s模型中特征提取网络与特征融合网络的普通卷积层;然后在模型特征提取网络的末端加入CA空间注意力机制;其次使用SIoU_Loss代替CIoU_Loss作为回归损失函数;最后使用Soft—NMS替换NMS。结果表明,改进后的模型在自制的茶叶嫩芽数据集上,相比于原始YOLOv5s算法,模型精确率、召回率和平均精度均值分别高出7.1%、5.9%、6.4%,权重大小从13.7 MB下降到7.48 MB。同时与目前主流的检测算法相比,在检测精度、模型大小和检测速度方面更有优势。改进后的模型降低被遮挡茶叶嫩芽的漏检率,能够准确快速地实现不同场景下的茶叶嫩芽检测。 展开更多
关键词 茶叶嫩芽 自然场景 YOLOv5s 目标检测 遮挡
在线阅读 下载PDF
非宾述词带宾语的认知基础
18
作者 卢英顺 《汉语学习》 北大核心 2025年第4期13-20,共8页
非宾述词是指不能带宾语的述词,即一般所说的形容词和不及物动词。汉语中非宾述词能够直接充当谓语,这为其带宾语提供了可能。从认知要素的激活来看,现代汉语中能够带宾语的多是那些可以激活两个或以上认知要素的非宾述词。非宾述词带... 非宾述词是指不能带宾语的述词,即一般所说的形容词和不及物动词。汉语中非宾述词能够直接充当谓语,这为其带宾语提供了可能。从认知要素的激活来看,现代汉语中能够带宾语的多是那些可以激活两个或以上认知要素的非宾述词。非宾述词带宾语后为相关述词增添了新的句式。 展开更多
关键词 非宾述词 形容词 宾语 认知图景
原文传递
基于深度学习的动态场景视觉SLAM算法
19
作者 王晓栋 陈援峰 杨伟高 《广州城市职业学院学报》 2025年第3期95-100,共6页
同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径... 同时定位与地图构建(SLAM)技术是无人机或机器人在未知复杂环境中进行自主探索的关键研究方向。借助该技术,机器人能够通过其传感器获取的数据,实时计算自身的位姿,同时构建外部环境的高精度地图。基于这些信息,机器人不仅能够制定路径规划,还可以动态修正位姿误差,从而显著提升在未知环境中导航的准确性和稳定性。在使用视觉传感器的SLAM系统中,位姿解算通常依赖于几何算法和特征匹配技术。这些方法通常假设外部环境由静止的物体构成,即基于场景静态化的前提。然而,在实际应用中,动态物体如行人和车辆经常出现,这对系统的性能和鲁棒性提出了严峻的挑战。因此,引入深度学习技术与视觉SLAM算法相结合,在现有的ORB-SLAM2算法框架上新增一个动态目标检测线程,用于识别动态物体,并在里程计的计算中剔除动态点,以减少动态目标对系统定位精度的影响。实验结果表明,该方法能够显著降低绝对轨迹误差,提升SLAM算法在动态场景下的适用性和稳定性。 展开更多
关键词 视觉SLAM 动态场景 深度学习 目标检测
在线阅读 下载PDF
基于改进YOLOv5的复杂场景电动车头盔检测方法 被引量:2
20
作者 韩东辰 张方晖 +3 位作者 王诗洋 段克盼 李宁星 王凯 《现代电子技术》 北大核心 2025年第1期123-129,共7页
佩戴电动车头盔是安全骑行的重要保障,对电动车驾乘人员佩戴头盔进行有效检测在保障驾乘人员安全方面具有重要意义。电动车头盔检测中存在目标之间相互遮挡、复杂背景干扰、头盔目标小等问题,现有方法尚不能满足复杂场景下电动车头盔检... 佩戴电动车头盔是安全骑行的重要保障,对电动车驾乘人员佩戴头盔进行有效检测在保障驾乘人员安全方面具有重要意义。电动车头盔检测中存在目标之间相互遮挡、复杂背景干扰、头盔目标小等问题,现有方法尚不能满足复杂场景下电动车头盔检测的要求,因此,提出一种改进YOLOv5的复杂场景电动车头盔识别方法。首先,提出一种新的主干网络结构ML-CSPDarknet53,增强网络的特征提取能力,引入轻量级上采样算子CARAFE,利用特征图语义信息扩大感受野;其次,搭建坐标卷积CoordConv模块,增强网络对空间信息的感知能力,并将WIoU v3作为边界框损失函数,降低低质量样本对模型性能的不利影响;最后,构建了内容丰富的头盔检测数据集对改进算法进行验证。实验结果表明,改进后算法相较于原算法在精确度、召回率、mAP@0.5、mAP@0.5:0.95上分别提升了2.9%、3.0%、3.4%和2.2%,并且性能优于其他主流检测算法,满足复杂道路交通场景下电动车驾乘人员头盔检测的任务要求。 展开更多
关键词 头盔检测 改进YOLOv5 复杂场景 目标遮挡 特征提取 上采样 坐标卷积 损失函数
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部