期刊文献+
共找到980篇文章
< 1 2 49 >
每页显示 20 50 100
Web-based multi-vision platform for earthwork productivity on construction sites using real-time model updating
1
作者 Jeongbin HWANG Insoo JEONG +1 位作者 Junghoon KIM Seokho CHI 《Frontiers of Structural and Civil Engineering》 2025年第6期1021-1040,共20页
Earthwork productivity analysis is essential for successful construction projects.If productivity analysis results can be accessed anytime and anywhere,then project management can be performed more efficiently.To this... Earthwork productivity analysis is essential for successful construction projects.If productivity analysis results can be accessed anytime and anywhere,then project management can be performed more efficiently.To this end,this paper proposes an earthwork productivity monitoring framework via a real-time scene updating multi-vision platform.The framework consists of four main processes:1)site-optimized database development;2)real-time monitoring model updating;3)multi-vision productivity monitoring;and 4)web-based monitoring platform for Internetconnected devices.The experimental results demonstrated satisfactory performance,with an average macro F1-score of 87.3%for continuous site-specific monitoring,an average accuracy of 86.2%for activity recognition,and the successful operation of multi-vision productivity monitoring through a web-based platform in real time.The findings can contribute to supporting site managers to understand real-time earthmoving operations while achieving better construction project and information management. 展开更多
关键词 online-active learning site-customized monitoring multi-vision monitoring earthwork productivity analysis web-based site monitoring platform
原文传递
基于多尺度特征融合的树木检测算法——DDC-YOLO
2
作者 张志杰 王庆 《森林工程》 北大核心 2026年第1期170-183,共14页
针对树木检测存在的遮挡干扰和光照不充分等问题,提出一种基于改进YOLOv10的检测算法——DDC-YOLO,DDC是由dynamic、DAF(dynamic align fusion)与CG-FPN(context guided-feature pyramid network)首字母拼写。首先,设计动态卷积混合模块... 针对树木检测存在的遮挡干扰和光照不充分等问题,提出一种基于改进YOLOv10的检测算法——DDC-YOLO,DDC是由dynamic、DAF(dynamic align fusion)与CG-FPN(context guided-feature pyramid network)首字母拼写。首先,设计动态卷积混合模块(dynamic convolutional mix block,DCMB),通过自适应动态卷积增强多尺度特征融合能力,解决传统卷积核单一性问题;其次,提出双主干动态特征融合网络,结合RT-DETR(real-time detection transformer)和YOLOv10的主干结构,并利用动态对齐融合(dynamic align fusion,DAF)模块调整特征权重,提升模型对不同特征的适应性;进一步引入金字塔上下文特征提取和空间特征重建技术优化颈部网络,实现多层次语义信息的深度融合。试验基于自建数据集TreeImages(包含7475张图像)进行验证,结果表明,DDC-YOLO的mAP50达到46.7%,较原YOLOv10模型提升5.0个百分点,参数量由2.27 M降至2.26 M(减少0.44%),检测速度(FPS)由202帧/s提升至254帧/s(提升25.4%)。改进后的模型在复杂场景下表现出更高的鲁棒性和实时性,为森林资源调查提供了高效解决方案。 展开更多
关键词 YOLOv10 目标检测 计算机视觉 双主干式动态融合 多尺度特征重建
在线阅读 下载PDF
层级特征融合Transformer的图像分类算法
3
作者 段士玺 王博 《电子科技》 2026年第2期72-78,共7页
针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级... 针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级的特征图,每个特征图包含不同层次的抽象特征表示。基于层级标签将ViT提取的特征映射为多级特征,运用层级特征融合策略整合不同层级信息,有效增强模型的分类性能。在CIFRA-10、CIFRA-100和CUB-200-2011这3个数据集将所提模型与多种先进深度学习模型进行对比和分析。在CIFRA-10数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为99.70%、98.80%和97.80%。在CIFRA-100数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为95.23%、93.54%和90.12%。在CUB-200-2011数据集,所提方法在第1层级和第2层级的分类精度分别为98.09%和93.66%。结果表明,所提模型的分类准确率优于其他对比模型。 展开更多
关键词 深度学习 卷积神经网络 TRANSFORMER 图像分类 层级特征 特征融合 多头注意力 Vision Transformer
在线阅读 下载PDF
基于计算机视觉算法的零部件缺陷智能检测系统
4
作者 何银银 《汽车电器》 2026年第1期111-113,共3页
随着汽车产业向高端制造转型,现有自动化缺陷检测设备在应对曲面工件、反光材质及复合型缺陷时存在明显不足。为此,本文设计并实现一种融合计算机视觉算法的智能检测系统。成像环节采用多相机阵列协同+景深扩展算法,实现曲面工件全域覆... 随着汽车产业向高端制造转型,现有自动化缺陷检测设备在应对曲面工件、反光材质及复合型缺陷时存在明显不足。为此,本文设计并实现一种融合计算机视觉算法的智能检测系统。成像环节采用多相机阵列协同+景深扩展算法,实现曲面工件全域覆盖;图像处理环节引入色相-饱和度-明度(Hue-Saturation-Value,HSV)颜色空间转换、自适应直方图均衡算法,有效抑制反光与光照不均问题;缺陷检测环节融合深度学习模型与阈值分割算法,实现微小缺陷的精准定位。经测试,该系统对0.2 mm级划痕的检出率达98.7%,气泡与油渍的误判率仅为0.3%;单件检测耗时稳定在420 ms,环境温漂影响控制在3%误差带内。 展开更多
关键词 计算机视觉 缺陷检测 多角度成像系统 阈值分割算法
在线阅读 下载PDF
面向自动驾驶的多尺度目标三维检测算法
5
作者 刘嫚 陈晓楠 《现代电子技术》 北大核心 2026年第1期141-147,共7页
在自动驾驶场景中,使用单目相机进行三维目标检测是一项具有挑战性的任务,尤其是在复杂道路环境下,目标的尺度差异和遮挡现象容易导致误检或漏检。针对这一问题,文中提出一种基于特征融合与增强的单目三维目标检测算法。首先,构建Faster... 在自动驾驶场景中,使用单目相机进行三维目标检测是一项具有挑战性的任务,尤其是在复杂道路环境下,目标的尺度差异和遮挡现象容易导致误检或漏检。针对这一问题,文中提出一种基于特征融合与增强的单目三维目标检测算法。首先,构建FasterNet+作为骨干网络,通过优化嵌入层和块结构,增强细节信息的提取,提升网络的整体性能;其次,设计多维特征自适应融合模块,自适应地选择并融合高维与低维特征,解决高维特征丢失小目标信息和低维特征缺乏上下文信息的问题;最后,引入特征增强注意力模块,突出特定目标区域,进一步提升网络在目标定位和分类方面的精度。在nuScenes数据集上的实验结果表明,其mAP和NDS比基准方法分别提高0.038和0.035,可以有效检测出不同类型和尺度的目标,并展现出更强的鲁棒性,为自动驾驶场景中的多维目标检测提供了一种新思路。 展开更多
关键词 自动驾驶 单目相机 三维目标检测 多尺度感知 特征融合 注意力机制 机器视觉
在线阅读 下载PDF
基于多目近红外视觉的多目标实时跟踪方法 被引量:1
6
作者 陈忠 王傲辰 +2 位作者 高心怡 何利辉 张宪民 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期31-38,共8页
近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成... 近红外光学跟踪系统能够根据附着于被跟踪物体上的反光标记球实时还原被跟踪物体的运动,目前已被广泛应用于多种领域。该研究提出了一种对目标丢失具有一定鲁棒性的多目近红外目标实时跟踪方法。首先,针对反光标记球在近红外相机中的成像特性,利用灰度质心法提取各个反光标记球的几何中心,然后在各单目相机中使用SORT算法作为多目标跟踪方法对各个标记点进行帧间匹配,并根据对极几何原理,结合带权二分图匹配方法确定反光标记球在各个相机中像点的匹配关系,依据三角测量方法实时计算各个受跟踪反光标记球的三维空间坐标;其次,根据运动过程中各反光标记球之间的空间位置关系对反光标记球进行分组,识别属于同一物体的反光标记球,并根据同组反光标记球间的欧氏距离建立被跟踪物体与反光标记球的外观特征向量,以此作为物体丢失重现的匹配依据,而完全丢失后再重现的被跟踪物体利用外观特征向量的余弦距离进行重匹配;最后,对所提方法进行实验验证。实验结果表明:所提方法在不小于60 f/s的帧率下的跟踪精度约可达0.5 mm;另外,其可以对丢失的重现物体以及反光标记球进行正确的重匹配。 展开更多
关键词 多目视觉 近红外光学跟踪 立体匹配 反光标记球
在线阅读 下载PDF
基于双目立体视觉的多分辨率图像匹配方法研究 被引量:1
7
作者 刘华春 吴广文 闫静莉 《现代电子技术》 北大核心 2025年第1期29-32,共4页
在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视... 在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视觉模型的双目旋转相机扫描目标并进行成像,根据内、外空间标定提升双目旋转相机的位置精度,保证目标的多分辨率成像效果;将其输入金字塔立体匹配网络中,通过网络中的类金字塔多空洞卷积操作提取双目图像特征,在此基础上,基于可变卷积增强其纹理特征细节;结合细粒度特征和互注意力机制完成双目图像匹配。测试结果显示,空间标定后,左、右两个相机的成像误差最小值分别为0.6 Pixel和0.4 Pixel;匹配点坐标偏差均值和坐标偏差方差值分别低于0.012和0.011,匹配效果良好。 展开更多
关键词 双目立体视觉 多分辨率 图像匹配 空间标定 双目旋转相机 特征提取 特征增强 细粒度
在线阅读 下载PDF
基于低成本多视角立体视觉的辣椒苗三维重建与策略优化 被引量:1
8
作者 朱磊 程瑞英 +3 位作者 丁一民 孙振源 郭政 江伟 《中国农村水利水电》 北大核心 2025年第4期123-129,共7页
基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒... 基于立体视觉的三维重建技术有效降低了植株表型无损测量中的影像获取成本,但算力消耗较大。开展三维重建策略优化研究,对于提高植株表型信息的采集效率具有重要意义。研究构建了以手机为影像获取手段的多视角成像系统,获取了30株辣椒苗的影像数据,进一步结合运动恢复结构与多视图立体视觉(SFM-MVS,Structure From Motion-MultiPle View Stereo)算法,在2160个不同分辨率和不同数量影像组合情景下,分别重建了辣椒苗三维点云。通过重建速度、精度、稳定性以及植株表型参数(叶长、叶宽)准确性的评估,优化植株三维点云重建方案。结果表明,当分辨率为480 p,图片数量大于45幅时,重建成功率达到80%,点云间平均距离误差均小于0.05 cm,提取的表型参数值与实测值的R2均到了0.96以上。同时,该情景下单株平均重建时间为344 s,仅为参照情景(分辨率为1080 p、图片数量为120幅)耗时的10%。综上,在辣椒苗的重建中可将分辨率和图像数量分别设置为480 p和45,从而优化表型测量效率。研究结果可为基于三维重建的辣椒苗表型参数快速无损测量提供参考。 展开更多
关键词 三维重建 多视角立体视觉 点云模型 表型参数
在线阅读 下载PDF
跨域环境下特定多目标跟踪算法的改进 被引量:2
9
作者 穆晓芳 李毫 +2 位作者 刘嘉骥 刘振宇 李越 《太原理工大学学报》 北大核心 2025年第1期165-173,共9页
【目的】针对监控视频跨域环境下的多目标跟踪画面中,频繁遮挡、轨迹开始终止时刻未知、目标太小、目标间交互、表观相似以及摄像头视角变化等问题,提出一种改进的多目标跟踪算法。【方法】该算法最大化利用低分检测对象,将未匹配的低... 【目的】针对监控视频跨域环境下的多目标跟踪画面中,频繁遮挡、轨迹开始终止时刻未知、目标太小、目标间交互、表观相似以及摄像头视角变化等问题,提出一种改进的多目标跟踪算法。【方法】该算法最大化利用低分检测对象,将未匹配的低分对象进行二次匹配,目标跨域后,依据摄像头拓扑排序规则,以及相邻摄像头的未匹配跟踪轨迹,同时对检测器YOLOv5算法进行优化改进,通过信息流的层层递进,有效解决多尺度问题和小目标信息提取不充分等问题,在相邻的摄像头中快速匹配到跟踪对象,以提高跨域环境下特定多目标跟踪的精度。【结果】对比消融试验表明,本改进算法MOTA达到了62.8%,IDswitch也显著降低。 展开更多
关键词 多目标跟踪 YOLO 计算机视觉 深度学习
在线阅读 下载PDF
联觉视域下“视觉+”多感官体验设计应用场景研究综述
10
作者 陈昊 陈雯雯 +1 位作者 胡果 游俊豪 《包装工程》 北大核心 2025年第24期326-334,共9页
目的联觉视域下的多感官体验设计广泛体现为“视觉+”体验模式并多以视听联觉为主,存在联觉交互模式研究部分失衡、应用面较窄等问题。本文拟对联觉体验应用场景研究现状进行系统梳理,为进一步发挥联觉效应在体验设计中的应用提供参考... 目的联觉视域下的多感官体验设计广泛体现为“视觉+”体验模式并多以视听联觉为主,存在联觉交互模式研究部分失衡、应用面较窄等问题。本文拟对联觉体验应用场景研究现状进行系统梳理,为进一步发挥联觉效应在体验设计中的应用提供参考。方法利用文献调研和案例分析,梳理归纳联觉交互模式的理论框架,以“视觉+”模式下的视听、视触、视味、视嗅联觉为例,总结具体实践应用领域。结果在多感官体验设计中,视觉和听觉发展成熟度较高,触、味、嗅三类低级感官通道研究存在一定局限。结论单一感官交互在沉浸体验上有限;联觉体验以“视觉+”模式为主导,多通过多感官整合理论支撑其感官协同效应;视听联觉占联觉交互模式的主导地位,在多媒体领域被广泛应用;视触、视味、视嗅三类新型联觉在广告营销与用户体验中展现潜力,其中视味联觉与视嗅联觉在场景营销和情绪唤醒领域更具应用优势。 展开更多
关键词 联觉 体验设计 “视觉+” 多感官整合
在线阅读 下载PDF
基于视觉相机和激光雷达融合的无人车障碍物检测与跟踪研究 被引量:3
11
作者 魏超 吴西涛 +3 位作者 朱耿霆 舒用杰 李路兴 随淑鑫 《机械工程学报》 北大核心 2025年第2期296-309,320,共15页
为提高无人车障碍物检测跟踪的精度和稳定性,首先针对YOLO v5(You only look once version 5,YOLO v5)网络存在的语义信息和候选框信息丢失的问题,引入深度可分离空洞空间金字塔结构与目标框加权融合算法完成对网络的优化;其次针对单阶... 为提高无人车障碍物检测跟踪的精度和稳定性,首先针对YOLO v5(You only look once version 5,YOLO v5)网络存在的语义信息和候选框信息丢失的问题,引入深度可分离空洞空间金字塔结构与目标框加权融合算法完成对网络的优化;其次针对单阶段障碍物点云聚类精度低的问题,设计一种考虑点云距离与外轮廓连续性的两阶段障碍物点云聚类方法并完成三维包围盒的建立;最后将注意力机制引入MobileNet使网络更加聚焦于目标对象特有的视觉特征,并综合利用视觉特征和三维点云信息共同构建关联性度量指标,提高匹配精度。利用KITTI数据集对构建的障碍物目标检测、跟踪与测速算法进行仿真测试,并搭建实车平台进行真实环境试验,验证所提算法的有效性和真实环境可迁移性。 展开更多
关键词 视觉相机 激光雷达 目标检测 多目标跟踪 无人车
原文传递
基于多尺度空间-光谱特征提取的颜料高光谱图像分类方法
12
作者 汤斌 罗希玲 +6 位作者 王建旭 范文奇 孙玉宇 刘家路 唐欢 赵雅 钟年丙 《光谱学与光谱分析》 北大核心 2025年第8期2364-2372,共9页
颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能... 颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能为科学修复提供指导依据。然而,传统颜料分析受限于样品尺寸、表面平整度,且部分分析方法需要取样,对文物造成不可逆损伤,这使得古书画颜料的检测面临诸多挑战。高光谱成像技术(HSI)凭借其无损检测、广域扫描及获取完整光谱信息的优势,成为文物颜料分析的重要工具。HSI克服了样品表面不平整、尺寸受限等问题,能够从不同波段获取细致的光谱和空间信息,帮助提取颜料的微观特征。旨在利用HSI技术实现古书画颜料的精准分类与深度特征提取,以应对复杂场景下的颜料检测挑战。为此,我们提出了一种多尺度空间-光谱特征融合的方法,在分析过程中结合不同层次的信息:利用光谱-空间注意力机制捕捉细节特征,并通过视觉转换器(ViT)模型获取图像整体的高层语义信息,从而增强对复杂颜料特征的表示能力和分类性能。实验结果表明,该方法在模拟画作样品上的分类性能显著优于传统和其他深度学习模型:与支持向量机(SVM)相比,分类精度提升了34.35%;相较于HyBridSN与SSRN模型,精度分别提高了8.93%和5.6%。本方法不仅提升了颜料检测的准确性,还为古书画的科学修复和价值保护提供了无损、可靠的技术支持,并为文物保护的智能化发展奠定了技术基础。 展开更多
关键词 高光谱成像 多尺度特征融合 Vision Transformer 光谱-空间注意力 颜料分类
在线阅读 下载PDF
自监督几何约束的单目视觉里程计
13
作者 夏琳琳 张尊正 +2 位作者 刘岘林 王凯 阮恒 《中国惯性技术学报》 北大核心 2025年第8期761-769,共9页
针对有监督学习的视觉里程计(VO)需要繁重的真实位姿标签标注过程、VO泛化能力不足导致定位轨迹漂移大的问题,提出一种基于编码器-解码器架构的自监督单目VO网络模型。通过编码器MPVi T对图像特征进行多层次多尺度嵌入,结合解码器U-Net... 针对有监督学习的视觉里程计(VO)需要繁重的真实位姿标签标注过程、VO泛化能力不足导致定位轨迹漂移大的问题,提出一种基于编码器-解码器架构的自监督单目VO网络模型。通过编码器MPVi T对图像特征进行多层次多尺度嵌入,结合解码器U-Net对低维与高维特征的逐级融合,实现了对表征平移和旋转的六自由度位姿的“端到端”学习;作为与位姿相关的几何约束,位姿变换的传递性约束与可逆性约束被集成至损失函数,有利于在局部范围内抑制VO定位的轨迹漂移。在KITTI基准数据集及自采集室外导航视频序列上的实验表明:所提VO网络模型在KITTI的9个序列中表现最优,绝对轨迹误差较次优方法DPVO平均减小25.80%,且在现实场景中能够应对环境特征稀疏性、机器人高速运动及剧烈光照变化,具有更好的鲁棒性与泛化性能。 展开更多
关键词 视觉里程计 位姿估计 多通道视觉Transformer 自监督 传递性与可逆性约束
在线阅读 下载PDF
行人时空图特征模型的多目标跟踪方法
14
作者 冯欣 孙谊 +1 位作者 焦晓宁 张杰 《重庆理工大学学报(自然科学)》 北大核心 2025年第4期130-138,共9页
针对计算机视觉领域中多目标跟踪任务,特别是行人因外观相似导致的身份ID频繁切换问题,提出一种新的行人时空图特征模型。通过构建帧间行人对象图和帧内行人对象图,整合了跨帧和同帧目标间的动态关系。引入图Transformer来提取这些图中... 针对计算机视觉领域中多目标跟踪任务,特别是行人因外观相似导致的身份ID频繁切换问题,提出一种新的行人时空图特征模型。通过构建帧间行人对象图和帧内行人对象图,整合了跨帧和同帧目标间的动态关系。引入图Transformer来提取这些图中的特征,并设计了前后帧目标边缘关系增强模块促进信息的跨帧传递与融合。提出一种优化的轨迹特征更新策略,不仅考虑目标外观特征的余弦相似性,还考虑特征向量模变化,以更全面地评估目标特征的一致性,尤其是在目标形状、大小或强度变化显著的情况下。通过这些方法,模型能更好地适应目标状态变化,减少跟踪过程中的错误匹配,提升多目标跟踪的准确性和稳定性。实验结果表明:所提算法在MOT16与MOT17数据集上的应用显著增强了行人目标特征的区分性,提高了多目标跟踪任务的精度。 展开更多
关键词 计算机视觉 多目标跟踪 图Transformer 对象图
在线阅读 下载PDF
联合测温贴片和计算机视觉的列车关键部件超温监测算法 被引量:1
15
作者 舒冬 张贝嘉 杨鸿泰 《城市轨道交通研究》 北大核心 2025年第3期186-191,共6页
[目的]由于基于温度传感器的列车关键部件温度监测方案存在投资及运维成本高昂的问题,难以满足大型工程项目中对该类部件温度监测广泛推广的需求,因此,亟须研发一种低造价且运维成本低的温度监测方案。[方法]提出了一种融合测温贴片和... [目的]由于基于温度传感器的列车关键部件温度监测方案存在投资及运维成本高昂的问题,难以满足大型工程项目中对该类部件温度监测广泛推广的需求,因此,亟须研发一种低造价且运维成本低的温度监测方案。[方法]提出了一种融合测温贴片和计算机视觉的超温监测算法。该算法遵循“先定位、后分割、再计算”的识别逻辑。通过采用二分k-means聚类算法并引入注意力机制对YOLOV3算法网络进行优化,实现了图像中测温贴片的精确定位;在U-Net++算法网络架构中嵌入主体边界分离模块,并在损失函数中增加相应的边界监督项,以增强边界分割效果,提高测温贴片在图像中的分割精度;对分割后的图像进行计算,根据测温贴片变色的相对体积质量来判定超温结果。[结果及结论]通过对SSD算法、Retina-Net算法、YOLOV3算法、YOLV4算法及改进后的YOLOV3算法等5种算法的定位精度进行试验对比,其定位准确率分别为95.32%、97.15%、98.09%、98.36%及99.21%,其中改进后的YOLOV3算法准确率接近100%。同时,对DeepLabV3+算法、U-Net++算法及改进后的U-Net++算法等3种算法的分割精度进行对比试验,结果显示分割精准度分别为95.97%、96.81%及98.36%,改进后的U-Net++算法表现最优。在真实测试集上进行的试验中,改进算法达到了99.30%的准确率。 展开更多
关键词 轨道交通列车 超温监测 机器视觉 测温贴片 多任务学习
在线阅读 下载PDF
基于深度残差网络的多层多道焊缝识别 被引量:1
16
作者 何俊杰 王传睿 王天琪 《天津工业大学学报》 北大核心 2025年第1期91-96,共6页
为保证焊缝跟踪的精度并将激光条纹从强弧光、飞溅中分离出来,提出了一种基于深度残差(SRNU)网络的激光条纹分割算法。该算法是将带有弧光的图像送入SRNU模型,对内嵌于Resunet网络的编码层部分进行改进,添加SE模块和分组残差模块,对多... 为保证焊缝跟踪的精度并将激光条纹从强弧光、飞溅中分离出来,提出了一种基于深度残差(SRNU)网络的激光条纹分割算法。该算法是将带有弧光的图像送入SRNU模型,对内嵌于Resunet网络的编码层部分进行改进,添加SE模块和分组残差模块,对多层级特征信息进行提取和解析。结果表明:所提算法与Resunet算法相比,平均交并比、精确率、召回率与F1分数分别提升了0.79%、1.38%、0.50%和0.91%,说明该方法有较好的鲁棒性且具有较强的抗干扰能力,在复杂工况下也能将激光条纹从强弧光、飞溅中分离出来。 展开更多
关键词 结构光视觉传感器 深度学习 多层多道焊缝 焊缝识别 深度残差 激光条纹分割算法
在线阅读 下载PDF
下旋乒乓球落点轨迹双目多目标捕捉仿真
17
作者 毛永革 张鹏 《计算机仿真》 2025年第10期268-272,511,共6页
下旋球在飞行过程中,由于马格努斯效应产生的侧向力与空气阻力、重力相互作用,导致其轨迹呈现非线性、低平且触台后快速下沉的特性。单目视觉系统难以直接获取这种复杂运动的三维信息,且单摄像头视角有限,易因运动模糊或遮挡导致轨迹重... 下旋球在飞行过程中,由于马格努斯效应产生的侧向力与空气阻力、重力相互作用,导致其轨迹呈现非线性、低平且触台后快速下沉的特性。单目视觉系统难以直接获取这种复杂运动的三维信息,且单摄像头视角有限,易因运动模糊或遮挡导致轨迹重建误差累积,显著降低轨迹捕捉精度。为精确获取下旋乒乓球的落点轨迹,提出下旋乒乓球落点轨迹双目多目标捕捉方法。结合乒乓球运动学方程,对马格努斯力与空气阻力作用进行量化分析,合理设置双目视觉检测点位。利用摄像机参数矩阵建立空间坐标与图像投影间的数学关系,使摄像机从不同角度捕捉到更全面、准确的运动信息,实现图像的精准匹配,有效抑制单目系统的误差累积;并采用K-means聚类算法实现特征点分组,将不同目标的特征点区分开来,避免特征点混淆对轨迹捕捉的影响。通过ORB特征匹配与单应性变换进一步处理不同视角下的图像关系,从而准确地跟踪乒乓球的运动轨迹,实现下旋乒乓球落点轨迹双目多目标捕捉。仿真结果表明,所提方法的近网分辨率衰减率可控制在0.8mm/pixel以内,并且在240ms的动态过程中能持续准确捕捉乒乓球的运动轨迹。上述方法有效减小了乒乓球运动轨迹的测量误差,特别是对具有下旋特性的乒乓球落点能够实现精准捕捉。 展开更多
关键词 乒乓球 下旋球 落点轨迹 双目视觉系统 多目标捕捉 运动学方程
在线阅读 下载PDF
农业领域多模态融合技术方法与应用研究进展 被引量:20
18
作者 李道亮 赵晔 杜壮壮 《农业机械学报》 北大核心 2025年第1期1-15,共15页
多模态融合技术通过结合多源数据,可以克服单一模态的局限性。近年来,传感器以及遥感技术的发展为作物监测提供了更加丰富的数据源,光谱数据、图像数据、雷达数据以及热红外数据被广泛应用于作物监测中。通过利用计算机视觉技术以及数... 多模态融合技术通过结合多源数据,可以克服单一模态的局限性。近年来,传感器以及遥感技术的发展为作物监测提供了更加丰富的数据源,光谱数据、图像数据、雷达数据以及热红外数据被广泛应用于作物监测中。通过利用计算机视觉技术以及数据分析方法,可以从中获取作物的表型参数、理化特征等信息,从而有助于评估作物的生长状况、指导农业生产管理。现有研究多数是基于单一模态数据展开,而单一模态的数据仅有一种类型的输入,缺乏对整体信息的理解,且容易受到单模态噪声的影响;部分研究虽然采用了多模态融合技术,但仍未能充分考虑模态间的复杂交互关系。为了深入分析多模态融合技术在农业领域应用的潜力,本文首先阐述了农业领域中多模态融合的先进技术与方法,重点梳理了多模态融合技术在作物识别、性状分析、产量预测、胁迫分析及病虫害诊断领域中的应用研究成果,分析了多模态融合技术在农业领域中存在的数据利用程度低、有效特征提取难、融合方式单一等问题,并对未来发展提出展望,以期通过多模态融合的方法推动农业精准管理、提高生产效率。 展开更多
关键词 多模态融合 传感器 遥感技术 作物监测 计算机视觉 农业精准管理
在线阅读 下载PDF
黄瓜病害智能识别技术研究进展 被引量:1
19
作者 杨振东 骆巍 +9 位作者 罗晨 姜鸿勋 张英 宋淑敏 史一鸣 于艳玲 杨田亮 马中杰 冯晓 杨凡 《河南农业科学》 北大核心 2025年第4期1-10,共10页
利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处... 利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处理、叶绿素荧光和高光谱等光谱分析、多模态数据融合技术。综述了基于上述技术的黄瓜病害智能识别研究进展,以及当前研究中存在的问题与不足,并展望了黄瓜病害智能识别技术的发展趋势,旨在为黄瓜病害智能识别的应用研究提供参考。 展开更多
关键词 黄瓜病害 计算机视觉 多模态数据融合 专家知识 智能识别 大模型
在线阅读 下载PDF
基于多目视觉的立体靶标位姿测量方法 被引量:1
20
作者 关玮童 罗哉 +1 位作者 江文松 杨力 《仪器仪表学报》 北大核心 2025年第4期218-227,共10页
激光三维测量是现代大型复杂曲面高精度测量技术的重要手段,广泛应用于车辆、船舶、飞行器等领域,尤其是在大场景的数字化成像方面。针对视觉跟踪三维测量精度和范围不能同时兼优的问题,提出了一种基于多目视觉跟踪的三维测量方法。该... 激光三维测量是现代大型复杂曲面高精度测量技术的重要手段,广泛应用于车辆、船舶、飞行器等领域,尤其是在大场景的数字化成像方面。针对视觉跟踪三维测量精度和范围不能同时兼优的问题,提出了一种基于多目视觉跟踪的三维测量方法。该方法采用多相机联合标定算法建立全局共基准位姿转换模型,实现激光传感器的位姿跟踪;以立体靶标定位精准度最高为优化目标,建立最优视场决策模型;根据立体靶标与线激光传感器之间的结构特征,建立靶标-激光传感器之间的空间几何相对位姿关系;采用几何距离的位姿匹配算法获取线激光传感器的位姿,并结合多相机视场空间完成激光点云数据的拼接,最终实现三维点云成像。为了验证方法的有效性,在1.8 m×2.5 m×1.5 m范围内搭建了四目激光三维测量系统。实验结果表明,该测量方法对立体靶标的平移定位不确定度为0.0543 mm,旋转定位不确定度为0.0478°;该方法在距离多目系统0.5、1和2 m处的横向测量范围分别为0.93、1.18和1.46 m;在使用同焦距相机以达到同等精度的条件下,分别比单目测量范围大0.57、0.7和0.82 m;比双目测量范围大0.35、0.46和0.49 m。说明基于多目视觉的立体靶标位姿测量方法在精度和测量范围上具有较好的工程优势。 展开更多
关键词 多相机视觉 三维重建 姿态跟踪 线激光
原文传递
上一页 1 2 49 下一页 到第
使用帮助 返回顶部