期刊文献+
共找到857篇文章
< 1 2 43 >
每页显示 20 50 100
基于自适应局部划分Vision Transformer的车辆重识别方法
1
作者 徐萌兮 陈海鑫 徐焕宇 《汽车技术》 北大核心 2026年第4期17-25,共9页
针对复杂场景下因摄像头视角变化、遮挡及车辆外观相似性导致模型的特征表达不充分和鲁棒性不足等问题,提出一种基于自适应局部划分Vision Transformer的车辆重识别方法。结合卷积和注意力设计自适应局部划分(ALP)模块;通过层次化注意... 针对复杂场景下因摄像头视角变化、遮挡及车辆外观相似性导致模型的特征表达不充分和鲁棒性不足等问题,提出一种基于自适应局部划分Vision Transformer的车辆重识别方法。结合卷积和注意力设计自适应局部划分(ALP)模块;通过层次化注意力融合(HAF)模块整合低层视觉细节与高层全局语义,为自适应区域划分提供特征引导;引入多重特征嵌入(MFE)模块,基于相机和视角的动态加权机制提升多视角、多相机环境下的特征区分能力。试验结果表明:在车辆重识别任务中,所提出方法在VeRi-776数据集上的mAP和Rank-1分别达到81.0%、97.1%,在VehicleID数据集上的Rank-1达到80.2%,显著提升了模型的识别精度和鲁棒性。 展开更多
关键词 车辆重识别 vision TRANSFORMER 局部划分 注意力融合
在线阅读 下载PDF
Vision Enhancement Technology of Drivers Based on Image Fusion 被引量:1
2
作者 陈天华 周爱德 +1 位作者 李会希 邢素霞 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2015年第5期495-501,共7页
The rise of urban traffic flow highlights the growing importance of traffic safety.In order to reduce the occurrence rate of traffic accidents,and improve front vision information of vehicle drivers,the method to impr... The rise of urban traffic flow highlights the growing importance of traffic safety.In order to reduce the occurrence rate of traffic accidents,and improve front vision information of vehicle drivers,the method to improve visual information of the vehicle driver in low visibility conditions is put forward based on infrared and visible image fusion technique.The wavelet image confusion algorithm is adopted to decompose the image into low-frequency approximation components and high-frequency detail components.Low-frequency component contains information representing gray value differences.High-frequency component contains the detail information of the image,which is frequently represented by gray standard deviation to assess image quality.To extract feature information of low-frequency component and high-frequency component with different emphases,different fusion operators are used separately by low-frequency and high-frequency components.In the processing of low-frequency component,the fusion rule of weighted regional energy proportion is adopted to improve the brightness of the image,and the fusion rule of weighted regional proportion of standard deviation is used in all the three high-frequency components to enhance the image contrast.The experiments on image fusion of infrared and visible light demonstrate that this image fusion method can effectively improve the image brightness and contrast,and it is suitable for vision enhancement of the low-visibility images. 展开更多
关键词 image fusion vision enhancement infrared image processing wavelet transform(WT)
在线阅读 下载PDF
A Fractal Dimension Based Framework for Night Vision Fusion 被引量:5
3
作者 Gaurav Bhatnagar Q.M.Jonathan Wu 《IEEE/CAA Journal of Automatica Sinica》 EI CSCD 2019年第1期220-227,共8页
In this paper, a novel fusion framework is proposed for night-vision applications such as pedestrian recognition,vehicle navigation and surveillance. The underlying concept is to combine low-light visible and infrared... In this paper, a novel fusion framework is proposed for night-vision applications such as pedestrian recognition,vehicle navigation and surveillance. The underlying concept is to combine low-light visible and infrared imagery into a single output to enhance visual perception. The proposed framework is computationally simple since it is only realized in the spatial domain. The core idea is to obtain an initial fused image by averaging all the source images. The initial fused image is then enhanced by selecting the most salient features guided from the root mean square error(RMSE) and fractal dimension of the visual and infrared images to obtain the final fused image.Extensive experiments on different scene imaginary demonstrate that it is consistently superior to the conventional image fusion methods in terms of visual and quantitative evaluations. 展开更多
关键词 FRACTAL DIMENSION image fusion navigation and SURVEILLANCE NIGHT vision
在线阅读 下载PDF
基于改进Vision Transformer网络的农作物病害识别方法研究
4
作者 罗兴 魏维 《黑龙江科学》 2025年第16期50-53,共4页
农作物病害对粮食生产和质量具有显著的负面影响。针对现有基于深度学习的农作物病害识别模型存在的分类精度不足和模型参数量大的问题提出一种基于Vision Transformer的新型架构,该模型采用多尺度卷积模块捕获不同尺度的特征,以扩展模... 农作物病害对粮食生产和质量具有显著的负面影响。针对现有基于深度学习的农作物病害识别模型存在的分类精度不足和模型参数量大的问题提出一种基于Vision Transformer的新型架构,该模型采用多尺度卷积模块捕获不同尺度的特征,以扩展模型的感受野,融合不同尺度特征进行卷积调制,将卷积调制与Vision Transformer相结合,构建成一个混合网络,该网络能够实现局部和全局特征的深度融合,从而显著增强特征分类能力。在Plant Village数据集上的测试结果表明,所提出的MCMT模型达到了99.5%的识别准确率,相较于传统的Vision Transformer计算量更低,识别准确率更高。 展开更多
关键词 农作物病害识别 卷积调制 特征融合 vision Transformer
在线阅读 下载PDF
多传感器信息处理下智能汽车3D防撞预警目标识别
5
作者 辛光红 林甄 邢洁洁 《传感技术学报》 北大核心 2026年第1期126-131,共6页
为了提高道路驾驶安全性,从视觉传感器和惯性测量传感器两方面进行智能汽车3D防撞预警目标识别方法设计。使用可见光双目相机作为视觉传感器采集3D图像,通过径向和切向畸变因子校正图像,提供高分辨率的道路环境数据;在此基础上,利用立... 为了提高道路驾驶安全性,从视觉传感器和惯性测量传感器两方面进行智能汽车3D防撞预警目标识别方法设计。使用可见光双目相机作为视觉传感器采集3D图像,通过径向和切向畸变因子校正图像,提供高分辨率的道路环境数据;在此基础上,利用立体匹配获得计算双目最小视差值,明确道路上的车辆、行人或其他障碍物与车辆间距离。考虑到城市道路情况复杂多变,从而影响车辆的实时动态控制和导航,使用惯性测量传感器测算车辆的加速度和角速度,提供车辆的运动状态和姿态信息。通过融合两种传感器的数据,判断是否存在潜在的碰撞风险,并提供及时的预警。实验结果表明,所提方法在预警距离设定为0.8 m时,可以在1 s内精准识别目标,实现有效的3D防撞预警。 展开更多
关键词 多传感器 防撞预警 信息融合 视觉传感器 惯性测量传感器 环境感知 车辆运动状态
在线阅读 下载PDF
基于多传感器信息融合的桥式起重机二维摆角测量方法
6
作者 潘爱华 王月新 +2 位作者 王佩君 袁伟 沈捷 《起重运输机械》 2026年第5期31-39,共9页
吊物摆角的精确监测是实现桥式起重机防摇摆与安全作业的重要前提,而二维摆角将一维摆角分解为XY方向投影角,有利于后续的防摇摆解耦控制。然而,现有基于单一传感器的起重机摆角检测方法在日常环境条件下易受干扰,难以保证测量精度与稳... 吊物摆角的精确监测是实现桥式起重机防摇摆与安全作业的重要前提,而二维摆角将一维摆角分解为XY方向投影角,有利于后续的防摇摆解耦控制。然而,现有基于单一传感器的起重机摆角检测方法在日常环境条件下易受干扰,难以保证测量精度与稳定性。为此,文中针对桥式起重机的工作特点,提出了一种融合工业相机与惯性测量单元的二维摆角测量方法。该方法包含2个测量通道,视觉测量通道通过工业相机识别吊具板上的二维码并结合几何约束计算二维摆角;惯性测量单元测量通道结合Z轴转角和加速度数据解算二维摆角,最后根据视觉几何测量方差和惯性测量单元摆角统计方差动态分配融合权重,进而加权计算出最终的二维摆角。该方法以视觉数据校准惯性测量单元数据,当视觉数据被干扰而丢弃时,以惯性测量单元数据作为补充,避免实时控制过程中数据中断,该方法充分利用了视觉数据无累计误差和惯性测量单元数据连续完整的特点。实验结果表明,在复杂环境中,系统能够长时间工作并保持较高的测量准确性与鲁棒性,具备良好的工程应用前景。 展开更多
关键词 桥式起重机 多传感器融合 惯性测量单元 视觉 二维摆角检测
在线阅读 下载PDF
基于SCViT的图像重构对抗样本防御方法
7
作者 张新君 郭继发 《计算机工程与科学》 北大核心 2026年第3期500-511,共12页
随着人工智能的日益发展,它给人们的生活带来极大便利的同时也逐渐引发人类对其安全性的思考。图像分类是计算机视觉领域的重要研究工作,但深度神经网络的脆弱性使其易受对抗样本的攻击。对抗样本是人工智能安全领域的一个重要研究方向... 随着人工智能的日益发展,它给人们的生活带来极大便利的同时也逐渐引发人类对其安全性的思考。图像分类是计算机视觉领域的重要研究工作,但深度神经网络的脆弱性使其易受对抗样本的攻击。对抗样本是人工智能安全领域的一个重要研究方向,关于对抗样本的生成和防御技术层出不穷。以ViT为基础进行改动,提出了可用于图像块相似度比较的新模型——SCViT。SCViT中,图像块经线性投射层和Transformer Encoder得到对应的表示向量,将这些向量进行余弦相似度比较即可判断图像块的相似程度。为了降低位置编码对相似度计算的影响,在SCViT的位置编码前添加了微小系数α。利用SCViT进行图像块相似度比较,使用干净样本的图像块逐块取代对抗样本的图像块,最后将所有取代完成的干净样本的图像块拼接成新的图像用于分类。在CIFAR-10数据集上的实验结果表明,对参数α进行恰当取值,可提升方法的防御效果;在Inception_v3和Inception_v4分类模型上的实验结果表明,所提方法在不同分类网络上具有良好的迁移性;与几种常用的图像重构防御方法进行对比,所提方法在取得优异防御效果的同时鲁棒性也更好,对4种攻击方法下的图像分类正确率均达到了80%以上;在CIFAR-100和ImageNet数据集上进行实验,对抗样本的分类准确率分别提高了54个百分点以上和46个百分点以上,体现了所提方法的通用性。 展开更多
关键词 图像分类 对抗样本 图像拼接 vision Transformer 泊松融合
在线阅读 下载PDF
融合HC-FPN与ICRU的机载视觉滑行道线检测方法
8
作者 章涛 付豪 +2 位作者 罗其俊 王壮 谢向镭 《计算机测量与控制》 2026年第1期42-50,共9页
为通过机载视觉传感器获取飞机滑行方向与滑行道线的相对位置关系,增强民航飞机滑行阶段机时机组人员对滑行道线的感知能力,以实现民航飞机视觉辅助驾驶,提出了一种融合HC-FPN与ICRU的机载视觉滑行道线检测方法;通过ResNet进行图像特征... 为通过机载视觉传感器获取飞机滑行方向与滑行道线的相对位置关系,增强民航飞机滑行阶段机时机组人员对滑行道线的感知能力,以实现民航飞机视觉辅助驾驶,提出了一种融合HC-FPN与ICRU的机载视觉滑行道线检测方法;通过ResNet进行图像特征提取,在网络颈部设计了HC-FPN融合多级高层信息;通过实例检测,并采用行锚检测与动态卷积预测滑行道线形状;此外设计了ICRU满足具有复杂拓扑结构的滑行道线检测;在损失中引入了PIoU损失函数;经过实验测试,该网络在自制滑行道线数据集上F1达到85.81%,在CurveLanes数据集和CULane数据集上F1达到86.17%和78.63%,在TuSimple数据集上准确率达到96.45%,实验结果证实了该方法的准确率和有效性,有助于飞机滑行过程中机组人员辅助驾驶。 展开更多
关键词 滑行道线检测 行锚检测 特征融合 拓扑结构 机载视觉
在线阅读 下载PDF
基于CNN-ViT融合与特征增强的金刚石刀头结块缺陷检测
9
作者 赵楠楠 赵文龙 +2 位作者 张海刚 匡国文 何玉林 《深圳大学学报(理工版)》 北大核心 2026年第2期171-178,I0002,共9页
当前基于深度学习的工业品缺陷检测研究大多是针对纹理规则、成像均匀的工件,对表面存在复杂反射与纹理干扰的高反射合金部件的检测挑战关注不足.金刚石刀头结块作为高反射合金工件的典型代表,其表面因含有金刚石颗粒和金属粉末而呈现... 当前基于深度学习的工业品缺陷检测研究大多是针对纹理规则、成像均匀的工件,对表面存在复杂反射与纹理干扰的高反射合金部件的检测挑战关注不足.金刚石刀头结块作为高反射合金工件的典型代表,其表面因含有金刚石颗粒和金属粉末而呈现强烈的镜面反射及随机高光点,导致划痕、孔洞、边缘缺陷等与背景噪声高度混杂,极大地增加了检测难度.为此,提出一种面向复杂高反射复合材质表面缺陷检测的跨模态动态融合框架DCVNet.通过构建局部-全局特征解耦机制,利用多阶段缺陷增强聚类实现背景-缺陷的物理先验分离,并引入渐进式特征融合模块实现卷积神经网络与视觉变换器的跨尺度深度特征融合,突破了传统算法在高反射复合材质缺陷检测上的局限性.构建金刚石刀头结块表面缺陷图像数据集,对模型进行训练,并与GoogLeNet、ResNet50、ResNet101、ViT-L16、MobileNetV2、CRAD、PNI、SuperSimpleNet和MAML模型进行仿真对比实验.结果表明,DCVNet模型检测准确率达到0.841,召回率为0.866,显著优于对比模型.DCVNet模型在复杂高反射复合材质表面缺陷检测中具有较高的检测精度和鲁棒性,为工业缺陷检测提供了新的解决方案. 展开更多
关键词 计算机视觉 工业品缺陷检测 卷积神经网络 视觉变换器 自注意力 特征融合 金刚石刀头结块
在线阅读 下载PDF
用于3D物体检测的端到端雷视融合网络研究
10
作者 陶俊杰 徐鹏 叶坚 《计算机仿真》 2026年第1期511-517,共7页
针对传统3D物体检测方法无法同时实现较高的定位与分类准确率的问题,提出了一种基于雷视融合的端到端的3D物体检测网络。首先将卷积神经网络提取到的图像特征投影到BEV中,将它们与基于雷达检测器的卷积层进行特征融合。其次利用连续卷... 针对传统3D物体检测方法无法同时实现较高的定位与分类准确率的问题,提出了一种基于雷视融合的端到端的3D物体检测网络。首先将卷积神经网络提取到的图像特征投影到BEV中,将它们与基于雷达检测器的卷积层进行特征融合。其次利用连续卷积的方法创建密集的BEV特征图,从BEV空间中每个点对应的最近图像特征中提取信息。最后设计了雷视连续融合层来连接两个通道的多个中间层,实现多个尺度上的雷达与视觉融合。通过在KITTI数据集的实验评估表明,文中提出的基于雷视融合的3D物体检测算法与目前的方法相比在速度和精度上有显著的提升。 展开更多
关键词 雷视融合 三维物体 目标检测 端到端 连续卷积
在线阅读 下载PDF
Dual-Path Vision Transformer用于急性缺血性脑卒中辅助诊断 被引量:3
11
作者 张桃红 郭学强 +4 位作者 郑瀚 罗继昌 王韬 焦力群 唐安莹 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期307-314,共8页
急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分... 急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分类智能模型DPVF。为了提高辅助诊断速度,基于EdgeViT的轻量化设计思想进行了模型的构建;为了使模型保持轻量化的同时具有较高的精度,提出空间-通道自注意力模块,促进Transformer模型捕获更全面的特征信息,提高模型的表达能力;此外,对于DPVF的两分支的特征融合,构建交叉注意力模块对两分支输出进行交叉融合,促使模型提取更丰富的特征,从而提高模型表现。实验结果显示DPVF在测试集上的准确率达98.5%,满足实际需求。 展开更多
关键词 急性缺血性脑卒中 视觉Transformer 双分支网络 特征融合
在线阅读 下载PDF
空间特征和高频特征融合的轻量级人脸伪造检测
12
作者 杜利莎 杨高明 +1 位作者 苏树智 刘惠临 《计算机应用研究》 北大核心 2026年第2期610-616,共7页
现有基于vision Transformer(ViT)的人脸伪造检测方法计算复杂度高,轻量化的算法很难捕捉到细微的伪造痕迹导致检测精度低。针对轻量化模型检测效率低的问题,设计高频分量提取模块和空频交叉融合模块,并与轻量级的卷积加法自注意ViT结... 现有基于vision Transformer(ViT)的人脸伪造检测方法计算复杂度高,轻量化的算法很难捕捉到细微的伪造痕迹导致检测精度低。针对轻量化模型检测效率低的问题,设计高频分量提取模块和空频交叉融合模块,并与轻量级的卷积加法自注意ViT结合。其中,高频分量提取模块提取图像中包含细微伪造痕迹的高频分量,空频交叉融合模块采用交叉注意力实现高频特征和空间特征的交互。与骨干网络比较,提出的方法在FaceForensics++数据集上的AUC提升了12.29个百分点,在DFDC上的跨数据集AUC提升了7.18个百分点。实验结果表明该方法在减少计算资源消耗的同时提升检测效率,在效率和性能之间取得平衡。 展开更多
关键词 人脸伪造检测 vision Transformer 轻量化 特征融合 高频特征
在线阅读 下载PDF
基于深度学习的储粮害虫图像目标检测研究进展与挑战
13
作者 李丹丹 刘欣欣 +4 位作者 罗渊贻 刘乾源 郑一力 陈晋莹 朱延光 《粮油食品科技》 北大核心 2026年第2期220-230,共11页
储粮害虫是威胁粮食数量与质量安全的重要因素,传统人工检验方法存在效率低和实时性不足的问题,亟需发展智能化检测技术。计算机视觉与深度学习的快速发展为储粮害虫检测提供了新的解决方案。本文系统梳理了该领域最新研究进展,主要包括... 储粮害虫是威胁粮食数量与质量安全的重要因素,传统人工检验方法存在效率低和实时性不足的问题,亟需发展智能化检测技术。计算机视觉与深度学习的快速发展为储粮害虫检测提供了新的解决方案。本文系统梳理了该领域最新研究进展,主要包括:一是综述了基于深度学习的储粮害虫检测方法,包括单阶段模型、双阶段模型及多尺度特征融合、频域特征增强与注意力机制等改进路径;二是总结并对比了近年来代表性研究的性能表现,发现主流方法的检测精度已稳定在90%~99%,部分轻量化模型在保持高精度的同时实现了实时性与可部署性;三是归纳了当前研究面临的数据集局限、小目标检测困难、模型复杂度高及可解释性不足等挑战,展望了未来发展方向,包括跨场景大规模数据集建设、轻量化与硬件加速、多模态融合与时空建模、模型鲁棒性与可信性的提升。本文旨在为储粮害虫检测的研究与应用提供参考,为智能储粮体系建设与粮食安全保障提供理论与技术支撑。 展开更多
关键词 储粮害虫 深度学习 目标检测 计算机视觉 多模态融合 智能粮仓
在线阅读 下载PDF
基于跨模态交互融合与全局特征校准的无人机电线检测
14
作者 田洪坤 姜囡 任涛 《控制与决策》 北大核心 2026年第3期639-650,共12页
无人机对电线的精确感知是电力系统运维与无人机自主避障的核心基础,但复杂环境下的光照变化、背景干扰及电线自身特性,给精准识别带来极大挑战.现有单一模态检测方法依赖可见光或红外数据,因复杂背景适应性差,在恶劣条件下表现不佳,存... 无人机对电线的精确感知是电力系统运维与无人机自主避障的核心基础,但复杂环境下的光照变化、背景干扰及电线自身特性,给精准识别带来极大挑战.现有单一模态检测方法依赖可见光或红外数据,因复杂背景适应性差,在恶劣条件下表现不佳,存在明显局限性;多模态检测虽通过融合可见光与红外数据提升了鲁棒性,但在复杂环境适应性与任务特异性挖掘上仍有不足.为此,提出可见光与红外数据跨模态交互融合与全局特征校准检测方案:通过跨模态交互引导融合模块(CIGF)实现双模态特征深度交互与优势互补,通过全局特征重要性校准器(GFSM)精准校准枢纽特征并增强关键信息,通过多感受野增强解码器(MRED)高效重建电线目标精细空间结构并实现像素级定位;三大核心模块协同,形成从特征提取、交互融合到全局校准再到精细解码的完整技术链路.在无人机电线检测权威数据集VITLD上的实验显示,该算法可满足检测精度与实时性的双重需求,尤其在夜间低光照、雾天模糊、雪天遮挡等复杂极端环境中仍保持高精度,突破传统方法应用瓶颈.该方案可为解决无人机电线检测问题提供有效思路,具有重要理论意义与实际应用价值. 展开更多
关键词 无人机 电线检测 自主巡检 多模态融合 目标识别 计算机视觉
原文传递
面向自动驾驶的多尺度目标三维检测算法
15
作者 刘嫚 陈晓楠 《现代电子技术》 北大核心 2026年第1期141-147,共7页
在自动驾驶场景中,使用单目相机进行三维目标检测是一项具有挑战性的任务,尤其是在复杂道路环境下,目标的尺度差异和遮挡现象容易导致误检或漏检。针对这一问题,文中提出一种基于特征融合与增强的单目三维目标检测算法。首先,构建Faster... 在自动驾驶场景中,使用单目相机进行三维目标检测是一项具有挑战性的任务,尤其是在复杂道路环境下,目标的尺度差异和遮挡现象容易导致误检或漏检。针对这一问题,文中提出一种基于特征融合与增强的单目三维目标检测算法。首先,构建FasterNet+作为骨干网络,通过优化嵌入层和块结构,增强细节信息的提取,提升网络的整体性能;其次,设计多维特征自适应融合模块,自适应地选择并融合高维与低维特征,解决高维特征丢失小目标信息和低维特征缺乏上下文信息的问题;最后,引入特征增强注意力模块,突出特定目标区域,进一步提升网络在目标定位和分类方面的精度。在nuScenes数据集上的实验结果表明,其mAP和NDS比基准方法分别提高0.038和0.035,可以有效检测出不同类型和尺度的目标,并展现出更强的鲁棒性,为自动驾驶场景中的多维目标检测提供了一种新思路。 展开更多
关键词 自动驾驶 单目相机 三维目标检测 多尺度感知 特征融合 注意力机制 机器视觉
在线阅读 下载PDF
基于欧式聚类的动态场景视觉-雷达融合SLAM算法及其实现
16
作者 杨伟高 王晓栋 《清远职业技术学院学报》 2026年第1期47-58,共12页
目前大多数视觉与激光融合的同步定位与建图(Simultaneous Localization and Mapping,SLAM)算法在进行位姿状态估计时,通常假设其运行环境为静态。然而,当机器人在包含动态对象的环境中移动时,这些对象的出现会改变图像信息,导致数据关... 目前大多数视觉与激光融合的同步定位与建图(Simultaneous Localization and Mapping,SLAM)算法在进行位姿状态估计时,通常假设其运行环境为静态。然而,当机器人在包含动态对象的环境中移动时,这些对象的出现会改变图像信息,导致数据关联错误,从而引发SLAM定位误差。针对此问题,提出一种改进的视觉与激光融合SLAM算法,以提高室内动态环境下的三维建图精度和鲁棒性。该方法结合对极几何约束和欧式聚类,实现对动态对象的精准检测和剔除,减少动态对象对SLAM系统定位和建图的干扰。实验结果表明,相较于传统的融合SLAM方法,改进后的算法在动态环境下的定位精度、地图质量以及鲁棒性方面均有提升,为智能机器人、自动驾驶等领域的动态环境建图提供新的解决方案。 展开更多
关键词 同步定位与建图 动态场景 视觉-激光融合 欧式聚类
在线阅读 下载PDF
融合视觉与惯性测量数据的结构振动鲁棒监测
17
作者 王宪玉 王军营 +2 位作者 朱前坤 杜永峰 薄士威 《振动.测试与诊断》 北大核心 2026年第1期203-211,225,共10页
针对计算机视觉的远距离结构振动识别技术在工程应用中存在的参数调节流程复杂、易受光照与环境干扰、稳定性和鲁棒性不足等问题,提出一种视觉与惯性测量数据融合的结构振动鲁棒监测方法。根据多源测量数据互补融合原理,将计算机视觉位... 针对计算机视觉的远距离结构振动识别技术在工程应用中存在的参数调节流程复杂、易受光照与环境干扰、稳定性和鲁棒性不足等问题,提出一种视觉与惯性测量数据融合的结构振动鲁棒监测方法。根据多源测量数据互补融合原理,将计算机视觉位移识别系统与惯性加速度传感系统集成于树莓派嵌入式计算平台,构建轻量化视觉-惯性联合监测系统。首先,分别获取结构同一测点的视觉位移与惯性加速度响应;其次,基于卡尔曼滤波的预测-更新机制,实现多速率测量数据融合;然后,在不同振动频率条件下,实现结构振动位移的鲁棒估计;最后,通过模型桥试验与现场实桥测试,对提出方法的有效性进行验证。结果表明:模型桥试验中,在行人激励及低频振动条件下,所提方法显著提升了移动端位移测量的稳定性,相较于单一视觉方法,位移误差可控制在3%左右;现场测试中,基于消费级相机的融合方案能够在实际桥梁运营条件下稳定识别结构振动响应。 展开更多
关键词 结构振动 计算机视觉 树莓派 卡尔曼滤波 数据融合
在线阅读 下载PDF
基于多模态数据和多模型融合的大范围土地覆盖制图
18
作者 茹逸凡 唐国良 李春来 《遥感学报》 北大核心 2026年第2期458-471,共14页
当前土地覆盖制图面临着单一数据源信息局限、数据异质性大、单一模型泛化能力不足等核心挑战。为此本研究基于多光谱影像MSI(Multispectral Imagery)的光谱特征与合成孔径雷达SAR(Synthetic Aperture Radar)数据的不同特性,构建了多模... 当前土地覆盖制图面临着单一数据源信息局限、数据异质性大、单一模型泛化能力不足等核心挑战。为此本研究基于多光谱影像MSI(Multispectral Imagery)的光谱特征与合成孔径雷达SAR(Synthetic Aperture Radar)数据的不同特性,构建了多模态(MSI+SAR)数据集,以弥补单模态SAR数据在复杂场景下的不足。此外,在模型层面系统评估7种代表性模型后,提出融合3类架构的多模型融合方法:以FCN代表卷积神经网络(CNN),以ConViT代表视觉变换器(ViT),以CoAtNet代表CNN-ViT混合架构。实验结果表明:多模态(MSI+SAR)数据较单模态SAR数据在总体精度OA(Overall Accuracy)和频率加权交并比FWIoU(Frequency-Weighted Intersection over Union)这两个代表性的语义分割评估指标上均实现了显著提升,而所提出的多模型融合框架在OA和FWIoU两个指标上进一步取得了改善。本研究所提出的创新方法,不仅增强了模型对复杂地物特征的提取能力,还有效提高了在大范围土地覆盖制图中的分类效果,验证了多模态数据与多模型融合在遥感制图中强大潜力。 展开更多
关键词 土地覆盖制图 多光谱 合成孔径雷达 多模态 多模型融合 卷积神经网络 视觉变换器
原文传递
深度感知融合下的船舶自动靠离泊控制方法研究
19
作者 闻鸣 周杰鑫 +3 位作者 杜兴刚 孙佳隆 郭殿禹 曹俊晨 《舰船科学技术》 北大核心 2026年第5期139-145,共7页
本文提出一种激光点云与立体视觉深度感知融合下的船舶自动靠离泊控制方法。首先,通过高精度相机与激光雷达联合标定,建立图像像素坐标系与激光雷达坐标系的转换关系;然后,采用椭圆形关联门和全局最近邻匹配算法实现跨模态目标关联,确... 本文提出一种激光点云与立体视觉深度感知融合下的船舶自动靠离泊控制方法。首先,通过高精度相机与激光雷达联合标定,建立图像像素坐标系与激光雷达坐标系的转换关系;然后,采用椭圆形关联门和全局最近邻匹配算法实现跨模态目标关联,确保靠离泊目标的精确位置;最后,针对船舶欠驱动特性,设计了纵向速度、横向速度和转航速度的增量式PID控制器,结合推力分配策略动态调整推进器参数,以应对复杂水动力环境的影响。实验结果表明,本文方法在目标匹配准确率有效提高,控制效果有效提升了船舶靠离泊的自动化水平和安全性。 展开更多
关键词 激光点云 立体视觉 深度感知融合 船舶自动靠离泊控制
在线阅读 下载PDF
全局-局部特征融合驱动的抑郁症筛查方法研究
20
作者 张嗣勇 邱杰凡 +3 位作者 赵祥云 肖克江 陈晓甫 毛科技 《电子与信息学报》 北大核心 2026年第1期321-334,共14页
目前,基于机器视觉的抑郁症识别筛查的方法往往忽略脸部的局部特征,在实际应用中一旦脸部被部分遮挡,会严重影响筛查的准确性,甚至无法进行有效筛查。为此,该文提出一种边缘视觉的抑郁症筛查方法,该方法通过构建一个全局-局部融合注意... 目前,基于机器视觉的抑郁症识别筛查的方法往往忽略脸部的局部特征,在实际应用中一旦脸部被部分遮挡,会严重影响筛查的准确性,甚至无法进行有效筛查。为此,该文提出一种边缘视觉的抑郁症筛查方法,该方法通过构建一个全局-局部融合注意力网络同步识别被筛查对象的面部表情和眼部局部特征。为了提高对眼部局部特征的提取能力,该文在网络中引入卷积注意力模块,强化对眼动轨迹特征的捕捉能力。实验结果表明,该方法在抑郁症识别上表现优异,在自建数据集上(包含脸部遮挡情况)的精确率、召回率、F1分数分别达0.76,0.78和0.77,较最新方法召回率提升10.76%,在AVEC2013和AVEC2014数据集上,平均绝对误差(MAE)分别低至5.74和5.79,较最新方法提升3.53%和1.2%。此外,通过可视化分析直观展现了模型对面部不同区域的关注度,进一步验证了方法的有效性和合理性。该方法部署于边缘设备后,单帧平均处理时延不超过56.14ms,为抑郁症筛查提供了新方案。 展开更多
关键词 抑郁症筛查 短序窗口划分 全局-局部特征融合 人脸图像 边缘视觉
在线阅读 下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部