期刊文献+
共找到839篇文章
< 1 2 42 >
每页显示 20 50 100
A Fractal Dimension Based Framework for Night Vision Fusion 被引量:5
1
作者 Gaurav Bhatnagar Q.M.Jonathan Wu 《IEEE/CAA Journal of Automatica Sinica》 EI CSCD 2019年第1期220-227,共8页
In this paper, a novel fusion framework is proposed for night-vision applications such as pedestrian recognition,vehicle navigation and surveillance. The underlying concept is to combine low-light visible and infrared... In this paper, a novel fusion framework is proposed for night-vision applications such as pedestrian recognition,vehicle navigation and surveillance. The underlying concept is to combine low-light visible and infrared imagery into a single output to enhance visual perception. The proposed framework is computationally simple since it is only realized in the spatial domain. The core idea is to obtain an initial fused image by averaging all the source images. The initial fused image is then enhanced by selecting the most salient features guided from the root mean square error(RMSE) and fractal dimension of the visual and infrared images to obtain the final fused image.Extensive experiments on different scene imaginary demonstrate that it is consistently superior to the conventional image fusion methods in terms of visual and quantitative evaluations. 展开更多
关键词 FRACTAL DIMENSION image fusion navigation and SURVEILLANCE NIGHT vision
在线阅读 下载PDF
基于改进Vision Transformer网络的农作物病害识别方法研究
2
作者 罗兴 魏维 《黑龙江科学》 2025年第16期50-53,共4页
农作物病害对粮食生产和质量具有显著的负面影响。针对现有基于深度学习的农作物病害识别模型存在的分类精度不足和模型参数量大的问题提出一种基于Vision Transformer的新型架构,该模型采用多尺度卷积模块捕获不同尺度的特征,以扩展模... 农作物病害对粮食生产和质量具有显著的负面影响。针对现有基于深度学习的农作物病害识别模型存在的分类精度不足和模型参数量大的问题提出一种基于Vision Transformer的新型架构,该模型采用多尺度卷积模块捕获不同尺度的特征,以扩展模型的感受野,融合不同尺度特征进行卷积调制,将卷积调制与Vision Transformer相结合,构建成一个混合网络,该网络能够实现局部和全局特征的深度融合,从而显著增强特征分类能力。在Plant Village数据集上的测试结果表明,所提出的MCMT模型达到了99.5%的识别准确率,相较于传统的Vision Transformer计算量更低,识别准确率更高。 展开更多
关键词 农作物病害识别 卷积调制 特征融合 vision Transformer
在线阅读 下载PDF
Dual-Path Vision Transformer用于急性缺血性脑卒中辅助诊断 被引量:3
3
作者 张桃红 郭学强 +4 位作者 郑瀚 罗继昌 王韬 焦力群 唐安莹 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期307-314,共8页
急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分... 急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分类智能模型DPVF。为了提高辅助诊断速度,基于EdgeViT的轻量化设计思想进行了模型的构建;为了使模型保持轻量化的同时具有较高的精度,提出空间-通道自注意力模块,促进Transformer模型捕获更全面的特征信息,提高模型的表达能力;此外,对于DPVF的两分支的特征融合,构建交叉注意力模块对两分支输出进行交叉融合,促使模型提取更丰富的特征,从而提高模型表现。实验结果显示DPVF在测试集上的准确率达98.5%,满足实际需求。 展开更多
关键词 急性缺血性脑卒中 视觉Transformer 双分支网络 特征融合
在线阅读 下载PDF
Vision Enhancement Technology of Drivers Based on Image Fusion 被引量:1
4
作者 陈天华 周爱德 +1 位作者 李会希 邢素霞 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2015年第5期495-501,共7页
The rise of urban traffic flow highlights the growing importance of traffic safety.In order to reduce the occurrence rate of traffic accidents,and improve front vision information of vehicle drivers,the method to impr... The rise of urban traffic flow highlights the growing importance of traffic safety.In order to reduce the occurrence rate of traffic accidents,and improve front vision information of vehicle drivers,the method to improve visual information of the vehicle driver in low visibility conditions is put forward based on infrared and visible image fusion technique.The wavelet image confusion algorithm is adopted to decompose the image into low-frequency approximation components and high-frequency detail components.Low-frequency component contains information representing gray value differences.High-frequency component contains the detail information of the image,which is frequently represented by gray standard deviation to assess image quality.To extract feature information of low-frequency component and high-frequency component with different emphases,different fusion operators are used separately by low-frequency and high-frequency components.In the processing of low-frequency component,the fusion rule of weighted regional energy proportion is adopted to improve the brightness of the image,and the fusion rule of weighted regional proportion of standard deviation is used in all the three high-frequency components to enhance the image contrast.The experiments on image fusion of infrared and visible light demonstrate that this image fusion method can effectively improve the image brightness and contrast,and it is suitable for vision enhancement of the low-visibility images. 展开更多
关键词 image fusion vision enhancement infrared image processing wavelet transform(WT)
在线阅读 下载PDF
视觉—语言—动作模型综述:从前史到前沿 被引量:2
5
作者 张慧 梁姝彤 +5 位作者 李明轩 田永林 葛经纬 于慧 李灵犀 王飞跃 《自动化学报》 北大核心 2025年第9期1922-1950,共29页
视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化... 视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化、端到端和混合三类主流建模范式,分析其结构特点、能力优势与面临的关键挑战.在此基础上,总结当前代表性VLA模型的体系结构、训练机制、多模态融合策略及应用成效,并对典型数据集与评测基准进行分类比较.最后,结合跨模态协同、知识注入、长时序规划与真实环境泛化等方面,展望未来VLA模型的发展趋势与研究方向. 展开更多
关键词 具身智能 视觉—语言—动作模型 多模态融合 端到端学习 任务泛化
在线阅读 下载PDF
基于ViT-CNN特征增强的图像超分辨率 被引量:1
6
作者 高志荣 孙清清 +2 位作者 熊承义 李帆 郑瑞华 《中南民族大学学报(自然科学版)》 2025年第2期253-259,共7页
卷积神经网络(CNN)可以提取图像的局部相关特征,视觉Transformer(ViT)则侧重于捕获图像的远距离依赖关系,二者有效结合能够改进图像的重构质量.研究了一种基于ViT-CNN特征增强的图像超分辨率(SR)网络.具体来说,网络包含了基于ViT的SR分... 卷积神经网络(CNN)可以提取图像的局部相关特征,视觉Transformer(ViT)则侧重于捕获图像的远距离依赖关系,二者有效结合能够改进图像的重构质量.研究了一种基于ViT-CNN特征增强的图像超分辨率(SR)网络.具体来说,网络包含了基于ViT的SR分支与基于CNN的梯度分支,SR分支主要用于提取图像特征域中的全局相关性,而梯度分支则专注于图像梯度域中的局部依赖关系.通过对两种信息的融合与渐进增强,获得高倍放大的重构图像.此外,在网络的学习阶段引入了梯度损失及渐进训练策略,有效降低了网络的训练难度并增强了训练的稳定性.在多个公开数据集上的大量实验结果验证了所提方法在改善重构系统性能方面的有效性. 展开更多
关键词 图像超分辨率 卷积神经网络 视觉Transformer 特征融合
在线阅读 下载PDF
结合时空注意力的视触融合目标识别方法
7
作者 刘佳 栗文龙 +2 位作者 陈大鹏 张松 黄孝荣 《计算机工程与应用》 北大核心 2025年第18期175-186,共12页
针对目前智能机器人领域中,利用多帧连续视觉和触觉信息时,对时空信息和模态间的异构信息处理不足的问题,提出了一种结合时空注意力的视触融合目标识别方法。该方法利用Swin Transformer模块从视觉和触觉图像中分别提取特征,减轻模态间... 针对目前智能机器人领域中,利用多帧连续视觉和触觉信息时,对时空信息和模态间的异构信息处理不足的问题,提出了一种结合时空注意力的视触融合目标识别方法。该方法利用Swin Transformer模块从视觉和触觉图像中分别提取特征,减轻模态间的异构性;使用基于注意力瓶颈机制的时空Transformer模块,实现视觉和触觉特征信息的时空交互和跨模态交互;通过多头自注意力融合模块,实现视触觉特征中信息的自适应聚合,提高了算法对目标识别的准确性;通过全连接层获得目标识别的结果。该模型在The Touch and Go公共数据集上的精确率和F1分数分别为98.38%和96.83%,比效果最好的对比模型提高了0.90和0.63个百分点。此外,消融实验也验证了提出的各个模块的有效性。 展开更多
关键词 多模态融合 目标识别 视触融合 TRANSFORMER 自注意力 时空信息
在线阅读 下载PDF
基于多尺度空间-光谱特征提取的颜料高光谱图像分类方法
8
作者 汤斌 罗希玲 +6 位作者 王建旭 范文奇 孙玉宇 刘家路 唐欢 赵雅 钟年丙 《光谱学与光谱分析》 北大核心 2025年第8期2364-2372,共9页
颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能... 颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能为科学修复提供指导依据。然而,传统颜料分析受限于样品尺寸、表面平整度,且部分分析方法需要取样,对文物造成不可逆损伤,这使得古书画颜料的检测面临诸多挑战。高光谱成像技术(HSI)凭借其无损检测、广域扫描及获取完整光谱信息的优势,成为文物颜料分析的重要工具。HSI克服了样品表面不平整、尺寸受限等问题,能够从不同波段获取细致的光谱和空间信息,帮助提取颜料的微观特征。旨在利用HSI技术实现古书画颜料的精准分类与深度特征提取,以应对复杂场景下的颜料检测挑战。为此,我们提出了一种多尺度空间-光谱特征融合的方法,在分析过程中结合不同层次的信息:利用光谱-空间注意力机制捕捉细节特征,并通过视觉转换器(ViT)模型获取图像整体的高层语义信息,从而增强对复杂颜料特征的表示能力和分类性能。实验结果表明,该方法在模拟画作样品上的分类性能显著优于传统和其他深度学习模型:与支持向量机(SVM)相比,分类精度提升了34.35%;相较于HyBridSN与SSRN模型,精度分别提高了8.93%和5.6%。本方法不仅提升了颜料检测的准确性,还为古书画的科学修复和价值保护提供了无损、可靠的技术支持,并为文物保护的智能化发展奠定了技术基础。 展开更多
关键词 高光谱成像 多尺度特征融合 vision Transformer 光谱-空间注意力 颜料分类
在线阅读 下载PDF
高频信息物体多层多元特征权重自适应融合三维重建网络
9
作者 王标 李影 +3 位作者 融百川 刘璟 张进 王永红 《光学精密工程》 北大核心 2025年第15期2424-2440,共17页
为解决光度立体深度学习在实现物体表面法向量重建过程中存在的表面纹理的高频信息丢失而导致重建精度偏差大的问题,提出了一种多层多元特征权重自适应融合三维重建网络(MMF-Net)。网络主要将PS-FCN作为基准模型,引入对称式编码-解码结... 为解决光度立体深度学习在实现物体表面法向量重建过程中存在的表面纹理的高频信息丢失而导致重建精度偏差大的问题,提出了一种多层多元特征权重自适应融合三维重建网络(MMF-Net)。网络主要将PS-FCN作为基准模型,引入对称式编码-解码结构,增强网络的学习和特征表达能力,提升了不同层级之间特征整合能力;设计独立层间权重自适应调节的多元卷积层,通过增加额外的可训练权重,兼顾具有形状信息与纹理信息,并且能够更好地捕捉到表面纹理的细节变化信息,使得该网络在高频信息较密集场景下的表现更加稳定和准确;辅助增加跳跃连接结构,通过中间层特征跨层连接至后续层级,保留物体高频信息且强化低频信息,以实现物体高低频特征信息的融合性应用。利用DiLiGenT基准数据集进行了相关测试,实验结果表明,MMF-Net能够实现平均MAE达到6.94°,对比PS-FCN(Norm)的7.39°提升了6%,在其中两幅含有高频信息物体的平均重建误差为11.03°,对比先前方法FUPS-Net的12.52°提升了12%。MMF-Net实现了光度立体物体表面低频信息和高频信息的有效性获取,为以物体表面法向量为基础的三维高精度重建提供参考。 展开更多
关键词 深度学习 光度立体视觉 多元卷积 特征融合 自适应权重
在线阅读 下载PDF
基于MEBP-YOLOv10的无人矿卡行进道路障碍物检测
10
作者 顾清华 陈永琪 +1 位作者 李学现 王丹 《黄金科学技术》 北大核心 2025年第4期888-899,共12页
随着露天矿无人驾驶技术的广泛应用,无人驾驶卡车在复杂矿区环境下的障碍物检测问题日益凸显。针对障碍物检测存在的多尺度目标精度差和小目标特征融合不足等问题,提出了一种基于MEBPYOLOv10的矿卡前进道路上的障碍物检测模型。该模型... 随着露天矿无人驾驶技术的广泛应用,无人驾驶卡车在复杂矿区环境下的障碍物检测问题日益凸显。针对障碍物检测存在的多尺度目标精度差和小目标特征融合不足等问题,提出了一种基于MEBPYOLOv10的矿卡前进道路上的障碍物检测模型。该模型首先设计了C2f-MSC模块,采用分组策略和多尺度卷积提高特征提取效率;其次在主干网络中嵌入ECA注意力机制,强化了模型对障碍物的特征提取能力;然后使用BiFPN特征融合模块,调整权重占比以提高小目标障碍物的特征融合能力;最后将预测框损失函数更换为PIoU损失函数,通过惩罚项加快模型收敛。试验结果表明,改进后的模型对露天矿区中障碍物的检测精度、召回率、mAP和实时检测速度分别达到89.8%、79.8%、83.5%和103.4FPS,显著提高了矿卡前进道路上障碍物的检测精度,同时兼顾了实时处理能力和模型轻量化需求,方便部署在矿卡上的边缘设备。 展开更多
关键词 露天矿 无人矿卡 机器视觉 障碍物检测 特征融合
在线阅读 下载PDF
基于人类视觉认知机制的表面缺陷检测 被引量:1
11
作者 崔丽莎 代润鹏 +3 位作者 姜晓恒 李飞蝶 陈恩庆 徐明亮 《浙江大学学报(理学版)》 北大核心 2025年第1期38-49,共12页
进行表面缺陷检测是确保产品性能、质量、美观度以及生产效率的重要手段。尽管人工智能在视觉检测领域取得了飞速发展,但基于生物视觉认知指导机器视觉学习的方法,仍是研究难点。提出了一种基于人类视觉认知机制的表面缺陷检测网络(HVCM... 进行表面缺陷检测是确保产品性能、质量、美观度以及生产效率的重要手段。尽管人工智能在视觉检测领域取得了飞速发展,但基于生物视觉认知指导机器视觉学习的方法,仍是研究难点。提出了一种基于人类视觉认知机制的表面缺陷检测网络(HVCM-Net)。在宏观层面,模拟视网膜上中央凹和中央凹外区域的工作原理,提出了中央视觉分支和外周视觉分支并行的骨干网络,分别负责学习缺陷图像的高空间频率局部细节信息和低空间频率全局语义信息。在微观层面,动态权重融合模块(DWFM)以自适应的方式融合两个分支的输出特征图,可学习和过滤更全面、准确和互补的缺陷特征。另外,融合分支引入特征保存下采样(FPD)模块,采用特征拼接技术,有效缓解了传统采样可能产生的微弱缺陷信息丢失问题。HVCM-Net在缺陷数据集GB-DET、NEU-DET和DAGM2007上取得了优于其他方法的检测性能,验证了其有效性。 展开更多
关键词 缺陷检测 人类视觉 中央视觉 外周视觉 特征融合
在线阅读 下载PDF
农业领域多模态融合技术方法与应用研究进展 被引量:11
12
作者 李道亮 赵晔 杜壮壮 《农业机械学报》 北大核心 2025年第1期1-15,共15页
多模态融合技术通过结合多源数据,可以克服单一模态的局限性。近年来,传感器以及遥感技术的发展为作物监测提供了更加丰富的数据源,光谱数据、图像数据、雷达数据以及热红外数据被广泛应用于作物监测中。通过利用计算机视觉技术以及数... 多模态融合技术通过结合多源数据,可以克服单一模态的局限性。近年来,传感器以及遥感技术的发展为作物监测提供了更加丰富的数据源,光谱数据、图像数据、雷达数据以及热红外数据被广泛应用于作物监测中。通过利用计算机视觉技术以及数据分析方法,可以从中获取作物的表型参数、理化特征等信息,从而有助于评估作物的生长状况、指导农业生产管理。现有研究多数是基于单一模态数据展开,而单一模态的数据仅有一种类型的输入,缺乏对整体信息的理解,且容易受到单模态噪声的影响;部分研究虽然采用了多模态融合技术,但仍未能充分考虑模态间的复杂交互关系。为了深入分析多模态融合技术在农业领域应用的潜力,本文首先阐述了农业领域中多模态融合的先进技术与方法,重点梳理了多模态融合技术在作物识别、性状分析、产量预测、胁迫分析及病虫害诊断领域中的应用研究成果,分析了多模态融合技术在农业领域中存在的数据利用程度低、有效特征提取难、融合方式单一等问题,并对未来发展提出展望,以期通过多模态融合的方法推动农业精准管理、提高生产效率。 展开更多
关键词 多模态融合 传感器 遥感技术 作物监测 计算机视觉 农业精准管理
在线阅读 下载PDF
基于多尺度与多级语义融合Transformer的人体姿态估计
13
作者 李俊 袁通达 陈黎 《武汉大学学报(理学版)》 北大核心 2025年第4期473-484,共12页
针对人体姿态估计任务中视觉Transformer模型存在的尺度多样性受限和近距离信息忽视问题,提出多尺度与多级语义融合Transformer(MMSF)模型。该模型通过引入关键点标记作为代理的交叉Transformer操作,实现了不同分辨率视觉信息的相互学习... 针对人体姿态估计任务中视觉Transformer模型存在的尺度多样性受限和近距离信息忽视问题,提出多尺度与多级语义融合Transformer(MMSF)模型。该模型通过引入关键点标记作为代理的交叉Transformer操作,实现了不同分辨率视觉信息的相互学习,提高了估计精度。同时,利用深度卷积和稠密连接复用标记技术,有效提取了含有多级语义信息的交叉标记,减少了编码器层堆叠,降低了模型复杂度。通过交叉标记与标准标记的交叉融合注意力操作,整合了多级语义信息,进一步增强了姿态估计效果。实验结果表明,在相同的条件下,MMSF模型在COCO数据集上达到了78.1%的平均精度,比TokenPose基准模型高2.3%;在MPII数据集上验证了其有效性,与近几年经典的基于Transformer的人体姿态估计方法相比取得了更好的性能。 展开更多
关键词 视觉Transformer 人体姿态估计 深度卷积 标记融合 交叉注意力
原文传递
基于特征融合和网络采样的点云配准 被引量:1
14
作者 陆军 王文豪 杜宏劲 《智能系统学报》 北大核心 2025年第3期621-630,共10页
针对点云配准过程中,下采样时容易丢失关键点、影响配准精度的问题,本文提出一种基于特征融合和网络采样的配准方法,提高了配准的精度和速度。在PointNet分类网络基础上,引入小型注意力机制,设计一种基于深度学习网络的关键点提取方法,... 针对点云配准过程中,下采样时容易丢失关键点、影响配准精度的问题,本文提出一种基于特征融合和网络采样的配准方法,提高了配准的精度和速度。在PointNet分类网络基础上,引入小型注意力机制,设计一种基于深度学习网络的关键点提取方法,将局部特征和全局特征融合,得到混合特征的特征矩阵。通过深度学习实现对应矩阵求解中相关参数的自动优化,最后利用加权奇异值分解(singular value decomposition,SVD)得到变换矩阵,完成配准。在ModelNet40数据集上的实验表明,和最远点采样相比,所提算法耗时减少45.36%;而配准结果和基于特征学习的鲁棒点匹配(robust point matching using learned features,RPM-Net)相比,平移矩阵均方误差降低5.67%,旋转矩阵均方误差降低13.1%。在自制点云数据上的实验,证实了算法在真实物体上配准的有效性。 展开更多
关键词 点云配准 特征融合 深度学习 网络采样 三维视觉 局部特征 全局特征 特征提取
在线阅读 下载PDF
黄瓜病害智能识别技术研究进展 被引量:1
15
作者 杨振东 骆巍 +9 位作者 罗晨 姜鸿勋 张英 宋淑敏 史一鸣 于艳玲 杨田亮 马中杰 冯晓 杨凡 《河南农业科学》 北大核心 2025年第4期1-10,共10页
利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处... 利用智能识别技术及时、准确识别黄瓜病害,进而积极防治、合理施药对于保障黄瓜高质量生产及生态环境安全具有重要意义。黄瓜病害智能识别主要采用基于传统专家系统和知识图谱的专家知识,以及基于传统机器学习和深度学习的可见光图像处理、叶绿素荧光和高光谱等光谱分析、多模态数据融合技术。综述了基于上述技术的黄瓜病害智能识别研究进展,以及当前研究中存在的问题与不足,并展望了黄瓜病害智能识别技术的发展趋势,旨在为黄瓜病害智能识别的应用研究提供参考。 展开更多
关键词 黄瓜病害 计算机视觉 多模态数据融合 专家知识 智能识别 大模型
在线阅读 下载PDF
一种多层次贝叶斯雷视融合目标检测与识别方法 被引量:1
16
作者 刘晓莉 王洪龙 +2 位作者 贺鹏鸣 周盼盼 王建强 《计算机技术与发展》 2025年第2期153-158,共6页
随着自动驾驶技术的发展,精确的目标检测与识别成为确保行车安全的关键。现有的基于贝叶斯网络的目标检测方法大多局限于单一传感器数据,未能充分利用多传感器数据的互补性。该文提出了一种基于贝叶斯网络的雷视融合目标检测和识别方法... 随着自动驾驶技术的发展,精确的目标检测与识别成为确保行车安全的关键。现有的基于贝叶斯网络的目标检测方法大多局限于单一传感器数据,未能充分利用多传感器数据的互补性。该文提出了一种基于贝叶斯网络的雷视融合目标检测和识别方法,旨在通过融合雷达和视觉传感器数据提高检测的准确性和鲁棒性。该文构建了一个多层次贝叶斯网络模型,用于表示两种传感器数据间的依赖关系,并设计了一种新的参数学习算法来优化网络参数。此外,提出了一个基于网络推理的检测流程,实现了对目标的快速且准确检测。在标准数据集上的实验结果表明,与现有技术相比,该方法在多个评估指标上均有显著提升,包括准确率、召回率和F1分数,同时保持了较低的计算复杂度,能够实现实时的目标检测,适合实时处理需求。该研究还探讨了模型的泛化能力和潜在的应用场景,为自动驾驶车辆的感知系统提供了一种有效的解决方案。 展开更多
关键词 自动驾驶 目标检测与识别 贝叶斯网络 雷视融合 参数学习
在线阅读 下载PDF
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
17
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉Transformer
在线阅读 下载PDF
新一代超声速客机总体气动技术挑战与展望
18
作者 李军府 赵彦 +6 位作者 王伟 谢露 张辉 王龙 袁麟 谭玉婷 宁宇 《航空学报》 北大核心 2025年第20期1-30,共30页
超声速客机能够在航线上长时间以高于声速的速度飞行,可将亚声速客机执飞远距离航班的飞行时间缩短50%以上,有效改善旅程舒适性。因而,绿色高效的超声速客机再次成为民用航空领域的研究热点。简要回顾了超声速客机的发展历程,重点综述... 超声速客机能够在航线上长时间以高于声速的速度飞行,可将亚声速客机执飞远距离航班的飞行时间缩短50%以上,有效改善旅程舒适性。因而,绿色高效的超声速客机再次成为民用航空领域的研究热点。简要回顾了超声速客机的发展历程,重点综述了超声速客机投入运营亟待解决的总体气动方面的技术挑战,包括多学科设计优化技术、飞发一体化设计技术、外部视景融合式驾驶舱设计技术、低声爆设计技术、声爆抑制技术、超声速巡航减阻技术、声爆风洞试验技术,探讨了超声速客机关键技术的发展方向。 展开更多
关键词 超声速客机 多学科设计优化 飞发一体化 外部视景融合 声爆 超声速巡航减阻
原文传递
加速度与计算机视觉多尺度滤波融合的桥梁位移响应监测方法
19
作者 吴桐 周志祥 唐亮 《土木工程学报》 北大核心 2025年第4期58-74,共17页
为改善现有计算机视觉技术在桥梁结构动态位移监测精度、采样频率、便捷性等方面存在的不足,充分挖掘各类监测响应中的有效信息,提出一种基于视觉位移和加速度多尺度滤波重构位移的方法,可实现位移在时域和频域的精度提升。首先,推导位... 为改善现有计算机视觉技术在桥梁结构动态位移监测精度、采样频率、便捷性等方面存在的不足,充分挖掘各类监测响应中的有效信息,提出一种基于视觉位移和加速度多尺度滤波重构位移的方法,可实现位移在时域和频域的精度提升。首先,推导位移重构过程在时域和频域的理论表达式,分析目标精度、时窗长度及采样频率的影响及取值依据,提出由视觉位移提供位移的准静力分量,由加速度提供位移的动力分量,二者通过互补滤波融合实现高精度位移重构;其次,由视觉位移和加速度中的同频带响应进行最小二乘拟合,可以在无需任何结构尺寸与测量参数条件下,快捷、自动计算视觉位移的比例因子。通过对实验室悬索桥缩尺模型进行两种工况的试验和户外两跨连续梁桥的动载试验,验证所提出方法对桥梁位移监测的可行性。模型桥试验中,以位移计实测位移为参考,融合位移的误差比视觉位移最大减小了约50%,比例因子计算误差小于2%;实桥试验中,比例因子计算与传统计算方法的误差小于8%。在两类试验中,相比视觉位移,融合位移均能够获取试验桥梁的高阶响应。研究结果表明:所提出的方法能得到高精度、宽频域和低噪声的位移,可推进计算机视觉在桥梁结构健康监测领域的进一步应用。 展开更多
关键词 桥梁工程 桥梁位移监测 计算机视觉 数据融合 互补滤波 比例因子
原文传递
相位测量偏折术与机器人主动触觉检测相融合的透明平面玻璃三维测量
20
作者 胡慧然 宋爱国 《光学精密工程》 北大核心 2025年第15期2319-2330,共12页
传统视觉测量方法难以有效感知透明玻璃表面,而触觉检测受限于采样效率和测量分辨率,难以实现高精度面型重建。为克服这些局限性,提出了一种基于相位测量偏折术与主动触觉探测的视触融合测量方法。视觉测量提供相对表面相位梯度信息,触... 传统视觉测量方法难以有效感知透明玻璃表面,而触觉检测受限于采样效率和测量分辨率,难以实现高精度面型重建。为克服这些局限性,提出了一种基于相位测量偏折术与主动触觉探测的视触融合测量方法。视觉测量提供相对表面相位梯度信息,触觉传感提供绝对位置信息,从而有效消除梯度-高度二义性,并抑制由底面玻璃偏折引起的幽灵条纹干扰。实验搭建了一套基于深度相机Realsense D435和UR10机械臂的测量系统,并在平面与近似平面玻璃样品上进行验证。实验结果表明:该方法可实现平面与近似平面玻璃的感知与重建,相比深度相机结合显像剂的方法,提出的方法在凹面玻璃表面重建中RMS降低了80.59%,在凸面玻璃表面重建中RMS降低了96.33%。提出的方法充分利用机器人自身的视觉-触觉传感能力实现了透明玻璃的三维测量与定位,为机器人在透明玻璃的感知与重建的应用中提供了一种解决方案。 展开更多
关键词 相位测量偏折术 视触融合 玻璃检测 主动触觉检测
在线阅读 下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部