期刊文献+
共找到667篇文章
< 1 2 34 >
每页显示 20 50 100
Modeling of multi-depth slanted airgun source for deghosting 被引量:2
1
作者 沈洪垒 Elboth Thomas +1 位作者 田钢 林智 《Applied Geophysics》 SCIE CSCD 2014年第4期405-417,509,共14页
To obtain high-resolution of the subsurface structure, we modeled multidepth slanted airgun sources to attenuate the source ghost. By firing the guns in sequence according to their relative depths, such a source can b... To obtain high-resolution of the subsurface structure, we modeled multidepth slanted airgun sources to attenuate the source ghost. By firing the guns in sequence according to their relative depths, such a source can build constructive primaries and destructive ghosts. To evaluate the attenuation of ghosts, the normalized squared error of the spectrum of the actual vs the expected signature is computed. We used a typical 680 cu.in airgun string and found via simulations that a depth interval of 1 or 1.5 m between airguns is optimum when considering deghosting performance and operational feasibility. When more subarrays are combined, preliminary simulations are necessary to determine the optimum depth combination. The frequency notches introduced by the excess use of subarrays may negatively affect the deghosting performance. Two or three slanted subarrays can be combined to remove the ghost effect. The sequence combination may partly affect deghosting but this can be eliminated by matched filtering. Directivity comparison shows that a multi-depth slanted source can significantly attenuate the notches and widen the energy transmission stability area. 展开更多
关键词 deghost multi-depth slanted source
在线阅读 下载PDF
基于FaceNet的人脸识别算法研究
2
作者 季丹 《电子设计工程》 2026年第1期145-149,共5页
为了提高人脸识别的性能,提出基于FaceNet的人脸识别算法。该算法的多任务级联卷积层通过卷积和反卷积操作处理人脸图像,提取人脸特征图像块;将提取结果输入FaceNet层后,经过归一化处理并利用三元组损失函数微调该图像块,提取人脸图像... 为了提高人脸识别的性能,提出基于FaceNet的人脸识别算法。该算法的多任务级联卷积层通过卷积和反卷积操作处理人脸图像,提取人脸特征图像块;将提取结果输入FaceNet层后,经过归一化处理并利用三元组损失函数微调该图像块,提取人脸图像块深度特征参数;利用风格池化层和风格整合层的人脸特征,清晰刻画特征参数风格;将包含风格的特征参数输入至全连接层形成全局的特征表示,最终在联合损失函数的优化下,通过Softmax分类器输出人脸识别结果。实验结果表明,该方法在不同图像大小下均能可靠提取人脸特征,余弦相似度均在0.94~0.97之间;在人脸遮挡和多人脸场景下,均能较好地完成人脸识别。 展开更多
关键词 多任务级联卷积层 风格池化层 深度特征参数 风格整合层 损失函数
在线阅读 下载PDF
基于多粒度特征融合模型的多说话人声纹识别研究
3
作者 李娅 周斌 胡波 《中南民族大学学报(自然科学版)》 2026年第1期77-85,共9页
声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各... 声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各自身份,该任务的关键在于提取具判别力的说话人特征.为此提出了多粒度特征融合模型(MGFF-TDNN),在MGFF-TDNN中,首先使用二维深度可分离卷积模块(DSM)作为前端特征提取器,以增强时频域特征的建模.其次,为了实现多粒度特征融合,设计了多粒度融合结构(M-TDNN),采用时延神经网络和音素级特征池化来捕获不同粒度的信息.在VoxCeleb数据集上的实验表明:MGFF-TDNN模型在使用了更少的参数量(4.78M)和计算资源(1.49G的浮点计算量)的情况下,仍表现出良好的性能. 展开更多
关键词 声纹识别 多说话人 多粒度特征融合 深度可分离卷积
在线阅读 下载PDF
不同裂纹参数下的转子系统振动特性试验
4
作者 韩冰 刘占生 +1 位作者 何鹏 颜培刚 《振动工程学报》 北大核心 2025年第3期461-468,共8页
以具有相同结构尺寸的四根多盘转子作为研究对象,利用精密线切割的加工方式分别在四根转子的不同位置预制不同深度的横向裂纹。对裂纹参数发生改变的转子系统展开振动特性测试,并分析裂纹转子的动力学响应特征与裂纹位置和裂纹深度之间... 以具有相同结构尺寸的四根多盘转子作为研究对象,利用精密线切割的加工方式分别在四根转子的不同位置预制不同深度的横向裂纹。对裂纹参数发生改变的转子系统展开振动特性测试,并分析裂纹转子的动力学响应特征与裂纹位置和裂纹深度之间的关系。试验结果表明:1/2临界转速区的2×共振现象以及1/3临界转速区的3×共振现象是转轴裂纹故障的典型特征,其中2×共振峰值会在裂纹深度达到一个临界点后迅速增加;而区别于已有研究结果,3×共振峰值会在裂纹深度达到临界点后突降;同时,引发2×和3×共振峰值发生突变的临界深度与裂纹位置是否处于轮盘根部存在关联。 展开更多
关键词 转子动力学 振动特性试验 裂纹深度 裂纹位置 多盘转子系统
在线阅读 下载PDF
多波束声呐测深精度和分辨力校准方法
5
作者 刘永伟 高维营 +3 位作者 李肆武 刘子琦 商德江 刘立辉 《中国海洋平台》 2025年第4期60-65,71,共7页
以消声水池为依托,建立一种可拆卸的多波束声呐测深精度及分辨力校准系统。校准系统的框架由桁架、支撑杆和底座构成,底座由工字钢和钢管组成,底座上安装不同大小的识别目标块,识别目标块由钢材制成,上部为空气腔,在侧部有放气孔,在底... 以消声水池为依托,建立一种可拆卸的多波束声呐测深精度及分辨力校准系统。校准系统的框架由桁架、支撑杆和底座构成,底座由工字钢和钢管组成,底座上安装不同大小的识别目标块,识别目标块由钢材制成,上部为空气腔,在侧部有放气孔,在底部有漏水孔。在桁架下部安装机械扫描装置,可完成多波束声呐的升降和扫描运动。校准系统的测深精度为5 mm,最小分辨力为0.001 m^(3)。对一个多波束声呐开展试验测试,发现该系统可校正多波束声呐的测深精度及分辨力性能。研究结果为多波束声呐性能的准确计量奠定基础。 展开更多
关键词 多波束声呐 测深精度 分辨力性能 校准装置
在线阅读 下载PDF
基于动态多目标追踪与背景提取的视觉SLAM方法
6
作者 王庆 史晓琼 +2 位作者 严超 孙杨 冯悠扬 《中国惯性技术学报》 北大核心 2025年第9期856-863,共8页
为提升复杂动态环境下视觉同时定位与建图(SLAM)系统的定位精度,提出一种基于动态多目标追踪与背景提取的视觉SLAM方法。基于YOLOv10的目标检测结果进行多目标追踪,通过运动一致性检测区分“真动态”与“假动态”对象,并结合深度分离的... 为提升复杂动态环境下视觉同时定位与建图(SLAM)系统的定位精度,提出一种基于动态多目标追踪与背景提取的视觉SLAM方法。基于YOLOv10的目标检测结果进行多目标追踪,通过运动一致性检测区分“真动态”与“假动态”对象,并结合深度分离的“前景”与“背景”分类结果,实现对真实动态物体的像素级剔除及对假动态物体和背景的二次提取,进而采用局部滑窗的光束平差法最小化重投影误差以优化定位。在OpenLORIS和TUM数据集上的实验表明,相比Dynamic-VINS,所提方法的平均定位精度分别提升22.56%和22.23%。 展开更多
关键词 多目标追踪 YOLOv10网络 深度分离 像素级剔除 背景提取
在线阅读 下载PDF
基于多尺度时序采样的多任务感知网络
7
作者 吴绍斌 褚云峰 +2 位作者 李奕萱 姜皓舰 黄宇 《北京理工大学学报》 北大核心 2025年第8期789-797,共9页
针对时序特征融合不充分,遮挡及远距离目标难以可靠感知的问题,提出了一种联合时序多尺度鸟瞰视角特征的多任务感知网络.首先,通过对深度预测概率建模,设计具备遮挡适应性的显式深度估计模块,将图像特征映射为鸟瞰视角特征,并利用深度... 针对时序特征融合不充分,遮挡及远距离目标难以可靠感知的问题,提出了一种联合时序多尺度鸟瞰视角特征的多任务感知网络.首先,通过对深度预测概率建模,设计具备遮挡适应性的显式深度估计模块,将图像特征映射为鸟瞰视角特征,并利用深度图辅助监督;然后,为提升远距离障碍物检测效果,基于可变形注意力机制设计时序鸟瞰视角采样模块,实现时序上多尺度鸟瞰视角特征加权融合;最后,将数据增强策略拓展至多任务,并分别通过检测和分割任务头,实现三维目标检测和车道线分割. nuScenes数据集和实车实验结果证明了该方案在遮挡区域和远距离目标检测方面取得了精度提升,且推理速度可以满足实车应用要求. 展开更多
关键词 鸟瞰图 深度估计 多尺度时序采样 多任务网络
在线阅读 下载PDF
基于深度残差网络的多层多道焊缝识别 被引量:1
8
作者 何俊杰 王传睿 王天琪 《天津工业大学学报》 北大核心 2025年第1期91-96,共6页
为保证焊缝跟踪的精度并将激光条纹从强弧光、飞溅中分离出来,提出了一种基于深度残差(SRNU)网络的激光条纹分割算法。该算法是将带有弧光的图像送入SRNU模型,对内嵌于Resunet网络的编码层部分进行改进,添加SE模块和分组残差模块,对多... 为保证焊缝跟踪的精度并将激光条纹从强弧光、飞溅中分离出来,提出了一种基于深度残差(SRNU)网络的激光条纹分割算法。该算法是将带有弧光的图像送入SRNU模型,对内嵌于Resunet网络的编码层部分进行改进,添加SE模块和分组残差模块,对多层级特征信息进行提取和解析。结果表明:所提算法与Resunet算法相比,平均交并比、精确率、召回率与F1分数分别提升了0.79%、1.38%、0.50%和0.91%,说明该方法有较好的鲁棒性且具有较强的抗干扰能力,在复杂工况下也能将激光条纹从强弧光、飞溅中分离出来。 展开更多
关键词 结构光视觉传感器 深度学习 多层多道焊缝 焊缝识别 深度残差 激光条纹分割算法
在线阅读 下载PDF
CSD-YOLOv8的输电线路故障目标检测
9
作者 马旭 王锐 +6 位作者 邓军 常驰 郝帅 李添麒 刘峥岐 李国亮 赵晴 《西安科技大学学报》 北大核心 2025年第2期383-392,共10页
针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入... 针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入空间金字塔池化将不同尺度特征进行融合;然后,在检测网络头部中引入深度可分离卷积,并将其与交叉卷积连接模块结合,实现对部分遮挡目标的准确检测;此外,设计基于通道注意力机制的特征融合模块对不同层级特征进行加权融合,提高复杂背景下故障目标特征信息提取能力;最后,利用某电力巡检部门近5年的巡检数据对所提出算法进行验证。结果表明:相比于4种经典对比算法,所提方法在对12种故障类型检测效果的综合指标最好,平均检测精度为94.7%,召回率为93.0%。与此同时,所提算法具有较好的实时性,对于分辨率为1280×720的图像检测速度为45帧/s,为输电线路的智能巡检奠定了坚实的理论基础。 展开更多
关键词 YOLOv8 多尺度检测 通道注意力机制 特征融合 深度可分离模块
在线阅读 下载PDF
基于用户数据特征深度挖掘的快速图书检索算法
10
作者 窦淑庆 刘思豆 《现代电子技术》 北大核心 2025年第14期137-142,共6页
针对传统图书推荐系统所得到的计算结果滞后于实时需求且准确性较低的缺陷,文中基于用户画像数据,提出一种快速图书检索算法。该算法在用户画像构建部分对静态属性抽取和动态标签行为进行建模。在图书特征提取模型中,使用BERT-Word2Vec... 针对传统图书推荐系统所得到的计算结果滞后于实时需求且准确性较低的缺陷,文中基于用户画像数据,提出一种快速图书检索算法。该算法在用户画像构建部分对静态属性抽取和动态标签行为进行建模。在图书特征提取模型中,使用BERT-Word2Vec作为基础框架进行多模态特征提取,并利用双塔深度匹配模型构建了用户MLP塔和图书改进CNN塔,对特征进行充分细致的多维分析。模型通过将实时反馈机制Kafka-Redis流处理算法与会话注意力加权融合,最终实现了场景化的推荐。实验测试结果显示,NDCG@10指标较最优基准提升了约21.0%,行为反馈延迟在峰值500 QPS流量下小于等于3.5 s。表明所提算法能够为知识服务场景提供兼具准确性、时效性与场景适应性的信息推荐解决方案。 展开更多
关键词 用户画像 双向编码器表示技术 双塔深度匹配模型 多层感知器 卷积神经网络 推荐算法
在线阅读 下载PDF
深度经颅磁刺激线圈设计及多目标黏菌算法
11
作者 熊慧 朱记斌 刘近贞 《生物医学工程学杂志》 北大核心 2025年第4期716-723,共8页
经颅磁刺激(TMS)的治疗效果与刺激线圈的结构密切相关。基于此,本研究设计了一种A字形线圈,并提出了一种多策略融合的多目标黏菌算法(MSSMA),旨在优化线圈的刺激深度、聚焦性及刺激强度。MSSMA通过融合双精英引导机制、双曲正切调控策... 经颅磁刺激(TMS)的治疗效果与刺激线圈的结构密切相关。基于此,本研究设计了一种A字形线圈,并提出了一种多策略融合的多目标黏菌算法(MSSMA),旨在优化线圈的刺激深度、聚焦性及刺激强度。MSSMA通过融合双精英引导机制、双曲正切调控策略以及混合多项式变异策略,显著提升了算法的收敛性与多样性。此外,与其他刺激线圈相比,经本文MSSMA算法优化的新型线圈在刺激深度方面表现优异。为了验证优化效果,搭建了磁场测量系统,通过对比测量数据与仿真数据,证实了本文算法可有效优化线圈性能。综上,本研究为深度TMS提供了新的方案,所提出的算法对多目标工程优化问题具有重要的参考价值。 展开更多
关键词 黏菌算法 多目标优化 经颅磁刺激 A字形线圈 刺激深度
原文传递
浮选泡沫低照度图像颜色深度编解码校正及多尺度增强
12
作者 孙磊 唐倩 +3 位作者 廖一鹏 廖玉华 董则希 何建军 《光学精密工程》 北大核心 2025年第10期1609-1626,共18页
浮选现场环境恶劣、光照条件复杂多变,针对现场采集的浮选图像易出现曝光不足、颜色失真等问题,提出了一种低照度图像颜色深度编解码校正及多尺度增强方法。首先,将低照度图像从RGB转换至HSV空间,针对明度(V)分量,采用非下采样剪切波变... 浮选现场环境恶劣、光照条件复杂多变,针对现场采集的浮选图像易出现曝光不足、颜色失真等问题,提出了一种低照度图像颜色深度编解码校正及多尺度增强方法。首先,将低照度图像从RGB转换至HSV空间,针对明度(V)分量,采用非下采样剪切波变换(NSST)进行多尺度分解;其次,提出基于全局空间模块的色彩编解码网络,通过挤压提取、色彩编码、色彩解码、颜色校正构建颜色深度编解码校正网络模型,对色度(H)、饱和度(S)分量进行颜色校正;然后,采用自适应模糊集增强V分量的低频子带图像,利用尺度相关系数有效滤除V分量中各高频子带的噪声成分,同时使用非线性增益函数对高频边缘系数进行显著增强处理;最后,对增强后的V分量各子带图像作NSST反变换重构,并将重构后的V分量与校正后的H分量、S分量融合转换回RGB空间。通过实验验证,与当前的主流方法相比,本文方法CIEDE平均降低14.8358,PSNR平均提高8.48 dB,结构相似度平均提高31.32%,连续边缘像素比保持在91%以上。本文方法显著改善了图像的亮度,提升了对比度、清晰度和信息熵,使图像颜色更接近真实色彩,保留了更多纹理细节,并在有效抑制噪声的同时,实现了边缘增强。 展开更多
关键词 浮选泡沫 低照度图像 颜色校正 颜色深度编解码网络 多尺度增强与去噪 非下采样剪切波变换 模糊集
在线阅读 下载PDF
基于多尺度门控卷积与深度注意力的时序分类方法 被引量:1
13
作者 杨瑞 张海清 +3 位作者 李代伟 Rattasit Sukhahuta 于曦 唐聃 《软件导刊》 2025年第2期33-39,共7页
针对现有时序分类方法难以充分捕捉序列中的深层特征以及特征学习不足的问题,提出一种基于多尺度门控卷积与深度注意力的时序分类网络MGDA-Net,有效提高了时序分类任务的准确率。MGDA-Net利用多尺度门控卷积模块捕获多尺度信息,并通过... 针对现有时序分类方法难以充分捕捉序列中的深层特征以及特征学习不足的问题,提出一种基于多尺度门控卷积与深度注意力的时序分类网络MGDA-Net,有效提高了时序分类任务的准确率。MGDA-Net利用多尺度门控卷积模块捕获多尺度信息,并通过门控机制筛选和调控特征流动来增强特征提取能力。同时,利用深度注意力模块,在保留通道间关系的基础上进一步捕获特征之间的空间关系,提升模型对重要特征的学习能力;引入残差链接促进特征复用和信息流动。实验结果显示,MGDA-Net在20个时序数据集上取得了最高排名和最低平均误差,在多个高维度数据集上的分类准确率提升2.3%~10.5%,证明了其有效性。 展开更多
关键词 时间序列分类 多尺度门控卷积 深度注意力 残差网络
在线阅读 下载PDF
基于多尺度特征融合和边缘增强的多传感器融合3D目标检测算法
14
作者 刘建国 陈文 +5 位作者 赵奕凡 周琪 颜伏伍 尹智帅 郑灏 吴友华 《重庆大学学报》 北大核心 2025年第8期78-85,共8页
基于BEV(bird’s eye view)多传感器融合的自动驾驶感知算法近年来取得重大进展,持续促进自动驾驶的发展。在多传感器融合感知算法研究中,多视角图像向BEV视角的转换和多模态特征融合一直是BEV感知算法的重点和难点。笔者提出MSEPE-CRN(... 基于BEV(bird’s eye view)多传感器融合的自动驾驶感知算法近年来取得重大进展,持续促进自动驾驶的发展。在多传感器融合感知算法研究中,多视角图像向BEV视角的转换和多模态特征融合一直是BEV感知算法的重点和难点。笔者提出MSEPE-CRN(multi-scale feature fusion and edge and point enhancement-camera radar net),一种用于3D目标检测的相机与毫米波雷达融合感知算法,利用边缘特征和点云提高深度预测的精度,实现多视角图像向BEV特征的精确转换。同时,引入多尺度可变形大核注意力机制进行模态融合,解决因不同传感器特征差异过大导致的错位。在nuScenes开源数据集上的实验结果表明,与基准网络相比,mAP提升2.17%、NDS提升1.93%、mATE提升2.58%、mAOE提升8.08%、mAVE提升2.13%,该算法可有效提高车辆对路面上运动障碍物的感知能力,具有实用价值。 展开更多
关键词 3D目标检测 Bird’s eye view 多模态融合 深度预测
在线阅读 下载PDF
基于深度学习的RGB-D图像显著性目标检测前沿进展 被引量:3
15
作者 黄年昌 杨阳 +1 位作者 张强 韩军功 《计算机学报》 北大核心 2025年第2期284-316,共33页
显著性目标检测是计算机视觉领域的基础问题之一,旨在对图像中最吸引人注意的目标进行检测和分割。随着深度学习技术的发展,基于RGB(Red-Green-Blue)图像的显著性目标检测算法取得了巨大进步,在简单场景下已经取得较为满意的结果。然而... 显著性目标检测是计算机视觉领域的基础问题之一,旨在对图像中最吸引人注意的目标进行检测和分割。随着深度学习技术的发展,基于RGB(Red-Green-Blue)图像的显著性目标检测算法取得了巨大进步,在简单场景下已经取得较为满意的结果。然而,局限于可见光相机的成像能力,RGB图像易受到光照条件的影响,且无法捕捉场景的三维空间信息。相应地,基于RGB图像的显著性目标检测算法通常难以在一些复杂场景下取得较好的检测效果。近年来,随着深度成像技术不断发展和硬件成本不断降低,深度相机得到了广泛应用。其捕获的场景空间信息,与可见光图像获取的场景细节信息相互补充,有助于提升复杂场景下显著性目标检测性能。因此,RGB-深度(RGB-Depth,RGB-D)图像显著性目标检测引起了学者广泛研究。本文对近期基于深度学习的RGB-D图像显著性目标检测算法进行了整理和分析。首先,分析了多模态RGB-D图像显著性目标检测所面临的关键问题,并以此对现有算法解决这些关键问题的主要思路和方法进行了总结和梳理。然后,介绍了用于RGB-D图像显著性目标检测算法研究的主流数据集和常用性能评价指标,并对各类主流模型进行了定量比较和定性分析。最后,本文进一步分析了RGB-D图像显著性目标检测领域有待解决的问题,同时对今后可能的研究趋势进行了展望。 展开更多
关键词 显著性目标检测 RGB图像 深度图像 深度学习 多模态图像处理
在线阅读 下载PDF
基于多视角边缘检测融合的放射性物品运输容器特征提取
16
作者 张沛东 肖连博 +4 位作者 张煜航 焦力敏 孙洪超 庄大杰 李国强 《包装工程》 北大核心 2025年第11期294-302,共9页
目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包... 目的针对放射性物品运输容器可靠性评估中存在的三维形变测量精度不足的瓶颈问题,提出一种融合多视角深度图投影与亚像素边缘检测的三维点云特征提取方法,以高精度几何特征数据支撑容器的结构优化设计与安全验证。方法首先,构建最小包围立方体,并设计六自由度多视角正交投影系统,将三维点云降维映射至二维深度图,实现容器全表面覆盖;其次,基于拟合边缘模型及局部灰度面积效应,检测亚像素边缘点;进一步结合投影参数化映射与动态曲率插值算法,引入法向量连续性约束及加权融合策略,重构高保真三维特征点;最后,搭建实验系统,获取容器三维点云数据,基于简化率、配准误差及计算时间指标,并与现有点云特征提取方法进行对比。结果采用所提方法获取特征点云,其配准最大平均误差为1.33 mm,最大均方根误差为1.39 mm,简化率为1.6%。与其他文献的结果相比,所提方法的简化率更小,计算时间更短,且误差更小。结论所提方法有效解决了大规模点云处理与几何特征保真之间的矛盾,显著提升了放射性容器三维特征提取的精度和效率,为核能工程安全评估提供了可靠的几何形变量化分析技术支撑。 展开更多
关键词 放射性物品运输容器 三维形变测量 多视角深度图融合 亚像素边缘检测
在线阅读 下载PDF
基于自监督学习的热成像与激光雷达融合深度补全方法 被引量:1
17
作者 于睿 马国梁 +1 位作者 郭健 许立松 《仪器仪表学报》 北大核心 2025年第1期170-181,共12页
深度补全是一种利用稀疏深度数据生成高分辨率稠密深度图的环境感知技术。然而,现有深度补全算法在昏暗或低照度场景中预测深度图的准确度不足,在极端光照条件下的应用效果较差。针对该问题,提出一种基于自监督深度学习的热成像与激光... 深度补全是一种利用稀疏深度数据生成高分辨率稠密深度图的环境感知技术。然而,现有深度补全算法在昏暗或低照度场景中预测深度图的准确度不足,在极端光照条件下的应用效果较差。针对该问题,提出一种基于自监督深度学习的热成像与激光雷达融合深度补全方法,用于训练网络模型在低光照或无光照的条件下生成像素级稠密的深度图。所提网络为编码器-解码器架构,以热图像和激光雷达的稀疏深度图作为编码器输入,在不同图像尺度上进行特征融合,解码器逐层对融合后的特征进行上采样和深度预测,生成稠密深度图。其次,设计了基于自注意力与跨注意力机制的多模态融合模块嵌入到编码器,通过自适应加权增强特征融合效果,提升预测稠密深度图的准确度。最后,构建了自监督学习框架,利用温度重建损失和稀疏深度损失进行自监督训练,无需额外的深度真值标注过程。在公开数据集上的实验验证表明,所提方法在不同光照条件下均能稳定生成稠密深度图。相较于现有深度补全基准方法,平均绝对误差在MS2和VIVID数据集上分别降低了44.49%和25.28%。在低光或无光环境下,通过融合热成像与激光雷达数据的互补优势,显著提高了深度预测的准确性和稳健性,为低光照场景下的环境感知提供了有效解决方案。 展开更多
关键词 深度图补全 多传感器数据融合 热成像 自监督学习 环境感知
原文传递
多尺度代价聚合的多聚焦图像3维形貌重建框架 被引量:2
18
作者 闫涛 尚起慧 +3 位作者 吴鹏 张江峰 钱宇华 陈斌 《计算机研究与发展》 北大核心 2025年第7期1771-1785,共15页
多聚焦图像3维形貌重建旨在利用不同聚焦水平的图像序列恢复场景的3维结构信息.现有的3维形貌重建方法大多从单一尺度对图像序列的聚焦水平进行评价,通过引入正则化或后处理方法引导重建过程,由于深度信息选择空间的局限性往往导致重建... 多聚焦图像3维形貌重建旨在利用不同聚焦水平的图像序列恢复场景的3维结构信息.现有的3维形貌重建方法大多从单一尺度对图像序列的聚焦水平进行评价,通过引入正则化或后处理方法引导重建过程,由于深度信息选择空间的局限性往往导致重建结果无法有效收敛.针对上述问题,提出一种多尺度代价聚合的多聚焦图像3维形貌重建框架(multi-scale cost aggregation framework for 3D shape reconstruction from multi-focus images,MSCAS),该框架首先引入非降采样的多尺度变换增加输入图像序列的深度信息选择空间,然后联合尺度内序列关联与尺度间信息约束进行代价聚合,通过这种扩张-聚合模式实现了场景深度表征信息的倍增与跨尺度和跨序列表征信息的有效融合.作为一种通用框架,MSCAS框架可实现已有模型设计类方法和深度学习类方法的嵌入进而实现性能提升.实验结果表明:MSCAS框架在嵌入模型设计类SFF方法后4组数据集中的均方根误差(root mean squared error,RMSE)平均下降14.91个百分点,结构相似度(structural similarity index measure,SSIM)平均提升56.69个百分点,嵌入深度学习类SFF方法后4组数据集中的RMSE平均下降1.55个百分点,SSIM平均提升1.61个百分点.验证了MSCAS框架的有效性和通用性. 展开更多
关键词 多尺度代价聚合 深度估计 聚焦测量 多聚焦图像序列 3维形貌重建
在线阅读 下载PDF
基于导向化神经辐射场的室内多视点深度估计算法研究
19
作者 季祥昊 李礼 姚剑 《测绘地理信息》 2025年第3期80-85,共6页
神经辐射场(neural radiance field,NeRF)方法能够在任意输入视角下完成高质量的视图合成,为场景表达提供了一种全新的思路。针对NeRF在深度估计任务上存在很大误差,且训练缓慢,内存开销大的问题,提出了一种新的基于导向化神经辐射场进... 神经辐射场(neural radiance field,NeRF)方法能够在任意输入视角下完成高质量的视图合成,为场景表达提供了一种全新的思路。针对NeRF在深度估计任务上存在很大误差,且训练缓慢,内存开销大的问题,提出了一种新的基于导向化神经辐射场进行深度估计的方法,与现有的基于神经网络的优化方法依赖于估计的对应关系不同,所提出的方法直接对隐式体素进行优化,消除了传统多视点深度估计方法在室内场景中匹配像素的困难。本方法的关键是利用低质量深度先验来指导NeRF的优化过程,通过深度先验将NeRF采样范围缩小至更加合适的区间,减少了不必要的光线采样,从而加快了网络训练速度,并提高输出深度图的质量以及视图合成的速度。实验表明,所提出的方法在室内场景上的表现优于现有的许多方法,同时还增强了视图合成能力,达成了比NeRF方法更优的视图合成质量。 展开更多
关键词 神经辐射场 多视点深度估计 光线采样 视图合成
原文传递
融合并行多卷积注意力的扩散模型去雾方法
20
作者 崔欣桐 王瑛 +3 位作者 邓真楠 王浚瞩 梁铮 邓红霞 《计算机工程与设计》 北大核心 2025年第7期2081-2088,共8页
针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注... 针对目前去雾方法细节模糊、对真实环境去雾不彻底等问题,提出一种融合并行多卷积注意力的条件扩散模型。将有雾图像作为条件先验引入扩散模型,提升扩散模型对尘雾的理解能力;设计构建并行多卷积注意力残差块,通过不同尺度卷积和不同注意力机制加强模型对尘雾区域的关注,提升模型对有雾图像的特征提取能力;使用SKFusion进行带权特征融合,更大限度保留重要的浅层特征;使用双3次下采样和拉普拉斯金字塔处理图像,降低模型参数和计算复杂度。通过将该方法与其它方法在不同数据集进行多种对比实验和消融实验,验证了该方法在图像去雾上的有效性。 展开更多
关键词 图像去雾 深度学习 扩散模型 并行多卷积注意力 深度可分离卷积 残差连接 多尺度特征融合
在线阅读 下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部