期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
局部特征引导的室内自监督单目深度估计方法的改进
1
作者 艾浩军 张锋 +2 位作者 吕鹏飞 唐雪华 王中元 《计算机研究与发展》 北大核心 2026年第2期338-351,共14页
近年来,自监督单目深度估计方法取得了显著的性能提升,但在复杂的室内场景生成结构化深度图时性能明显下降,为此,提出局部特征引导知识蒸馏的自监督单目深度估计方法LoFtDepth改进训练过程。首先,使用预训练的深度估计网络预测结构化的... 近年来,自监督单目深度估计方法取得了显著的性能提升,但在复杂的室内场景生成结构化深度图时性能明显下降,为此,提出局部特征引导知识蒸馏的自监督单目深度估计方法LoFtDepth改进训练过程。首先,使用预训练的深度估计网络预测结构化的相对深度图作为深度先验,从中提取局部特征作为边界点引导局部深度估计细化,减少深度无关特征的干扰,将深度先验中的边界知识传递到自监督深度估计网络中。同时,引入逆自动掩模加权的表面法线损失,通过对齐自监督网络预测的深度图和深度先验在无纹理区域的法线方向来提升深度估计精度。最后,根据相机运动的连续性,对相机位姿残差估计施加位姿一致性约束以适应室内场景相机位姿的频繁变化来减小训练误差和提升模型性能。主要的室内公开数据集上的实验结果表明,LoFtDepth性能提升显著,将相对误差降至0.121,且生成的深度图具有更高的全局准确度和良好的结构特征。 展开更多
关键词 单目深度估计 自监督学习 局部特征 知识蒸馏 表面法线约束
在线阅读 下载PDF
基于互补注意力记忆机制的方面级抽象式文本摘要研究
2
作者 李祖超 张石头 +2 位作者 艾浩军 李奇伟 王平 《中文信息学报》 北大核心 2025年第8期158-169,共12页
方面级抽象式文本摘要(Aspect-based Abstract Summarization,ABAS)是一项旨在为特定用户定制关注特定方面摘要的具有挑战性的新任务。该文提出了互补注意力记忆(Complementary Attentional Memory,CoAM)方法,通过记忆机制增强ABAS任务... 方面级抽象式文本摘要(Aspect-based Abstract Summarization,ABAS)是一项旨在为特定用户定制关注特定方面摘要的具有挑战性的新任务。该文提出了互补注意力记忆(Complementary Attentional Memory,CoAM)方法,通过记忆机制增强ABAS任务中的方面-上下文交互建模。该文将CoAM与摘要模型BART集成,实现特定方面与上下文特征更好的聚合,生成更高质量的摘要。在多个现有数据集上的实验结果表明,CoAM模型优于现有的包括大模型在内的基线模型,并具有跨领域的鲁棒泛化能力。为了检验CoAM模型在不同语言环境下的效果,该文构建了中文方面级抽象式文本摘要数据集CABAS,并在该数据集上进行了人工标注和模型评估,以推动中文精细化方面级文本摘要的发展。 展开更多
关键词 互补注意力 记忆机制 方面级抽象式文本摘要
在线阅读 下载PDF
基于扩散模型的室内定位射频指纹数据增强方法 被引量:5
3
作者 艾浩军 曾维珂 +2 位作者 陶荆杰 徐锦盈 常含笑 《通信学报》 EI CSCD 北大核心 2023年第11期201-212,共12页
射频指纹室内定位方法通过在离线阶段采集足量信号指纹建立密集指纹库保证定位精度。为降低指纹采集成本,提出一种基于扩散模型的射频指纹数据增强方法(FPDiffusion)。首先建立指纹序列的时序图表示,通过高斯加噪方法实现扩散模型的前... 射频指纹室内定位方法通过在离线阶段采集足量信号指纹建立密集指纹库保证定位精度。为降低指纹采集成本,提出一种基于扩散模型的射频指纹数据增强方法(FPDiffusion)。首先建立指纹序列的时序图表示,通过高斯加噪方法实现扩散模型的前向过程,反向过程采用U型自编码器网络,根据射频指纹特性设计了网络的损失函数,最后给出了基于稀疏指纹生成稠密指纹的计算过程。实验结果表明,在仅有少量有标签指纹的情况下,FPDiffusion方法在K-近邻(KNN)和卷积神经网络(CNN)算法上的定位误差降低率分别达到76%和28%,在KNN上的定位精度相比高斯过程回归(GPR)和GPR-GAN方法有显著提升。 展开更多
关键词 扩散模型 数据增强 射频指纹 室内定位
在线阅读 下载PDF
一种混合协同定位的多机器人通信方法研究
4
作者 艾浩军 韩亮亮 +2 位作者 黄乐 金子龙 王壹丰 《载人航天》 CSCD 北大核心 2019年第5期646-651,共6页
针对月面环境下无GPS定位的多机器人之间组网通信与全局定位问题,提出了一种混合定位的多机器人精准通信方法。首先利用自定位和相对定位结合、近定位和远定位结合的方案,实现月面多机器人的精准定位,然后采用基于MODBUS的网络通信方法... 针对月面环境下无GPS定位的多机器人之间组网通信与全局定位问题,提出了一种混合定位的多机器人精准通信方法。首先利用自定位和相对定位结合、近定位和远定位结合的方案,实现月面多机器人的精准定位,然后采用基于MODBUS的网络通信方法进行信息互通,将接收的信息数据进行自动缓存和融合,最后进行通讯信息分析和定位融合处理。此外,将提出的通信组网框架在STM32平台上进行开发和测试,在400 m实验测试中通信正常,定位精度达到米级。 展开更多
关键词 MODBUS 无线组网 通信与定位平台 中断机制
在线阅读 下载PDF
Shallow Convolutional Neural Networks for Acoustic Scene Classification 被引量:5
5
作者 LU Lu YANG Yuhong +2 位作者 JIANG Yuzhi ai haojun TU Weiping 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2018年第2期178-184,共7页
Recently, deep neural networks, which include convolutional neural networks(CNNs), have been widely applied to acoustic scene classification(ASC). Motivated by the fact that some simplified CNNs have shown improve... Recently, deep neural networks, which include convolutional neural networks(CNNs), have been widely applied to acoustic scene classification(ASC). Motivated by the fact that some simplified CNNs have shown improvements over deep CNNs, such as Visual Geometry Group Net(VGG-Net), we have figured out how to simplify the VGG-Net style architecture to a shallow CNN with improved performance. Max pooling and batch normalization are also applied for better accuracy. With a series of controlled tests on detection and classification of acoustic scenes and events(DCASE) 2016 data sets, our shallow CNN achieves 6.7% improvement, and reduces time complexity to 5%, compared with the VGG-Net style CNN. 展开更多
关键词 acoustic scene classification convolutional neuralnetworks Mel-spectrogram
原文传递
基于双重语义对比学习的无监督红外图像生成方法
6
作者 程梓萌 杨馨悦 +1 位作者 艾浩军 王中元 《计算机科学》 2026年第4期260-268,共9页
红外图像在计算机视觉领域应用广泛。受制于采集条件,高质量红外图像数据集规模较小。把可见光图像转换为红外图像,是扩充红外数据集的有效手段。现有生成方法多依赖有监督学习,需要大量配对数据。为此,提出基于双重语义对比学习的无监... 红外图像在计算机视觉领域应用广泛。受制于采集条件,高质量红外图像数据集规模较小。把可见光图像转换为红外图像,是扩充红外数据集的有效手段。现有生成方法多依赖有监督学习,需要大量配对数据。为此,提出基于双重语义对比学习的无监督红外图像生成方法DSCGAN。该方法采用双向转换架构,通过语义对比学习增强图像内容保持能力和红外特征学习能力。损失函数增加几何一致性损失,协助保留可见光图像的原始结构与细节。同时,构建多尺度PatchGAN判别器,增强判别能力,提升生成图片的真实感。在AVIID-1,AVIID-2和Day-DroneVehicle数据集上的实验表明,DSCGAN在多项指标上优于对比方法,生成的红外图像热辐射分布更合理,视觉质量更优。在AVIID-1数据集中,DSCGAN的SSIM值提升至0.8144,FID分数降低至0.1456。在Day-DroneVehicle数据集中,DSCGAN的PSNR值提升至18.14,LPIPS值降低至0.2949。所提方法为无监督红外图像生成提供了新思路,可进一步应用于红外目标检测和场景分割等下游任务。 展开更多
关键词 图像到图像转换 语义对比学习 红外图像生成 多尺度判别器 几何一致性约束
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部