期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
结合多尺度与多层级聚合的卷轴画图像描述模型
1
作者 乐超洋 胡文瑾 张福军 《现代电子技术》 北大核心 2025年第17期41-47,共7页
针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可... 针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可以有效提高卷积层获取空间信息的能力并融合卷轴画图像全局和局部的多尺度上下文信息,从而得到具有丰富语义信息的特征表示。在解码阶段,设计了多层级聚合网络,通过聚合不同编码层的特征实现高层编码层语义信息和低层编码层内容信息的有效利用,从而有效缓解信息丢失的问题。实验结果表明,该模型在卷轴画数据集上取得了不错效果,较NIC模型在BLEU-4、METEOR上分别提高了26.7%、0.9%,并生成准确性更高的描述语句。 展开更多
关键词 图像描述 卷轴画图像 多尺度特征 非对称卷积 多层级聚合解码 TRANSFORMER
在线阅读 下载PDF
基于多阶门控聚合网络的光学化学结构识别
2
作者 林帆 李建华 《计算机工程》 北大核心 2025年第8期364-372,共9页
在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而... 在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次在序列解码时采用引入相对位置编码的Transformer作为解码器,精准捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建一个包含40万个分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。 展开更多
关键词 光学化学结构识别 编码解码架构 深度学习 SMILES表达式 多阶门控聚合网络
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
3
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
基于特征聚合和Gaussian-Laplacian-Logistic混合模型的图像压缩
4
作者 朱俊 刘磊 +2 位作者 王帅 王珺 谭伟彪 《淮北师范大学学报(自然科学版)》 2025年第2期32-41,共10页
图像压缩在细节恢复和复杂场景处理方面存在局限,尤其在长距离上下文信息的利用上。为解决这一问题,提出一种基于自注意力特征聚合机制和Gaussian-Laplacian-Logistic混合模型。该模型通过融合不同层次的特征,有效捕捉长距离信息关系,... 图像压缩在细节恢复和复杂场景处理方面存在局限,尤其在长距离上下文信息的利用上。为解决这一问题,提出一种基于自注意力特征聚合机制和Gaussian-Laplacian-Logistic混合模型。该模型通过融合不同层次的特征,有效捕捉长距离信息关系,增强特征表达能力。提出创新性特征聚合模块,将压缩特征与Transformer中间层特征结合,提供更丰富的上下文信息,改善图像重建中的细节恢复和结构保持。引入Gaussian-Laplacian-Logistic混合模型,根据图像局部特征自适应调整,提高压缩效率。实验表明,所提模型在峰值信噪比(peak signal-to-noise ratio,PSNR)和多尺度结构相似性(multi-scale structural similarity,MS-SSIM)性能上优于传统学习压缩和标准压缩技术,特别在高复杂度图像和细节恢复方面表现突出。 展开更多
关键词 深度学习 图像压缩 特征聚合 混合模型 编码器-解码器架构 视频编码
在线阅读 下载PDF
面向6G的RM码编译码方案
5
作者 陈芳 陈景灿 +2 位作者 秦海生 魏岳军 李莉萍 《移动通信》 2025年第2期51-57,共7页
纠错编码是提升信道可靠性的重要途径。里德-穆勒(Reed-Muller)码作为最古老和最流行的码之一,其独特的码字结构使得编码和译码都具有较低的复杂度,并且可为其他码型的研究提供参考。2017年,RM码被证明可以在二进制擦除信道上实现信道容... 纠错编码是提升信道可靠性的重要途径。里德-穆勒(Reed-Muller)码作为最古老和最流行的码之一,其独特的码字结构使得编码和译码都具有较低的复杂度,并且可为其他码型的研究提供参考。2017年,RM码被证明可以在二进制擦除信道上实现信道容量,使得RM码的理论与应用再次引起关注。对RM码的编码结构和现有的译码算法进行论述与总结,并对当前译码算法的改进和发展进行综合论述。最后,对RM码作为6G的候选编码方案,未来需要开展的研究方向进行展望。 展开更多
关键词 RM码 RM码编码 递归列表译码 递归投影聚合译码 删余
在线阅读 下载PDF
基于多路信息聚合协同解码的单通道语音增强 被引量:1
6
作者 莫尚斌 王文君 +2 位作者 董凌 高盛祥 余正涛 《计算机应用》 CSCD 北大核心 2024年第8期2611-2617,共7页
为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复... 为了改善基于卷积编解码架构的单通道语音增强网络对语音声学特征提取不充分、解码特征丢失严重的问题,提出一种基于多路信息聚合协同解码的单通道语音增强网络MIACD,通过双路编码器充分提取融入了语音自监督学习(SSL)表征的幅度谱和复数谱特征,由4层Conformer分别从时间和频率维度对提取特征建模,采用残差连接将双路编码器提取的语音幅度、复数特征引入三路信息聚合解码器,并利用所提通道-时频注意力(CTF-Attention)机制根据语音能量分布情况调节解码器中聚合信息,有效缓解解码时可用声学信息缺失严重的问题。在公开数据集Voice Bank DEMAND上的实验结果表明,与用于单通道语音增强的协作学习框架(GaGNet)相比,MIACD在客观评价指标宽带感知评估语音质量(WB-PESQ)上提升了5.1%,短时客观可懂度(STOI)达到96.7%,验证所提方法可充分利用语音信息重构信号,有效抑制噪声并提升语音可理解性。 展开更多
关键词 声学特征 多路信息聚合 双路编码器 三路信息聚合解码器 通道-时频注意力机制
在线阅读 下载PDF
A new insight into aggregation structure of organic solids and its relationship to room-temperature phosphorescence effect 被引量:1
7
作者 Mingxue Gao Jia Ren +3 位作者 Yanxiang Gong Manman Fang Jie Yang Zhen Li 《Aggregate》 EI CAS 2024年第2期370-377,共8页
In order to improve the performance of organic luminescent materials,lots of studies have been carried out at the molecular level.However,these materials are mostly applied as solids or aggregates in practical applica... In order to improve the performance of organic luminescent materials,lots of studies have been carried out at the molecular level.However,these materials are mostly applied as solids or aggregates in practical applications,in which the relationship between aggregation structure and luminescent property should be paid more attention.Here,we obtained five phenothiazine 5,5-dioxide(O-PTZ)derivatives with distinct molecular conformations by rational design of chemical structures,and systematically studied their room-temperature phosphorescence(RTP)effect in solid state.It was found that O-PTZ dimers with quasi-equatorial(eq)conformation tended to show strongerπ-πinteraction than quasi-axial(ax)conformers in crystal state,which was more conducive to the generation of RTP.Based on this result,a multi-level structural model of organic solids was proposed to draw the relationship between aggregation structure and RTP effect,just like the research for the structureproperty relationship of proteins.Using this structural model as the guide,boosted RTP efficiency from 1%to 20%was successfully achieved in the corresponding host-vip doping system,showing its wide applicability. 展开更多
关键词 molecular conformation multi-level structural model room-temperature phosphorescence phenothiazine 5 5-dioxide derivatives aggregation
在线阅读 下载PDF
基于信息融合和数据增强的篇章级事件检测方法
8
作者 谭立君 胡艳丽 +1 位作者 曹健威 谭真 《计算机科学与探索》 CSCD 北大核心 2024年第11期3015-3026,共12页
事件检测是自然语言处理领域的关键任务,旨在识别事件触发词并正确分类其事件类型。语句级事件检测方法未能有效利用文本中的句内和句间事件相关性信息,面临着一词多义、事件共现等众多难题。此外,基于神经网络的事件检测模型需要大量... 事件检测是自然语言处理领域的关键任务,旨在识别事件触发词并正确分类其事件类型。语句级事件检测方法未能有效利用文本中的句内和句间事件相关性信息,面临着一词多义、事件共现等众多难题。此外,基于神经网络的事件检测模型需要大量的文本数据作为训练支撑,但语料库的数据不足严重影响着结果的准确率及模型的稳定性。针对上述问题,提出了基于信息融合和数据增强的篇章级事件检测方法LGIA。该方法采用编-解码框架,设计了基于膨胀卷积网络的句子级局部信息抽取模块和基于条件层归一化的篇章级全局信息抽取模块,以深入挖掘整个文档的上下文语义信息和事件间的相关性。同时,采用了同义词替换的数据增强策略,有效扩充了数据样本,从而缓解了数据不足问题带来的影响。经实验验证,LGIA方法在ACE2005数据集上取得了较好的结果,并在数据增强后的TAC-KBP2017数据集上得到了显著的性能提升,F1值分别达到了77.6%和65.3%,相较于现有的基线方法展现出了更优越的性能表现。 展开更多
关键词 事件检测 信息融合 数据增强 编码-解码框架
在线阅读 下载PDF
基于分层解码和渐进融合的快速显著性目标检测 被引量:1
9
作者 杨爱萍 王子麒 +1 位作者 程思萌 刘彦 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第7期721-728,共8页
现有显著性目标检测方法大多只关心模型的检测精度,容易忽略模型的编解码效率,导致网络运行速度较慢.针对上述问题,本文提出一种基于分层解码和渐进融合的快速显著性目标检测网络,并分别设计语义提取模块、空间增强模块和边界提取模块,... 现有显著性目标检测方法大多只关心模型的检测精度,容易忽略模型的编解码效率,导致网络运行速度较慢.针对上述问题,本文提出一种基于分层解码和渐进融合的快速显著性目标检测网络,并分别设计语义提取模块、空间增强模块和边界提取模块,对编码器提取到的多尺度特征进行分层筛选和高效解码.其中,语义提取模块可准确定位显著性目标的整体区域,空间增强模块可完整保留显著性目标的空域信息,边界提取模块可增强显著性目标的边界轮廓.由于不同层级特征的感受野和分辨率不同,本文设计了邻间聚合模块和边界细化模块,对筛选后的特征进行渐进式融合并逐步细化得到最后的显著性预测图.实验结果表明,所提方法不仅能够得到边界清晰、区域完整的显著性预测图,还能显著提升模型的编解码效率,快速检测显著性目标,在ECSSD和HKU-IS数据集上的最大值F max分别为0.947和0.936,优于其他方法. 展开更多
关键词 显著性目标检测 分层解码 渐进融合 邻间聚合 边界细化
在线阅读 下载PDF
面向生物医学数据库的图像边缘检测与分割技术研究 被引量:1
10
作者 陈迪 陈云虹 +1 位作者 程红阳 叶青 《电子设计工程》 2024年第17期180-184,共5页
针对传统自然图像边缘检测分割算法处理医学图像时存在有精度低、效率差的问题,文中基于Transformer和CNN提出了一种图像边缘分割算法。该算法用窗口多头注意力机制替代原Trans⁃former结构中的多头注意力机制,增强了模型的训练精度。同... 针对传统自然图像边缘检测分割算法处理医学图像时存在有精度低、效率差的问题,文中基于Transformer和CNN提出了一种图像边缘分割算法。该算法用窗口多头注意力机制替代原Trans⁃former结构中的多头注意力机制,增强了模型的训练精度。同时,通过改进CNN模型实现了对全局特征和局部特征的兼顾。上采样部分采用渐进式解码器,并利用逐步聚合模块融合全局特征和局部特征,进一步减少了图像分割带来的精度损失。在实验测试中,所提算法的准确率、召回率以及F1值在主流对比算法中均为最优,证明其综合性能较为理想。 展开更多
关键词 医学图像分割 Transformer结构 卷积神经网络 渐进式解码器 逐步聚合模块
在线阅读 下载PDF
基于双流增强编码和注意优化解码的图像篡改定位算法
11
作者 朱叶 赵晓祥 于洋 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1103-1115,共13页
主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通... 主流图像篡改定位方法通常通过简单操作融合不同流的不一致特征,导致特征冗余且篡改区域的像素误检。基于此,本文提出基于双流增强编码和注意优化解码的图像篡改定位框架。首先,提出双流增强编码分别对图像和频域特征进行基于噪声和通道注意力的自增强和基于特征映射的交叉注意权重的交互增强。随后,引入多级感受野策略探索多尺度上下文信息,设计邻阶特征聚合模块融合多尺度相邻特征。最后,利用篡改区域和非篡改区域协同增强模型的篡改定位能力,提出注意优化解码模块,消除初始篡改区域预测中边缘像素的错误预测,逐步精确细化篡改定位。在4个主流公共基准数据集NIST16、Coverage、Columbia、CASIA和两个现实挑战数据集IMD20、Wild上与主流篡改定位方法进行对比,本文算法在无微调模型和微调模型两个设置下,在6个数据集上的性能最优,证明本文提出的篡改定位网络能够充分利用多种篡改线索,在不同的篡改数据集上实现篡改区域的有效定位,具有更高的定位精度和更强的鲁棒性。 展开更多
关键词 图像篡改定位 双流增强编码 注意优化解码 邻阶特征聚合
在线阅读 下载PDF
基于上下文聚合策略的轻量级编/解码抓取位姿检测 被引量:4
12
作者 徐胜军 任君琳 +2 位作者 刘光辉 孟月波 韩九强 《机器人》 EI CSCD 北大核心 2023年第6期641-654,共14页
针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网... 针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网络参数量,增强网络对抓取区域特征的提取能力;其次,利用双线性插值法和深度可分离卷积层建立深度分离-重构块,在恢复高层特征丢失信息的同时,有效减少解码网络的参数量;最后,针对可抓取区域像素点与目标物体全貌之间的非一致性问题,基于交叉熵辅助损失和自注意力机制,提出一种抓取区域上下文聚合策略,引导网络增强可抓取目标区域特征的表征能力,抑制非抓取像素点的冗余特征。实验结果表明,所提网络在Cornell数据集的图像拆分与对象拆分子集上抓取检测准确率分别可达97.8%与93.8%,单张图像检测速度可达64.93张/秒;在Jacquard数据集上抓取检测准确率可达95.1%,单张图像检测速度可达60.6张/秒。与对比网络相比,所提网络不仅计算量与参数量较小,而且抓取检测的准确率与速度均有明显提升,在真实场景下对9种物体的抓取检测验证中,抓取成功率达到93.3%。 展开更多
关键词 非结构化环境 编/解码网络 上下文聚合 轻量级 抓取位姿
原文传递
MIME文档和集合文档的解码算法
13
作者 龙恒 《计算机时代》 2010年第9期48-51,共4页
MIME(Multipurpose Internet Mail Extensions)主要用于电子邮件传输非文本数据。它兼容旧版本的信息格式,使得那些旧的应用网关也可以处理MIME格式的信息,并增加了许多功能,可以用邮件传输二进制数据。集合文档是MIME格式的一种应用,... MIME(Multipurpose Internet Mail Extensions)主要用于电子邮件传输非文本数据。它兼容旧版本的信息格式,使得那些旧的应用网关也可以处理MIME格式的信息,并增加了许多功能,可以用邮件传输二进制数据。集合文档是MIME格式的一种应用,用于将根资源和附属资源集合进同一个信息里。文章首先介绍了MIME格式和集合文档的格式,给出了一个对MIME格式文档的解码算法,然后在这个算法的基础上给出了集合文档的解码算法。 展开更多
关键词 邮件 MIME 集合文档 解码算法
在线阅读 下载PDF
虚拟聚合与精准解码:农村广播大喇叭在突发疫情传播中的政治功能 被引量:8
14
作者 郭淼 郝静 《新闻与传播评论》 CSSCI 2021年第2期98-105,共8页
2020年初新型冠状病毒肺炎所引发的重大公共卫生风险,使隔离人员、信息畅达成为防控疫情、维护秩序稳定、防范次生风险的首要任务。农村因春节期间返乡人数激增成为防控关键区域,对返乡流动人口及留守村民的疫情管控是基层社会治理的难... 2020年初新型冠状病毒肺炎所引发的重大公共卫生风险,使隔离人员、信息畅达成为防控疫情、维护秩序稳定、防范次生风险的首要任务。农村因春节期间返乡人数激增成为防控关键区域,对返乡流动人口及留守村民的疫情管控是基层社会治理的难点。为实现精准的防疫信息传播,有效发挥风险预警的作用,广播大喇叭成为农村疫情预警和疫情期间隔离管控等信息传播的重要手段,是通过精准解码缩小政治信息鸿沟、垂直到村以增强个体理解、激活政治参与意识的工具,是规范性政治权力虚拟聚合、政治信息传播仪式化的表征,是基层政治治理的隐喻符号。“溢散”和“共鸣”使新媒体与农村广播大喇叭实现联动,二次传播增强了政治传播效果,创新了基层治理手段,为引导社会舆情,防范社会风险,提升基层治理水平和治理能力现代化发挥了重要作用。 展开更多
关键词 农村广播大喇叭 虚拟聚合 精准解码 政治传播 风险预警
在线阅读 下载PDF
基于编解码机制的水下图像语义分割
15
作者 王金康 何晓晖 +1 位作者 邵发明 卢冠林 《舰船电子工程》 2023年第9期29-35,共7页
随着水下资源的开发,深度学习在水资源探索和开发领域应用越来越广泛。在水下原始图像质量低下的情况下,传统的语义分割技术对水下目标分割边界模糊、定位不准确、漏检和误检的情况经常发生。论文针对上述问题,提出了一种专门应用于水... 随着水下资源的开发,深度学习在水资源探索和开发领域应用越来越广泛。在水下原始图像质量低下的情况下,传统的语义分割技术对水下目标分割边界模糊、定位不准确、漏检和误检的情况经常发生。论文针对上述问题,提出了一种专门应用于水下图像的语义分割方法。首先基于多空间转换对原始水下图像进行增强处理。其次通过密集连接的混合空洞卷积在扩大感受野的同时消除多层空洞卷积带来的“gridding issue”问题,然后设计级联空洞卷积空间金字塔池化模块来整合不同尺度的边界特征,丰富目标细节信息。最后,采用上下文信息聚合机制将浅层网络和深层网络的特征进行融合以提取丰富的上下文信息。实验证明论文提出的方法相比最先进的语义分割方法对水下图像的分割效果更好。 展开更多
关键词 水下图像 语义分割 编解码机制 上下文信息聚合
在线阅读 下载PDF
基于双流聚合Transformer的RGB-D语义分割
16
作者 葛梦娇 苏雯 +2 位作者 何烨 陈稼炜 高金凤 《电子科技》 2025年第12期79-85,共7页
针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征... 针对RGB-D(Red Green Blue Depth)语义分割中色彩信息和深度信息无法有效融合以及无法充分提取多尺度上下文信息的问题,文中提出了一种基于双流聚合Transformer的RGB-D语义分割方法。通过Transformer提取全彩图像和深度图像的多层次特征,采用通道注意交叉融合模块与深度增强RGB操作实现各层次特征模态鸿沟的补偿,完成双模态信息融合。使用多层聚合解码器模块整合多层次多尺度上下文特征,减少了信息传递损失,实现了更准确和更全面的语义分割。实验结果表明,所提方法在NYU-Dv2数据集上的平均交并比(mean Intersection over Union,mIoU)、像素准确率和平均像素准确率分别达到52.9%、78.0%、66.0%。在Cityscapes数据集上的实验结果表明,在低分辨率输入图像下,所提方法的mIoU达到了79.8%。 展开更多
关键词 RGB-D 语义分割 Transformer 通道注意交叉融合 深度增强RGB操作 多层聚合解码器 全彩图像 深度图像
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部