期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于自注意力机制的高分遥感影像语义分割 被引量:2
1
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
双先验引导的注意力特征聚合去雾生成对抗网络
2
作者 王燕 胡津源 +1 位作者 刘晶晶 陈燕燕 《计算机工程与科学》 北大核心 2025年第10期1841-1852,共12页
图像去雾是计算机视觉领域中一个具有挑战性的热点问题。现有的去雾方法通常使用单一的卷积神经网络(CNN)来解决问题,但此类方法缺乏细节恢复机制,并且在非均匀雾情况下去雾性能较差。为了解决上述2个问题,提出了一个双先验引导的注意... 图像去雾是计算机视觉领域中一个具有挑战性的热点问题。现有的去雾方法通常使用单一的卷积神经网络(CNN)来解决问题,但此类方法缺乏细节恢复机制,并且在非均匀雾情况下去雾性能较差。为了解决上述2个问题,提出了一个双先验引导的注意力特征聚合去雾生成对抗网络,暗通道先验和语义先验分别引导图像广义特征和纹理细节的恢复。其中,生成器采用参数共享编码器提取特征,添加了注意力特征聚合块(AFAB)对多尺度特征进行聚合增强,并通过解码多尺度特征恢复无雾图像,最后用多尺度判别器监督无雾图像的恢复。此外,考虑到图像中可能存在雾的不均匀分布,提出了坐标注意力残差块(CARB),它能自适应地分配权重,使网络关注图像的重要特征;同时,采用残差聚合的方式通过3个CARB构造了坐标注意力密集残差组(CARG),使得残差特征能被充分利用。实验结果表明,提出的网络在合成有雾图像数据集和现实有雾图像数据集上均表现优异。 展开更多
关键词 图像去雾 生成对抗网络 双先验引导 注意力特征聚合 参数共享编码器 坐标注意力
在线阅读 下载PDF
基于编解码网络的生猪骨架提取方法研究
3
作者 王泽华 徐爱俊 +2 位作者 周素茵 叶俊华 夏芳 《计算机应用与软件》 北大核心 2025年第4期181-188,共8页
针对生猪骨架提取难度大、精度低、耗时长等问题,提出一种基于编解码网络的生猪骨架提取方法。该文构建关键点热力图生成模型,将ResNet50残差网络和U-Net语义分割网络相结合,搭建编码-解码网络结构并引入注意力机制,以提高尾、蹄等小目... 针对生猪骨架提取难度大、精度低、耗时长等问题,提出一种基于编解码网络的生猪骨架提取方法。该文构建关键点热力图生成模型,将ResNet50残差网络和U-Net语义分割网络相结合,搭建编码-解码网络结构并引入注意力机制,以提高尾、蹄等小目标关键点的特征提取精度;在生成关键点热力图的同时预测关键点偏移量,弥补反算关键点原始位置时的精度损失,再利用霍夫投票机制对二者进行加权聚合,最终映射得到生猪骨架。实验结果表明,骨架提取准确率为85.27%。相较于ResNet50残差网络,在耗时相近的情况下,准确率提高了22.67个百分点。该研究为生猪骨架提取提供了一种新的方法,可为进一步开展生猪行为研究提供技术参考。 展开更多
关键词 骨架提取 关键点检测 生猪 注意力机制 特征提取 编解码网络
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
4
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
结合多尺度与多层级聚合的卷轴画图像描述模型
5
作者 乐超洋 胡文瑾 张福军 《现代电子技术》 北大核心 2025年第17期41-47,共7页
针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可... 针对卷轴画图像的尺度大小不一且具有一定的空间分布特性以及基于Transformer的编码层容易丢失图像关键信息的问题,文中提出一种结合多尺度与多层级聚合的卷轴画图像描述模型(MMA)。在编码阶段,通过引入非对称卷积和多尺度特征模块,可以有效提高卷积层获取空间信息的能力并融合卷轴画图像全局和局部的多尺度上下文信息,从而得到具有丰富语义信息的特征表示。在解码阶段,设计了多层级聚合网络,通过聚合不同编码层的特征实现高层编码层语义信息和低层编码层内容信息的有效利用,从而有效缓解信息丢失的问题。实验结果表明,该模型在卷轴画数据集上取得了不错效果,较NIC模型在BLEU-4、METEOR上分别提高了26.7%、0.9%,并生成准确性更高的描述语句。 展开更多
关键词 图像描述 卷轴画图像 多尺度特征 非对称卷积 多层级聚合解码 TRANSFORMER
在线阅读 下载PDF
GMFNet:全局多尺度和多级别的特征融合语义分割网络 被引量:1
6
作者 陈金令 赵成明 李洁 《计算机应用与软件》 北大核心 2025年第4期311-318,334,共9页
语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结... 语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结构不仅在空间上提取多尺度信息和通道上对图像信息充分利用,还增强编码器阶段的特征重用。设计特征融合注意力模块,在编码器中连接不同阶段的高低水平特征和新特征。实验表明,该算法在Cityscapes数据集上达到了77.92%mIoU。 展开更多
关键词 语义分割 卷积神经网络 全局上下文信息 特征融合 编码器-解码器
在线阅读 下载PDF
基于多阶门控聚合网络的光学化学结构识别
7
作者 林帆 李建华 《计算机工程》 北大核心 2025年第8期364-372,共9页
在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而... 在光学化学结构识别(OCSR)领域,现有基于深度学习的模型通常依赖于卷积神经网络(CNN)或视觉Transformer进行视觉特征提取,并采用Transformer进行序列解码。这些模型虽然有效,但仍受限于图像特征提取能力和解码时位置编码的精确性,从而影响识别效率。针对这些限制,将多阶门控聚合网络(MogaNet)和引入相对位置编码的Transformer构成的编码解码架构用于OCSR领域,提出一种基于多阶门控聚合网络的光学化学结构识别模型。该模型首先在图像特征提取时通过MogaNet空间聚合模块,捕获多尺度特征并减少特征冗余,并且通过MogaNet通道聚合模块改善通道维度的多样性;其次在序列解码时采用引入相对位置编码的Transformer作为解码器,精准捕捉序列单词之间的相对位置关系。为了训练和验证该模型,构建一个包含40万个分子的化学结构数据集,其中包含Markush结构与非Markush结构。实验结果表明,该模型的准确率达到了92.36%,优于其他现有的模型。 展开更多
关键词 光学化学结构识别 编码解码架构 深度学习 SMILES表达式 多阶门控聚合网络
在线阅读 下载PDF
基于特征聚合和Gaussian-Laplacian-Logistic混合模型的图像压缩
8
作者 朱俊 刘磊 +2 位作者 王帅 王珺 谭伟彪 《淮北师范大学学报(自然科学版)》 2025年第2期32-41,共10页
图像压缩在细节恢复和复杂场景处理方面存在局限,尤其在长距离上下文信息的利用上。为解决这一问题,提出一种基于自注意力特征聚合机制和Gaussian-Laplacian-Logistic混合模型。该模型通过融合不同层次的特征,有效捕捉长距离信息关系,... 图像压缩在细节恢复和复杂场景处理方面存在局限,尤其在长距离上下文信息的利用上。为解决这一问题,提出一种基于自注意力特征聚合机制和Gaussian-Laplacian-Logistic混合模型。该模型通过融合不同层次的特征,有效捕捉长距离信息关系,增强特征表达能力。提出创新性特征聚合模块,将压缩特征与Transformer中间层特征结合,提供更丰富的上下文信息,改善图像重建中的细节恢复和结构保持。引入Gaussian-Laplacian-Logistic混合模型,根据图像局部特征自适应调整,提高压缩效率。实验表明,所提模型在峰值信噪比(peak signal-to-noise ratio,PSNR)和多尺度结构相似性(multi-scale structural similarity,MS-SSIM)性能上优于传统学习压缩和标准压缩技术,特别在高复杂度图像和细节恢复方面表现突出。 展开更多
关键词 深度学习 图像压缩 特征聚合 混合模型 编码器-解码器架构 视频编码
在线阅读 下载PDF
基于多任务学习的全景驾驶感知算法
9
作者 吴伟林 刘春泉 余孝源 《计算机工程与设计》 北大核心 2025年第4期1127-1133,共7页
针对全景驾驶感知算法YOLOP存在特征图池化操作自适应较差、下采样过程细节丢失和模型性能差的问题,提出一种基于多任务学习的全景驾驶感知算法,引入高效处理模块,提高对特征图池化操作自适应能力,采用不同加权系数的损失函数,提升网络... 针对全景驾驶感知算法YOLOP存在特征图池化操作自适应较差、下采样过程细节丢失和模型性能差的问题,提出一种基于多任务学习的全景驾驶感知算法,引入高效处理模块,提高对特征图池化操作自适应能力,采用不同加权系数的损失函数,提升网络的检测性能及鲁棒性。在BDD100K数据集的评估结果中,车道线检测准确率提高11.6%,可行驶区域检测的平均交并比(mIoU)提高2.1%,车辆检测的平均精确率均值的50%指标(mAP50)提高3.7%。在KITTI数据集的评估结果中,车辆检测mAP50指标提高3.4%。 展开更多
关键词 多任务学习网络 编码-解码器 车道线检测 可行驶区域检测 车辆检测 特征对齐 转置卷积
在线阅读 下载PDF
基于MST-ECGNet深度学习模型的非接触ECG信号重构方法研究
10
作者 郭天娇 袁年曾 +6 位作者 安强 吕昊 王敬哲 张志远 龙语诺 刘振华 薛慧君 《空军军医大学学报》 2025年第10期1353-1358,1363,共7页
目的针对传统心电图(ECG)监测技术舒适性差、难以连续监测等问题,开展生物雷达与深度学习技术结合的非接触ECG信号精准重构研究。方法采用94 GHz连续波生物雷达采集胸腔微动信号,通过变分模态分解算法从中分离出心脏机械运动信号;构建... 目的针对传统心电图(ECG)监测技术舒适性差、难以连续监测等问题,开展生物雷达与深度学习技术结合的非接触ECG信号精准重构研究。方法采用94 GHz连续波生物雷达采集胸腔微动信号,通过变分模态分解算法从中分离出心脏机械运动信号;构建一种基于多尺度心脏特征提取网络和Transformer编解码架构的ECG重构模型(MST-ECGNet),采用双路特征提取架构,通过多尺度心跳特征提取网络捕获心脏机械运动信号的不同尺度局部特征,结合Transformer-Encoder捕获其全局时序特征,经特征融合后由Transformer-Decoder实现ECG波形重构。结果所提方法重构的ECG信号与参考信号的皮尔森相关系数达0.956,表明重构的ECG信号与参考信号高度一致,与现有非接触式方法相比,所提方法在波形还原准确性上更具优势。结论提出一种基于MST-ECGNet模型的非接触ECG信号重构方法,该模型兼顾多尺度局部特征与全局特征提取,实现了精准的ECG信号重构,为心血管疾病的诊断和监测提供了一种非接触、长期、动态的解决方案。 展开更多
关键词 生物雷达 非接触式 神经网络 多尺度特征 编解码网络 心电图 心脏机械运动 心血管疾病
在线阅读 下载PDF
基于上下文聚合策略的轻量级编/解码抓取位姿检测 被引量:4
11
作者 徐胜军 任君琳 +2 位作者 刘光辉 孟月波 韩九强 《机器人》 EI CSCD 北大核心 2023年第6期641-654,共14页
针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网... 针对多样性目标在非结构化环境中的抓取位姿难以估计的问题,提出一种基于上下文聚合策略的轻量级编/解码抓取位姿检测网络。首先,以编/解码网络架构为基础,利用深度可分离卷积层与混洗单元构建目标特征深度分离-融合提取块,减少编码网络参数量,增强网络对抓取区域特征的提取能力;其次,利用双线性插值法和深度可分离卷积层建立深度分离-重构块,在恢复高层特征丢失信息的同时,有效减少解码网络的参数量;最后,针对可抓取区域像素点与目标物体全貌之间的非一致性问题,基于交叉熵辅助损失和自注意力机制,提出一种抓取区域上下文聚合策略,引导网络增强可抓取目标区域特征的表征能力,抑制非抓取像素点的冗余特征。实验结果表明,所提网络在Cornell数据集的图像拆分与对象拆分子集上抓取检测准确率分别可达97.8%与93.8%,单张图像检测速度可达64.93张/秒;在Jacquard数据集上抓取检测准确率可达95.1%,单张图像检测速度可达60.6张/秒。与对比网络相比,所提网络不仅计算量与参数量较小,而且抓取检测的准确率与速度均有明显提升,在真实场景下对9种物体的抓取检测验证中,抓取成功率达到93.3%。 展开更多
关键词 非结构化环境 编/解码网络 上下文聚合 轻量级 抓取位姿
原文传递
动态异构特征融合的水下图像增强算法 被引量:11
12
作者 韩晓微 张云泽 +2 位作者 谢英红 吴宝举 赵玉莹 《控制与决策》 EI CSCD 北大核心 2023年第6期1560-1568,共9页
针对水下图像细节模糊和色彩失真严重的问题,提出一种基于编码解码结构的动态异构特征融合水下图像增强网络.首先,设计异构特征融合模块,将不同级别与不同层次的特征进行融合,提升网络对细节信息和语义信息的整体感知能力;然后,设计新... 针对水下图像细节模糊和色彩失真严重的问题,提出一种基于编码解码结构的动态异构特征融合水下图像增强网络.首先,设计异构特征融合模块,将不同级别与不同层次的特征进行融合,提升网络对细节信息和语义信息的整体感知能力;然后,设计新型特征注意力机制,改进传统通道注意力机制,并将改进后的通道注意力与像素注意力机制加入异构特征融合过程,加强网络提取不同浑浊度像素特征的能力;接着,设计动态特征增强模块,自适应扩展感受野以提升网络对图像畸变景物的适应力和模型转换能力,加强网络对感兴趣区域的学习;最后,设计色彩损失函数,并联合最小化绝对误差损失与结构相似性损失,在保持图像纹理的基础上纠正色偏.实验结果表明,所提出算法可有效提升网络的特征提取能力,降低水下图像的雾度效应,提升图像的清晰度和色彩饱和度. 展开更多
关键词 深度学习 神经网络 注意力机制 异构特征融合 编码解码结构 水下图像增强
原文传递
融合子区域局部二值模式特征与深层聚合网络的人脸识别 被引量:2
13
作者 傅桂霞 魏文辉 +2 位作者 邹国锋 尹丽菊 高明亮 《科学技术与工程》 北大核心 2018年第19期237-243,共7页
针对深度网络对人脸噪声敏感,且学习过程容易忽视人脸结构信息的问题,提出融合子区域局部二值模式(local binary pattern,LBP)特征和深层聚合网络的人脸识别算法。将人脸图像划分为不同子区域,并采用局部二值模式对人脸进行预处理,获取... 针对深度网络对人脸噪声敏感,且学习过程容易忽视人脸结构信息的问题,提出融合子区域局部二值模式(local binary pattern,LBP)特征和深层聚合网络的人脸识别算法。将人脸图像划分为不同子区域,并采用局部二值模式对人脸进行预处理,获取子区域人脸的LBP特征。不同子区域LBP特征输入不同的稀疏自动编码器,实现深层特征提取;然后不同稀疏自动编码器的输出特征通过全连接方式实现特征聚合,获得人脸特征向量用于分类。通过大量实验获取了最优的聚合网络模型架构和网络参数取值,改善了人脸识别效果。 展开更多
关键词 局部二值模式特征 稀疏自动编码器 子区域划分 深层聚合网络 人脸识别
在线阅读 下载PDF
基于空洞卷积和多特征融合的混凝土路面裂缝检测 被引量:9
14
作者 瞿中 陈雯 《计算机科学》 CSCD 北大核心 2022年第3期192-196,共5页
混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的... 混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的残差网络Res2Net提高特征提取能力;在网络的中间部分,使用串联和并联相结合的不同空洞率的空洞卷积,从而在增加特征点的感受野的同时不会降低特征图的分辨率;在解码阶段,融合了从低层卷积到高层卷积的多尺度和多级特征,提高了裂缝检测的准确性。为证明所提算法的有效性和准确性,将其与现有的部分检测方法进行了比较并使用F-score来评估检测性能。在多个混凝土路面数据集上的实验结果表明,该算法提高了裂缝检测的准确性,具有较好的鲁棒性。 展开更多
关键词 裂缝检测 空洞卷积 多特征融合 编码-解码结构 残差网络
在线阅读 下载PDF
混合扩张卷积和注意力机制的路面裂缝检测 被引量:7
15
作者 瞿中 李明 《计算机工程与设计》 北大核心 2023年第8期2425-2431,共7页
针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积... 针对复杂背景下路面裂缝检测困难的问题,提出一种基于混合扩张卷积和空间-通道注意力机制的路面裂缝检测算法。基于改进的U-Net网络,在编码阶段,使用空间-通道注意力机制增强裂缝特征,抑制非裂缝特征;在网络中间部分,使用混合扩张卷积实现在不增加额外模块的前提下增大网络的感受野;在解码阶段,融合多层次和多尺度特征使最终预测结果更接近路面真实情况。实验结果表明,所提算法能够快速准确地对路面裂缝进行检测,具有较强的鲁棒性。 展开更多
关键词 裂缝检测 深度学习 卷积神经网络 编码-解码结构 混合扩张卷积 空间-通道注意力机制 多尺度特征融合
在线阅读 下载PDF
融合通道与空间注意力的编解码人群计数算法 被引量:2
16
作者 余鹰 潘诚 +2 位作者 朱慧琳 钱进 汤洪 《计算机科学与探索》 CSCD 北大核心 2022年第11期2547-2556,共10页
人群计数旨在准确地预测现实场景中人群的数量、分布和密度,然而现实场景普遍存在背景复杂、目标尺度多样和人群分布杂乱等问题,给人群计数任务带来极大的挑战。针对这些问题,提出了一种融合通道与空间注意力的编解码结构人群计数网络(C... 人群计数旨在准确地预测现实场景中人群的数量、分布和密度,然而现实场景普遍存在背景复杂、目标尺度多样和人群分布杂乱等问题,给人群计数任务带来极大的挑战。针对这些问题,提出了一种融合通道与空间注意力的编解码结构人群计数网络(CSANet)。该模型采用多层次编解码网络结构提取多尺度语义特征,并充分融合空间上下文信息,以此来解决复杂场景中行人尺度变化和分布杂乱的问题;为了降低复杂背景对计数性能的影响,在特征融合的过程中引入了通道与空间注意力,提高人群区域的特征权重,凸显感兴趣区域,同时降低弱相关背景区域的特征权重,抑制背景噪声干扰,最终提升人群密度图质量。为了验证算法的有效性,在多个经典人群计数数据集上进行了实验,实验结果表明,与现有的人群计数算法相比,CSANet具有良好的多尺度特征提取能力和背景噪声抑制能力,这使得密集场景下计数算法的准确性和鲁棒性均有较大提升。 展开更多
关键词 人群计数 编解码网络 注意力 特征融合 深度学习
在线阅读 下载PDF
基于稀疏卷积的非对称特征聚合点云压缩算法 被引量:1
17
作者 黄炜 朱映韬 +2 位作者 陈冬杰 王宝土 陈建 《电视技术》 2022年第12期67-71,76,共6页
当前基于深度学习的点云压缩算法存在局部特征学习不足的问题,点云庞大的数据量也限制了网络规模。为了保障重建质量的同时合理控制计算复杂度,提出一种基于稀疏卷积的非对称特征聚合点云压缩算法,设计非对称特征聚合编解码网络、逐通... 当前基于深度学习的点云压缩算法存在局部特征学习不足的问题,点云庞大的数据量也限制了网络规模。为了保障重建质量的同时合理控制计算复杂度,提出一种基于稀疏卷积的非对称特征聚合点云压缩算法,设计非对称特征聚合编解码网络、逐通道稀疏残差卷积提升率失真性能。经实验验证,相较于现有的G-PCC、V-PCC和Learned-PCGC算法,所提算法的BD-Rate分别减少88%,46%,40%以上,BD-PSNR分别增加8.9 dB,2.4 dB,1.8 dB以上。 展开更多
关键词 点云压缩 自编码器 稀疏卷积 非对称特征聚合
在线阅读 下载PDF
模拟“what”通路前端视觉机制的边缘检测网络 被引量:1
18
作者 潘盛辉 王蕤兴 林川 《广西科技大学学报》 2022年第2期60-68,共9页
边缘检测是图像处理工作的关键步骤之一,目前边缘检测模型基于卷积神经网络(CNNs)搭建编码-解码网络。由于现有编码网络提取特征能力有限,且忽视了神经元之间复杂的信息流向,本文模拟视网膜、外侧膝状体(LGN)和腹侧通路(“what”通路)前... 边缘检测是图像处理工作的关键步骤之一,目前边缘检测模型基于卷积神经网络(CNNs)搭建编码-解码网络。由于现有编码网络提取特征能力有限,且忽视了神经元之间复杂的信息流向,本文模拟视网膜、外侧膝状体(LGN)和腹侧通路(“what”通路)前端V1区、V2区、V4区的生物视觉机制,搭建全新的编码网络和解码网络。编码网络模拟视网膜-LGN-V1-V2的信息传递机制,充分提取图像中的特征信息;解码网络模拟V4区的信息整合功能,设计邻近融合网络以整合编码网络的特征预测,实现特征的充分融合。该神经网络模型在BSDS500数据集和NYUD-V2数据集上进行了实验。结果表明,本文搭建的编码-解码方法的F值(ODS)为0.820,相比于LRCNet提高了0.49%。 展开更多
关键词 边缘检测 生物视觉 编码-解码网络 特征提取 卷积神经网络(CNNs)
在线阅读 下载PDF
基于多输入多输出编解码器网络的图像去模糊 被引量:1
19
作者 许光宇 汪雨 《齐鲁工业大学学报》 CAS 2023年第6期16-23,共8页
针对动态场景下非均匀盲去模糊算法存在去模糊不彻底和纹理细节丢失的问题,提出了一种基于多输入多输出编解码器网络的图像去模糊方法。首先,采用一个特征提取模块获取不同尺度模糊图像的全局和局部特征信息,为网络提供更丰富、更全面... 针对动态场景下非均匀盲去模糊算法存在去模糊不彻底和纹理细节丢失的问题,提出了一种基于多输入多输出编解码器网络的图像去模糊方法。首先,采用一个特征提取模块获取不同尺度模糊图像的全局和局部特征信息,为网络提供更丰富、更全面的图像特征信息。其次,使用特征融合模块对多尺度特征进行融合,使不同尺度下的上下文特征与细节信息可以在单个U-net网络中流动,增强了特征信息的流动性,解决了传统方法中多个子网络堆叠导致特征流动受阻的问题。最后,设计了一个由L1损失、多尺度频率重建损失和边缘损失组成的混合损失函数,在提升图像复原效果的同时更好地保留纹理结构和边缘信息。为了评估网络去模糊性能,在基准数据集GoPro和HIDE上进行测试,复原图像的峰值信噪比均值分别为31.94、29.45 dB,结构相似度均值分别为0.961、0.936,均高于相比较的去模糊算法。在视觉效果上,恢复的图像纹理结构和边缘更清晰,更接近真实图像。所提出的网络模型能够获取更丰富的特征信息,增强了网络内部特征的流动能力,取得了较好的去模糊效果。 展开更多
关键词 图像去模糊 多尺度网络 编码-解码结构 特征融合 多输入多输出
在线阅读 下载PDF
基于ADBN的入侵检测方法
20
作者 江泽涛 周谭盛子 《计算机应用研究》 CSCD 北大核心 2020年第9期2797-2801,共5页
当下大多数入侵检测算法无法在入侵检测率和误报率之间取得较好的平衡,为了有效避免此类问题,提出了一种基于非对称深度信念网络的入侵检测方法。该方法首先通过训练深度信念网络初始化ADBN(asymmetric deep belief network)模型中编码... 当下大多数入侵检测算法无法在入侵检测率和误报率之间取得较好的平衡,为了有效避免此类问题,提出了一种基于非对称深度信念网络的入侵检测方法。该方法首先通过训练深度信念网络初始化ADBN(asymmetric deep belief network)模型中编码器部分的参数,利用正态分布初始化解码器部分的参数。然后通过计算重构误差来调优ADBN模型的参数,使模型能获取原始数据的最优低维表征。最后以编码器得到的数据作为分类器的输入数据并对其进行检测,采用ADBN模型可以提取出更有利于分类的特征且能够在模型初始化阶段节省更多的测试时间。实验结果表明,该方法可以达到更好的检测性能,对小类别样本也达到了较好的检测准确率。 展开更多
关键词 入侵检测 特征提取 非对称深度信念网络 编码器 解码器
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部