期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
SwinHCAD: A Robust Multi-Modality Segmentation Model for Brain Tumors Using Transformer and Channel-Wise Attention
1
作者 Seyong Jin Muhammad Fayaz +2 位作者 L.Minh Dang Hyoung-Kyu Song Hyeonjoon Moon 《Computers, Materials & Continua》 2026年第1期511-533,共23页
Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the b... Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the burden on medical staff and provides quantitative information,existing methodologies and recent models still struggle to accurately capture and classify the fine boundaries and diverse morphologies of tumors.In order to address these challenges and maximize the performance of brain tumor segmentation,this research introduces a novel SwinUNETR-based model by integrating a new decoder block,the Hierarchical Channel-wise Attention Decoder(HCAD),into a powerful SwinUNETR encoder.The HCAD decoder block utilizes hierarchical features and channelspecific attention mechanisms to further fuse information at different scales transmitted from the encoder and preserve spatial details throughout the reconstruction phase.Rigorous evaluations on the recent BraTS GLI datasets demonstrate that the proposed SwinHCAD model achieved superior and improved segmentation accuracy on both the Dice score and HD95 metrics across all tumor subregions(WT,TC,and ET)compared to baseline models.In particular,the rationale and contribution of the model design were clarified through ablation studies to verify the effectiveness of the proposed HCAD decoder block.The results of this study are expected to greatly contribute to enhancing the efficiency of clinical diagnosis and treatment planning by increasing the precision of automated brain tumor segmentation. 展开更多
关键词 Attention mechanism brain tumor segmentation channel-wise attention decoder deep learning medical imaging MRI transformer U-Net
在线阅读 下载PDF
Effective convolution mixed Transformer Siamese network for robust visual tracking
2
作者 Lin Chen Yungang Liu Yuan Wang 《Control Theory and Technology》 2025年第2期221-236,共16页
Siamese tracking algorithms usually take convolutional neural networks(CNNs)as feature extractors owing to their capability of extracting deep discriminative features.However,the convolution kernels in CNNs have limit... Siamese tracking algorithms usually take convolutional neural networks(CNNs)as feature extractors owing to their capability of extracting deep discriminative features.However,the convolution kernels in CNNs have limited receptive fields,making it difficult to capture global feature dependencies which is important for object detection,especially when the target undergoes large-scale variations or movement.In view of this,we develop a novel network called effective convolution mixed Transformer Siamese network(SiamCMT)for visual tracking,which integrates CNN-based and Transformer-based architectures to capture both local information and long-range dependencies.Specifically,we design a Transformer-based module named lightweight multi-head attention(LWMHA)which can be flexibly embedded into stage-wise CNNs and improve the network’s representation ability.Additionally,we introduce a stage-wise feature aggregation mechanism which integrates features learned from multiple stages.By leveraging both location and semantic information,this mechanism helps the SiamCMT to better locate and find the target.Moreover,to distinguish the contribution of different channels,a channel-wise attention mechanism is introduced to enhance the important channels and suppress the others.Extensive experiments on seven challenging benchmarks,i.e.,OTB2015,UAV123,GOT10K,LaSOT,DTB70,UAVTrack112_L,and VOT2018,demonstrate the effectiveness of the proposed algorithm.Specially,the proposed method outperforms the baseline by 3.5%and 3.1%in terms of precision and success rates with a real-time speed of 59.77 FPS on UAV123. 展开更多
关键词 Visual tracking Siamese network TRANSFORMER Feature aggregation channel-wise attention
原文传递
融合注意力的特征聚合孪生网络视觉跟踪
3
作者 金静 牛品 翟凤文 《计算机工程与应用》 北大核心 2025年第12期166-176,共11页
目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregat... 目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregation module)。在骨干网络中引入拆分注意力机制,用来提取浅层特征中有价值的上下文信息,通过像素级互相关模块(pixel-wise cross correlation,PWCC)融合模板区域和搜索区域浅层和深层特征中的上下文信息,以增强模板区域和搜索区域的特征图之间的联系,从而提高跟踪器的鲁棒性。针对因尺度变化而容易导致目标丢失的问题,设计了一个多通道特征聚合模块(multi-channel feature aggregation module,MCFA),用于聚合目标不同区域的特征信息,使跟踪器尽可能地区分目标和语义背景,进一步提升跟踪准确性。最后,在OTB100、VOT2019、GOT10K和LaSOT四个数据集上进行了详尽的实验评估,结果显示,SiamMCFA与当前基于孪生网络的先进的跟踪器SiamCAR相比,其成功率(success rate)与精准度(precision)分别提高了2.26和2.83个百分点。与SiamIRCA相比成功率与精准度提高了0.3和0.9个百分点。 展开更多
关键词 目标跟踪 孪生网络 拆分注意力 像素级互相关 多通道特征聚合
在线阅读 下载PDF
结合深度信息引导和多尺度通道注意力机制的单目三维目标检测算法 被引量:3
4
作者 刘青 李伟 +3 位作者 余少勇 宋宇萍 周启迪 邹伟林 《山东大学学报(理学版)》 北大核心 2025年第1期63-73,82,共12页
针对三维边界框无法从缺少空间线索的单目图像中准确估计的问题,本文提出一种基于深度信息引导和多尺度通道注意力机制的单目三维目标检测算法。为了引入三维信息并有效地获取和利用不同尺度特征图的空间信息,在特征提取模块中利用多尺... 针对三维边界框无法从缺少空间线索的单目图像中准确估计的问题,本文提出一种基于深度信息引导和多尺度通道注意力机制的单目三维目标检测算法。为了引入三维信息并有效地获取和利用不同尺度特征图的空间信息,在特征提取模块中利用多尺度分割注意力算法,分别从单目图像和深度图中提取多尺度预处理特征图,利用通道注意力算法进行权重标定,提高了特征图的表征能力。通过深度引导动态局部卷积网络,将包含多尺度信息的深度图特征作为单目图像特征的特定卷积核,引入三维信息作为指导,减少直接融合的误差累积,并解决单目视觉中近大远小的尺度敏感问题。选择不同的评估指标对模型的性能进行评价与比较。实验结果表明,同其他算法相比,本文算法的自动驾驶数据集中汽车、行人、骑自行车的人的三维目标检测平均精度均提高。 展开更多
关键词 单目三维目标检测 深度引导 多尺度通道注意力机制 自动驾驶
原文传递
基于DT-KAN-iTransformer的超短期风电功率多步预测
5
作者 鄢仁武 吴慧敏 李培强 《智慧电力》 北大核心 2025年第10期95-105,共11页
针对超短期风电功率多步预测中存在的数据分布偏移与多变量间通道相关性建模问题,提出一种基于DT-KAN-iTransformer的超短期风电功率多步预测模型。首先,为缓解风电数据在空间内与空间间存在的分布偏移,引入融合分布偏移(DT)模块在模型... 针对超短期风电功率多步预测中存在的数据分布偏移与多变量间通道相关性建模问题,提出一种基于DT-KAN-iTransformer的超短期风电功率多步预测模型。首先,为缓解风电数据在空间内与空间间存在的分布偏移,引入融合分布偏移(DT)模块在模型输入前后分别进行归一化与反归一化,以保持数据窗口分布一致性。其次,采用经科尔莫戈洛夫-阿诺德网络(KAN)改进的iTransformer网络,通过转置嵌入和非线性映射建立不同变量间的通道相关性,捕捉多变量间的非线性关系。最后,基于200 MW风电场实际数据,与9种基准模型进行对比实验。结果表明,所提出的DT-KAN-iTransformer模型在3项评价指标中均表现出更高的预测精度。 展开更多
关键词 风电功率 超短期 多步预测 分布偏移 通道相关性 DT-KAN-iTransformer
在线阅读 下载PDF
利用可选择多尺度图卷积网络的骨架行为识别
6
作者 曹毅 李杰 +2 位作者 叶培涛 王彦雯 吕贤海 《电子与信息学报》 北大核心 2025年第3期839-849,共11页
针对目前骨架行为识别方法忽视骨架关节点多尺度依赖关系和无法合理利用卷积核进行时间建模的问题,该文提出了一种可选择多尺度图卷积网络(SMS-GCN)的行为识别模型。首先,介绍了人体骨架图的构建原理和通道拓扑细化图卷积网络的结构;其... 针对目前骨架行为识别方法忽视骨架关节点多尺度依赖关系和无法合理利用卷积核进行时间建模的问题,该文提出了一种可选择多尺度图卷积网络(SMS-GCN)的行为识别模型。首先,介绍了人体骨架图的构建原理和通道拓扑细化图卷积网络的结构;其次,构建成对关节邻接矩阵和多关节邻接矩阵以生成多尺度通道拓扑细化邻接矩阵,并引入图卷积网络,进一步提出多尺度图卷积(MS-GC)模块,以期实现对骨架关节点的多尺度依赖关系的建模;然后,基于多尺度时序卷积和可选择大核网络,提出可选择多尺度时序卷积(SMS-TC)模块,以期实现对有用的时间上下文特征的充分提取,同时结合MS-GC和SMS-TC模块,进而提出可选择多尺度图卷积网络模型并在多支流数据输入下进行训练;最后,在NTU-RGB+D和NTU-RGB+D 120数据集上进行大量实验,实验结果表明,该模型能够捕获更多的关节特征和学习有用的时间信息,具有优异的准确率和泛化能力。 展开更多
关键词 骨架行为识别 图卷积网络 多尺度通道拓扑细化邻接矩阵 可选择多尺度时序卷积 可选择多尺度图卷积网络
在线阅读 下载PDF
基于通道自注意力机制的图像降噪算法
7
作者 吴畏 吴昊 《长春师范大学学报》 2025年第2期42-50,共9页
基于卷积神经网络的图像降噪算法对图像自身信息的利用率相对有限,导致降噪后的图像出现一定程度的失真。Transformer架构中的自注意力机制能够有效利用图片自身信息,但计算量相对较高,对内存空间依赖相对较大。针对卷积神经网络信息利... 基于卷积神经网络的图像降噪算法对图像自身信息的利用率相对有限,导致降噪后的图像出现一定程度的失真。Transformer架构中的自注意力机制能够有效利用图片自身信息,但计算量相对较高,对内存空间依赖相对较大。针对卷积神经网络信息利用率相对有限以及Transformer计算量大的缺陷,提出一种基于通道自注意力机制的图像降噪算法,该算法能够有效利用图片自身信息,降低Transformer的计算量。实验结果表明,本文算法能够在保证降噪效率的基础上有效提升图片降噪效果,在与主流降噪算法的对比中也能取得较优的降噪效果。 展开更多
关键词 图像降噪 卷积神经网络 TRANSFORMER 通道自注意力
在线阅读 下载PDF
基于轻量化YOLOv7的带式输送机输送带撕裂检测算法 被引量:2
8
作者 安龙辉 王满利 张长森 《电子测量技术》 北大核心 2025年第1期64-75,共12页
针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态... 针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态非单调FM的Wise-IoU损失函数,使模型更加关注普通质量的样本,提高模型检测性能。然后,使用LAMP剪枝方法,提高模型的计算速度并降低计算复杂度,实现检测网络的轻量化,采用通道知识蒸馏无损提高模型精度,最后使用TensorRT加速模型,达到更快的检测速度。实验结果表明,与基准模型相比,改进后模型的参数量和计算量分别减少了86.8%、49.2%,mAP@0.5:0.95达到了62.4%,并且检测速度提升151.0 fps,模型大小从71.3 MB减少到12.8 MB。经过改进后的模型,提高了对输送带撕裂故障检测的准确性和实时性。 展开更多
关键词 YOLOv7 目标检测 Wise-IoU LAMP剪枝 通道知识蒸馏 TensorRT
原文传递
基于改进YOLOv8的钢材质表面缺陷检测
9
作者 张惠 韩跃平 李瑞红 《测试技术学报》 2025年第4期430-438,共9页
随着新一代信息技术与制造业的深入融合,制造产业发生巨大变革,工业生产中表面缺陷的检测愈发重要。针对钢表面缺陷检测中存在漏检和误检以及检测精度不高等问题,提出一种基于YOLOv8改进模型的算法。首先,在主干网络中将原有C2f模块融... 随着新一代信息技术与制造业的深入融合,制造产业发生巨大变革,工业生产中表面缺陷的检测愈发重要。针对钢表面缺陷检测中存在漏检和误检以及检测精度不高等问题,提出一种基于YOLOv8改进模型的算法。首先,在主干网络中将原有C2f模块融合了一种空间和通道重建卷积模块,减少了密集模型参数中的固有冗余,进一步构建轻量级网络模型;然后,在Neck阶段使用双向特征金字塔网络代替路径聚合网络,旨在使用有效的特征融合方式提高算法的检测性能;最后,使用Wise-IOUv1代替原YOLOv8中的CIOU来优化损失函数。实验证明,改进后的YOLOv8算法与原算法相比,m AP提高了8.1百分点,计算量降低了9.6百分点,检测速度提高了8.7百分点,检测效果优于原算法,很大程度提高了钢表面缺陷检测的检测性能。 展开更多
关键词 缺陷检测 YOLOv8 空间和通道重建卷积 特征融合 Wise-IOUv1
在线阅读 下载PDF
基于深度非对称可分离卷积的人脸表情识别
10
作者 戚星烁 胡黄水 +1 位作者 唐志振 王玲 《长春工业大学学报》 2025年第2期143-148,共6页
提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了... 提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了文中提出的深度非对称可分离卷积和改进通道注意力机制的有效性。 展开更多
关键词 计算机视觉 人脸表情识别 深度可分离卷积 通道注意力机制
在线阅读 下载PDF
基于通道注意力和特征融合的伪造语音检测研究
11
作者 汤龙 雷震春 《计算机技术与发展》 2025年第10期131-138,共8页
随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临... 随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临的一系列问题。为了聚集丰富的上下文信息和融合尺度不一致的特征,该文提出了双分支通道注意力模块,利用深度卷积沿通道维度聚合多尺度上下文信息,同时在两个分支上捕捉全局和局部特征信息;然后提出了注意力特征融合模块,将LFCC特征经过真实语音GMM和欺骗语音GMM得到对数高斯概率特征,随后基于注意力进行特征融合以学习具有通道上下文信息和全局局部特征信息的交互特征,解决了特征融合机制场景单一的问题。与基线系统相比,文中最佳系统AFF-ResNet在ASVSpoof2021LA数据集上的EER和min t-DCF分别降低37.5%和15.3%。实验结果表明,该方法显著提升了语音欺骗检测的准确率。 展开更多
关键词 伪造语音检测 对数高斯概率特征 通道注意力 深度卷积 多尺度上下文信息 特征融合
在线阅读 下载PDF
基于改进YOLOv11的农作物实时检测研究
12
作者 冉书伟 张丽丽 +4 位作者 王维政 宋昕蕊 王佳佳 倪雪松 马玉国 《智慧农业导刊》 2025年第10期27-31,共5页
采摘机器人或无人机等智能农业装备在进行视觉检测作业时往往背景环境复杂、画面中同时存在大量样本,而且现有目标检测方法对低质量样本考虑不充分,致使传统目标检测模型检测不准。该文提出一种基于YOLOv11-MW的轻量化农作物实时检测模... 采摘机器人或无人机等智能农业装备在进行视觉检测作业时往往背景环境复杂、画面中同时存在大量样本,而且现有目标检测方法对低质量样本考虑不充分,致使传统目标检测模型检测不准。该文提出一种基于YOLOv11-MW的轻量化农作物实时检测模型,在骨干网络的跨阶段部分连接与空间注意力结构(Cross Stage Partial with Spatial Attention,C2PSA)中提出一种基于混合局部通道注意力(Mixed Local Channel Attention,MLCA)机制模块,增强模型对大量样本的特征提取能力,可以克服复杂背景干扰并提升检测精度;将损失函数替换为Wise-IOU提出一种新的检测头WIOUv3-Detect(WDetect),降低因几何因素对低质量样本的过度惩罚,减少误识别、漏识别。实验结果表明,文中算法在满足边缘算力需求且提升计算速度的前提下,小麦样本检测精度mAP提升1.2%,葡萄样本提升1.9%,更均衡、更准确地进行农作物检测。 展开更多
关键词 机器人 无人机 目标检测 YOLO 通道注意力 Wise-IOU
在线阅读 下载PDF
基于改进YOLOv5s的输电通道隐患目标检测方法 被引量:1
13
作者 邢志鹏 郑含博 +2 位作者 崔明蕙 李金恒 梁炎燊 《中国测试》 北大核心 2025年第2期155-161,共7页
针对“三跨”输电线路容易受到外力破坏引发安全事故的问题,文章通过构建隐患目标数据集,提出基于改进YOLOv5s的输电通道隐患目标检测模型。一方面在模型头部引入SimAM(a simple,parameter-free attention module)注意力机制模块以加强... 针对“三跨”输电线路容易受到外力破坏引发安全事故的问题,文章通过构建隐患目标数据集,提出基于改进YOLOv5s的输电通道隐患目标检测模型。一方面在模型头部引入SimAM(a simple,parameter-free attention module)注意力机制模块以加强隐患目标在提取特征中的权重,另一方面使用WIoU(wise intersection over union)代替模型原始的CIoU(complete intersection over union)作为边界框回归损失函数以提高预测边界框的回归预测精度。实验结果表明,相较于基线模型,该文提出模型在参数量不变的同时,准确率上升了2百分点,召回率提高了1.1百分点;在阈值为0.5和0.5∶0.95时的精度分别提升了1.4百分点和1百分点;与当前主流的目标检测模型RetinaNet、SSD(single shot multibox detector)和YOLOv3进行对比评估,该文提出的模型精度明显高于其他三种模型。提出的改进方法可为输电通道防外破研究提供一种新思路。 展开更多
关键词 输电通道 防外力破坏 目标检测 SimAM注意力机制 Wise-IoU损失函数
在线阅读 下载PDF
面向模块化格基密钥封装机制算法多项式乘法的侧信道安全防护关键技术研究
14
作者 赵毅强 孔金笛 +5 位作者 付玉成 张启智 叶茂 夏显召 宋昕彤 何家骥 《电子与信息学报》 北大核心 2025年第9期3126-3136,共11页
后量子密码算法CRYSTALS-Kyber已被美国国家标准与技术研究院(NIST)标准化为唯一的模块化格基密钥封装机制方案(ML-KEM),以抵御大规模量子计算机的攻击。虽然后量子密码通过数学理论保证了算法的安全性,但在密码实现运算过程中仍面临侧... 后量子密码算法CRYSTALS-Kyber已被美国国家标准与技术研究院(NIST)标准化为唯一的模块化格基密钥封装机制方案(ML-KEM),以抵御大规模量子计算机的攻击。虽然后量子密码通过数学理论保证了算法的安全性,但在密码实现运算过程中仍面临侧信道威胁。该文针对当前后量子密码算法硬件实现中存在的侧信道泄露风险,提出一种随机伪轮隐藏防护技术,通过动态插入冗余模运算与线性反馈移位寄存器(LFSR)随机调度机制,破坏多项式逐点乘法(PWM)关键操作的时序特征,从而混淆侧信道信息相关性。为了验证其有效性,在Xilinx Spartan-6 FPGA平台对安全增强前后的Kyber解密模块进行实现,并开展基于选择密文的相关功耗分析(CPA)。实验结果表明,防护前攻击者仅需897~1 650条功耗迹线即可恢复Kyber长期密钥;防护后在10 000条迹线下仍无法成功破解,破解密钥所需迹线数量显著提高。同时,相较现有的Kyber防护实现方案,该文的安全增强设计在面积开销上优于其他的隐藏方案。 展开更多
关键词 后量子密码算法 侧信道攻击 相关功耗分析 多项式乘法 Kyber
在线阅读 下载PDF
基于像素级水平的通道自适应水下图像增强算法
15
作者 彭晏飞 张添淇 安彤 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1037-1045,共9页
现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G... 现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G和B三通道进行增强。此算法分4个阶段,通过4个阶段的分通道特征提取完成整个增强过程。首先,通过增强网络的局部和全局语义,优化通道衰减来修复上下文的颜色通道;其次,通过注意机制聚合空间和通道特征,并抑制不相关的颜色定位跳跃信息;然后,通过优化注意力机制调整自适应特征;最后,为提高算法色偏纠正能力,提出了一个色偏纠正模块,在第四阶段使用色偏调节模块进一步调整图像的色偏问题。在UIEB数据集和EUVP数据集上与其他算法进行对比,本文算法的PSNR指标提高了14.35%,SSIM提高了5.8%,UIQM提高了3.2%,UCIQE提高了13.7%,且主观效果最佳。 展开更多
关键词 水下图像增强 通道增强 像素级增强 深度学习
在线阅读 下载PDF
U-Net通道变换网络在腺体图像分割中的应用 被引量:3
16
作者 曹伟杰 段先华 +1 位作者 许振伟 盛帅 《中国图象图形学报》 CSCD 北大核心 2024年第3期713-724,共12页
目的 腺体医学图像分割是将医学图像中的腺体区域与周围组织分离出来的过程,对分割精度有极高要求。传统模型在对腺体医学图像分割时,因腺体形态多样性和小目标众多的特点,容易出现分割不精细或误分割等问题,对此根据腺体医学图像的特点... 目的 腺体医学图像分割是将医学图像中的腺体区域与周围组织分离出来的过程,对分割精度有极高要求。传统模型在对腺体医学图像分割时,因腺体形态多样性和小目标众多的特点,容易出现分割不精细或误分割等问题,对此根据腺体医学图像的特点对U-Net型通道变换网络分割模型进行改进,实现对腺体图像更高精度分割。方法 首先在U-Net型通道变换网络的编码器前端加入ASPP_SE(spatial pyramid pooling_squeeze-and-excitation networks)模块与ConvBatchNorm模块的组合,在增强编码器提取小目标特征信息能力的同时,防止模型训练出现过拟合现象。其次在编码器与跳跃连接中嵌入简化后的密集连接,增强编码器相邻模块特征信息融合。最后在通道融合变换器(channel cross fusion with Transformer,CCT)中加入细化器,将自注意力图投射到更高维度,提高自注意机制能力,增强编码器全局模块特征信息融合。简化后的密集连接与CCT结合使用,模型可以达到更好效果。结果 改进算法在公开腺体数据集MoNuSeg(multi-organ nuclei segmentation challenge)和Glas(gland segmentation)上进行实验。以Dice系数和IoU(intersectionoverunion)系数为主要指标,在MoNuSeg的结果为80.55%和67.32%,在Glas数据集的结果为92.23%和86.39%,比原U-Net型通道变换网络分别提升了0.88%、1.06%和1.53%、2.43%。结论 本文提出的改进算法在腺体医学分割上优于其他现有分割算法,能满足临床医学腺体图像分割要求。 展开更多
关键词 医学图像分割 U-Net型通道变换网络(UCTransNet) 密集连接 注意力机制 细化器
原文传递
钢轨表面缺陷检测Mask R-CNN算法研究与优化 被引量:3
17
作者 孟瑞锋 梁桢 +2 位作者 贾超 乔志 赵晨 《都市快轨交通》 北大核心 2024年第5期68-77,共10页
为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network... 为有效防止城市轨道交通事故发生,更好地保障运行安全,钢轨表面缺陷检测技术在巡检工作中发挥着重要作用。针对现有钢轨缺陷检测技术中检测精度差、小目标敏感度低等问题,在Mask R-CNN(mask region-based convolutional neural network)算法模型基础上,提出一种融合注意力机制的模型改进方案。该方案在特征提取网络中引入通道-空间复合注意力机制(channel-wise spatial module,CSM)用于实例分割缺陷检测,有效剔除干扰信息,获得多尺度特征表达,得到更多空间信息以及更优的浅层信息,从而提升对钢轨表面缺陷边缘检测能力。在相同的实验环境下,相对于Mask R-CNN算法,加入CSM后,Mask R-CNN模型的平均精度均值(mean average precision,mAP)提高了6.5%。其中,对钢轨“凹陷”“裂纹”以及“疲劳磨损”缺陷识别的平均精度(average precision,AP)分别提高了6.3%、6.9%和6.1%。横向对比发现,加入CSM后的Mask R-CNN模型,相较于Fast R-CNN模型,三种缺陷的分割效果分别提升了11.6%、12.5%和12.9%。同时,相较于Faster R-CNN模型,三种缺陷的分割效果分别提升了8.8%、10.0%和10.3%。加入CSM后的Mask R-CNN模型可以更好地识别三类缺陷,提升检测精度和小目标敏感度,为轨道智能巡检提供更安全有力的技术支持和保障。 展开更多
关键词 城市轨道交通 通道-空间注意力机制 钢轨缺陷 实例分割 Mask R-CNN算法
在线阅读 下载PDF
区域感知实时人像超分辨率重建网络
18
作者 龚柯存 周梦琳 唐东明 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期588-595,共8页
在人像超分辨率重建领域,传统方法通常将整幅图像进行统一处理,导致效率低下。为降低模型的推理时延,提出了一种实时超分辨率重建模型RASR。该模型利用门控单元处理低分辨率图像,识别出人像边缘区域;采用分区重建策略,使用不同尺寸的子... 在人像超分辨率重建领域,传统方法通常将整幅图像进行统一处理,导致效率低下。为降低模型的推理时延,提出了一种实时超分辨率重建模型RASR。该模型利用门控单元处理低分辨率图像,识别出人像边缘区域;采用分区重建策略,使用不同尺寸的子模型分别针对包含或不包含人像边缘的区域进行重建。实验结果表明:与现有方法相比,RASR模型在4倍上采样重建场景下的推理时延降低了88%,能够更有效地重建高分辨率人像图像。 展开更多
关键词 区域感知 单图像超分辨率 门控单元 通道划分块 深度学习
原文传递
面向电子装备装配引导的AR跟踪方法研究 被引量:3
19
作者 杜小东 王鹏 +2 位作者 史建成 王月 帅昊 《应用科学学报》 CAS CSCD 北大核心 2024年第3期416-424,共9页
为了提高面向电子装备装配引导的增强现实(augmented reality,AR)跟踪方法的鲁棒性与适用性,在像素投票姿态估计网络结构的基础上,结合深度可分离卷积和通道注意力机制对AR跟踪算法进行优化。首先,针对电子装备六自由度姿态公共数据集... 为了提高面向电子装备装配引导的增强现实(augmented reality,AR)跟踪方法的鲁棒性与适用性,在像素投票姿态估计网络结构的基础上,结合深度可分离卷积和通道注意力机制对AR跟踪算法进行优化。首先,针对电子装备六自由度姿态公共数据集稀缺与使用约束较多的问题,使用RGB-D相机采集并制作AR装配引导的电子装备的六自由度姿态训练数据集。然后,在基于像素投票的姿态估计网络结构基础上,使用深度可分离卷积对网络进行轻量化,并引入通道注意力机制对通道进行权重评估,以弥补网络轻量化造成的精度损失。最后,通过电子装备装配任务对提出的方法进行AR装配引导验证。实验结果表明:提出的跟踪注册方法相对于修改前的跟踪方法具有较好的鲁棒性,同时保持了装配引导的精度,能够对弱纹理的电子装备进行跟踪。 展开更多
关键词 电子装备 增强现实 三维跟踪 深度可分离卷积 通道注意力
在线阅读 下载PDF
一种基于通道注意力机制的交通监控视频超分辨率算法
20
作者 林哲显 《上海船舶运输科学研究所学报》 2024年第1期66-72,共7页
为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,... 为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,从而有效提升监控视频超分辨率图像的质量。在某交通监控场景下开展车牌识别试验,对该CA-BasicVSR模型的有效性进行验证,结果表明:在交通监控画面还原任务中,该模型对画面还原的峰值信噪比相比EDVR-L模型和BasicVSR模型能分别提高约1.3 dB和0.3 dB;在车牌识别任务中,使用该模型处理的交通监控视频画面作为输入,相比原始低分辨率的视频画面,能提高车牌识别的成功率。 展开更多
关键词 视频超分辨率 BasicVSR模型 通道注意力机制(CA) 车牌识别
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部