期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
SwinHCAD: A Robust Multi-Modality Segmentation Model for Brain Tumors Using Transformer and Channel-Wise Attention
1
作者 Seyong Jin Muhammad Fayaz +2 位作者 L.Minh Dang Hyoung-Kyu Song Hyeonjoon Moon 《Computers, Materials & Continua》 2026年第1期511-533,共23页
Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the b... Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the burden on medical staff and provides quantitative information,existing methodologies and recent models still struggle to accurately capture and classify the fine boundaries and diverse morphologies of tumors.In order to address these challenges and maximize the performance of brain tumor segmentation,this research introduces a novel SwinUNETR-based model by integrating a new decoder block,the Hierarchical Channel-wise Attention Decoder(HCAD),into a powerful SwinUNETR encoder.The HCAD decoder block utilizes hierarchical features and channelspecific attention mechanisms to further fuse information at different scales transmitted from the encoder and preserve spatial details throughout the reconstruction phase.Rigorous evaluations on the recent BraTS GLI datasets demonstrate that the proposed SwinHCAD model achieved superior and improved segmentation accuracy on both the Dice score and HD95 metrics across all tumor subregions(WT,TC,and ET)compared to baseline models.In particular,the rationale and contribution of the model design were clarified through ablation studies to verify the effectiveness of the proposed HCAD decoder block.The results of this study are expected to greatly contribute to enhancing the efficiency of clinical diagnosis and treatment planning by increasing the precision of automated brain tumor segmentation. 展开更多
关键词 Attention mechanism brain tumor segmentation channel-wise attention decoder deep learning medical imaging MRI transformer U-Net
在线阅读 下载PDF
Effective convolution mixed Transformer Siamese network for robust visual tracking
2
作者 Lin Chen Yungang Liu Yuan Wang 《Control Theory and Technology》 2025年第2期221-236,共16页
Siamese tracking algorithms usually take convolutional neural networks(CNNs)as feature extractors owing to their capability of extracting deep discriminative features.However,the convolution kernels in CNNs have limit... Siamese tracking algorithms usually take convolutional neural networks(CNNs)as feature extractors owing to their capability of extracting deep discriminative features.However,the convolution kernels in CNNs have limited receptive fields,making it difficult to capture global feature dependencies which is important for object detection,especially when the target undergoes large-scale variations or movement.In view of this,we develop a novel network called effective convolution mixed Transformer Siamese network(SiamCMT)for visual tracking,which integrates CNN-based and Transformer-based architectures to capture both local information and long-range dependencies.Specifically,we design a Transformer-based module named lightweight multi-head attention(LWMHA)which can be flexibly embedded into stage-wise CNNs and improve the network’s representation ability.Additionally,we introduce a stage-wise feature aggregation mechanism which integrates features learned from multiple stages.By leveraging both location and semantic information,this mechanism helps the SiamCMT to better locate and find the target.Moreover,to distinguish the contribution of different channels,a channel-wise attention mechanism is introduced to enhance the important channels and suppress the others.Extensive experiments on seven challenging benchmarks,i.e.,OTB2015,UAV123,GOT10K,LaSOT,DTB70,UAVTrack112_L,and VOT2018,demonstrate the effectiveness of the proposed algorithm.Specially,the proposed method outperforms the baseline by 3.5%and 3.1%in terms of precision and success rates with a real-time speed of 59.77 FPS on UAV123. 展开更多
关键词 Visual tracking Siamese network TRANSFORMER Feature aggregation channel-wise attention
原文传递
Systematic Analysis of Latent Fingerprint Patterns through Fractionally Optimized CNN Model for Interpretable Multi-Output Identification
3
作者 Mubeen Sabir Zeshan Aslam Khan +7 位作者 Muhammad Waqar Khizer Mehmood Muhammad Junaid Ali Asif Raja Naveed Ishtiaq Chaudhary Khalid Mehmood Cheema Muhammad Asif Zahoor Raja Muhammad Farhan Khan Syed Sohail Ahmed 《Computer Modeling in Engineering & Sciences》 2025年第10期807-855,共49页
Fingerprint classification is a biometric method for crime prevention.For the successful completion of various tasks,such as official attendance,banking transactions,andmembership requirements,fingerprint classificati... Fingerprint classification is a biometric method for crime prevention.For the successful completion of various tasks,such as official attendance,banking transactions,andmembership requirements,fingerprint classification methods require improvement in terms of accuracy,speed,and the interpretability of non-linear demographic features.Researchers have introduced several CNN-based fingerprint classification models with improved accuracy,but these models often lack effective feature extractionmechanisms and complex multineural architectures.In addition,existing literature primarily focuses on gender classification rather than accurately,efficiently,and confidently classifying hands and fingers through the interpretability of prominent features.This research seeks to improve a compact,robust,explainable,and non-linear feature extraction-based CNN model for robust fingerprint pattern analysis and accurate yet efficient fingerprint classification.The proposed model(a)recognizes gender,hands,and fingers correctly through an advanced channel-wise attention-based feature extraction procedure,(b)accelerates the fingerprints identification process by applying an innovative fractional optimizer within a simple,but effective classification architecture,and(c)interprets prominent features through an explainable artificial intelligence technique.The encapsulated dependencies among distinct complex features are captured through a non-linear activation operation within a customized CNN model.The proposed fractionally optimized convolutional neural network(FOCNN)model demonstrates improved performance compared to some existing models,achieving high accuracies of 97.85%,99.10%,and 99.29%for finger,gender,and hand classification,respectively,utilizing the benchmark Sokoto Coventry Fingerprint Dataset. 展开更多
关键词 Convolutional neural networks generalized fractional optimizer fingerprint classification explainable AI channel-wise feature extraction convergence speed
在线阅读 下载PDF
融合注意力的特征聚合孪生网络视觉跟踪
4
作者 金静 牛品 翟凤文 《计算机工程与应用》 北大核心 2025年第12期166-176,共11页
目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregat... 目前以孪生网络为基础的目标跟踪算法,仍然存在网络浅层的特征中有价值的上下文信息无法合理利用的问题。针对这一问题,提出一种融合拆分注意力机制(split-attention,SA)的目标跟踪算法SiamMCFA(siamese multi-channel feature aggregation module)。在骨干网络中引入拆分注意力机制,用来提取浅层特征中有价值的上下文信息,通过像素级互相关模块(pixel-wise cross correlation,PWCC)融合模板区域和搜索区域浅层和深层特征中的上下文信息,以增强模板区域和搜索区域的特征图之间的联系,从而提高跟踪器的鲁棒性。针对因尺度变化而容易导致目标丢失的问题,设计了一个多通道特征聚合模块(multi-channel feature aggregation module,MCFA),用于聚合目标不同区域的特征信息,使跟踪器尽可能地区分目标和语义背景,进一步提升跟踪准确性。最后,在OTB100、VOT2019、GOT10K和LaSOT四个数据集上进行了详尽的实验评估,结果显示,SiamMCFA与当前基于孪生网络的先进的跟踪器SiamCAR相比,其成功率(success rate)与精准度(precision)分别提高了2.26和2.83个百分点。与SiamIRCA相比成功率与精准度提高了0.3和0.9个百分点。 展开更多
关键词 目标跟踪 孪生网络 拆分注意力 像素级互相关 多通道特征聚合
在线阅读 下载PDF
基于DT-KAN-iTransformer的超短期风电功率多步预测 被引量:1
5
作者 鄢仁武 吴慧敏 李培强 《智慧电力》 北大核心 2025年第10期95-105,共11页
针对超短期风电功率多步预测中存在的数据分布偏移与多变量间通道相关性建模问题,提出一种基于DT-KAN-iTransformer的超短期风电功率多步预测模型。首先,为缓解风电数据在空间内与空间间存在的分布偏移,引入融合分布偏移(DT)模块在模型... 针对超短期风电功率多步预测中存在的数据分布偏移与多变量间通道相关性建模问题,提出一种基于DT-KAN-iTransformer的超短期风电功率多步预测模型。首先,为缓解风电数据在空间内与空间间存在的分布偏移,引入融合分布偏移(DT)模块在模型输入前后分别进行归一化与反归一化,以保持数据窗口分布一致性。其次,采用经科尔莫戈洛夫-阿诺德网络(KAN)改进的iTransformer网络,通过转置嵌入和非线性映射建立不同变量间的通道相关性,捕捉多变量间的非线性关系。最后,基于200 MW风电场实际数据,与9种基准模型进行对比实验。结果表明,所提出的DT-KAN-iTransformer模型在3项评价指标中均表现出更高的预测精度。 展开更多
关键词 风电功率 超短期 多步预测 分布偏移 通道相关性 DT-KAN-iTransformer
在线阅读 下载PDF
结合深度信息引导和多尺度通道注意力机制的单目三维目标检测算法 被引量:3
6
作者 刘青 李伟 +3 位作者 余少勇 宋宇萍 周启迪 邹伟林 《山东大学学报(理学版)》 北大核心 2025年第1期63-73,82,共12页
针对三维边界框无法从缺少空间线索的单目图像中准确估计的问题,本文提出一种基于深度信息引导和多尺度通道注意力机制的单目三维目标检测算法。为了引入三维信息并有效地获取和利用不同尺度特征图的空间信息,在特征提取模块中利用多尺... 针对三维边界框无法从缺少空间线索的单目图像中准确估计的问题,本文提出一种基于深度信息引导和多尺度通道注意力机制的单目三维目标检测算法。为了引入三维信息并有效地获取和利用不同尺度特征图的空间信息,在特征提取模块中利用多尺度分割注意力算法,分别从单目图像和深度图中提取多尺度预处理特征图,利用通道注意力算法进行权重标定,提高了特征图的表征能力。通过深度引导动态局部卷积网络,将包含多尺度信息的深度图特征作为单目图像特征的特定卷积核,引入三维信息作为指导,减少直接融合的误差累积,并解决单目视觉中近大远小的尺度敏感问题。选择不同的评估指标对模型的性能进行评价与比较。实验结果表明,同其他算法相比,本文算法的自动驾驶数据集中汽车、行人、骑自行车的人的三维目标检测平均精度均提高。 展开更多
关键词 单目三维目标检测 深度引导 多尺度通道注意力机制 自动驾驶
原文传递
利用可选择多尺度图卷积网络的骨架行为识别
7
作者 曹毅 李杰 +2 位作者 叶培涛 王彦雯 吕贤海 《电子与信息学报》 北大核心 2025年第3期839-849,共11页
针对目前骨架行为识别方法忽视骨架关节点多尺度依赖关系和无法合理利用卷积核进行时间建模的问题,该文提出了一种可选择多尺度图卷积网络(SMS-GCN)的行为识别模型。首先,介绍了人体骨架图的构建原理和通道拓扑细化图卷积网络的结构;其... 针对目前骨架行为识别方法忽视骨架关节点多尺度依赖关系和无法合理利用卷积核进行时间建模的问题,该文提出了一种可选择多尺度图卷积网络(SMS-GCN)的行为识别模型。首先,介绍了人体骨架图的构建原理和通道拓扑细化图卷积网络的结构;其次,构建成对关节邻接矩阵和多关节邻接矩阵以生成多尺度通道拓扑细化邻接矩阵,并引入图卷积网络,进一步提出多尺度图卷积(MS-GC)模块,以期实现对骨架关节点的多尺度依赖关系的建模;然后,基于多尺度时序卷积和可选择大核网络,提出可选择多尺度时序卷积(SMS-TC)模块,以期实现对有用的时间上下文特征的充分提取,同时结合MS-GC和SMS-TC模块,进而提出可选择多尺度图卷积网络模型并在多支流数据输入下进行训练;最后,在NTU-RGB+D和NTU-RGB+D 120数据集上进行大量实验,实验结果表明,该模型能够捕获更多的关节特征和学习有用的时间信息,具有优异的准确率和泛化能力。 展开更多
关键词 骨架行为识别 图卷积网络 多尺度通道拓扑细化邻接矩阵 可选择多尺度时序卷积 可选择多尺度图卷积网络
在线阅读 下载PDF
基于通道自注意力机制的图像降噪算法
8
作者 吴畏 吴昊 《长春师范大学学报》 2025年第2期42-50,共9页
基于卷积神经网络的图像降噪算法对图像自身信息的利用率相对有限,导致降噪后的图像出现一定程度的失真。Transformer架构中的自注意力机制能够有效利用图片自身信息,但计算量相对较高,对内存空间依赖相对较大。针对卷积神经网络信息利... 基于卷积神经网络的图像降噪算法对图像自身信息的利用率相对有限,导致降噪后的图像出现一定程度的失真。Transformer架构中的自注意力机制能够有效利用图片自身信息,但计算量相对较高,对内存空间依赖相对较大。针对卷积神经网络信息利用率相对有限以及Transformer计算量大的缺陷,提出一种基于通道自注意力机制的图像降噪算法,该算法能够有效利用图片自身信息,降低Transformer的计算量。实验结果表明,本文算法能够在保证降噪效率的基础上有效提升图片降噪效果,在与主流降噪算法的对比中也能取得较优的降噪效果。 展开更多
关键词 图像降噪 卷积神经网络 TRANSFORMER 通道自注意力
在线阅读 下载PDF
改进YOLOv11的雨天场景检测算法
9
作者 郝培男 张颖 +2 位作者 宁慧聪 闫田子 胡旭如 《计算机应用文摘》 2025年第24期63-66,74,共5页
面对雨天场景中语义模糊与密集雨滴造成的遮挡问题,文章在YOLOv11框架上引入空间辅助通道注意力机制进行改进。首先,通过多语义特征分解充分挖掘目标在不同语义层次上的特征表达;其次,结合空间注意力机制从模糊及受干扰图像中提取关键特... 面对雨天场景中语义模糊与密集雨滴造成的遮挡问题,文章在YOLOv11框架上引入空间辅助通道注意力机制进行改进。首先,通过多语义特征分解充分挖掘目标在不同语义层次上的特征表达;其次,结合空间注意力机制从模糊及受干扰图像中提取关键特征,减弱雨滴与反光噪声对特征提取的影响;再次,引入通道自注意力机制以降低通道间语义差异,从而增强目标与背景的区分能力;最后,通过协作融合机制整合多层特征,提高整体检测性能。实验结果表明,改进算法在雨天场景下的mAP@50和mAP@50-95分别达到27.5%与16.2%,较原YOLOv11模型提高1.4%和0.7%。为进一步验证该算法的普适性,文章在PASCAL VOC数据集上对YOLO系列模型进行了对比。结果显示,改进算法在20个类别中的18个类别上获得更优检测性能,证明其在复杂雨天环境下具有更高的鲁棒性与适用性。 展开更多
关键词 雨天场景检测 空间注意力机制 通道自注意力机制 注意力协作
在线阅读 下载PDF
基于轻量化YOLOv7的带式输送机输送带撕裂检测算法 被引量:2
10
作者 安龙辉 王满利 张长森 《电子测量技术》 北大核心 2025年第1期64-75,共12页
针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态... 针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态非单调FM的Wise-IoU损失函数,使模型更加关注普通质量的样本,提高模型检测性能。然后,使用LAMP剪枝方法,提高模型的计算速度并降低计算复杂度,实现检测网络的轻量化,采用通道知识蒸馏无损提高模型精度,最后使用TensorRT加速模型,达到更快的检测速度。实验结果表明,与基准模型相比,改进后模型的参数量和计算量分别减少了86.8%、49.2%,mAP@0.5:0.95达到了62.4%,并且检测速度提升151.0 fps,模型大小从71.3 MB减少到12.8 MB。经过改进后的模型,提高了对输送带撕裂故障检测的准确性和实时性。 展开更多
关键词 YOLOv7 目标检测 Wise-IoU LAMP剪枝 通道知识蒸馏 TensorRT
原文传递
基于改进YOLOv8的钢材质表面缺陷检测
11
作者 张惠 韩跃平 李瑞红 《测试技术学报》 2025年第4期430-438,共9页
随着新一代信息技术与制造业的深入融合,制造产业发生巨大变革,工业生产中表面缺陷的检测愈发重要。针对钢表面缺陷检测中存在漏检和误检以及检测精度不高等问题,提出一种基于YOLOv8改进模型的算法。首先,在主干网络中将原有C2f模块融... 随着新一代信息技术与制造业的深入融合,制造产业发生巨大变革,工业生产中表面缺陷的检测愈发重要。针对钢表面缺陷检测中存在漏检和误检以及检测精度不高等问题,提出一种基于YOLOv8改进模型的算法。首先,在主干网络中将原有C2f模块融合了一种空间和通道重建卷积模块,减少了密集模型参数中的固有冗余,进一步构建轻量级网络模型;然后,在Neck阶段使用双向特征金字塔网络代替路径聚合网络,旨在使用有效的特征融合方式提高算法的检测性能;最后,使用Wise-IOUv1代替原YOLOv8中的CIOU来优化损失函数。实验证明,改进后的YOLOv8算法与原算法相比,m AP提高了8.1百分点,计算量降低了9.6百分点,检测速度提高了8.7百分点,检测效果优于原算法,很大程度提高了钢表面缺陷检测的检测性能。 展开更多
关键词 缺陷检测 YOLOv8 空间和通道重建卷积 特征融合 Wise-IOUv1
在线阅读 下载PDF
时频注意力和通道式门控的合成语声检测
12
作者 毛嘉莹 魏小鹏 张婷婷 《应用声学》 北大核心 2025年第6期1614-1622,共9页
深度神经网络的发展极大提高了合成语声的相似度和自然度,这给合成语声检测带来了全新挑战。为了充分利用语声数据中的时域和频域信息,并根据输入的语声数据动态地选择通道特征以抑制不相关的通道,提出了一种基于时频注意力和通道式门... 深度神经网络的发展极大提高了合成语声的相似度和自然度,这给合成语声检测带来了全新挑战。为了充分利用语声数据中的时域和频域信息,并根据输入的语声数据动态地选择通道特征以抑制不相关的通道,提出了一种基于时频注意力和通道式门控的合成语声检测模型。该模型首先利用SincNet架构进行前端特征学习;然后,通过时频注意力模块有效地整合时域与频域信息并突出其关键信息;最后,使用多组潜在空间通道级门控模块解决时频信息融合造成的通道信息冗余问题,并使模型在训练过程中有选择性地从各个通道中学习区分性更高的信息。在ASVspoof2019 LA数据集上的实验结果表明,提出的方法在等错误率和最小串联检测成本函数两个指标上与当前的先进模型相比有一定的竞争力。同时,模型在ASVspoof2015 LA和ASVspoof2021 LA数据集上的表现也证明了其具有良好的泛化能力。 展开更多
关键词 合成语声检测 时频注意力 通道式门控
在线阅读 下载PDF
基于深度非对称可分离卷积的人脸表情识别
13
作者 戚星烁 胡黄水 +1 位作者 唐志振 王玲 《长春工业大学学报》 2025年第2期143-148,共6页
提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了... 提出深度非对称可分离卷积在网络结构不变的情况下,有效地降低了网络的参数。为了提高人脸表情的识别准确率,提出了改进通道注意力机制,通过指数函数增大不同通道特征图之间的差异,更突出关键特征。在Fer2013数据集上的实验表明,验证了文中提出的深度非对称可分离卷积和改进通道注意力机制的有效性。 展开更多
关键词 计算机视觉 人脸表情识别 深度可分离卷积 通道注意力机制
在线阅读 下载PDF
基于通道注意力和特征融合的伪造语音检测研究
14
作者 汤龙 雷震春 《计算机技术与发展》 2025年第10期131-138,共8页
随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临... 随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临的一系列问题。为了聚集丰富的上下文信息和融合尺度不一致的特征,该文提出了双分支通道注意力模块,利用深度卷积沿通道维度聚合多尺度上下文信息,同时在两个分支上捕捉全局和局部特征信息;然后提出了注意力特征融合模块,将LFCC特征经过真实语音GMM和欺骗语音GMM得到对数高斯概率特征,随后基于注意力进行特征融合以学习具有通道上下文信息和全局局部特征信息的交互特征,解决了特征融合机制场景单一的问题。与基线系统相比,文中最佳系统AFF-ResNet在ASVSpoof2021LA数据集上的EER和min t-DCF分别降低37.5%和15.3%。实验结果表明,该方法显著提升了语音欺骗检测的准确率。 展开更多
关键词 伪造语音检测 对数高斯概率特征 通道注意力 深度卷积 多尺度上下文信息 特征融合
在线阅读 下载PDF
联合元素乘法算子与通道剪枝的钢材表面缺陷检测网络
15
作者 杨春龙 吕东澔 +2 位作者 张勇 田旭 王城智 《计算机工程与应用》 北大核心 2025年第22期245-256,共12页
针对目前钢材表面缺陷检测网络在资源受限设备上难以实时精准检测的问题,提出了一种联合元素乘法算子与通道剪枝的钢材表面缺陷检测网络。为提高缺陷特征的有效提取,设计了特征空间膨胀模块(feature space expansion module,FSEM)和边... 针对目前钢材表面缺陷检测网络在资源受限设备上难以实时精准检测的问题,提出了一种联合元素乘法算子与通道剪枝的钢材表面缺陷检测网络。为提高缺陷特征的有效提取,设计了特征空间膨胀模块(feature space expansion module,FSEM)和边缘特征提取模块,采用四层分层架构构建轻量级高效特征提取网络(lightweight and efficient feature extraction network,LENet);为提升多尺度特征的有效融合,基于通道先验卷积注意力(channelprior convolutional attention,CPCA)设计了自适应融合(adaptive fusion,AW-Fusion)模块和FSEM,采用特征金字塔架构构建自适应多尺度特征融合网络(adaptive multi-scale feature fusion network,AMFN);为降低网络复杂度和提升网络检测速度,采用通道剪枝对网络进行后端压缩。在数据集NEU-DET上进行相关实验来验证网络的有效性和优越性。实验结果表明,剪枝后的网络在低复杂度下检测精度为78.1%,检测速度为179.8 FPS,满足实际应用需求。 展开更多
关键词 元素乘法算子 钢材表面 缺陷检测 通道剪枝
在线阅读 下载PDF
基于改进YOLOv11的农作物实时检测研究
16
作者 冉书伟 张丽丽 +4 位作者 王维政 宋昕蕊 王佳佳 倪雪松 马玉国 《智慧农业导刊》 2025年第10期27-31,共5页
采摘机器人或无人机等智能农业装备在进行视觉检测作业时往往背景环境复杂、画面中同时存在大量样本,而且现有目标检测方法对低质量样本考虑不充分,致使传统目标检测模型检测不准。该文提出一种基于YOLOv11-MW的轻量化农作物实时检测模... 采摘机器人或无人机等智能农业装备在进行视觉检测作业时往往背景环境复杂、画面中同时存在大量样本,而且现有目标检测方法对低质量样本考虑不充分,致使传统目标检测模型检测不准。该文提出一种基于YOLOv11-MW的轻量化农作物实时检测模型,在骨干网络的跨阶段部分连接与空间注意力结构(Cross Stage Partial with Spatial Attention,C2PSA)中提出一种基于混合局部通道注意力(Mixed Local Channel Attention,MLCA)机制模块,增强模型对大量样本的特征提取能力,可以克服复杂背景干扰并提升检测精度;将损失函数替换为Wise-IOU提出一种新的检测头WIOUv3-Detect(WDetect),降低因几何因素对低质量样本的过度惩罚,减少误识别、漏识别。实验结果表明,文中算法在满足边缘算力需求且提升计算速度的前提下,小麦样本检测精度mAP提升1.2%,葡萄样本提升1.9%,更均衡、更准确地进行农作物检测。 展开更多
关键词 机器人 无人机 目标检测 YOLO 通道注意力 Wise-IOU
在线阅读 下载PDF
基于改进YOLOv5s的输电通道隐患目标检测方法 被引量:1
17
作者 邢志鹏 郑含博 +2 位作者 崔明蕙 李金恒 梁炎燊 《中国测试》 北大核心 2025年第2期155-161,共7页
针对“三跨”输电线路容易受到外力破坏引发安全事故的问题,文章通过构建隐患目标数据集,提出基于改进YOLOv5s的输电通道隐患目标检测模型。一方面在模型头部引入SimAM(a simple,parameter-free attention module)注意力机制模块以加强... 针对“三跨”输电线路容易受到外力破坏引发安全事故的问题,文章通过构建隐患目标数据集,提出基于改进YOLOv5s的输电通道隐患目标检测模型。一方面在模型头部引入SimAM(a simple,parameter-free attention module)注意力机制模块以加强隐患目标在提取特征中的权重,另一方面使用WIoU(wise intersection over union)代替模型原始的CIoU(complete intersection over union)作为边界框回归损失函数以提高预测边界框的回归预测精度。实验结果表明,相较于基线模型,该文提出模型在参数量不变的同时,准确率上升了2百分点,召回率提高了1.1百分点;在阈值为0.5和0.5∶0.95时的精度分别提升了1.4百分点和1百分点;与当前主流的目标检测模型RetinaNet、SSD(single shot multibox detector)和YOLOv3进行对比评估,该文提出的模型精度明显高于其他三种模型。提出的改进方法可为输电通道防外破研究提供一种新思路。 展开更多
关键词 输电通道 防外力破坏 目标检测 SimAM注意力机制 Wise-IoU损失函数
在线阅读 下载PDF
面向模块化格基密钥封装机制算法多项式乘法的侧信道安全防护关键技术研究
18
作者 赵毅强 孔金笛 +5 位作者 付玉成 张启智 叶茂 夏显召 宋昕彤 何家骥 《电子与信息学报》 北大核心 2025年第9期3126-3136,共11页
后量子密码算法CRYSTALS-Kyber已被美国国家标准与技术研究院(NIST)标准化为唯一的模块化格基密钥封装机制方案(ML-KEM),以抵御大规模量子计算机的攻击。虽然后量子密码通过数学理论保证了算法的安全性,但在密码实现运算过程中仍面临侧... 后量子密码算法CRYSTALS-Kyber已被美国国家标准与技术研究院(NIST)标准化为唯一的模块化格基密钥封装机制方案(ML-KEM),以抵御大规模量子计算机的攻击。虽然后量子密码通过数学理论保证了算法的安全性,但在密码实现运算过程中仍面临侧信道威胁。该文针对当前后量子密码算法硬件实现中存在的侧信道泄露风险,提出一种随机伪轮隐藏防护技术,通过动态插入冗余模运算与线性反馈移位寄存器(LFSR)随机调度机制,破坏多项式逐点乘法(PWM)关键操作的时序特征,从而混淆侧信道信息相关性。为了验证其有效性,在Xilinx Spartan-6 FPGA平台对安全增强前后的Kyber解密模块进行实现,并开展基于选择密文的相关功耗分析(CPA)。实验结果表明,防护前攻击者仅需897~1 650条功耗迹线即可恢复Kyber长期密钥;防护后在10 000条迹线下仍无法成功破解,破解密钥所需迹线数量显著提高。同时,相较现有的Kyber防护实现方案,该文的安全增强设计在面积开销上优于其他的隐藏方案。 展开更多
关键词 后量子密码算法 侧信道攻击 相关功耗分析 多项式乘法 Kyber
在线阅读 下载PDF
基于面向通道分组卷积网络的番茄主要器官实时识别 被引量:16
19
作者 周云成 许童羽 +1 位作者 邓寒冰 苗腾 《农业工程学报》 EI CAS CSCD 北大核心 2018年第10期153-162,共10页
番茄器官的实时准确识别是实现自动采摘、靶向施药等自动化生产的关键。该文提出一种基于面向通道分组卷积网络的番茄主要器官实时识别网络模型,该模型直接用特征图预测番茄器官目标边界和类型。以统计可分性、计算速度等为判据,并结合... 番茄器官的实时准确识别是实现自动采摘、靶向施药等自动化生产的关键。该文提出一种基于面向通道分组卷积网络的番茄主要器官实时识别网络模型,该模型直接用特征图预测番茄器官目标边界和类型。以统计可分性、计算速度等为判据,并结合样本扩增训练,分析了该网络和几种典型网络在番茄器官图像处理上的性能,以此筛选出识别网络的基础结构,在基础结构后面分别附加带dropout层的面向通道分组卷积模块和全卷积层作为识别网络的总体架构。试验结果表明:用面向通道分组卷积网络作为识别网络的基础结构,可在显著提高网络召回率、识别速度和精度的前提下,大幅降低模型的大小,该结构网络对花、果、茎识别的平均精度分别为96.52%、97.85%和82.62%,召回率分别为77.39%、69.33%和64.23%,识别速度为62帧/s;与YOLOv2相比,该文识别网络召回率提高了14.03个百分点,精度提高了2.51个百分点。 展开更多
关键词 图像识别 算法 实时识别 番茄 卷积神经网络 面向通道分组卷积 特征提取
在线阅读 下载PDF
基于导频ICI自消除的OFDM系统时变信道估计 被引量:4
20
作者 丁勇 欧阳缮 +1 位作者 谢跃雷 肖海林 《系统工程与电子技术》 EI CSCD 北大核心 2014年第8期1632-1637,共6页
在基于分段线性模型的正交频分复用(orthogonal frequency division multiplexing,OFDM)时变信道估计中,存在模型参数估计精度受到载波间干扰(inter-carrier interference,ICI)影响的问题。为此,本文采用ICI自消除技术,抑制了导频子载波... 在基于分段线性模型的正交频分复用(orthogonal frequency division multiplexing,OFDM)时变信道估计中,存在模型参数估计精度受到载波间干扰(inter-carrier interference,ICI)影响的问题。为此,本文采用ICI自消除技术,抑制了导频子载波的ICI,改善了模型参数的估计性能。此外,还推导了单抽头Jakes信道条件下模型参数估计均方误差的表达式,理论分析表明,与基本的分段线性模型方法相比,本文方法可以使均方误差下降约13dB。仿真结果验证了在多抽头信道和大的多普勒扩展条件下,本文方法也能明显提高ICI抑制能力,从而得到更好的系统误码性能。 展开更多
关键词 正交频分复用 信道估计 分段线性模型 载波间干扰抑制
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部