期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
基于时空交互网络的人体行为检测方法研究 被引量:1
1
作者 田青 张浩然 +2 位作者 楚柏青 张正 豆飞 《计算机应用与软件》 北大核心 2025年第4期156-165,共10页
针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和... 针对现有的人体行为检测方法中,存在特征融合能力较差、时序信息相关性不强和行为边界不明确等问题,提出一种基于时空交互网络的人体行为检测方法。重新设计了双流特征提取模块,在空间流和时空流两个网络之间添加连接层;分别在空间流和时间流网络中引入改进的空间变换网络和视觉注意力模型;设计基于像素筛选器的特征融合模块,用于重点区域时序信息相关性的计算和两类不同维度特征的聚合;对网络的损失函数进行了优化。在AVA数据集上的实验结果表明该方法在检测精度、速度以及泛化能力上具有优越性。 展开更多
关键词 时空交互网络 人体行为检测 视觉注意力 特征融合 损失函数
在线阅读 下载PDF
多尺度密集交互注意力残差真实图像去噪网络 被引量:1
2
作者 郭业才 胡晓伟 +1 位作者 AMITAVE Saha 毛湘南 《图学学报》 北大核心 2025年第2期279-287,共9页
针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级... 针对图像去噪特征提取不全面以及特征利用率低,导致生成图像不够清晰的问题,提出一种多尺度密集交互注意力残差去噪网络(MDIARN)。首先,通过多尺度非对称特征提取模块(MAFM)初步提取浅层信息特征,以确保图像特征的多样性;然后,多尺度级联模块(MSCM)利用多维密集交互残差单元(MDIU)对图像特征进行多维映射,并逐步级联以增强模型之间的信息传递和交互性,充分拟合训练数据;引入双路全局注意力模块(DGAM)对多级特征进行全局联合学习,获取更具有判别性的特征信息;跳跃连接促进结构之间的参数共享,使不同维度的特征充分融合,保证信息的完整性;最后,采用残差学习构建出清晰的去噪图像。结果表明,该算法在真实噪声数据集(DND和SIDD)上峰值信噪比分别为39.80 dB和39.62 dB,结构相似性分别为95.4%和95.8%,均优于主流去噪算法。此外,该算法在低光度场景下应用也能保留更多细节,从而显著提升图像质量。 展开更多
关键词 图像去噪 多尺度特征提取 多维密集交互 卷积神经网络 注意力
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
3
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
面向点云理解的双邻域图卷积方法
4
作者 李宗民 徐畅 +2 位作者 白云 鲜世洋 戎光彩 《浙江大学学报(工学版)》 北大核心 2025年第5期879-889,共11页
针对现有方法对局部点云结构建模时空间跨度有限以及传统特征聚合方法造成一定信息损失的问题,提出双邻域图卷积网络(DNGCN).在原始点云中增加角度先验,以增强对点云局部几何结构的理解,捕捉局部细节.对原始邻域进行扩展,在局域内设计... 针对现有方法对局部点云结构建模时空间跨度有限以及传统特征聚合方法造成一定信息损失的问题,提出双邻域图卷积网络(DNGCN).在原始点云中增加角度先验,以增强对点云局部几何结构的理解,捕捉局部细节.对原始邻域进行扩展,在局域内设计双邻域图卷积,通过集成高斯自适应聚合,在提取较大感受野范围内显著特征的同时,充分保留原始邻域信息.通过局部-全局信息交互来增大局部点的空间跨度,捕获远距离依赖关系.本文方法在分类数据集ModelNet40和ScanObjectNN上分别取得了94.1%、89.6%的总体精度,与其他先进算法相比有显著提升,较DGCNN分别提升了1.2%、11.5%.在部件分割数据集ShapeNetPart和语义分割数据集ScanNetv2、S3DIS上均获得优秀的性能,平均交并比分别为86.7%、74.9%和69.8%.通过大量的实验,证明了该模型的有效性. 展开更多
关键词 点云特征 图卷积网络 几何增强 局部全局交互 注意力机制
在线阅读 下载PDF
基于跨模态特征交互和多尺度重建的红外与可见光图像融合
5
作者 姚睿 王凯 +2 位作者 郭浩帆 胡文涛 田祥瑞 《红外与激光工程》 北大核心 2025年第8期259-270,共12页
针对弱光环境下红外与可见光图像融合存在的纹理细节丢失、视觉效果和实时性差等问题,提出了一种基于跨模态特征交互和多尺度重建(Cross-modal Feature Interaction and Multi-scale Reconstruction,CFIMR)的红外与可见光图像融合算法CF... 针对弱光环境下红外与可见光图像融合存在的纹理细节丢失、视觉效果和实时性差等问题,提出了一种基于跨模态特征交互和多尺度重建(Cross-modal Feature Interaction and Multi-scale Reconstruction,CFIMR)的红外与可见光图像融合算法CFIMRFusion。该算法构建了包括卷积注意力增强模块、编码器网络、跨模态特征交互融合模块和基于多尺度重建的解码器网络的四阶段融合框架。首先,设计卷积注意力增强模块提升弱可见光图像的对比度和纹理可见性,并利用编码器网络从红外图像和增强后的可见光图像中提取深层多尺度特征。然后,提出基于通道-空间注意力的跨模态特征交互融合模块,对红外显著特征和可见光细节特征进行互补融合。最后,为解决使用普通解码器重建图像时出现特征消失等问题,将融合得到的多尺度特征以跳跃连接的方式输入到解码器各级,重建高保真的融合图像。实验结果表明,CFIMRFusion融合图像的细节特征和整体视觉效果优于对比算法;且与最优对比算法相比,融合图像在TNO数据集中平均梯度、边缘强度分别提升了15.8%、18.2%,在LLVIP数据集中互信息、标准差分别提升了11.5%、9.5%,在MSRS数据集中边缘强度提升了10.1%;三个数据集上的融合速度分别为最快对比算法的24.1%、23.86%和25.2%。 展开更多
关键词 图像融合 图像增强 注意力机制 自编码网络 跨模态特征交互
原文传递
基于自注意力特征交互的红外与可见光图像融合方法
6
作者 管芳景 蒋琦炜 +1 位作者 罗晓清 金琦淳 《红外技术》 北大核心 2025年第11期1406-1414,共9页
现有多传感器图像融合方法存在层次特征融合不充分、解耦的互补特征难以鉴别的问题,为此本文提出了一种基于自注意力特征交互的红外与可见光图像融合方法。该方法在孪生分支上约束深层特征的相似性,促使多层级多尺度的互补特征通过交互... 现有多传感器图像融合方法存在层次特征融合不充分、解耦的互补特征难以鉴别的问题,为此本文提出了一种基于自注意力特征交互的红外与可见光图像融合方法。该方法在孪生分支上约束深层特征的相似性,促使多层级多尺度的互补特征通过交互模块进行合理的交换与融合。具体地,交互模块利用跨模态注意力机制计算多模态图像之间的局部特征不相似度,并以此作为特征的交互系数实现上下分支特征的交互。但是不相似度量易受噪声、伪影等信息影响,误判其为互补信息。由于该类信息对于本模态图像较为孤立,本方法通过计算全局自注意力系数判别该类信息。最终的交互系数由跨模态注意力系数与全局自注意力系数两部分组成,可以有效地提取互补特征。同时,为了保证融合特征的完整性与一致性,本方法提出特征循环一致性损失对融合特征进行约束,促使融合图像具备更丰富的源图像信息。为适应融合场景的多样性,本文提出了一种基于掩码与池化的融合损失函数。通过在TNO、RoadScene等数据集上与其他State-of-the-Art方法进行主客观指标比较,检验了本文方法的优越性。 展开更多
关键词 特征相似性 特征交互 自注意力 孪生网络 红外与可见光 图像融合
在线阅读 下载PDF
具有特征交互适应的3D双手网格重建方法
7
作者 刘佳 张家辉 陈大鹏 《信号处理》 北大核心 2025年第7期1291-1302,共12页
从单张RGB图像中实现双手的3D交互式网格重建是一项极具挑战性的任务。由于双手之间的相互遮挡以及局部外观相似性较高,导致部分特征提取不够准确,从而丢失了双手之间的交互信息并使重建的手部网格与输入图像出现不对齐等问题。为了解... 从单张RGB图像中实现双手的3D交互式网格重建是一项极具挑战性的任务。由于双手之间的相互遮挡以及局部外观相似性较高,导致部分特征提取不够准确,从而丢失了双手之间的交互信息并使重建的手部网格与输入图像出现不对齐等问题。为了解决上述问题,本文首先提出一种包含两个部分的特征交互适应模块,第一部分特征交互在保留左右手分离特征的同时生成两种新的特征表示,并通过交互注意力模块捕获双手的交互特征;第二部分特征适应则是将此交互特征利用交互注意力模块适应到每只手,为左右手特征注入全局上下文信息。其次,引入三层图卷积细化网络结构用于精确回归双手网格顶点,并通过基于注意力机制的特征对齐模块增强顶点特征和图像特征的对齐,从而增强重建的手部网格和输入图像的对齐。同时提出一种新的多层感知机结构,通过下采样和上采样操作学习多尺度特征信息。最后,设计相对偏移损失函数约束双手的空间关系。在InterHand2.6M数据集上的定量和定性实验表明,与现有的优秀方法相比,所提出的方法显著提升了模型性能,其中平均每关节位置误差(Mean Per Joint Position Error,MPJPE)和平均每顶点位置误差(Mean Per Vertex Position Error,MPVPE)分别降低至7.19 mm和7.33 mm。此外,在RGB2Hands和EgoHands数据集上进行泛化性实验,定性实验结果表明所提出的方法具有良好的泛化能力,能够适应不同环境背景下的手部网格重建。 展开更多
关键词 双手重建 注意力机制 特征交互适应 特征对齐 图卷积网络
在线阅读 下载PDF
基于改进RT-DETR的葡萄叶片病害检测
8
作者 王海瑞 胡灿 +1 位作者 朱贵富 蒋晨 《湖南农业大学学报(自然科学版)》 北大核心 2025年第4期117-124,共8页
针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提... 针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提取能力,并在模型的主干特征提取部分加入DCNv2_CA模块来提高模型对病害深层关键特征的提取能力;其次,在模型的特征交互模块中引入高低频特征交互(HiLo)注意力机制,使模型能同时关注特征的高低频信息,提高模型对葡萄细小病害的检测能力;最后,用聚合–分发机制重构模型的跨层融合网络,使其能更充分地融合各个层级之间的信息,进一步提升模型对相似表型症状病害的识别性能。结果表明:改进RT-DETR模型的病害检测准确率、召回率和平均精度均值分别达到了90.8%、89.5%和93.4%,相较于初始模型分别提升了5.4、3.9和5.6个百分点,且相对于其他模型也具有明显的优势。综上可见,改进后的RT-DETR模型能够准确地实现葡萄叶片病害检测。 展开更多
关键词 葡萄叶片 目标检测 病害检测 RT-DETR 注意力机制 可变形卷积网络 高低频特征交互 聚合–分发机制
在线阅读 下载PDF
空间-光谱联合解卷的全色锐化网络
9
作者 郑建炜 夏弘毅 徐宏辉 《光子学报》 北大核心 2025年第1期176-188,共13页
以深度解卷网络为核心的全色锐化方法虽兼具可解释理论框架和自学习能力,然而往往采用简单网络各自逼近空间、光谱退化矩阵,缺乏协作的先验学习策略。为此,提出空间-光谱联合解卷网络,在迭代优化的理论指导下分别通过多尺度级联策略和... 以深度解卷网络为核心的全色锐化方法虽兼具可解释理论框架和自学习能力,然而往往采用简单网络各自逼近空间、光谱退化矩阵,缺乏协作的先验学习策略。为此,提出空间-光谱联合解卷网络,在迭代优化的理论指导下分别通过多尺度级联策略和点卷积操作实现自适应空间、光谱响应矩阵估计,并构建以注意力为基础的空间-光谱先验算子。在先验算子求解中,提出由多头光谱注意力和多头空间注意力组成的联合注意机制,分别在局部窗口中沿光谱和空间维度计算自注意力值,以捕获长程频谱依赖性,并建模全局空间交互作用。进一步构建了联合网络架构用于空间和光谱注意力间的精确信息融合。此外,设计了一种尺度感知协作模块,以捕获图像的多尺度局部特征。三个遥感数据集的实验结果证明了所提方案在数值和可视化结果层面均优于其他对比方法,其中在GF-2数据集上实现了0.798 dB的峰值信噪比增益。 展开更多
关键词 遥感图像 全色锐化 深度学习 网络解卷 TRANSFORMER 多尺度卷积 特征交互
在线阅读 下载PDF
面向知识图谱的网络信息自监督强化学习推荐模型
10
作者 封顺 《现代电子技术》 北大核心 2025年第10期142-146,共5页
为深入理解和挖掘用户历史网络交互信息中的行为特征,动态提取用户交互行为变化,实现网络信息个性化推荐,构建了一种基于知识图谱的网络信息自监督强化学习推荐模型。该模型构建了用户网络信息交互行为的知识图谱,清晰地展示用户历史网... 为深入理解和挖掘用户历史网络交互信息中的行为特征,动态提取用户交互行为变化,实现网络信息个性化推荐,构建了一种基于知识图谱的网络信息自监督强化学习推荐模型。该模型构建了用户网络信息交互行为的知识图谱,清晰地展示用户历史网络信息交互行为。通过基于自监督强化学习的特征提取模型,有效捕捉知识图谱中用户行为的动态变化,避免流行度偏差的负面影响,从而提取出历史网络交互信息的特征。基于知识图谱相似度计算,推荐与用户历史交互信息特征相似的网络信息实体,实现精准且个性化的推荐。实验结果验证,所提模型为用户推荐网络电影信息资源后,点击播放转化率达96.83%,网络信息个性化推荐效果明显提升。 展开更多
关键词 知识图谱 网络信息 自监督 强化学习 推荐模型 交互信息 特征提取 相似度计算
在线阅读 下载PDF
WiFi信号可视化与双流网络融合的手势识别
11
作者 丁昊 袁江琳 +2 位作者 石鸿凌 龚晓龙 孙美静 《无线电工程》 2025年第5期959-965,共7页
手势动作根据信号波动范围可分为对应于人机交互中的基础大尺度动作与富含复杂语义信息的精细小尺度动作。现有WiFi手势识别系统在面对这些不同尺度的动作时,依赖多个独立的网络模型,需多对收发器按照严格限制的位置进行布设。基于WiFi... 手势动作根据信号波动范围可分为对应于人机交互中的基础大尺度动作与富含复杂语义信息的精细小尺度动作。现有WiFi手势识别系统在面对这些不同尺度的动作时,依赖多个独立的网络模型,需多对收发器按照严格限制的位置进行布设。基于WiFi信号可视化技术和双流网络的系统,通过引入跨模态交互模块(Cross-modal Interaction Module, CIM)和谱特征转移(Spectral Feature Transformation, SFT)模块,展现出了对收发设备位置和手势动作尺度的自适应能力,成功应用于单发单收场景。在公开数据集Widar3上进行的实验表明,系统在同样的实验场景下识别准确率高于其他方法。在单发单收场景下,对同时包含大尺度与精细小尺度手势动作的数据集,当WiFi收发器位置固定时,系统平均识别准确率达到94.85%;在收发器位置不固定的情况下,平均识别准确率仍能达到91.26%。 展开更多
关键词 WiFi信号可视化 双流网络 手势识别 跨模态交互 谱特征转移
在线阅读 下载PDF
基于复数协方差卷积神经网络的运动想象脑电信号解码方法 被引量:1
12
作者 黄仁慧 张锐锋 +3 位作者 文晓浩 闭金杰 黄守麟 李廷会 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期43-56,共14页
深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基... 深度挖掘和利用脑电信号的特征信息,以提高运动想象的分类性能,一直是脑机接口的研究热点。考虑到脑电特征空间具有高维性且与幅值和相位密切相关,如何有效表达和同时利用脑电的幅值和相位信息已经成为一个难题。为此,本研究提出一种基于复数协方差特征的三维复值卷积神经网络。首先,构建脑电不同频率下的复数协方差矩阵特征,不仅通过复值表示将幅值和相位信息结合在一起,并且保留分类所需的多变量信息,如幅值、相位、空间位置、频率等。其次,设计针对多复数协方差特征的全复数卷积神经网络,实现运动想象任务的高性能分类。在2个公开数据集上的实验结果表明,本研究提出的方法可获得比现有前沿方法至少高出2.49和1.85个百分点的平均准确率。 展开更多
关键词 脑电信号 脑机接口 幅相信息融合 复数协方差特征 复值卷积神经网络 信息交互
在线阅读 下载PDF
基于交叉注意力的点击率预测模型 被引量:1
13
作者 何李杰 高茂庭 《计算机工程与应用》 北大核心 2025年第7期353-360,共8页
有效特征的挖掘是点击率预测的关键,针对点击率预测模型对局部组合特征与全局特征间的信息交流考虑不充分,对组合特征的重要度表达不准确的问题,提出一种基于交叉注意力的点击率预测模型(CANN),通过交叉注意力机制突出组合特征与全局特... 有效特征的挖掘是点击率预测的关键,针对点击率预测模型对局部组合特征与全局特征间的信息交流考虑不充分,对组合特征的重要度表达不准确的问题,提出一种基于交叉注意力的点击率预测模型(CANN),通过交叉注意力机制突出组合特征与全局特征间的联系和交流,以充分挖掘有效特征。通过全局平均池化分别得到每个特征的特征值并拼接成全局特征;采用轴加权融合的方式来捕获组合特征;通过交叉注意力机制实现全局特征与组合特征交叉,得到组合特征的权重来表达其重要性,并将加权的组合特征融合到全局特征,以提高信息交流;通过多层感知机学习,得到点击率预测值。在两个公开和真实的数据集上的实验结果验证了该模型的有效性。 展开更多
关键词 点击率预测 交叉注意力 特征交互 神经网络
在线阅读 下载PDF
MHVTs:多尺度混合视觉自注意力模型
14
作者 高丽丽 应文豪 +2 位作者 钟珊 胡文军 吴晓宇 《计算机工程与设计》 北大核心 2025年第5期1395-1402,共8页
为提高ViT模型在小型数据集上从零开始训练的性能,提出一种多尺度混合ViT模型(MHVT),由多尺度扩张局部聚集模块(MDLA)和多尺度先下采样再上采样模块(MPUA)组成。MDLA利用不同膨胀率的深度可分卷积在不同通道上提取不同尺度的局部特征。M... 为提高ViT模型在小型数据集上从零开始训练的性能,提出一种多尺度混合ViT模型(MHVT),由多尺度扩张局部聚集模块(MDLA)和多尺度先下采样再上采样模块(MPUA)组成。MDLA利用不同膨胀率的深度可分卷积在不同通道上提取不同尺度的局部特征。MPUA在自注意力计算前,在不同的通道上对查询、键和值进行不同粒度的池化处理,保持计算效率的同时捕获多尺度的全局特征。在各种小尺寸数据集上的大量实验验证了MHVT在精度和速度方面均获得了更好的权衡。 展开更多
关键词 视觉自注意力模型 局部相关性 多尺度特征交互 卷积神经网络 小型数据集 自注意力模型 卷积神经网络
在线阅读 下载PDF
基于关联交互和双边注意力的稀疏目标检测器
15
作者 周泽政 陈东方 王晓峰 《计算机工程与设计》 北大核心 2025年第1期206-213,共8页
稀疏目标检测器Sparse R-CNN算法缺少对目标间关系的建模,导致网络对全局特征信息的利用较差,使检测效果不佳。为解决上述问题,提出关联交互模块,通过融合可学习的参数和与图像数据相关的目标间关联特征数据,增强目标之间的关联性;提出... 稀疏目标检测器Sparse R-CNN算法缺少对目标间关系的建模,导致网络对全局特征信息的利用较差,使检测效果不佳。为解决上述问题,提出关联交互模块,通过融合可学习的参数和与图像数据相关的目标间关联特征数据,增强目标之间的关联性;提出双边注意力机制,通过融合实例交互注意力信息和物体与物体间的关联注意力信息,增强对全局特征的交互。基于PASCAL VOC和MS COCO数据集的实验结果表明,该方法能够有效提升检测精度,整体性能优于原方法。 展开更多
关键词 目标检测 深度学习 稀疏网络 关联 实例交互 全局特征 注意力机制
在线阅读 下载PDF
基于高阶空间交互作用的姿态估计网络
16
作者 黄晓宇 陈佳艺 +2 位作者 吴艺玮 吴胜昔 王学武 《华东理工大学学报(自然科学版)》 北大核心 2025年第4期514-521,共8页
人体姿态估计是计算机视觉领域的一个重要研究方向。随着深度学习技术的进步,现有的姿态估计模型在预测人体关键点方面已经取得了显著成效,然而,在处理复杂场景如严重遮挡、复杂背景、极端姿态、多尺度变化和光照变化时,这些模型仍然面... 人体姿态估计是计算机视觉领域的一个重要研究方向。随着深度学习技术的进步,现有的姿态估计模型在预测人体关键点方面已经取得了显著成效,然而,在处理复杂场景如严重遮挡、复杂背景、极端姿态、多尺度变化和光照变化时,这些模型仍然面临挑战,准确度往往受到影响。为解决这个问题,本文提出了一种改进的基于高分辨率网络(High-Resolution Network,HRNet)的人体姿态估计方法,该方法通过引入高阶空间交互和注意力机制,显著提升了模型在复杂场景中的表现;并采用递归门控卷积和卷积注意力模块以增强模型在高阶空间特征提取的能力。结果表明,提出的方法在COCO2017数据集上超越了现有主流方法,实现了更高的姿态估计精度。 展开更多
关键词 姿态估计 高分辨率网络 高阶空间交互 CBAM注意力机制 特征提取
在线阅读 下载PDF
多分支特征融合分类网络用于CXR图像识别 被引量:1
17
作者 苏华强 雷海军 雷柏英 《信号处理》 北大核心 2025年第2期253-266,共14页
COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量... COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量时间和精力,而且增加医生感染的风险。因此,能够从胸部X射线的图像中,自动识别COVID-19的算法显得尤为重要。本文提出了一种基于深度学习的CXR图像分类框架,该框架能够在有限的训练数据下生成更具判别力的特征。具体而言,首先通过残差神经网络(ResNet34和ResNet50)和Transformer组成多分支分类网络,其中ResNet分支通过深度残差结构,有效地提取丰富的语义信息和细腻的纹理信息;而Transformer分支则通过自注意力机制,捕捉图像的全局语义特征。随后,利用特征交互模块将ResNet分支提取丰富的语义信息和纹理信息,与Transformer提取的全局语义特征进行特征交互。最后,再通过特征融合模块来提取图像的多尺度语义特征。该方法能够在有限训练数据的条件下提取多尺度特征表示,以对COVID-19感染区域进行特征提取和定位。实验在公开DLAI3和COVIDx数据集上与15种方法进行了比较,相比于ResNet50的模型,准确率分别提高了1.37%和0.76%。本文提出的分类方法,结合ResNet和Transformer网络在特征提取上的优点,使得网络对CXR图像的识别结果更加准确。 展开更多
关键词 胸部X射线检查 特征交互模块 多分支分类网络 残差神经网络 TRANSFORMER
在线阅读 下载PDF
融合多图卷积的表格学习模型
18
作者 王秋雨 赵韦鑫 +2 位作者 颜怀柏 杨炬龙 彭舰 《计算机工程与设计》 北大核心 2025年第9期2570-2577,共8页
针对现有的表格学习方法在平衡特征与实例关系、构建图表示过程复杂且关注角度单一等问题,本文提出一种基于图神经网络的表格学习模型。该模型分别从表格数据的行和列角度初始化特征嵌入图与实例交互图,融合了数据的局部和全局信息。模... 针对现有的表格学习方法在平衡特征与实例关系、构建图表示过程复杂且关注角度单一等问题,本文提出一种基于图神经网络的表格学习模型。该模型分别从表格数据的行和列角度初始化特征嵌入图与实例交互图,融合了数据的局部和全局信息。模型通过结合图卷积和图注意力的双核卷积模块增强节点嵌入表示,利用基于动态门控的层级池化模块降低图复杂度并保留重要节点差异信息,同时引入自适应融合模块平衡特征与实例关系并提升模型准确性。在5个公开数据集上的实验结果表明,模型性能提升了1~3个百分点;大量消融实验验证了各模块对提升模型学习能力的重要性。 展开更多
关键词 表格学习 特征嵌入 实例交互 图卷积网络 图注意力网络 层级池化 自适应融合
在线阅读 下载PDF
改进YOLOv10的架空输电线路多缺陷检测方法 被引量:1
19
作者 李坤祥 刘大明 《电子测量技术》 北大核心 2025年第9期156-167,共12页
针对输电线路缺陷检测任务中目标尺度多样、背景复杂、目标遮挡,以及现有目标检测算法难以在实时检测的前提下保证检测精度而出现漏检、误检的问题,提出改进YOLOv10的输电线路无人机巡检缺陷检测算法TLDDet。首先设计融合部分卷积和上... 针对输电线路缺陷检测任务中目标尺度多样、背景复杂、目标遮挡,以及现有目标检测算法难以在实时检测的前提下保证检测精度而出现漏检、误检的问题,提出改进YOLOv10的输电线路无人机巡检缺陷检测算法TLDDet。首先设计融合部分卷积和上下文锚点注意力的高效特征融合模块(FC2FA),在降低模型参数量的同时提升模型的特征集成能力。然后使用基于多头自注意力机制的尺度内特征交互模块AIFI增强对小目标的检测效果,该模块通过加强特征图中高级语义信息的表达从而提高模型检测的准确率。最后设计遮挡感知注意网络检测头SEAM-Head,减少由于遮挡问题导致的特征丢失的问题。实验结果表明,所提出的TLDDet较原始模型YOLOv10s参数量减少33%,计算量减少30%,对输电线路多种缺陷的Precision、Recall和mAP50分别提高4.3%、2.4%和3.7%,检测速度达到143 FPS,且与其他实时检测算法的对比中具有更好的检测性能。 展开更多
关键词 输电线路缺陷检测 YOLOv10 实时检测 特征融合 上下文锚点注意力 尺度内特征交互 遮挡感知注意网络
原文传递
改进YOLOv8n的电磁离合器端面缺陷检测 被引量:1
20
作者 魏书豪 徐红伟 +2 位作者 柯海森 李孝禄 丁建雄 《现代制造工程》 北大核心 2025年第5期126-134,共9页
电磁离合器是汽车生产过程中的重要部件,针对其端面缺陷尺寸微小、背景纹理复杂以及现有算法无法实现缺陷多样性检测等问题,提出了基于改进YOLOv8n的轻量级目标检测算法。在主干网络中融合EMA注意力和部分卷积,设计了轻量级的C2F-PE模... 电磁离合器是汽车生产过程中的重要部件,针对其端面缺陷尺寸微小、背景纹理复杂以及现有算法无法实现缺陷多样性检测等问题,提出了基于改进YOLOv8n的轻量级目标检测算法。在主干网络中融合EMA注意力和部分卷积,设计了轻量级的C2F-PE模块以改进C2F结构,增强网络的特征提取能力;为促进相同尺度间更丰富的特征融合,引入自注意力内尺度特征交互(AIFI)模块替换SPPF层,以捕获更细粒度的信息;在颈部网络中添加小目标检测层,有效地融合了浅层特征信息,提升了模型对小目标的感知力;引入Slim-neck模块改进颈部网络,轻量化模型的同时保持网络的检测精度。实验结果表明,改进后的算法相较于YOLOv8n算法,mAP@0.5达到94.6%,提升了4.5%,参数量减少13.3%,检测速度达到81 f/s。该算法更好地平衡了检测精度和速度,满足电磁离合器生产中实时检测的需求。 展开更多
关键词 YOLOv8n 电磁离合器 缺陷检测 轻量级网络 EMA注意力 内尺度特征交互 Slim-neck模块
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部