期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Foreground Segmentation Network with Enhanced Attention
1
作者 姜锐 朱瑞祥 +1 位作者 蔡萧萃 苏虎 《Journal of Shanghai Jiaotong university(Science)》 EI 2023年第3期360-369,共10页
Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively inv... Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively investigated in this field. Foreground segmentation networks (FgSegNets) are representative deep end-to-endMOS methods proposed recently. This study explores a new mechanism to improve the spatial feature learningcapability of FgSegNets with relatively few brought parameters. Specifically, we propose an enhanced attention(EA) module, a parallel connection of an attention module and a lightweight enhancement module, with sequentialattention and residual attention as special cases. We also propose integrating EA with FgSegNet_v2 by taking thelightweight convolutional block attention module as the attention module and plugging EA module after the twoMaxpooling layers of the encoder. The derived new model is named FgSegNet_v2 EA. The ablation study verifiesthe effectiveness of the proposed EA module and integration strategy. The results on the CDnet2014 dataset,which depicts human activities and vehicles captured in different scenes, show that FgSegNet_v2 EA outperformsFgSegNet_v2 by 0.08% and 14.5% under the settings of scene dependent evaluation and scene independent evaluation, respectively, which indicates the positive effect of EA on improving spatial feature learning capability ofFgSegNet_v2. 展开更多
关键词 human-computer interaction moving object segmentation foreground segmentation network enhanced attention convolutional block attention module
原文传递
Fusion of Convolutional Self-Attention and Cross-Dimensional Feature Transformationfor Human Posture Estimation
2
作者 Anzhan Liu Yilu Ding Xiangyang Lu 《Journal of Beijing Institute of Technology》 EI CAS 2024年第4期346-360,共15页
Human posture estimation is a prominent research topic in the fields of human-com-puter interaction,motion recognition,and other intelligent applications.However,achieving highaccuracy in key point localization,which ... Human posture estimation is a prominent research topic in the fields of human-com-puter interaction,motion recognition,and other intelligent applications.However,achieving highaccuracy in key point localization,which is crucial for intelligent applications,contradicts the lowdetection accuracy of human posture detection models in practical scenarios.To address this issue,a human pose estimation network called AT-HRNet has been proposed,which combines convolu-tional self-attention and cross-dimensional feature transformation.AT-HRNet captures significantfeature information from various regions in an adaptive manner,aggregating them through convolu-tional operations within the local receptive domain.The residual structures TripNeck and Trip-Block of the high-resolution network are designed to further refine the key point locations,wherethe attention weight is adjusted by a cross-dimensional interaction to obtain more features.To vali-date the effectiveness of this network,AT-HRNet was evaluated using the COCO2017 dataset.Theresults show that AT-HRNet outperforms HRNet by improving 3.2%in mAP,4.0%in AP75,and3.9%in AP^(M).This suggests that AT-HRNet can offer more beneficial solutions for human posture estimation. 展开更多
关键词 human posture estimation adaptive fusion method cross-dimensional interaction attention module high-resolution network
在线阅读 下载PDF
基于分频特征交互的非均匀雾图清晰化
3
作者 王科平 刘雨欣 +3 位作者 杨艺 张高鹏 王田 费树岷 《兵器装备工程学报》 北大核心 2025年第11期216-226,266,共12页
雾霾的非均匀随机分布是图像去雾面临的主要挑战性之一。在图像中,雾霾覆盖的范围通常呈现白色或灰白色,降低了该区域的图像信息熵,使得信息在频域内向低频区域聚拢。提出了一种基于分频特征交互的非均匀雾图清晰化算法,首先,对图像进... 雾霾的非均匀随机分布是图像去雾面临的主要挑战性之一。在图像中,雾霾覆盖的范围通常呈现白色或灰白色,降低了该区域的图像信息熵,使得信息在频域内向低频区域聚拢。提出了一种基于分频特征交互的非均匀雾图清晰化算法,首先,对图像进行频域转换,实现多级尺寸压缩和高低频分离。其次,在雾霾分布较高的低频分量,利用Transformer注意力关注机制和全局特征提取能力,增强随机雾霾分布和浓度变化的表征。在高频分量,构建深度差分高频特征增强模块,利用图像自身梯度信息引导,增强图像的边缘细节特征。最后,设计特征交互模块,在Transformer提取到的低频雾霾特征权重指导下,对不同位置和浓度的雾图进行自适应复原,同时实现低频特征与高频特征的层级间信息融合。在4个非均匀雾图数据集上的实验结果表明,所提算法在主观和客观评价均取得优异的效果。 展开更多
关键词 非均匀图像去雾 频域分离处理 注意力机制 深度差分卷积 特征交互模块
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
4
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
基于特征增强和交互网络的遥感图像储罐检测
5
作者 葛延良 邹志鹏 +3 位作者 任军超 陈余蕊 梁太川 毕洪波 《黑龙江大学自然科学学报》 2025年第3期370-378,共9页
储罐作为石油、天然气和液体原料的特有存储容器,通过高分辨率卫星采集的遥感图像实现储罐的精确检测,对军事和民用领域的能源储备及其管理具有重要意义。为精准地识别遥感图像中的储罐,提出了一种基于特征增强和交互网络(Feature enhan... 储罐作为石油、天然气和液体原料的特有存储容器,通过高分辨率卫星采集的遥感图像实现储罐的精确检测,对军事和民用领域的能源储备及其管理具有重要意义。为精准地识别遥感图像中的储罐,提出了一种基于特征增强和交互网络(Feature enhancement and interaction network,FEINet)的检测算法。运用视觉成像机理和注意力机制设计了一个尺度增强注意力模块(Scale enhanced attention module,SEAM)获取目标区域的感受野信息,旨在全面地理解上下文信息。为缓解语义稀释的问题,开发了一个交互引导模块(Interactive guidance module,IGM)来实现目标的完整表达。大量的实验表明,所提出的算法在遥感储罐数据集上的4个评价指标超过了5种最先进的算法,验证了此模型对于遥感储罐图像识别的有效性。 展开更多
关键词 储罐 注意力机制 尺度增强注意力模块 交互引导模块
在线阅读 下载PDF
基于机器视觉的金属零件表面缺陷检测研究 被引量:2
6
作者 孙姿姣 罗芳 李阳辉 《清远职业技术学院学报》 2025年第1期42-48,共7页
目前制造业中,金属零件的缺陷问题会导致重大经济损失,主要问题在于零件缺陷小且缺陷位置出现随机,传统人工检测难以区分微小缺陷位置与非缺陷位置,且人力成本高,经济效益低下。针对这一问题,研究提出一种基于机器视觉的金属零件表面缺... 目前制造业中,金属零件的缺陷问题会导致重大经济损失,主要问题在于零件缺陷小且缺陷位置出现随机,传统人工检测难以区分微小缺陷位置与非缺陷位置,且人力成本高,经济效益低下。针对这一问题,研究提出一种基于机器视觉的金属零件表面缺陷检测方法,通过机器视觉检测代替人力劳动,同时采用交互式空间位置注意力模块,解决了金属零件表面的缺陷不明显难以检测的问题,采用对偶局部-全局Transformer模块,解决了缺陷区域与周围正常区域难以区分的问题,提高了金属零件表面微小缺陷的检测性能,从而提高企业经济效益。 展开更多
关键词 机器视觉 缺陷检测 交互式空间位置注意力模块 对偶局部-全局Transformer模块
在线阅读 下载PDF
改进YOLOv8n的电磁离合器端面缺陷检测 被引量:1
7
作者 魏书豪 徐红伟 +2 位作者 柯海森 李孝禄 丁建雄 《现代制造工程》 北大核心 2025年第5期126-134,共9页
电磁离合器是汽车生产过程中的重要部件,针对其端面缺陷尺寸微小、背景纹理复杂以及现有算法无法实现缺陷多样性检测等问题,提出了基于改进YOLOv8n的轻量级目标检测算法。在主干网络中融合EMA注意力和部分卷积,设计了轻量级的C2F-PE模... 电磁离合器是汽车生产过程中的重要部件,针对其端面缺陷尺寸微小、背景纹理复杂以及现有算法无法实现缺陷多样性检测等问题,提出了基于改进YOLOv8n的轻量级目标检测算法。在主干网络中融合EMA注意力和部分卷积,设计了轻量级的C2F-PE模块以改进C2F结构,增强网络的特征提取能力;为促进相同尺度间更丰富的特征融合,引入自注意力内尺度特征交互(AIFI)模块替换SPPF层,以捕获更细粒度的信息;在颈部网络中添加小目标检测层,有效地融合了浅层特征信息,提升了模型对小目标的感知力;引入Slim-neck模块改进颈部网络,轻量化模型的同时保持网络的检测精度。实验结果表明,改进后的算法相较于YOLOv8n算法,mAP@0.5达到94.6%,提升了4.5%,参数量减少13.3%,检测速度达到81 f/s。该算法更好地平衡了检测精度和速度,满足电磁离合器生产中实时检测的需求。 展开更多
关键词 YOLOv8n 电磁离合器 缺陷检测 轻量级网络 EMA注意力 内尺度特征交互 Slim-neck模块
在线阅读 下载PDF
基于改进YOLOv7-tiny的绝缘子缺陷检测网络 被引量:1
8
作者 韩兴宇 陈为真 《现代电子技术》 北大核心 2025年第16期105-112,共8页
现有的检测方法在复杂背景的输电线路图像中识别绝缘子微小缺陷时,得到的图像存在背景环境复杂、缺陷尺寸小等问题。为保证输电线路的安全运行,提出一种基于YOLOv7-tiny的绝缘子缺陷检测网络(IDD-Net)。首先,引入基于注意力的尺度内特... 现有的检测方法在复杂背景的输电线路图像中识别绝缘子微小缺陷时,得到的图像存在背景环境复杂、缺陷尺寸小等问题。为保证输电线路的安全运行,提出一种基于YOLOv7-tiny的绝缘子缺陷检测网络(IDD-Net)。首先,引入基于注意力的尺度内特征交互(AIFI)来处理高维特征,从而降低计算量;其次,使用双向加权路径特征金字塔网络(BiFPN)进行特征融合,并对下采样模块进行改进,增强网络的感知能力;最后,使用Focal-DIoU损失函数提高锚框质量。结果表明,与基线模型相比,IDD-Net的平均精度均值提高4.1%,精确率和召回率分别提高2.4%和6.5%,参数量和浮点运算量分别减少5.8%和2.3%,对于闪络缺陷的平均精度提高11.2%。由此说明所提方法参数量较小,性能更优异,鲁棒性更强。 展开更多
关键词 YOLOv7-tiny 绝缘子缺陷检测 基于注意力的尺度内特征交互 双向加权路径特征金字塔网络 MC下采样模块 轻量级网络
在线阅读 下载PDF
基于交叉视觉状态空间与多分支交互注意力的医学图像分割
9
作者 薛伟 陈创慧 +2 位作者 杜明洋 钟平 郑啸 《电子学报》 北大核心 2025年第9期3331-3344,共14页
医学图像分割是智慧医疗领域的关键技术,旨在精准识别并分割影像中的器官或病变区域,为临床诊断与治疗决策提供可靠的量化依据.近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的医学图像分割方法因其优异的局部特征提取能... 医学图像分割是智慧医疗领域的关键技术,旨在精准识别并分割影像中的器官或病变区域,为临床诊断与治疗决策提供可靠的量化依据.近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的医学图像分割方法因其优异的局部特征提取能力得到广泛应用.然而,受限于卷积操作固有的局部感受野,CNN在建模长距离空间依赖和全局上下文信息方面仍存在不足.尽管基于Transformer的方法通过自注意力机制实现了对全局特征的建模,但计算复杂度随序列长度的平方增长,制约了其实际应用效率.针对上述问题,本文提出一种新的医学图像分割网络,该网络包含交叉视觉状态空间(Cross-Vision State Space,C-VSS)和多分支交互注意力(Multi-Branch Interactive Attention,MBIA)两个核心模块.C-VSS模块融合卷积操作的局部感知优势与状态空间的长序列建模能力,通过双分支协作策略,在保持线性计算复杂度的同时,实现对局部和全局特征的有效提取与融合.MBIA模块则通过多分支架构增强多尺度上下文信息的表征能力,并在编码器与解码器之间建立双向信息交互通道,实现跨层特征的动态融合,从而提升模型对复杂结构的感知能力.为验证所提方法的有效性,在CVC-ColonDB、ISIC2017、ISIC2018和COVID-19这4个公开医学图像分割数据集上开展试验.结果表明:与次优方法相比,本文方法在交并比(Intersection over Union,IoU)指标上分别提升了约0.94、0.83、1.04和2.28个百分点,在Dice相似系数(Dice Similarity Coefficient,DSC)指标上分别提升了约0.63、0.50、1.56和1.51个百分点.此外,平均数(Average,Avg)指标在4个数据集上分别达到91.51%、91.74%、91.30%和88.78%,均优于所有对比方法,展现出最优性能,充分验证了所提方法在分割性能上的优越性.进一步开展消融实验以验证核心模块的作用,实验表明:单独移除C-VSS模块后,IoU指标分别下降3.62、2.15、1.69和2.13个百分点,DSC指标分别下降2.25、1.29、1.02和1.40个百分点;单独移除MBIA模块后,IoU指标分别下降10.11、0.50、1.08和1.97个百分点,DSC指标分别下降6.54、0.30、0.65和1.30个百分点.实验结果充分证明C-VSS与MBIA模块的有效性,且MBIA模块对性能提升的贡献更为显著,二者协同作用可进一步优化模型性能. 展开更多
关键词 医学图像分割 交叉视觉状态空间(C-VSS) 多分支交互注意力(MBIA) 动态特征融合 卷积神经网络(CNN) TRANSFORMER
在线阅读 下载PDF
融合时空图卷积与注意力机制的行业就业需求波动预测
10
作者 耿艳利 徐胜超 《计算机测量与控制》 2025年第12期303-311,共9页
为解决行业就业需求波动中复杂时空耦合关系建模困难的问题,研究提出一种融合时空图卷积与注意力机制的多粒度动态预测方法;通过对就业需求数据进行长短期双视角采样,构建多尺度输入特征;利用空间-时间注意力机制动态增强关键行业节点... 为解决行业就业需求波动中复杂时空耦合关系建模困难的问题,研究提出一种融合时空图卷积与注意力机制的多粒度动态预测方法;通过对就业需求数据进行长短期双视角采样,构建多尺度输入特征;利用空间-时间注意力机制动态增强关键行业节点与事件敏感时段的特征表达;采用图卷积和时间卷积分别提取行业间空间依赖关系和时序依赖模式;引入双向图交互模块实现静态结构与动态时序特征的自适应融合,并结合多层感知机输出最终预测结果;实验结果表明,该方法在制造业和服务业场景中平均绝对误差(MAE)分别达到0.55和0.72,平均绝对百分比误差(MAPE)低于9.5%,Moran's I指数小于0.01,验证了其在复杂时空动态捕捉与突发冲击响应方面的有效性与稳定性,可为区域就业政策制定与人力资源规划提供可靠的数据支持。 展开更多
关键词 时空图卷积 注意力机制 双向图交互模块 行业就业需求 波动预测
在线阅读 下载PDF
基于改进YOLOv8的瓶装产品褶皱检测模型
11
作者 曹海文 陈德平 +3 位作者 杨丹妮 王楠 钟震宇 段二强 《自动化与信息工程》 2025年第4期11-21,共11页
针对瓶装产品褶皱的旋转角度随机、多尺度,以及与瓶体背景对比度低等特性,提出基于改进YOLOv8的瓶装产品褶皱检测模型。该模型利用Sobel算子提取边缘特征,通过融合边缘特征与空间特征,增强低对比度区域的边缘特征提取能力;通过融合卷积... 针对瓶装产品褶皱的旋转角度随机、多尺度,以及与瓶体背景对比度低等特性,提出基于改进YOLOv8的瓶装产品褶皱检测模型。该模型利用Sobel算子提取边缘特征,通过融合边缘特征与空间特征,增强低对比度区域的边缘特征提取能力;通过融合卷积与加性注意力机制,使YOLOv8模型能够同时提取图像的全局特征与局部特征,改进模型对不同尺度褶皱的特征融合能力,从而增强对旋转目标的鲁棒性;利用基于注意力的尺度内特征交互模块替换快速空间金字塔池化模块,增强骨干网络在同一尺度内的褶皱特征提取能力,解耦特征提取与多尺度特征融合任务;利用双向特征金字塔网络改进路径聚合网络,通过加权特征融合的方式动态调整特征权重,提升模型的多尺度特征融合能力;基于该模型构建了一套瓶装产品褶皱检测系统。实验结果表明,改进的YOLOv8模型的AP50为82.3%,相较于YOLOv8-OBB模型提升了6.6%,能更好地完成瓶装产品褶皱的检测任务。经实际生产线验证,该瓶装产品褶皱检测系统的检测精度、推理速度和稳定性均符合工业应用要求。 展开更多
关键词 瓶装产品褶皱检测 改进YOLOv8 SOBEL算子 加性注意力机制 基于注意力的尺度内特征交互模块 双向特征金字塔网络
在线阅读 下载PDF
基于深度学习的息肉分割网络GLIA-Net 被引量:6
12
作者 任莉莉 边璇 +1 位作者 王光磊 王洪瑞 《计算机工程》 CAS CSCD 北大核心 2022年第12期248-254,共7页
随着卷积神经网络的发展,现有改进的息肉分割U-Net网络能有效提高息肉分割准确率,但引入了大量参数,导致模型复杂度增大且计算效率降低。提出具有低复杂度、高性能的网络GLIA-Net,用于分割内窥镜图像中的息肉区域。以U-Net为基础架构,... 随着卷积神经网络的发展,现有改进的息肉分割U-Net网络能有效提高息肉分割准确率,但引入了大量参数,导致模型复杂度增大且计算效率降低。提出具有低复杂度、高性能的网络GLIA-Net,用于分割内窥镜图像中的息肉区域。以U-Net为基础架构,在双层卷积后加入全局与局部交互式注意力融合模块。全局注意力基于2个可学习的外部储存器,通过2个级联的线性层和归一化层来实现。局部注意力基于局部跨通道交互策略,将一维卷积代替全连接层,在保证网络性能的同时降低计算复杂度,加快网络的计算速度。结合高效通道注意力和外部注意力的优点,在不引入过多参数量和计算量的前提下融合局部注意力和全局注意力,同时在通道与空间2个维度上引入注意力机制,提取丰富的多尺度语义信息。在Kvasir数据集上的实验结果表明,GLIA-Net的平均交并比、Dice、体积重叠误差分别为69.4%、80.7%和5.0%,与ExfuseNet、SegNet、ResUNet等网络相比,在保证网络计算效率的同时具有较优的分割精度。 展开更多
关键词 卷积神经网络 U-Net网络 息肉分割 内窥镜图像 交互式注意力融合模块
在线阅读 下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取 被引量:5
13
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 自注意力机制 中文电子病历 数据集标注与构建
在线阅读 下载PDF
高分辨率特征保持的头部姿态软阶段回归算法
14
作者 莫建文 梁豪昌 +2 位作者 袁华 姜贵昀 陈明瑶 《电子测量技术》 北大核心 2024年第7期130-137,共8页
针对在头部姿态估计推理过程中由于上下采样操作而导致的姿态特征损失问题,提出了一种高分辨率特征保持的头部姿态软阶段回归算法。该算法首先利用编码器HR-Net对原始人脸图像进行高分辨率特征保持的多尺度特征编码,并在其卷积块中加入T... 针对在头部姿态估计推理过程中由于上下采样操作而导致的姿态特征损失问题,提出了一种高分辨率特征保持的头部姿态软阶段回归算法。该算法首先利用编码器HR-Net对原始人脸图像进行高分辨率特征保持的多尺度特征编码,并在其卷积块中加入TA维度交互模块以捕获更多空间与通道之间的交互信息;然后使用解码器SSR-Net算法对HR-Net输出的不同尺度特征图进行关键参数解码和头部姿态软阶段回归,并引入了高效通道注意力ECA以加强特征通道间的信息交互,减少冗余特征。实验结果表明,所提算法在公开数据集AFLW2000和BIWI上均有优秀表现,其MAE分别降低至4.19和3.00。 展开更多
关键词 头部姿态估计 高分辨率特征 软阶段回归 信息交互 TA维度交互 ECA注意力
原文传递
基于多维度信息交互的遥感图像目标检测算法 被引量:4
15
作者 卜荟力 方贤进 杨高明 《黑龙江工业学院学报(综合版)》 2022年第10期58-65,共8页
随着卫星遥感图像和航空遥感图像分辨率的不断提高,从遥感影像中获取的有用数据和信息越来越多,与普通图像相比,遥感图像具有类别不平衡、背景复杂、小物体检测困难等特点。针对以上问题,提出一种改进YOLOv5s的遥感图像目标检测算法MPSA... 随着卫星遥感图像和航空遥感图像分辨率的不断提高,从遥感影像中获取的有用数据和信息越来越多,与普通图像相比,遥感图像具有类别不平衡、背景复杂、小物体检测困难等特点。针对以上问题,提出一种改进YOLOv5s的遥感图像目标检测算法MPSA-YOLOv5。设计一种多维度信息交互极化自注意力(Multi-dimensional information interaction Polarized Self-Attention,MPSA)模块,充分考虑捕获通道交互对细节信息的重要程度,并将其嵌入到主干网络中。改进特征增强结构,替换使用Softpool池化方式保留更多原始信息,实现特征增强。实验结果表明,MPSA-YOLOv5在NWPUVHR-10公共遥感图像数据集上检测精度达到91.4%,相比于SSD、YOLOv3、YOLOX-S和原YOLOv5s算法分别提高了6.06、2.8、1.45和1.7个百分点,MPSA-YOLOv5算法有效提升了遥感图像的检测精度。 展开更多
关键词 目标检测 信息交互 自注意力模块 特征增强
在线阅读 下载PDF
基于重构双注意力网络的图文情感分析
16
作者 周乐善 冯锡炜 《计算机技术与发展》 2024年第12期157-164,共8页
在传统的图文跨模态情感分析算法中,由于缺乏对视觉特征空间和通道的关注,往往容易造成局部特征关键信息的丢失,导致在特征融合阶段,不能很好地表示关键信息。因此,该文提出了基于重构双注意力网络的图文情感分析模型(Images-Text Senti... 在传统的图文跨模态情感分析算法中,由于缺乏对视觉特征空间和通道的关注,往往容易造成局部特征关键信息的丢失,导致在特征融合阶段,不能很好地表示关键信息。因此,该文提出了基于重构双注意力网络的图文情感分析模型(Images-Text Sentiment Analysis Based on Reconstructed Dual Attention Networks Fusion, IRDA)。该模型在视觉特征提取中使用ResNet50获取视觉特征,同时引入空间和通道重构卷积模块,对视觉特征空间和通道位置信息进行重构,对不同位置的关键信息进行融合,加强视觉特征提取。在文本特征提取中使用BERT模型获取文本特征表示,并使用双向门控循环单元(Bi-GRU)关注低层次单词之间的上下文联系,进而增强文本语义特征。使用交互注意力机制关注模态间的特征交互,并进行视觉特征与文本特征融合,进而完成情感分类任务。该模型在MVSA多模态数据集上进行实验验证,实验结果表明该模型皆优于当前主流模型,证实了模型的有效性。 展开更多
关键词 深度学习 多模态 交互注意力 BERT 重构单元卷积模块 卷积神经网络 情感分析
在线阅读 下载PDF
基于全局分割图卷积网络的骨骼双人交互行为识别
17
作者 徐寅虎 《软件导刊》 2024年第6期157-162,共6页
图卷积网络(GCN)在双人交互识别方面应用非常广泛,但是传统图卷积网络对于节点特征的学习不够充分,尤其在双人交互行为中,每个节点的特征往往包含多个人的信息,导致节点特征不够准确。为了有效提取双人交互行为关节点之间的相关性特征,... 图卷积网络(GCN)在双人交互识别方面应用非常广泛,但是传统图卷积网络对于节点特征的学习不够充分,尤其在双人交互行为中,每个节点的特征往往包含多个人的信息,导致节点特征不够准确。为了有效提取双人交互行为关节点之间的相关性特征,聚合双人之间的特征信息,提出全局分割图卷积网络(GS-GCN),进行基于骨骼的双人交互行为识别。GS-GCN包含全局分割图卷积(GSGC)和层次聚合注意力(HAA)模块,GSGC将图卷积(GCN)和全局分割图(GS-Graph)相结合,将双人交互识别看成全局性识别,并具有多个邻接矩阵,可提取单人特征和双人全局特征。此外,单人的层次和双人层次的重要性各不相同,为了突出交互行为之间的交互信息,引入层次聚合的注意力模块(HAA),突出交互行为中更加明显的语义信息。在NTU-RGB+D、NTU-RGB+D 120和SBU双人交互数据集上进行实验,验证了模型有效性,与其他双人交互识别方法相比,该模型性能更优。 展开更多
关键词 双人交互识别 图卷积网络 邻接矩阵 注意力模块
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部