期刊文献+
共找到248篇文章
< 1 2 13 >
每页显示 20 50 100
MAGPNet:Multi-Domain Attention-Guided Pyramid Network for Infrared Small Object Detection
1
作者 DING Leqi WANG Biyun +1 位作者 YAO Lixiu CAI Yunze 《Journal of Shanghai Jiaotong university(Science)》 2025年第5期935-951,共17页
To overcome the obstacles of poor feature extraction and little prior information on the appearance of infrared dim small targets,we propose a multi-domain attention-guided pyramid network(MAGPNet).Specifically,we des... To overcome the obstacles of poor feature extraction and little prior information on the appearance of infrared dim small targets,we propose a multi-domain attention-guided pyramid network(MAGPNet).Specifically,we design three modules to ensure that salient features of small targets can be acquired and retained in the multi-scale feature maps.To improve the adaptability of the network for targets of different sizes,we design a kernel aggregation attention block with a receptive field attention branch and weight the feature maps under different perceptual fields with attention mechanism.Based on the research on human vision system,we further propose an adaptive local contrast measure module to enhance the local features of infrared small targets.With this parameterized component,we can implement the information aggregation of multi-scale contrast saliency maps.Finally,to fully utilize the information within spatial and channel domains in feature maps of different scales,we propose the mixed spatial-channel attention-guided fusion module to achieve high-quality fusion effects while ensuring that the small target features can be preserved at deep layers.Experiments on public datasets demonstrate that our MAGPNet can achieve a better performance over other state-of-the-art methods in terms of the intersection of union,Precision,Recall,and F-measure.In addition,we conduct detailed ablation studies to verify the effectiveness of each component in our network. 展开更多
关键词 infrared small objection detection kernel aggregation attention adaptive local contrast measure mixed spatial-channel attention
原文传递
VTAN: A Novel Video Transformer Attention-Based Network for Dynamic Sign Language Recognition
2
作者 Ziyang Deng Weidong Min +2 位作者 Qing Han Mengxue Liu Longfei Li 《Computers, Materials & Continua》 2025年第2期2793-2812,共20页
Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dyn... Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dynamic sign language requires identifying keyframes that best represent the signs, and missing these keyframes reduces accuracy. Secondly, some methods do not focus enough on hand regions, which are small within the overall frame, leading to information loss. To address these challenges, we propose a novel Video Transformer Attention-based Network (VTAN) for dynamic sign language recognition. Our approach prioritizes informative frames and hand regions effectively. To tackle the first issue, we designed a keyframe extraction module enhanced by a convolutional autoencoder, which focuses on selecting information-rich frames and eliminating redundant ones from the video sequences. For the second issue, we developed a soft attention-based transformer module that emphasizes extracting features from hand regions, ensuring that the network pays more attention to hand information within sequences. This dual-focus approach improves effective dynamic sign language recognition by addressing the key challenges of identifying critical frames and emphasizing hand regions. Experimental results on two public benchmark datasets demonstrate the effectiveness of our network, outperforming most of the typical methods in sign language recognition tasks. 展开更多
关键词 Dynamic sign language recognition TRANSFORMER soft attention attention-based visual feature aggregation
在线阅读 下载PDF
A Novel Feature Aggregation Approach for Image Retrieval Using Local and Global Features
3
作者 Yuhua Li Zhiqiang He +4 位作者 Junxia Ma Zhifeng Zhang Wangwei Zhang Prasenjit Chatterjee Dragan Pamucar 《Computer Modeling in Engineering & Sciences》 SCIE EI 2022年第4期239-262,共24页
The current deep convolution features based on retrievalmethods cannot fully use the characteristics of the salient image regions.Also,they cannot effectively suppress the background noises,so it is a challenging task... The current deep convolution features based on retrievalmethods cannot fully use the characteristics of the salient image regions.Also,they cannot effectively suppress the background noises,so it is a challenging task to retrieve objects in cluttered scenarios.To solve the problem,we propose a new image retrieval method that employs a novel feature aggregation approach with an attention mechanism and utilizes a combination of local and global features.The method first extracts global and local features of the input image and then selects keypoints from local features by using the attention mechanism.After that,the feature aggregation mechanism aggregates the keypoints to a compact vector representation according to the scores evaluated by the attention mechanism.The core of the aggregation mechanism is to allow features with high scores to participate in residual operations of all cluster centers.Finally,we get the improved image representation by fusing aggregated feature descriptor and global feature of the input image.To effectively evaluate the proposedmethod,we have carried out a series of experiments on large-scale image datasets and compared them with other state-of-the-art methods.Experiments show that this method greatly improves the precision of image retrieval and computational efficiency. 展开更多
关键词 attention mechanism image retrieval descriptor aggregation convolutional neural network
在线阅读 下载PDF
MASA-Net:Multi-Aspect Channel-Spatial Attention Network With Cross-Layer Feature Aggregation for Accurate Fungi Species Identification
4
作者 Indranil Bera Rajesh Mukherjee Bidesh Chakraborty 《IET Cyber-Systems and Robotics》 2025年第4期81-94,共14页
Accurate identification of fungal species is essential for effective diagnosis and treatment.Traditional microscopy-based methods are often subjective and time-consuming.Deep learning has emerged as a promising tool i... Accurate identification of fungal species is essential for effective diagnosis and treatment.Traditional microscopy-based methods are often subjective and time-consuming.Deep learning has emerged as a promising tool in this domain.However,existing deep learning models often struggle to generalise in the presence of class imbalance and subtle morphological differences,which are common in fungal image datasets.This study proposes MASA-Net,a deep learning framework that combines a fine-tuned DenseNet201 backbone with a multi-aspect channel-spatial attention(MASA)module.The attention mechanism refines spatial and channel-wise features by capturing multi-scale spatial patterns and adaptively emphasising informative channels.This enhances the network's ability to focus on diagnostically relevant fungal structures while suppressing irrelevant features.The MASA-Net is evaluated on the DeFungi dataset and demonstrates superior performance in terms of accuracy,precision,recall and F1-score.It also outperforms established attention mechanisms such as squeeze-andexcitation networks(SE)and convolutional block attention module(CBAM)under identical conditions.These results highlight MASA-Net's robustness and effectiveness in addressing class imbalance and structural variability,offering a reliable solution for automated fungal species identification. 展开更多
关键词 attention convolutional neural network(CNN) cross-layer feature aggregation fungi Classification transfer learning
原文传递
特征偏置与注意力聚合的自监督单目深度估计网络
5
作者 贾瑞明 余俊 +2 位作者 徐霄 王涵 郑瀚 《计算机工程与应用》 北大核心 2026年第1期253-263,共11页
提出一种特征偏置与注意力聚合的网络模型,解决单目深度估计任务中存在的深度不连续、局部偏差大等问题。特征偏置增强模块通过在网络内部特征通道维度上添加随机偏置,强化网络对位置信息的处理,增强模型的泛化能力。此外,重新设计卷积... 提出一种特征偏置与注意力聚合的网络模型,解决单目深度估计任务中存在的深度不连续、局部偏差大等问题。特征偏置增强模块通过在网络内部特征通道维度上添加随机偏置,强化网络对位置信息的处理,增强模型的泛化能力。此外,重新设计卷积与自注意力的双路聚合结构,使用深度卷积与非压缩门控结构模块,更加准确地推理像点的深度信息。在公开数据集KITTI和Make3D上分别进行了对比实验和泛化验证实验,对比实验的精度提升了2.01%,跨数据集泛化实验的精度提高了5.23%。 展开更多
关键词 单目深度估计 自监督 聚合注意力 特征偏置增强
在线阅读 下载PDF
顾及距离衰减效应的地理知识图谱补全方法
6
作者 赫晓慧 李爽 +1 位作者 孔锦澜 田智慧 《地球信息科学学报》 北大核心 2026年第2期273-286,共14页
【目的】地理知识图谱(GeoKG)通过知识图谱的形式化技术,将地理知识表示为计算机可解释、可复用、可推理的知识网络。但由于地理信息分布的稀疏性以及更新的落后性,地理知识图谱往往是不完整的,制约着其应用广度和深度,需要地理知识图... 【目的】地理知识图谱(GeoKG)通过知识图谱的形式化技术,将地理知识表示为计算机可解释、可复用、可推理的知识网络。但由于地理信息分布的稀疏性以及更新的落后性,地理知识图谱往往是不完整的,制约着其应用广度和深度,需要地理知识图谱补全方法来解决其不完整的问题。然而,现有补全方法未充分考虑到地理知识图谱中的语义信息以及地理实体间的交互遵循距离衰减效应,致使嵌入空间难以充分还原地理实体和关系的真实分布,从而限制了补全性能的提升。【方法】本文提出了一种顾及距离衰减效应的地理知识图谱补全方法DDGKGC(Distance-Decaying Effect-Aware Geographic Knowledge Graph Completion method)。该方法首先通过语义信息聚合模块和距离衰减效应感知模块,捕获实体和关系间的语义信息和距离信息;然后,通过基于双注意力机制的表示学习模块自适应地学习实体和关系的邻域信息,得到实体和关系的嵌入表示,最后通过ConvE得分函数进行评分预测,并使用预测结果来完成地理知识图谱补全任务。【结果】为全面评估模型性能,本文在自构建数据集Multi-Geo、CityDirection、CountyDistance及公开数据集Countries-S3上进行了对比实验、消融实验和多维度分析验证。实验结果表明,DDGKGC在MRR、Hits@1、Hits@3、Hits@10等多项指标上表现出色,尤其在全面反映模型性能的MRR指标上相较于对比方法在4个数据集上分别提升4%、3.1%、1.8%和5.2%。此外,通过多维度分析验证评估,证明了DDGKGC能够更合理地建模地理实体关系间的空间和语义关联,从而提升补全结果的准确性与地理合理性。【结论】本文提出的顾及距离衰减效应的地理知识图谱补全方法,不仅有效提升了地理知识图谱补全任务的性能,还展现出良好的泛化能力与应用潜力,同时也为地理知识图谱的深化应用提供了可靠支撑。 展开更多
关键词 地理知识图谱 地理知识图谱补全 距离衰减效应 语义信息聚合 实体关系表示 注意力机制
原文传递
基于多尺度注意力视觉Mamba U-Net的耕地遥感分割方法
7
作者 侯新刚 王勤令 伟锋 《农业机械学报》 北大核心 2026年第4期279-286,共8页
耕地遥感影像的准确分割对产量预测、农业经营和国家粮食安全至关重要。由于遥感农田图像分辨率高、尺寸大、种类多、边界不规则、背景复杂等特点,以及遥感图像分割中广泛应用的卷积神经网络和Transformer存在难以提取远程依赖关系和计... 耕地遥感影像的准确分割对产量预测、农业经营和国家粮食安全至关重要。由于遥感农田图像分辨率高、尺寸大、种类多、边界不规则、背景复杂等特点,以及遥感图像分割中广泛应用的卷积神经网络和Transformer存在难以提取远程依赖关系和计算复杂度高等局限性,使得农田遥感图像分割研究仍具有一定挑战性。针对当前耕地遥感分割任务中存在的边界模糊、地类混杂等问题,本文提出一种新型多尺度注意力视觉Mamba U-Net(MSAVM-UNet)模型。该模型通过3个模块实现性能突破:首先,改进视觉状态空间模块采用双向选择性扫描机制,在保持线性计算复杂度的同时实现长程依赖建模;其次,通道感知注意力状态空间模块通过动态光谱-空间特征重标定,有效提升耕地与背景地物的区分度;最后,构建多尺度跨层级特征金字塔特征聚合模块,实现多粒度信息融合。在公开耕地数据集的试验表明,MSAVM-UNet在分割精度和计算效率方面均显著优于现有方法,平均分割精度和相似系数分别达到85.60%和84.46%。研究结果为智慧农业耕地精准监测提供了可靠技术支撑。 展开更多
关键词 耕地遥感图像分割 通道感知注意力视觉状态空间 多尺度注意力聚合 MSAVM-UNet
在线阅读 下载PDF
基于注意力和变分类自编码的PCB小样本缺陷检测
8
作者 宋涛 冉璐 +4 位作者 杨金河 邢镔 龙邹荣 王泓俊 李梓谦 《计算机工程与应用》 北大核心 2026年第4期363-372,共10页
针对小样本印刷电路板(printed circuit board,PCB)缺陷样本少、样本失衡、难泛化导致检测精度较低的问题,引入元学习方案,在元学习目标检测框架上提出基于注意力和变分类自编码的小样本缺陷检测方法。针对支持分支建模易受噪声影响问题... 针对小样本印刷电路板(printed circuit board,PCB)缺陷样本少、样本失衡、难泛化导致检测精度较低的问题,引入元学习方案,在元学习目标检测框架上提出基于注意力和变分类自编码的小样本缺陷检测方法。针对支持分支建模易受噪声影响问题,提出基于注意力的背景弱化模块,通过对注意力机制进行改进,使模型能够自适应改变重要性,聚焦前景信息与周围差异,减少背景干扰。鉴于支持分支缺乏类特征提取,导致查询特征与支持特征聚合后容易发生漏检、错检的问题,提出变分类自编码模块,利用概率分布以及重参数化获得类特征,提高新类检测准确率。为了充分探索查询特征与支持特征高级特征关系,提出多特征聚合模块,利用元素乘法、减法运算对两种特征之间的相似点和差异性进行建模,同时通过查询原型减少随机采样带来的噪声。实验结果表明,在PKU-Market-PCB数据集上,该方法在10样本下新类、基类准确率最高可达到65.3%、89.7%。 展开更多
关键词 小样本目标检测 元学习 注意力机制 变分类自编码 多特征聚合
在线阅读 下载PDF
基于压缩空间注意力和序列聚合重分配的交通流量预测
9
作者 杨真真 何袁梁 徐奕 《南京邮电大学学报(自然科学版)》 北大核心 2026年第2期105-112,共8页
针对现有交通流量预测方法难以同时兼顾全局路网趋势与局部路段细节,且对交通数据长期依赖关系建模不足的问题,提出了一种基于压缩空间注意力和序列聚合重分配(Compressed Spatial Attention and Sequence Aggregation Redistribution,C... 针对现有交通流量预测方法难以同时兼顾全局路网趋势与局部路段细节,且对交通数据长期依赖关系建模不足的问题,提出了一种基于压缩空间注意力和序列聚合重分配(Compressed Spatial Attention and Sequence Aggregation Redistribution,CSA-SAR)的交通流量预测方法。首先,设计了压缩空间注意力机制,通过轴向压缩技术减少冗余信息干扰,并通过卷积模块增强交通数据关键空间特征的细节表达。其次,设计了序列聚合重分配模块,利用随机池化生成全局状态的核心表示,并通过动态拼接与局部时间特征结合,改善长期依赖关系建模中全局与局部信息的融合效果。然后,设计了多尺度时间信息提取模块,通过多尺度卷积捕捉交通数据不同时间尺度特征,与序列聚合模块协同优化时间维度建模。最后,在三个数据集上的仿真实验表明,提出的CSA-SAR均优于现有交通流量预测方法。 展开更多
关键词 交通流量预测 压缩空间注意力 序列聚合重分配 多尺度时间信息 多尺度卷积
在线阅读 下载PDF
VIFusion:低光场景下可见光与红外图像的互补融合模型
10
作者 张晓滨 牛燕皓 陈金广 《西安工程大学学报》 2026年第1期126-135,共10页
针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual tem... 针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual temporal feature aggregation,DTFA)模块、特征细化前馈网络(feature refinement feedforward network,FRFN)模块和空间通道注意力机制(spatial channel attention,SCA)模块提升了融合图像的质量和信息表达能力。其中,DTFA模块使用分组卷积保持特征空间完整性,然后进行时序对齐与融合,以增强时序一致性并减少信息损失。FRFN模块对提取的特征进行逐层优化,减少通道冗余。SCA模块通过自适应建模图像空间和通道关系,突出关键特征,提高信息表达能力、增强边缘、纹理等细节信息。实验结果表明:在LLVIP数据集上,VIFusion模型在客观指标(AG、CC、EN、SF、SSIM、VIF、MI)上优于传统方法和深度学习模型(如GTF、TarDAL、DenseFuse等)。在数据集TNO上的泛化实验中,生成的融合图像在细节保留和目标突出上也表现更佳。VIFusion模型为低光场景下的多模态图像融合提供了一种高效实用的解决方案。 展开更多
关键词 双时态特征聚合 特征细化前馈网络 空间通道注意力 图像融合
在线阅读 下载PDF
基于级联注意力的结肠息肉图像分割算法研究
11
作者 周孟然 陆鹏 《重庆工商大学学报(自然科学版)》 2026年第1期1-10,共10页
目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision... 目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision Transformer,PVT)作为编码器,接着设计了多尺度特征注意力提取模块(Multi-scale Feature Attention Extraction,MFAE)和层间注意力聚合模块(Inter-layer Attention Aggregation,IA)。其中,PVT通过其自注意力机制保证了模型的泛化能力,MFAE使用不同大小的滤波器多尺度提取特征,旨在缓解注意力分散问题;IA交互融合不同层级特征,有效解决多级特征融合产生的信息丢失问题;最后引入全局上下文模块(Global Context,GC)使模型更好地理解特征图之间的像素依赖关系。结果在Kvasir、CVC-ClinicDB、CVC-ColonDB和ETIS数据集上进行了评估,相较于最优基线模型,mDice、mIoU分别提高了1.76%、0.81%、1.51%、1.74%、3.15%、2.65%和1.73%、3.84%。结论PVT-CAMNet的学习性能和泛化性能均优于其他先进方法,在息肉图像分割上具有一定的应用价值。 展开更多
关键词 息肉图像分割 多尺度注意力提取 层间注意力聚合 全局上下文
在线阅读 下载PDF
基于链路聚合的图欺诈检测
12
作者 邱天 贾凌翔 +3 位作者 高杨 冯尊磊 高艺 宋明黎 《软件学报》 北大核心 2026年第2期860-874,共15页
随着信息技术发展,信息网络、人类社会与物理空间交互加深,信息空间风险外溢现象严峻.欺诈事件激增,欺诈检测成为重要研究领域.欺诈行为给社会带来了诸多负面影响,且逐渐呈现出智能化、产业化及高度隐蔽性等新兴特征,传统的专家规则与... 随着信息技术发展,信息网络、人类社会与物理空间交互加深,信息空间风险外溢现象严峻.欺诈事件激增,欺诈检测成为重要研究领域.欺诈行为给社会带来了诸多负面影响,且逐渐呈现出智能化、产业化及高度隐蔽性等新兴特征,传统的专家规则与深度图神经网络算法在应对上显得愈发局限.当前反欺诈算法多从节点自身与邻居节点的局部信息出发,或聚焦于用户个体,或分析节点与网络拓扑关系,或利用图嵌入技术学习节点表示,这些视角虽然能具备一定的欺诈检测能力,但是忽略了实体长程关联模式的关键作用,缺乏对于海量欺诈链路之间共性模式的挖掘,限制了全面的欺诈检测能力.针对以上欺诈检测算法的局限性,提出一种基于链路聚合的图欺诈检测模型PA-GNN(path aggregation graph neural network),包含不定长链路采样,位置关联的统一链路编码,链路信息交互聚合,以及聚合关联的欺诈检测.从节点出发的若干链路之间通过全局模式交互与相似度比对,挖掘欺诈链路之间的共性规律,从而更全面地揭示欺诈行为之间的关联模式,并通过链路聚合继而实现欺诈检测.在金融交易、社交网络和评论网络这3类欺诈场景下的多个数据集上的实验结果表明,所提方法的曲线下面积(AUC)和平均精度(AP)指标相较于最优基准模型均有显著提升.此外,该方法为欺诈检测任务挖掘了潜在的共性欺诈链路模式,驱动节点学习这些重要的模式并获得更具表现力的表示,具备一定的可解释性. 展开更多
关键词 图神经网络 欺诈检测 链路聚合 注意力机制 特征表示
在线阅读 下载PDF
面向飞机蒙皮覆盖检测的多无人机协同任务规划
13
作者 朴敏楠 李浩龙 +1 位作者 李海丰 范龙飞 《控制与决策》 北大核心 2026年第3期809-821,共13页
针对飞机蒙皮覆盖检测的场景下,传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题,现有研究多集中于多无人机协同作业的技术方案,其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP)是描述多无人机协同检测的问题模型,... 针对飞机蒙皮覆盖检测的场景下,传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题,现有研究多集中于多无人机协同作业的技术方案,其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP)是描述多无人机协同检测的问题模型,当前算法多采用启发式算法,但其求解速度和解的质量无法满足实际要求.为此,将MCMP问题建模为带有容量约束的车辆路径规划问题(CVRP),提出两阶段的深度强化学习(TSDRL)的求解模型:第1阶段根据节点数量,利用基于注意力机制的策略网络求解最优无人机数量;第2阶段设计一种新的编码器-解码器结构的策略网络,以构建每架无人机的路径.该模型通过策略梯度训练,能够快速求解每架无人机的高质量路径,为了解决三维环境碰撞问题,使用RRT^(*)算法优化路径以满足碰撞约束.仿真结果表明,所提模型在计算效率与求解质量上均优于现有的深度强化学习方法和启发式算法,并且模型具有良好的泛化性,可应用于不同机型. 展开更多
关键词 飞机蒙皮检测 任务规划 深度强化学习 注意力机制 策略梯度
原文传递
多尺度注意力聚合视觉Mamba-UNet的遥感图像显著性目标检测方法
14
作者 张善文 郭能念 +2 位作者 邵彧 李萍 许新华 《电光与控制》 北大核心 2026年第2期1-6,13,共7页
针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS... 针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS)模块构建,利用VSS和CASC有效获取遥感图像(RSI)中的长距离依赖关系,在瓶颈层引入空洞多尺度注意力聚合(DMSAA)模块,有效整合局部-全局特征,提取多尺度小目标的细节特征。该模型整合了多尺度卷积、注意力机制、U-Net与Mamba-UNet的优势,提高了RSISOD的性能。在大规模RSI数据集EORSSD中的飞机图像子集上进行了实验。结果表明,MSAAVMamba-UNet能够精确检测RSI中的显著性多尺度小目标,精度达到84.07%,该方法为RSISOD系统提供了技术支持。 展开更多
关键词 遥感图像 显著性目标检测 空洞多尺度注意力聚合 Mamba-UNet 多尺度注意力聚合视觉Mamba-UNet
在线阅读 下载PDF
改进YOLOv10的复杂场景人体跌倒检测方法
15
作者 郭莉 张雪松 +1 位作者 李萌萌 金花 《电子测量技术》 北大核心 2026年第3期204-212,共9页
针对复杂场景中高动态人体运动引发的跌倒特征判别性下降、小目标难以识别、关键部位遮挡等问题,提出了一种基于改进YOLOv10的人体跌倒检测算法ICI-YOLO。通过引入上下文锚点注意力替换骨干网络中的部分自注意力机制,实现了全局上下文... 针对复杂场景中高动态人体运动引发的跌倒特征判别性下降、小目标难以识别、关键部位遮挡等问题,提出了一种基于改进YOLOv10的人体跌倒检测算法ICI-YOLO。通过引入上下文锚点注意力替换骨干网络中的部分自注意力机制,实现了全局上下文依赖与细粒度空间融合表征;融合了迭代注意力机制对骨干网络C2f进行重构,强化关键区域语义表达能力;并提出融合交互卷积和跨尺度特征融合的交互式特征融合网络,提升了模型多尺度特征融合能力。实验表明,改进后的ICI-YOLO模型在自制人体跌倒行为检测数据集FALL上召回率和mAP@0.5分别提升了4.3%和2.2%,在公开数据集DiverseFALL10500上准确率和mAP@0.5:0.95分别提升了2.0%和1.5%,且在与主流实时检测算法的对比中展现出更优的检测性能。 展开更多
关键词 人体跌倒检测 YOLOv10 上下文锚点注意力 迭代注意力 交互卷积
原文传递
融合多元注意力与高效特征聚合的行人重识别方法
16
作者 程杰 卞长智 +1 位作者 张婧 李小霞 《计算机工程与应用》 北大核心 2026年第2期220-231,共12页
针对行人重识别任务中视角、光照以及姿态变化等导致行人特征提取不充分的问题,设计了一种融合多元注意力与高效特征聚合的行人重识别网络。在ResNet50的瓶颈模块中嵌入无参通道注意力,利用均值与方差信息对通道权重进行调整,以增强对... 针对行人重识别任务中视角、光照以及姿态变化等导致行人特征提取不充分的问题,设计了一种融合多元注意力与高效特征聚合的行人重识别网络。在ResNet50的瓶颈模块中嵌入无参通道注意力,利用均值与方差信息对通道权重进行调整,以增强对关键通道的作用。仅在ResNet50的深层网络中引入自注意力机制,通过计算特征点之间的相关性来提高捕捉全局信息的能力,同时设置不同下采样率的双分支,以捕获不同分辨率下的行人特征信息。设计高效特征聚合金字塔,通过自上而下和自下而上的双路径实现深层语义和浅层的细节信息快速融合,同时在金字塔横向连接中加入通道与空间注意力残差融合模块以突出行人关键特征。使用双重批量归一化特征分类模块优化训练,提高网络稳定性。在Market1501、DukeMTMC-ReID和CUHK03数据集上,所提方法的mAP和Rank-1指标分别达到了89.5%和95.6%、80.1%和90.5%、79.7%和84.9%,实验结果表明,所提方法能够有效提高受视角、光照、姿态变化影响的行人重识别性能。 展开更多
关键词 行人重识别(Re-ID) ResNet50 注意力机制 高效特征聚合 金字塔横向连接
在线阅读 下载PDF
基于部分卷积的残差特征聚合轻量超分辨率网络
17
作者 闫航 刘春龙 宋振峰 《现代电子技术》 北大核心 2026年第5期89-96,共8页
为了解决图像超分辨率重建模型普遍参数量大和计算过程复杂,对计算量和资源需求急剧增加的问题,文中提出一种基于部分卷积的残差特征聚合轻量超分辨率网络。该网络在部分卷积层的基础上减少模型冗余计算的同时也减少了参数量。在轻量化... 为了解决图像超分辨率重建模型普遍参数量大和计算过程复杂,对计算量和资源需求急剧增加的问题,文中提出一种基于部分卷积的残差特征聚合轻量超分辨率网络。该网络在部分卷积层的基础上减少模型冗余计算的同时也减少了参数量。在轻量化的前提下,引入残差特征聚合模块,同时关注局部与非局部特征信息,以增强网络对图像细节的全面捕捉,加速信息传递的同时提高网络泛化能力。实验结果表明,所提方法同NGswin和LKFN在公共基准测试集2倍、3倍、4倍缩放因子下的PSNR相比,分别平均提升0.28 dB、0.13 dB、0.08 dB和0.03 dB、0.02 dB、0.02 dB;参数量分别减少82%、81%、81%和38%、37%、36%;GFLOPs分别减少55%、58%、56%和6%、7%、11%。网络在轻量化的同时实现了重建图像质量的提高,减少了图像模糊程度,缓解了重建图像的伪影情况,充分证明了所提方法的高效性。 展开更多
关键词 轻量化模型 卷积神经网络 图像超分辨率重建 特征聚合 深度学习 自注意力机制
在线阅读 下载PDF
基于体素-关键点特征聚合网络的点云3维目标检测 被引量:1
18
作者 陈旭东 韩丽丽 +2 位作者 肖英豪 薛保国 马留洋 《激光技术》 北大核心 2026年第2期291-299,共9页
为了解决现有点云检测方法中忽略3维结构上下文特性、导致特征表示能力弱和候选框准确性低的问题,基于体素-关键点编码和多层级特征融合理论,研究了一种3维目标检测模型。利用球查询和体素查询的灵活感受野,从3维稀疏卷积特征和鸟瞰图... 为了解决现有点云检测方法中忽略3维结构上下文特性、导致特征表示能力弱和候选框准确性低的问题,基于体素-关键点编码和多层级特征融合理论,研究了一种3维目标检测模型。利用球查询和体素查询的灵活感受野,从3维稀疏卷积特征和鸟瞰图像特征中提取3维候选框的多层次特征,并利用点之间的远程上下文依赖关系去学习可判别性表征;开发了体素-关键点编码模块,通过多层自注意力关键点采样方法及编码策略进行3维候选框的细化;通过卷积注意力方式对多层级特征进行聚合,得到了3维候选框表征,并在大规模点云目标检测数据集KITTI和Waymo数据集上进行了实验分析。结果表明,该方法能高效准确识别3维目标,在骑行者类别的3维检测精度最高达93.88%,在多个检测场景中均优于主流方法。该研究在远点稀疏场景下的3维目标检测中具有良好的应用价值。 展开更多
关键词 图像处理 3维目标检测 多层次特征融合 关键点采样 多尺度自注意力
在线阅读 下载PDF
多尺度聚合协同轴向语义引导的实体关系联合抽取方法
19
作者 钱清 陈辉程 +2 位作者 崔允贺 唐瑞雪 付金玫 《计算机科学》 北大核心 2026年第3期97-106,共10页
近年来,基于表填充的实体关系联合抽取方法取得了显著效果,但现有研究尚未考虑到词对间的边界关联性建模,以及构建词对语义相似性问题。为解决上述问题,提出了一种基于多尺度聚合协同轴向语义引导的实体关系联合抽取模型。首先,设计的... 近年来,基于表填充的实体关系联合抽取方法取得了显著效果,但现有研究尚未考虑到词对间的边界关联性建模,以及构建词对语义相似性问题。为解决上述问题,提出了一种基于多尺度聚合协同轴向语义引导的实体关系联合抽取模型。首先,设计的多尺度语义聚合模块通过并行多个不同尺寸的深度卷积提取不同排列下词对间的边界关联信息,从而丰富词对语义,识别隐形实体。其次,轴向语义引导模块通过行列带状卷积从轴向上进行卷积注意力校准,强化词对关键语义表征,从而改善词对间语义相似问题。最后,在数据集NYT*,WebNLG*,NYT和WebNLG上进行实验,该方法分别取得了93.2%,94.5%,93.2%和91.4%的F1得分,相较于基线模型分别提高了0.1个百分点、0.6个百分点、0.4个百分点和1.0个百分点,表明其能够捕获词对边界关联以及精细化词对语义,提升了实体关系联合抽取的性能。 展开更多
关键词 自然语言处理 实体关系联合抽取 多尺度语义聚合 轴向语义引导 卷积注意力
在线阅读 下载PDF
基于分层式残差聚合与双分支维度分裂注意力机制的情绪识别
20
作者 李杰 何文雪 +1 位作者 王述畅 杨帮华 《中国医学物理学杂志》 2026年第2期220-228,共9页
针对脑电图(EEG)动态复杂性和解码难度限制情绪识别的精度和鲁棒性的问题,提出一种新的情绪分类模型MADBNet。首先,多尺度分组卷积用于捕捉不同层次的情绪特征;随后,通过分层残差聚合多尺度特征,并穿插轴向通道空间注意力捕获通道相关... 针对脑电图(EEG)动态复杂性和解码难度限制情绪识别的精度和鲁棒性的问题,提出一种新的情绪分类模型MADBNet。首先,多尺度分组卷积用于捕捉不同层次的情绪特征;随后,通过分层残差聚合多尺度特征,并穿插轴向通道空间注意力捕获通道相关性和空间依赖性;最后,通过双分支维度分裂特征处理的注意力机制增强局部与全局关联,实现EEG时空频特征的融合。在DEAP数据集上的实验结果表明,该模型在精度和稳定性显示出优越的性能。 展开更多
关键词 情绪识别 人机交互 分层残差聚合 轴向通道空间注意力 双分支维度分裂
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部