期刊文献+
共找到233篇文章
< 1 2 12 >
每页显示 20 50 100
MAGPNet:Multi-Domain Attention-Guided Pyramid Network for Infrared Small Object Detection
1
作者 DING Leqi WANG Biyun +1 位作者 YAO Lixiu CAI Yunze 《Journal of Shanghai Jiaotong university(Science)》 2025年第5期935-951,共17页
To overcome the obstacles of poor feature extraction and little prior information on the appearance of infrared dim small targets,we propose a multi-domain attention-guided pyramid network(MAGPNet).Specifically,we des... To overcome the obstacles of poor feature extraction and little prior information on the appearance of infrared dim small targets,we propose a multi-domain attention-guided pyramid network(MAGPNet).Specifically,we design three modules to ensure that salient features of small targets can be acquired and retained in the multi-scale feature maps.To improve the adaptability of the network for targets of different sizes,we design a kernel aggregation attention block with a receptive field attention branch and weight the feature maps under different perceptual fields with attention mechanism.Based on the research on human vision system,we further propose an adaptive local contrast measure module to enhance the local features of infrared small targets.With this parameterized component,we can implement the information aggregation of multi-scale contrast saliency maps.Finally,to fully utilize the information within spatial and channel domains in feature maps of different scales,we propose the mixed spatial-channel attention-guided fusion module to achieve high-quality fusion effects while ensuring that the small target features can be preserved at deep layers.Experiments on public datasets demonstrate that our MAGPNet can achieve a better performance over other state-of-the-art methods in terms of the intersection of union,Precision,Recall,and F-measure.In addition,we conduct detailed ablation studies to verify the effectiveness of each component in our network. 展开更多
关键词 infrared small objection detection kernel aggregation attention adaptive local contrast measure mixed spatial-channel attention
原文传递
VTAN: A Novel Video Transformer Attention-Based Network for Dynamic Sign Language Recognition
2
作者 Ziyang Deng Weidong Min +2 位作者 Qing Han Mengxue Liu Longfei Li 《Computers, Materials & Continua》 2025年第2期2793-2812,共20页
Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dyn... Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dynamic sign language requires identifying keyframes that best represent the signs, and missing these keyframes reduces accuracy. Secondly, some methods do not focus enough on hand regions, which are small within the overall frame, leading to information loss. To address these challenges, we propose a novel Video Transformer Attention-based Network (VTAN) for dynamic sign language recognition. Our approach prioritizes informative frames and hand regions effectively. To tackle the first issue, we designed a keyframe extraction module enhanced by a convolutional autoencoder, which focuses on selecting information-rich frames and eliminating redundant ones from the video sequences. For the second issue, we developed a soft attention-based transformer module that emphasizes extracting features from hand regions, ensuring that the network pays more attention to hand information within sequences. This dual-focus approach improves effective dynamic sign language recognition by addressing the key challenges of identifying critical frames and emphasizing hand regions. Experimental results on two public benchmark datasets demonstrate the effectiveness of our network, outperforming most of the typical methods in sign language recognition tasks. 展开更多
关键词 Dynamic sign language recognition TRANSFORMER soft attention attention-based visual feature aggregation
在线阅读 下载PDF
A Novel Feature Aggregation Approach for Image Retrieval Using Local and Global Features
3
作者 Yuhua Li Zhiqiang He +4 位作者 Junxia Ma Zhifeng Zhang Wangwei Zhang Prasenjit Chatterjee Dragan Pamucar 《Computer Modeling in Engineering & Sciences》 SCIE EI 2022年第4期239-262,共24页
The current deep convolution features based on retrievalmethods cannot fully use the characteristics of the salient image regions.Also,they cannot effectively suppress the background noises,so it is a challenging task... The current deep convolution features based on retrievalmethods cannot fully use the characteristics of the salient image regions.Also,they cannot effectively suppress the background noises,so it is a challenging task to retrieve objects in cluttered scenarios.To solve the problem,we propose a new image retrieval method that employs a novel feature aggregation approach with an attention mechanism and utilizes a combination of local and global features.The method first extracts global and local features of the input image and then selects keypoints from local features by using the attention mechanism.After that,the feature aggregation mechanism aggregates the keypoints to a compact vector representation according to the scores evaluated by the attention mechanism.The core of the aggregation mechanism is to allow features with high scores to participate in residual operations of all cluster centers.Finally,we get the improved image representation by fusing aggregated feature descriptor and global feature of the input image.To effectively evaluate the proposedmethod,we have carried out a series of experiments on large-scale image datasets and compared them with other state-of-the-art methods.Experiments show that this method greatly improves the precision of image retrieval and computational efficiency. 展开更多
关键词 attention mechanism image retrieval descriptor aggregation convolutional neural network
在线阅读 下载PDF
MASA-Net:Multi-Aspect Channel-Spatial Attention Network With Cross-Layer Feature Aggregation for Accurate Fungi Species Identification
4
作者 Indranil Bera Rajesh Mukherjee Bidesh Chakraborty 《IET Cyber-Systems and Robotics》 2025年第4期81-94,共14页
Accurate identification of fungal species is essential for effective diagnosis and treatment.Traditional microscopy-based methods are often subjective and time-consuming.Deep learning has emerged as a promising tool i... Accurate identification of fungal species is essential for effective diagnosis and treatment.Traditional microscopy-based methods are often subjective and time-consuming.Deep learning has emerged as a promising tool in this domain.However,existing deep learning models often struggle to generalise in the presence of class imbalance and subtle morphological differences,which are common in fungal image datasets.This study proposes MASA-Net,a deep learning framework that combines a fine-tuned DenseNet201 backbone with a multi-aspect channel-spatial attention(MASA)module.The attention mechanism refines spatial and channel-wise features by capturing multi-scale spatial patterns and adaptively emphasising informative channels.This enhances the network's ability to focus on diagnostically relevant fungal structures while suppressing irrelevant features.The MASA-Net is evaluated on the DeFungi dataset and demonstrates superior performance in terms of accuracy,precision,recall and F1-score.It also outperforms established attention mechanisms such as squeeze-andexcitation networks(SE)and convolutional block attention module(CBAM)under identical conditions.These results highlight MASA-Net's robustness and effectiveness in addressing class imbalance and structural variability,offering a reliable solution for automated fungal species identification. 展开更多
关键词 attention convolutional neural network(CNN) cross-layer feature aggregation fungi Classification transfer learning
原文传递
特征偏置与注意力聚合的自监督单目深度估计网络
5
作者 贾瑞明 余俊 +2 位作者 徐霄 王涵 郑瀚 《计算机工程与应用》 北大核心 2026年第1期253-263,共11页
提出一种特征偏置与注意力聚合的网络模型,解决单目深度估计任务中存在的深度不连续、局部偏差大等问题。特征偏置增强模块通过在网络内部特征通道维度上添加随机偏置,强化网络对位置信息的处理,增强模型的泛化能力。此外,重新设计卷积... 提出一种特征偏置与注意力聚合的网络模型,解决单目深度估计任务中存在的深度不连续、局部偏差大等问题。特征偏置增强模块通过在网络内部特征通道维度上添加随机偏置,强化网络对位置信息的处理,增强模型的泛化能力。此外,重新设计卷积与自注意力的双路聚合结构,使用深度卷积与非压缩门控结构模块,更加准确地推理像点的深度信息。在公开数据集KITTI和Make3D上分别进行了对比实验和泛化验证实验,对比实验的精度提升了2.01%,跨数据集泛化实验的精度提高了5.23%。 展开更多
关键词 单目深度估计 自监督 聚合注意力 特征偏置增强
在线阅读 下载PDF
顾及距离衰减效应的地理知识图谱补全方法
6
作者 赫晓慧 李爽 +1 位作者 孔锦澜 田智慧 《地球信息科学学报》 北大核心 2026年第2期273-286,共14页
【目的】地理知识图谱(GeoKG)通过知识图谱的形式化技术,将地理知识表示为计算机可解释、可复用、可推理的知识网络。但由于地理信息分布的稀疏性以及更新的落后性,地理知识图谱往往是不完整的,制约着其应用广度和深度,需要地理知识图... 【目的】地理知识图谱(GeoKG)通过知识图谱的形式化技术,将地理知识表示为计算机可解释、可复用、可推理的知识网络。但由于地理信息分布的稀疏性以及更新的落后性,地理知识图谱往往是不完整的,制约着其应用广度和深度,需要地理知识图谱补全方法来解决其不完整的问题。然而,现有补全方法未充分考虑到地理知识图谱中的语义信息以及地理实体间的交互遵循距离衰减效应,致使嵌入空间难以充分还原地理实体和关系的真实分布,从而限制了补全性能的提升。【方法】本文提出了一种顾及距离衰减效应的地理知识图谱补全方法DDGKGC(Distance-Decaying Effect-Aware Geographic Knowledge Graph Completion method)。该方法首先通过语义信息聚合模块和距离衰减效应感知模块,捕获实体和关系间的语义信息和距离信息;然后,通过基于双注意力机制的表示学习模块自适应地学习实体和关系的邻域信息,得到实体和关系的嵌入表示,最后通过ConvE得分函数进行评分预测,并使用预测结果来完成地理知识图谱补全任务。【结果】为全面评估模型性能,本文在自构建数据集Multi-Geo、CityDirection、CountyDistance及公开数据集Countries-S3上进行了对比实验、消融实验和多维度分析验证。实验结果表明,DDGKGC在MRR、Hits@1、Hits@3、Hits@10等多项指标上表现出色,尤其在全面反映模型性能的MRR指标上相较于对比方法在4个数据集上分别提升4%、3.1%、1.8%和5.2%。此外,通过多维度分析验证评估,证明了DDGKGC能够更合理地建模地理实体关系间的空间和语义关联,从而提升补全结果的准确性与地理合理性。【结论】本文提出的顾及距离衰减效应的地理知识图谱补全方法,不仅有效提升了地理知识图谱补全任务的性能,还展现出良好的泛化能力与应用潜力,同时也为地理知识图谱的深化应用提供了可靠支撑。 展开更多
关键词 地理知识图谱 地理知识图谱补全 距离衰减效应 语义信息聚合 实体关系表示 注意力机制
原文传递
基于多尺度注意力视觉Mamba U-Net的耕地遥感分割方法
7
作者 侯新刚 王勤令 伟锋 《农业机械学报》 北大核心 2026年第4期279-286,共8页
耕地遥感影像的准确分割对产量预测、农业经营和国家粮食安全至关重要。由于遥感农田图像分辨率高、尺寸大、种类多、边界不规则、背景复杂等特点,以及遥感图像分割中广泛应用的卷积神经网络和Transformer存在难以提取远程依赖关系和计... 耕地遥感影像的准确分割对产量预测、农业经营和国家粮食安全至关重要。由于遥感农田图像分辨率高、尺寸大、种类多、边界不规则、背景复杂等特点,以及遥感图像分割中广泛应用的卷积神经网络和Transformer存在难以提取远程依赖关系和计算复杂度高等局限性,使得农田遥感图像分割研究仍具有一定挑战性。针对当前耕地遥感分割任务中存在的边界模糊、地类混杂等问题,本文提出一种新型多尺度注意力视觉Mamba U-Net(MSAVM-UNet)模型。该模型通过3个模块实现性能突破:首先,改进视觉状态空间模块采用双向选择性扫描机制,在保持线性计算复杂度的同时实现长程依赖建模;其次,通道感知注意力状态空间模块通过动态光谱-空间特征重标定,有效提升耕地与背景地物的区分度;最后,构建多尺度跨层级特征金字塔特征聚合模块,实现多粒度信息融合。在公开耕地数据集的试验表明,MSAVM-UNet在分割精度和计算效率方面均显著优于现有方法,平均分割精度和相似系数分别达到85.60%和84.46%。研究结果为智慧农业耕地精准监测提供了可靠技术支撑。 展开更多
关键词 耕地遥感图像分割 通道感知注意力视觉状态空间 多尺度注意力聚合 MSAVM-UNet
在线阅读 下载PDF
基于注意力和变分类自编码的PCB小样本缺陷检测
8
作者 宋涛 冉璐 +4 位作者 杨金河 邢镔 龙邹荣 王泓俊 李梓谦 《计算机工程与应用》 北大核心 2026年第4期363-372,共10页
针对小样本印刷电路板(printed circuit board,PCB)缺陷样本少、样本失衡、难泛化导致检测精度较低的问题,引入元学习方案,在元学习目标检测框架上提出基于注意力和变分类自编码的小样本缺陷检测方法。针对支持分支建模易受噪声影响问题... 针对小样本印刷电路板(printed circuit board,PCB)缺陷样本少、样本失衡、难泛化导致检测精度较低的问题,引入元学习方案,在元学习目标检测框架上提出基于注意力和变分类自编码的小样本缺陷检测方法。针对支持分支建模易受噪声影响问题,提出基于注意力的背景弱化模块,通过对注意力机制进行改进,使模型能够自适应改变重要性,聚焦前景信息与周围差异,减少背景干扰。鉴于支持分支缺乏类特征提取,导致查询特征与支持特征聚合后容易发生漏检、错检的问题,提出变分类自编码模块,利用概率分布以及重参数化获得类特征,提高新类检测准确率。为了充分探索查询特征与支持特征高级特征关系,提出多特征聚合模块,利用元素乘法、减法运算对两种特征之间的相似点和差异性进行建模,同时通过查询原型减少随机采样带来的噪声。实验结果表明,在PKU-Market-PCB数据集上,该方法在10样本下新类、基类准确率最高可达到65.3%、89.7%。 展开更多
关键词 小样本目标检测 元学习 注意力机制 变分类自编码 多特征聚合
在线阅读 下载PDF
VIFusion:低光场景下可见光与红外图像的互补融合模型
9
作者 张晓滨 牛燕皓 陈金广 《西安工程大学学报》 2026年第1期126-135,共10页
针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual tem... 针对低光场景下可见光与红外图像融合算法存在时序信息丢失、特征图通道冗余、细节模糊等问题,本文基于Vision Transformer框架,提出了一种低光场景下可见光与红外图像的互补融合模型VIFusion。该模型通过包含的双时态特征聚合(dual temporal feature aggregation,DTFA)模块、特征细化前馈网络(feature refinement feedforward network,FRFN)模块和空间通道注意力机制(spatial channel attention,SCA)模块提升了融合图像的质量和信息表达能力。其中,DTFA模块使用分组卷积保持特征空间完整性,然后进行时序对齐与融合,以增强时序一致性并减少信息损失。FRFN模块对提取的特征进行逐层优化,减少通道冗余。SCA模块通过自适应建模图像空间和通道关系,突出关键特征,提高信息表达能力、增强边缘、纹理等细节信息。实验结果表明:在LLVIP数据集上,VIFusion模型在客观指标(AG、CC、EN、SF、SSIM、VIF、MI)上优于传统方法和深度学习模型(如GTF、TarDAL、DenseFuse等)。在数据集TNO上的泛化实验中,生成的融合图像在细节保留和目标突出上也表现更佳。VIFusion模型为低光场景下的多模态图像融合提供了一种高效实用的解决方案。 展开更多
关键词 双时态特征聚合 特征细化前馈网络 空间通道注意力 图像融合
在线阅读 下载PDF
基于级联注意力的结肠息肉图像分割算法研究
10
作者 周孟然 陆鹏 《重庆工商大学学报(自然科学版)》 2026年第1期1-10,共10页
目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision... 目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision Transformer,PVT)作为编码器,接着设计了多尺度特征注意力提取模块(Multi-scale Feature Attention Extraction,MFAE)和层间注意力聚合模块(Inter-layer Attention Aggregation,IA)。其中,PVT通过其自注意力机制保证了模型的泛化能力,MFAE使用不同大小的滤波器多尺度提取特征,旨在缓解注意力分散问题;IA交互融合不同层级特征,有效解决多级特征融合产生的信息丢失问题;最后引入全局上下文模块(Global Context,GC)使模型更好地理解特征图之间的像素依赖关系。结果在Kvasir、CVC-ClinicDB、CVC-ColonDB和ETIS数据集上进行了评估,相较于最优基线模型,mDice、mIoU分别提高了1.76%、0.81%、1.51%、1.74%、3.15%、2.65%和1.73%、3.84%。结论PVT-CAMNet的学习性能和泛化性能均优于其他先进方法,在息肉图像分割上具有一定的应用价值。 展开更多
关键词 息肉图像分割 多尺度注意力提取 层间注意力聚合 全局上下文
在线阅读 下载PDF
基于链路聚合的图欺诈检测
11
作者 邱天 贾凌翔 +3 位作者 高杨 冯尊磊 高艺 宋明黎 《软件学报》 北大核心 2026年第2期860-874,共15页
随着信息技术发展,信息网络、人类社会与物理空间交互加深,信息空间风险外溢现象严峻.欺诈事件激增,欺诈检测成为重要研究领域.欺诈行为给社会带来了诸多负面影响,且逐渐呈现出智能化、产业化及高度隐蔽性等新兴特征,传统的专家规则与... 随着信息技术发展,信息网络、人类社会与物理空间交互加深,信息空间风险外溢现象严峻.欺诈事件激增,欺诈检测成为重要研究领域.欺诈行为给社会带来了诸多负面影响,且逐渐呈现出智能化、产业化及高度隐蔽性等新兴特征,传统的专家规则与深度图神经网络算法在应对上显得愈发局限.当前反欺诈算法多从节点自身与邻居节点的局部信息出发,或聚焦于用户个体,或分析节点与网络拓扑关系,或利用图嵌入技术学习节点表示,这些视角虽然能具备一定的欺诈检测能力,但是忽略了实体长程关联模式的关键作用,缺乏对于海量欺诈链路之间共性模式的挖掘,限制了全面的欺诈检测能力.针对以上欺诈检测算法的局限性,提出一种基于链路聚合的图欺诈检测模型PA-GNN(path aggregation graph neural network),包含不定长链路采样,位置关联的统一链路编码,链路信息交互聚合,以及聚合关联的欺诈检测.从节点出发的若干链路之间通过全局模式交互与相似度比对,挖掘欺诈链路之间的共性规律,从而更全面地揭示欺诈行为之间的关联模式,并通过链路聚合继而实现欺诈检测.在金融交易、社交网络和评论网络这3类欺诈场景下的多个数据集上的实验结果表明,所提方法的曲线下面积(AUC)和平均精度(AP)指标相较于最优基准模型均有显著提升.此外,该方法为欺诈检测任务挖掘了潜在的共性欺诈链路模式,驱动节点学习这些重要的模式并获得更具表现力的表示,具备一定的可解释性. 展开更多
关键词 图神经网络 欺诈检测 链路聚合 注意力机制 特征表示
在线阅读 下载PDF
多尺度注意力聚合视觉Mamba-UNet的遥感图像显著性目标检测方法
12
作者 张善文 郭能念 +2 位作者 邵彧 李萍 许新华 《电光与控制》 北大核心 2026年第2期1-6,13,共7页
针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS... 针对遥感图像显著性目标检测(RSISOD)难题,构建一种多尺度注意力聚合视觉Mamba-UNet(MSAAVMamba-UNet)模型。该模型由一个编码器、一个解码器、三个通道注意力跳跃连接(CASC)层和一个瓶颈层组成,其中,编码器和解码器由视觉状态空间(VSS)模块构建,利用VSS和CASC有效获取遥感图像(RSI)中的长距离依赖关系,在瓶颈层引入空洞多尺度注意力聚合(DMSAA)模块,有效整合局部-全局特征,提取多尺度小目标的细节特征。该模型整合了多尺度卷积、注意力机制、U-Net与Mamba-UNet的优势,提高了RSISOD的性能。在大规模RSI数据集EORSSD中的飞机图像子集上进行了实验。结果表明,MSAAVMamba-UNet能够精确检测RSI中的显著性多尺度小目标,精度达到84.07%,该方法为RSISOD系统提供了技术支持。 展开更多
关键词 遥感图像 显著性目标检测 空洞多尺度注意力聚合 Mamba-UNet 多尺度注意力聚合视觉Mamba-UNet
在线阅读 下载PDF
融合多元注意力与高效特征聚合的行人重识别方法
13
作者 程杰 卞长智 +1 位作者 张婧 李小霞 《计算机工程与应用》 北大核心 2026年第2期220-231,共12页
针对行人重识别任务中视角、光照以及姿态变化等导致行人特征提取不充分的问题,设计了一种融合多元注意力与高效特征聚合的行人重识别网络。在ResNet50的瓶颈模块中嵌入无参通道注意力,利用均值与方差信息对通道权重进行调整,以增强对... 针对行人重识别任务中视角、光照以及姿态变化等导致行人特征提取不充分的问题,设计了一种融合多元注意力与高效特征聚合的行人重识别网络。在ResNet50的瓶颈模块中嵌入无参通道注意力,利用均值与方差信息对通道权重进行调整,以增强对关键通道的作用。仅在ResNet50的深层网络中引入自注意力机制,通过计算特征点之间的相关性来提高捕捉全局信息的能力,同时设置不同下采样率的双分支,以捕获不同分辨率下的行人特征信息。设计高效特征聚合金字塔,通过自上而下和自下而上的双路径实现深层语义和浅层的细节信息快速融合,同时在金字塔横向连接中加入通道与空间注意力残差融合模块以突出行人关键特征。使用双重批量归一化特征分类模块优化训练,提高网络稳定性。在Market1501、DukeMTMC-ReID和CUHK03数据集上,所提方法的mAP和Rank-1指标分别达到了89.5%和95.6%、80.1%和90.5%、79.7%和84.9%,实验结果表明,所提方法能够有效提高受视角、光照、姿态变化影响的行人重识别性能。 展开更多
关键词 行人重识别(Re-ID) ResNet50 注意力机制 高效特征聚合 金字塔横向连接
在线阅读 下载PDF
基于部分卷积的残差特征聚合轻量超分辨率网络
14
作者 闫航 刘春龙 宋振峰 《现代电子技术》 北大核心 2026年第5期89-96,共8页
为了解决图像超分辨率重建模型普遍参数量大和计算过程复杂,对计算量和资源需求急剧增加的问题,文中提出一种基于部分卷积的残差特征聚合轻量超分辨率网络。该网络在部分卷积层的基础上减少模型冗余计算的同时也减少了参数量。在轻量化... 为了解决图像超分辨率重建模型普遍参数量大和计算过程复杂,对计算量和资源需求急剧增加的问题,文中提出一种基于部分卷积的残差特征聚合轻量超分辨率网络。该网络在部分卷积层的基础上减少模型冗余计算的同时也减少了参数量。在轻量化的前提下,引入残差特征聚合模块,同时关注局部与非局部特征信息,以增强网络对图像细节的全面捕捉,加速信息传递的同时提高网络泛化能力。实验结果表明,所提方法同NGswin和LKFN在公共基准测试集2倍、3倍、4倍缩放因子下的PSNR相比,分别平均提升0.28 dB、0.13 dB、0.08 dB和0.03 dB、0.02 dB、0.02 dB;参数量分别减少82%、81%、81%和38%、37%、36%;GFLOPs分别减少55%、58%、56%和6%、7%、11%。网络在轻量化的同时实现了重建图像质量的提高,减少了图像模糊程度,缓解了重建图像的伪影情况,充分证明了所提方法的高效性。 展开更多
关键词 轻量化模型 卷积神经网络 图像超分辨率重建 特征聚合 深度学习 自注意力机制
在线阅读 下载PDF
多尺度聚合协同轴向语义引导的实体关系联合抽取方法
15
作者 钱清 陈辉程 +2 位作者 崔允贺 唐瑞雪 付金玫 《计算机科学》 北大核心 2026年第3期97-106,共10页
近年来,基于表填充的实体关系联合抽取方法取得了显著效果,但现有研究尚未考虑到词对间的边界关联性建模,以及构建词对语义相似性问题。为解决上述问题,提出了一种基于多尺度聚合协同轴向语义引导的实体关系联合抽取模型。首先,设计的... 近年来,基于表填充的实体关系联合抽取方法取得了显著效果,但现有研究尚未考虑到词对间的边界关联性建模,以及构建词对语义相似性问题。为解决上述问题,提出了一种基于多尺度聚合协同轴向语义引导的实体关系联合抽取模型。首先,设计的多尺度语义聚合模块通过并行多个不同尺寸的深度卷积提取不同排列下词对间的边界关联信息,从而丰富词对语义,识别隐形实体。其次,轴向语义引导模块通过行列带状卷积从轴向上进行卷积注意力校准,强化词对关键语义表征,从而改善词对间语义相似问题。最后,在数据集NYT*,WebNLG*,NYT和WebNLG上进行实验,该方法分别取得了93.2%,94.5%,93.2%和91.4%的F1得分,相较于基线模型分别提高了0.1个百分点、0.6个百分点、0.4个百分点和1.0个百分点,表明其能够捕获词对边界关联以及精细化词对语义,提升了实体关系联合抽取的性能。 展开更多
关键词 自然语言处理 实体关系联合抽取 多尺度语义聚合 轴向语义引导 卷积注意力
在线阅读 下载PDF
基于分层式残差聚合与双分支维度分裂注意力机制的情绪识别
16
作者 李杰 何文雪 +1 位作者 王述畅 杨帮华 《中国医学物理学杂志》 2026年第2期220-228,共9页
针对脑电图(EEG)动态复杂性和解码难度限制情绪识别的精度和鲁棒性的问题,提出一种新的情绪分类模型MADBNet。首先,多尺度分组卷积用于捕捉不同层次的情绪特征;随后,通过分层残差聚合多尺度特征,并穿插轴向通道空间注意力捕获通道相关... 针对脑电图(EEG)动态复杂性和解码难度限制情绪识别的精度和鲁棒性的问题,提出一种新的情绪分类模型MADBNet。首先,多尺度分组卷积用于捕捉不同层次的情绪特征;随后,通过分层残差聚合多尺度特征,并穿插轴向通道空间注意力捕获通道相关性和空间依赖性;最后,通过双分支维度分裂特征处理的注意力机制增强局部与全局关联,实现EEG时空频特征的融合。在DEAP数据集上的实验结果表明,该模型在精度和稳定性显示出优越的性能。 展开更多
关键词 情绪识别 人机交互 分层残差聚合 轴向通道空间注意力 双分支维度分裂
在线阅读 下载PDF
基于改进GraphSAGE的网络攻击检测
17
作者 闫彦彤 于文涛 +1 位作者 李丽红 方伟 《郑州大学学报(理学版)》 北大核心 2026年第1期27-34,共8页
基于深度学习的网络攻击检测是对欧几里得数据进行建模,无法学习攻击数据中的结构特征。为此,提出一种基于改进图采样与聚合(graph sample and aggregate,GraphSAGE)的网络攻击检测算法。首先,将攻击数据从平面结构转换为图结构数据。其... 基于深度学习的网络攻击检测是对欧几里得数据进行建模,无法学习攻击数据中的结构特征。为此,提出一种基于改进图采样与聚合(graph sample and aggregate,GraphSAGE)的网络攻击检测算法。首先,将攻击数据从平面结构转换为图结构数据。其次,对GraphSAGE算法进行了改进,包括在消息传递阶段融合节点和边的特征,同时在消息聚合过程中考虑不同源节点对目标节点的影响程度,并在边嵌入生成时引入残差学习机制。在两个公开网络攻击数据集上的实验结果表明,在二分类情况下,所提算法的总体性能优于E-GraphSAGE、LSTM、RNN、CNN算法;在多分类情况下,所提算法在大多数攻击类型上的F1值高于对比算法。 展开更多
关键词 网络攻击检测 深度学习 图神经网络 图采样与聚合 注意力机制
在线阅读 下载PDF
GNN:Core Branches,Integration Strategies and Applications
18
作者 Wenfeng Zheng Guangyu Xu +3 位作者 SiyuLu Junmin Lyu Feng Bao Lirong Yin 《Computer Modeling in Engineering & Sciences》 2026年第1期156-190,共35页
Graph Neural Networks(GNNs),as a deep learning framework specifically designed for graph-structured data,have achieved deep representation learning of graph data through message passing mechanisms and have become a co... Graph Neural Networks(GNNs),as a deep learning framework specifically designed for graph-structured data,have achieved deep representation learning of graph data through message passing mechanisms and have become a core technology in the field of graph analysis.However,current reviews on GNN models are mainly focused on smaller domains,and there is a lack of systematic reviews on the classification and applications of GNN models.This review systematically synthesizes the three canonical branches of GNN,Graph Convolutional Network(GCN),Graph Attention Network(GAT),and Graph Sampling Aggregation Network(GraphSAGE),and analyzes their integration pathways from both structural and feature perspectives.Drawing on representative studies,we identify three major integration patterns:cascaded fusion,where heterogeneous modules such as Convolutional Neural Network(CNN),Long Short-Term Memory(LSTM),and GraphSAGE are sequentially combined for hierarchical feature learning;parallel fusion,where multi-branch architectures jointly encode complementary graph features;and feature-level fusion,which employs concatenation,weighted summation,or attention-based gating to adaptively merge multi-source embeddings.Through these patterns,integrated GNNs achieve enhanced expressiveness,robustness,and scalability across domains including transportation,biomedicine,and cybersecurity. 展开更多
关键词 Graph neural network(GNN) Graph convolutional network(GCN) Graph attention network(GAT) Graph sampling aggregation network(GraphSAGE) integration
在线阅读 下载PDF
基于多层特征嵌入的单目标跟踪算法 被引量:1
19
作者 才华 周鸿策 +1 位作者 付强 赵义武 《兵工学报》 北大核心 2025年第3期333-348,共16页
针对现有视觉目标跟踪方法仅使用初始帧的目标单一外观特征,导致当背景复杂或外观发生剧烈变化时跟踪失效的问题,提出一种基于多层特征嵌入的单目标跟踪算法。增强目标的外观区分度,使用稀疏内嵌注意力机制编码器,嵌入具有高实例区分度... 针对现有视觉目标跟踪方法仅使用初始帧的目标单一外观特征,导致当背景复杂或外观发生剧烈变化时跟踪失效的问题,提出一种基于多层特征嵌入的单目标跟踪算法。增强目标的外观区分度,使用稀疏内嵌注意力机制编码器,嵌入具有高实例区分度的外观特征;采用类间特征聚合编码器嵌入目标的类别信息,在外观发生变化时保持类内的紧凑性;同时将预测的历史帧跟踪框坐标转化为目标运动轨迹特征嵌入,为算法提供高置信度的时间上下文特征。研究结果表明:所提算法在OTB100基准测试中成功率和准确率分别达到71.4%和92.6%,在GOT-10K、LaSOT、TrackingNet共3个大规模公开数据上取得了鲁棒的效果,成功率分别达到64.9%、72.0%和78.7%;基于多层特征嵌入的单目标跟踪算法有效地克服了现有算法的局限,具有较好的准确性和鲁棒性。 展开更多
关键词 目标跟踪 稀疏内嵌注意力机制编码器 类间特征聚合编码器 运动特征嵌入
在线阅读 下载PDF
基于层次特征增强的细粒度点云分类 被引量:1
20
作者 白静 刘路 +1 位作者 郑虎 蒋金哲 《浙江大学学报(理学版)》 北大核心 2025年第1期70-80,共11页
针对粗粒度点云分类方法在细粒度数据集中局部特征提取不足的问题,提出了一种基于层次特征增强的三维细粒度点云分类网络(HFE-Net)。基于Veronese映射的点特征增强模块(V-PE)对点云数据进行数据增强,辅助网络学习法线和姿态高阶信息;基... 针对粗粒度点云分类方法在细粒度数据集中局部特征提取不足的问题,提出了一种基于层次特征增强的三维细粒度点云分类网络(HFE-Net)。基于Veronese映射的点特征增强模块(V-PE)对点云数据进行数据增强,辅助网络学习法线和姿态高阶信息;基于多尺度上下文感知的簇内特征增强模块(CA-IntraCE),利用不同尺度的K近邻(K-nearest neighbors,KNN)算法以及交叉注意力实现不同尺度特征的增强,以消除最大池化带来的信息丢失;基于分组稀疏采样的簇间特征增强模块(GSS-InterCE),利用最远点采样(FPS)算法获得稀疏点,并采用交叉注意力实验不同簇间的特征增强,从而提高网络的细粒度判别能力。在FG3D数据集Airplane、Car和Chair 3个类别上的实验结果显示,HFE-Net的总体准确率分别达97.40%,80.53%和83.83%,已超过现有最优方法DC-Net、FGPNet的分类框架,说明HFE-Net的分类性能具有一定的优越性。 展开更多
关键词 三维点云 细粒度分类 交叉注意力 特征增强
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部