期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
A deep dense captioning framework with joint localization and contextual reasoning
1
作者 KONG Rui XIE Wei 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第9期2801-2813,共13页
Dense captioning aims to simultaneously localize and describe regions-of-interest(RoIs)in images in natural language.Specifically,we identify three key problems:1)dense and highly overlapping RoIs,making accurate loca... Dense captioning aims to simultaneously localize and describe regions-of-interest(RoIs)in images in natural language.Specifically,we identify three key problems:1)dense and highly overlapping RoIs,making accurate localization of each target region challenging;2)some visually ambiguous target regions which are hard to recognize each of them just by appearance;3)an extremely deep image representation which is of central importance for visual recognition.To tackle these three challenges,we propose a novel end-to-end dense captioning framework consisting of a joint localization module,a contextual reasoning module and a deep convolutional neural network(CNN).We also evaluate five deep CNN structures to explore the benefits of each.Extensive experiments on visual genome(VG)dataset demonstrate the effectiveness of our approach,which compares favorably with the state-of-the-art methods. 展开更多
关键词 dense captioning joint localization contextual reasoning deep convolutional neural network
在线阅读 下载PDF
Aspect-Based Sentiment Classification Using Deep Learning and Hybrid of Word Embedding and Contextual Position
2
作者 Waqas Ahmad Hikmat Ullah Khan +3 位作者 Fawaz Khaled Alarfaj Saqib Iqbal Abdullah Mohammad Alomair Naif Almusallam 《Intelligent Automation & Soft Computing》 SCIE 2023年第9期3101-3124,共24页
Aspect-based sentiment analysis aims to detect and classify the sentiment polarities as negative,positive,or neutral while associating them with their identified aspects from the corresponding context.In this regard,p... Aspect-based sentiment analysis aims to detect and classify the sentiment polarities as negative,positive,or neutral while associating them with their identified aspects from the corresponding context.In this regard,prior methodologies widely utilize either word embedding or tree-based rep-resentations.Meanwhile,the separate use of those deep features such as word embedding and tree-based dependencies has become a significant cause of information loss.Generally,word embedding preserves the syntactic and semantic relations between a couple of terms lying in a sentence.Besides,the tree-based structure conserves the grammatical and logical dependencies of context.In addition,the sentence-oriented word position describes a critical factor that influences the contextual information of a targeted sentence.Therefore,knowledge of the position-oriented information of words in a sentence has been considered significant.In this study,we propose to use word embedding,tree-based representation,and contextual position information in combination to evaluate whether their combination will improve the result’s effectiveness or not.In the meantime,their joint utilization enhances the accurate identification and extraction of targeted aspect terms,which also influences their classification process.In this research paper,we propose a method named Attention Based Multi-Channel Convolutional Neural Net-work(Att-MC-CNN)that jointly utilizes these three deep features such as word embedding with tree-based structure and contextual position informa-tion.These three parameters deliver to Multi-Channel Convolutional Neural Network(MC-CNN)that identifies and extracts the potential terms and classifies their polarities.In addition,these terms have been further filtered with the attention mechanism,which determines the most significant words.The empirical analysis proves the proposed approach’s effectiveness compared to existing techniques when evaluated on standard datasets.The experimental results represent our approach outperforms in the F1 measure with an overall achievement of 94%in identifying aspects and 92%in the task of sentiment classification. 展开更多
关键词 Sentiment analysis word embedding aspect extraction consistency tree multichannel convolutional neural network contextual position information
在线阅读 下载PDF
Flex-QUIC:AI for QUIC Transport Protocol with High-Efficiency in Future Wireless Networks
3
作者 Jiang Tao Liu Yang +2 位作者 Zhang Yu Peng Miaoran Wang Haoyu 《China Communications》 2025年第12期1-14,共14页
This paper proposes Flex-QUIC,an AIempowered quick UDP Internet connections(QUIC)enhancement framework that addresses the challenge of degraded transmission efficiency caused by the static parameterization of acknowle... This paper proposes Flex-QUIC,an AIempowered quick UDP Internet connections(QUIC)enhancement framework that addresses the challenge of degraded transmission efficiency caused by the static parameterization of acknowledgment(ACK)mechanisms,loss detection,and forward error correction(FEC)in dynamic wireless networks.Unlike the standard QUIC protocol,Flex-QUIC systematically integrates machine learning across three critical modules to achieve high-efficiency operation.First,a contextual multi-armed bandit-based ACK adaptation mechanism optimizes the ACK ratio to reduce wireless channel contention.Second,the adaptive loss detection module utilizes a long short-term memory(LSTM)model to predict the reordering displacement for optimizing the packet reordering tolerance.Third,the FEC transmission scheme jointly adjusts the redundancy level based on the LSTM-predicted loss rate and congestion window state.Extensive evaluations across Wi-Fi,5G,and satellite network scenarios demonstrate that Flex-QUIC significantly improves throughput and latency reduction compared to the standard QUIC and other enhanced QUIC variants,highlighting its adaptability to diverse and dynamic network conditions.Finally,we further discuss open issues in deploying AI-native transport protocols. 展开更多
关键词 contextual multi-armed bandit long shortterm memory QUIC transport protocol wireless networks
在线阅读 下载PDF
基于双向时序窗口Transformer的网络入侵检测方法
4
作者 王长浩 王明阳 +1 位作者 丁磊 刘凯 《计算机应用研究》 北大核心 2026年第1期271-279,共9页
近年来,网络攻击的高度动态化、隐蔽化给互联网的安全和稳定带来了极大的威胁。针对现有网络入侵检测方法在局部时序建模精度不足及多分类下少数类识别能力不佳等问题,提出了一种基于双向时间滑动窗口Transformer的网络异常流量检测方... 近年来,网络攻击的高度动态化、隐蔽化给互联网的安全和稳定带来了极大的威胁。针对现有网络入侵检测方法在局部时序建模精度不足及多分类下少数类识别能力不佳等问题,提出了一种基于双向时间滑动窗口Transformer的网络异常流量检测方法。该方法将网络流量数据转换为突出时序关系的三维序列数据,引入可学习的嵌入编码及上下文位置编码,以增强序列特征的表现能力,提升了异常流量检测的准确率和稳定性,并在UNSW-NB15、CIC-IDS-2017公开数据集上进行了验证。实验结果表明,所提方法均表现出较好的性能优势,在二分类任务中检测准确率分别为99.79%、99.77%;在多分类任务中,准确率分别达到98.48%、99.76%,性能均显著高于其他先进深度学习模型。综上,该方法有效提升了网络异常流量检测的准确性和对少数类攻击的识别能力,为网络安全防护提供了新的技术手段。 展开更多
关键词 入侵检测 网络流量 双向时间窗口 上下文位置编码
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
5
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉Transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
基于FAC-Net的结直肠息肉图像分割方法
6
作者 冀常鹏 梁正 代巍 《中国医学物理学杂志》 2026年第3期308-316,共9页
针对结直肠息肉图像分割中息肉边界模糊不清、形状复杂无法准确定位息肉位置从而影响分割准确率的问题,提出一种基于频域感知和上下文信息(FAC-Net)的结直肠息肉图像分割方法,首先利用Transformer编码器构建特征金字塔,通过自注意力捕... 针对结直肠息肉图像分割中息肉边界模糊不清、形状复杂无法准确定位息肉位置从而影响分割准确率的问题,提出一种基于频域感知和上下文信息(FAC-Net)的结直肠息肉图像分割方法,首先利用Transformer编码器构建特征金字塔,通过自注意力捕获全局上下文;其次设计全局频域感知模块,引进小波变换将高频分量用于边界增强,低频分量辅助定位;然后通过分组特征与跨空间学习机制构建多尺度语义增强模块,旨在加强模型对于病变区域的空间细节捕捉能力;最后设计跨层特征聚合模块,采用注意力引导的跨层融合策略,有效聚合浅层细节特征与深层语义特征,显著提升分割精度。在Kvasir-SEG、Clinic-DB、Colon-DB、CVC-300和ETIS数据集上进行实验,其Dice指数分别为0.927、0.937、0.808、0.912和0.788,分割性能优于通用分割模型。评估结果表明,FAC-Net具有较高的分割准确率和良好的泛化能力。 展开更多
关键词 结直肠息肉分割 FAC-Net TRANSFORMER 自注意力机制
在线阅读 下载PDF
基于多尺度特征融合和注意力机制的小目标检测
7
作者 方岩 袁国宏 +1 位作者 孙正宝 岳昆 《云南大学学报(自然科学版)》 北大核心 2026年第1期36-44,共9页
针对目标检测中存在的小目标特征信息提取不足、背景噪声干扰和定位困难导致漏检的问题,提出基于多尺度特征融合和注意力机制的小目标检测模型YOLOv7-BAMFF.首先,将包含丰富语义信息的Conv2层加入特征融合过程,提取更细粒度的低层特征,... 针对目标检测中存在的小目标特征信息提取不足、背景噪声干扰和定位困难导致漏检的问题,提出基于多尺度特征融合和注意力机制的小目标检测模型YOLOv7-BAMFF.首先,将包含丰富语义信息的Conv2层加入特征融合过程,提取更细粒度的低层特征,并在多尺度特征融合过程中进行跨尺度的跳跃连接和上下文信息自适应加权融合;然后,在特征重提取和优化过程中引入改进的协同注意力机制,抑制复杂背景噪声干扰、增强对小目标的关注;最后,通过优化模型的定位损失函数以提高对小目标的定位精度、并增加小目标检测头,从而提升小目标检测能力.在PASCAL VOC和VisDrone2019数据集上的实验结果表明,提出方法的平均检测精度分别从基线方法YOLOv7的82.1%和43.8%提升至85.4%和50.4%,且优于现有主流检测方法. 展开更多
关键词 小目标检测 多尺度特征融合 协同注意力机制 上下文信息 卷积神经网络
在线阅读 下载PDF
Residual Feature Attentional Fusion Network for Lightweight Chest CT Image Super-Resolution 被引量:1
8
作者 Kun Yang Lei Zhao +4 位作者 Xianghui Wang Mingyang Zhang Linyan Xue Shuang Liu Kun Liu 《Computers, Materials & Continua》 SCIE EI 2023年第6期5159-5176,共18页
The diagnosis of COVID-19 requires chest computed tomography(CT).High-resolution CT images can provide more diagnostic information to help doctors better diagnose the disease,so it is of clinical importance to study s... The diagnosis of COVID-19 requires chest computed tomography(CT).High-resolution CT images can provide more diagnostic information to help doctors better diagnose the disease,so it is of clinical importance to study super-resolution(SR)algorithms applied to CT images to improve the reso-lution of CT images.However,most of the existing SR algorithms are studied based on natural images,which are not suitable for medical images;and most of these algorithms improve the reconstruction quality by increasing the network depth,which is not suitable for machines with limited resources.To alleviate these issues,we propose a residual feature attentional fusion network for lightweight chest CT image super-resolution(RFAFN).Specifically,we design a contextual feature extraction block(CFEB)that can extract CT image features more efficiently and accurately than ordinary residual blocks.In addition,we propose a feature-weighted cascading strategy(FWCS)based on attentional feature fusion blocks(AFFB)to utilize the high-frequency detail information extracted by CFEB as much as possible via selectively fusing adjacent level feature information.Finally,we suggest a global hierarchical feature fusion strategy(GHFFS),which can utilize the hierarchical features more effectively than dense concatenation by progressively aggregating the feature information at various levels.Numerous experiments show that our method performs better than most of the state-of-the-art(SOTA)methods on the COVID-19 chest CT dataset.In detail,the peak signal-to-noise ratio(PSNR)is 0.11 dB and 0.47 dB higher on CTtest1 and CTtest2 at×3 SR compared to the suboptimal method,but the number of parameters and multi-adds are reduced by 22K and 0.43G,respectively.Our method can better recover chest CT image quality with fewer computational resources and effectively assist in COVID-19. 展开更多
关键词 SUPER-RESOLUTION COVID-19 chest CT lightweight network contextual feature extraction attentional feature fusion
在线阅读 下载PDF
基于顾及上下文特征的耕地范围建筑物检测 被引量:1
9
作者 胡佳睿 潘俊 +1 位作者 赵和鹏 何建美 《测绘地理信息》 2025年第3期121-124,共4页
在耕地范围进行建筑物检测时,大棚不属于违建关注的建筑物类别,但部分大棚与建筑物纹理相似、形状相近,容易造成对大棚的误检。考虑到在建筑物邻近区域基本为耕地而在大棚周边基本为大棚,针对该特点,提出了一种基于顾及上下文特征的建... 在耕地范围进行建筑物检测时,大棚不属于违建关注的建筑物类别,但部分大棚与建筑物纹理相似、形状相近,容易造成对大棚的误检。考虑到在建筑物邻近区域基本为耕地而在大棚周边基本为大棚,针对该特点,提出了一种基于顾及上下文特征的建筑物检测方法。基于构建的耕地范围建筑物检测数据集进行实验,结果表明相对于原始Faster基于候选区域的卷积神经网络(region-based convolutional neural networks,R-CNN),所提方法可以有效降低对大棚的误判,获得更高的建筑物检测精度。 展开更多
关键词 上下文特征 建筑物检测 深度学习 卷积神经网络
原文传递
基于上下文全局空间图的轨迹用户链接
10
作者 侯萱 梁志贞 +2 位作者 张磊 刘佰龙 张雪飞 《计算机工程与科学》 北大核心 2025年第2期336-348,共13页
轨迹用户链接TUL是指判定目标轨迹所属用户,已成为一项重要的轨迹数据挖掘任务。尽管基于深度学习的模型在TUL研究中取得显著进展,但现有模型主要关注单个轨迹点的基本时空特征,忽略全局位置空间相关性、上下文信息和用户的多周期移动规... 轨迹用户链接TUL是指判定目标轨迹所属用户,已成为一项重要的轨迹数据挖掘任务。尽管基于深度学习的模型在TUL研究中取得显著进展,但现有模型主要关注单个轨迹点的基本时空特征,忽略全局位置空间相关性、上下文信息和用户的多周期移动规律,导致TUL结果准确度不高。提出了一种基于上下文全局空间图的轨迹用户链接模型CGSG-TUL。在位置嵌入方面,根据历史轨迹构建上下文全局空间图,融入所有位置的邻近关系和类别等上下文信息,对位置的空间相关性有效建模。在时间编码方面,根据不同时间尺度对签入的时间戳进行编码,捕获用户的多周期移动规律。在Foursquare-NYK和Foursquare-TKY这两个真实数据集上的实验结果表明,CGSG-TUL性能比目前最好的基准模型GNNTUL的ACC@1和Marco-F 1分别平均提高2.50%和2.72%。 展开更多
关键词 轨迹用户链接 上下文全局空间图 多周期移动规律 图神经网络 TRANSFORMER
在线阅读 下载PDF
基于交叉融合编码器的Transformer图像特征提取网络 被引量:1
11
作者 龚宇 吴鹏 《电子科技》 2025年第9期20-25,共6页
针对基于窗口的视觉Transformer易破坏细粒度特征、模型参数量大等问题,文中提出一种基于交叉融合编码器模块的Transformer图像特征提取网络。利用图像通道特征相关一致性剥离特征图来获得两个特征子集,并联两个注意力模块分别进行注意... 针对基于窗口的视觉Transformer易破坏细粒度特征、模型参数量大等问题,文中提出一种基于交叉融合编码器模块的Transformer图像特征提取网络。利用图像通道特征相关一致性剥离特征图来获得两个特征子集,并联两个注意力模块分别进行注意计算以获得局部和全局信息,采用交叉机制融合信息。结合CAT Transformer的窗口间注意力模块设计一种用于特征图通道维度之间的窗口内注意力方式,以避免破坏纹理信息,增强局部特征的表征能力。实验结果表明,所提模型在CIFAR-100数据集使用7.8 MB参数达到79.86%的TOP-1准确率,在ImageNet-1K数据集达到80.7%的准确率,同时利用Grad-CAM(Gradient-weighted Class Activation Mapping)来可视化模型决策过程。 展开更多
关键词 计算机视觉 图像分类 自注意力机制 特征提取 上下文信息 编码器 通道特征 卷积神经网络
在线阅读 下载PDF
融合CNN和Transformer的高分辨率遥感影像滑坡检测方法 被引量:2
12
作者 王凡 《遥感信息》 北大核心 2025年第5期158-165,共8页
鉴于基于深度学习滑坡识别检测方法存在着样本少、提取结果不完整、提取精度低等问题,提出了一种融合CNN和Transformer的高分辨率遥感影像滑坡识别检测方法。该方法针对样本不足的问题,通过正负样本互嵌及图像变换法实现滑坡样本的有效... 鉴于基于深度学习滑坡识别检测方法存在着样本少、提取结果不完整、提取精度低等问题,提出了一种融合CNN和Transformer的高分辨率遥感影像滑坡识别检测方法。该方法针对样本不足的问题,通过正负样本互嵌及图像变换法实现滑坡样本的有效扩充。为提升滑坡检测效果,在主干特征提取网络中融合了双层路由注意力模块,有效实现CNN局部特征提取增强特征表示和Transformer全局建模的能力。在特征融合中设计了上下文信息融合网络,综合利用金字塔上下文提取模块、多特征融合技术和动态插值融合技术实现多尺度滑坡样本的特征提取与上下文信息融合。实验结果表明,该方法在滑坡检测的平均精度达94.88%,F1-score达95.40%,在性能上优于常用目标检测方法。 展开更多
关键词 滑坡检测 CNN TRANSFORMER 双层路由注意力 上下文信息融合网络
在线阅读 下载PDF
城际创新网络情境时空的演化特征与影响因素——基于黄河流域的实证研究
13
作者 冯海龙 李梦妍 赵建吉 《经济地理》 北大核心 2025年第10期131-140,共10页
基于黄河流域城市间合作申请专利数据,从内部和外部两个层面对城际创新网络的结构特征、社区划分、节点层级、轴线层级、网络时空演化等进行了深入分析,结合多维邻近性框架,研究了创新网络情境时空演化的影响因素。结果表明:(1)黄河流... 基于黄河流域城市间合作申请专利数据,从内部和外部两个层面对城际创新网络的结构特征、社区划分、节点层级、轴线层级、网络时空演化等进行了深入分析,结合多维邻近性框架,研究了创新网络情境时空演化的影响因素。结果表明:(1)黄河流域内部创新网络规模不断扩大,网络联结性增强,畅通程度提升;创新网络社区数量减少,模块度逐年下降,社区集聚化程度明显增强;城市节点层级显著提升,低层级城市向高层级转化的趋势明显;城市轴线联系显著增强,呈现明显的多核心辐射布局。(2)黄河流域内部城市与外部城市之间的创新合作不断增强,创新联系趋向紧密,创新合作通畅度显著提升;内部—外部创新网络的节点层级显著提升,网络核心城市的数量不断增加;轴线层级不断提升,一级和二级轴线联系继续扩展。北京在网络中的地位凸显,与黄河流域的创新联系不断强化。(3)济南、西安、青岛、郑州、兰州等城市是黄河流域内部创新网络的核心节点,北京、南京、成都、上海、武汉等城市是外部网络的核心节点。(4)地理邻近、制度邻近、社会邻近对黄河流域内部和外部创新网络演化起到正向作用,认知邻近在一定程度上会对创新网络产生抑制作用,文化邻近对黄河流域内部创新网络的影响由抑制转变为促进。 展开更多
关键词 创新网络 情境时空 网络节点 多维邻近性 合作申请专利 黄河流域
原文传递
基于交互图推理网络的弱监督伪装目标检测 被引量:1
14
作者 张冬冬 王春平 +2 位作者 付强 宋瑶 刘新海 《北京理工大学学报》 北大核心 2025年第7期718-730,共13页
伪装目标检测(camouflaged object detection,COD)是计算机视觉领域一项具有挑战性的基础研究.由于像素级注释的成本较高,研究者们通常采用涂鸦注释作为弱监督信号.然而,涂鸦标注存在信息过于稀疏且缺乏边缘信息等固有局限,这严重制约... 伪装目标检测(camouflaged object detection,COD)是计算机视觉领域一项具有挑战性的基础研究.由于像素级注释的成本较高,研究者们通常采用涂鸦注释作为弱监督信号.然而,涂鸦标注存在信息过于稀疏且缺乏边缘信息等固有局限,这严重制约了模型的预测可靠性.针对这些问题,本文提出一种新颖的交互图推理网络(interactive graphical reasoning network,IGRNet),该网络通过图表示来推断伪装区域及其边缘之间的内在关系.具体而言,引入了图推理网络建模像素间的长距离依赖关系,设计了高效的图交互单元(graph interaction unit,GIU)增强异构特征的表征能力.同时,为提升模型的场景理解能力并充分利用不同特征间的互补性,构建了上下文增强模块(context enhancement module,CEM)实现多特征融合与上下文信息挖掘.此外,提出了自监督伪装检测损失(self-supervised camouflage detection loss,Lscd)来引导网络学习结构信息,进一步增强前景−背景的区分能力.在3个标准基准数据集上的大量实验表明,本文方法不仅显著优于现有弱监督算法,在某些评估指标上甚至超越了全监督方法的性能. 展开更多
关键词 伪装目标检测 弱监督 涂鸦注释 图推理网络 上下文信息
在线阅读 下载PDF
全局语义感知与纹理频域约束的激光干扰图像修复 被引量:1
15
作者 赵佩瑶 冯斌 +3 位作者 杨欣朋 苗锡奎 吴云龙 叶庆 《红外与激光工程》 北大核心 2025年第5期324-338,共15页
成像设备在受到外界激光干扰时,干扰光斑会遮挡显著目标的有效信息,导致图像质量显著下降,对后续工作带来困扰。针对激光干扰图像修复的问题,提出了基于全局语义感知与纹理频域约束的激光干扰图像修复网络模型。该模型由全局语义引导阶... 成像设备在受到外界激光干扰时,干扰光斑会遮挡显著目标的有效信息,导致图像质量显著下降,对后续工作带来困扰。针对激光干扰图像修复的问题,提出了基于全局语义感知与纹理频域约束的激光干扰图像修复网络模型。该模型由全局语义引导阶段和局部细节增强阶段两部分组成:全局语义引导阶段通过结合滑动窗口的自注意力机制和分层结构的HBES(Hybrid Block of ESA andSTL)模块逐步扩大感受野以提取全局上下文信息,从而准确地推断出干扰区域的合理内容;局部细节增强阶段则以全局语义引导阶段的预测结果为输入,通过分析未干扰区域和干扰区域之间的相似性,将背景和干扰区域的关联信息相结合,生成高质量的修复结果。此外,为提升网络对纹理细节的关注,设计了一种余弦变换损失函数,强调图像细节部分的修复,使干扰区域的重建图像清晰、连贯。实验结果表明,该模型在激光干扰图像修复任务上取得了良好的修复效果,有效改善了图像质量。 展开更多
关键词 图像修复 激光干扰 上下文注意力机制 生成对抗网络 离散余弦变换
原文传递
上下文关系编码器与孪生神经网络在工业缺陷检测中的应用
16
作者 张卉婧 李敏波 《微型电脑应用》 2025年第4期287-290,共4页
工业产品在现代社会中无处不在,但在工业生产过程中不可避免地会出现一些产品质量问题,针对工业场景下收集的样本图像类间数据量不均衡、总体样本量较小等问题,引入上下文关系编码器(CRE)与孪生神经网络(SNN)结合的CRE-SNN工业缺陷分类... 工业产品在现代社会中无处不在,但在工业生产过程中不可避免地会出现一些产品质量问题,针对工业场景下收集的样本图像类间数据量不均衡、总体样本量较小等问题,引入上下文关系编码器(CRE)与孪生神经网络(SNN)结合的CRE-SNN工业缺陷分类网络。该网络不需要对样本数据进行标注,经过循环迭代生成标注的特征图像,能够解决标注耗时的问题;同时,该网络使用对特征对比的方式进行分类,可以应对工业场景下样本数量不足的问题。训练出的网络能够应用于多种不同的数据集和仅有几张样本图像的极端情况,具有良好的泛化性和鲁棒性。在3个不同工业数据集上的实验表明,与其他经典算法相比,所损网络的准确率、平均准确率(mAP)等指标得到了一定的提升。 展开更多
关键词 缺陷检测 上下文关系编码器 连体神经网络 小样本学习
在线阅读 下载PDF
融合岛式双向特征金字塔的遥感图像目标检测
17
作者 梁礼明 冯耀 +1 位作者 龙鹏威 王泽欣 《计算机工程与应用》 北大核心 2025年第19期202-213,共12页
针对遥感图像目标检测存在复杂背景干扰、目标多尺度差异等问题,提出一种融合岛式双向特征金字塔网络的遥感图像目标检测算法(IFD-YOLOv8s)。设计岛式双向特征金字塔网络,增强模型对目标尺度变化的适应性,减少多层次特征融合过程中信息... 针对遥感图像目标检测存在复杂背景干扰、目标多尺度差异等问题,提出一种融合岛式双向特征金字塔网络的遥感图像目标检测算法(IFD-YOLOv8s)。设计岛式双向特征金字塔网络,增强模型对目标尺度变化的适应性,减少多层次特征融合过程中信息丢失,有助于深层语义和细粒度信息的高效传播;提出特征上下文增量模块,对地物目标特征进行更全面的捕获,提高模型检测能力;设计双线池化注意力模块,抑制非目标噪声干扰,增强遥感目标特征可辨别性。在公共数据集RSOD和NWPU VHR-10上进行消融和对比实验,平均准确率均值分别为98.2%和91.4%,相较于基线算法YOLOv8s分别提升1.8和2.1个百分点。与主流目标检测算法相比,IFD-YOLOv8s对复杂背景目标和多尺度目标的检测更有效。在公共数据集DOTA上进行泛化实验,平均准确率均值为78.7%,相比原模型提高1.8个百分点。 展开更多
关键词 遥感图像 目标检测 特征金字塔网络 上下文信息 注意力机制
在线阅读 下载PDF
一种多级别多尺度上下文特征融合的玻璃面分割算法
18
作者 任晓宇 智敏 《计算机应用与软件》 北大核心 2025年第3期209-215,220,共8页
在日常生活中非常常见的透明玻璃或者镜面往往会给计算机视觉任务带来严峻的挑战。因此,提出一种针对玻璃镜面的图像分割模型,并提出多尺度上下文卷积计算(Multi-Scale Contextual Convolution,MSCC)模块来挖掘不同尺度下的玻璃特征且... 在日常生活中非常常见的透明玻璃或者镜面往往会给计算机视觉任务带来严峻的挑战。因此,提出一种针对玻璃镜面的图像分割模型,并提出多尺度上下文卷积计算(Multi-Scale Contextual Convolution,MSCC)模块来挖掘不同尺度下的玻璃特征且同时不改变特征图的分辨率。实验结果表明,相比于目前主流的最先进算法(State-of-the-Art),该文所提出的模型实现了大幅度的性能改进,充分说明了其在上下文特征表征上的卓越能力。 展开更多
关键词 玻璃分割 上下文特征融合 多级别多尺度 卷积神经网络
在线阅读 下载PDF
语义引导的全局-局部图神经网络的关系抽取
19
作者 任楚岚 刘长胜 +1 位作者 邹绍强 井立志 《计算机工程与设计》 北大核心 2025年第3期705-711,共7页
为解决实体间距离过长导致关系抽取性能不佳的问题,提出一种基于上下文语义引导的全局-局部图神经网络的关系抽取方法。通过注意力增强神经网络集中不同时间步的单词的重要性和相关性,获取上下文语义引导的信息;构建全局-局部图神经网... 为解决实体间距离过长导致关系抽取性能不佳的问题,提出一种基于上下文语义引导的全局-局部图神经网络的关系抽取方法。通过注意力增强神经网络集中不同时间步的单词的重要性和相关性,获取上下文语义引导的信息;构建全局-局部图神经网络增强全局结构和局部实体之间的交互,通过改进的APPNP(approximate personalized propagation of neural predications)算法增强全局依赖关系;融合两个模块进行关系抽取。在NYT数据集上的实验结果表明,F1达到83.7%,较目前主流方法更具优势,验证了模型的有效性。 展开更多
关键词 关系抽取 上下文语义 注意力增强神经网络 图神经网络 全局结构 局部实体 长距离
在线阅读 下载PDF
TF-YOLO:上下文感知与多尺度增强的脑肿瘤MRI检测
20
作者 蒋文虎 《蚌埠学院学报》 2025年第5期48-54,共7页
针对脑肿瘤MRI检测中形态异质性高、边界模糊及噪声干扰导致的漏检问题,改进一种高精度且鲁棒性强的检测框架,即改进了TF-YOLO模型:上下文感知Transformer(Co T),融合3×3卷积局部编码与全局自注意力机制,显式建模肿瘤-水肿带-卫星... 针对脑肿瘤MRI检测中形态异质性高、边界模糊及噪声干扰导致的漏检问题,改进一种高精度且鲁棒性强的检测框架,即改进了TF-YOLO模型:上下文感知Transformer(Co T),融合3×3卷积局部编码与全局自注意力机制,显式建模肿瘤-水肿带-卫星病灶的长程空间依赖,自适应调整感受野;嵌入多尺度金字塔增强网络(PENet),通过可微分拉普拉斯金字塔分解、残差边缘增强与动态通道滤波三阶段策略,抑制高频伪影并增强肿瘤边缘及低频解剖特征。在Br35H数据集上,m AP50达98.2%,较基线YOLOv11提升2.4%;肿瘤召回率提升1.8%,消融实验验证Co T与PENet的互补性。协同设计有效解决了形态异质性与边界模糊问题,显著降低漏检风险并抑制背景干扰,为复杂医学场景下的弱显著性目标检测提供了可靠解决方案。 展开更多
关键词 脑肿瘤检测 YOLOv11算法 上下文感知Transformer 多尺度金字塔增强网络
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部