期刊文献+
共找到15,739篇文章
< 1 2 250 >
每页显示 20 50 100
基于BSimilar优化PTransformer的光伏功率短期预测
1
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 TRANSFORMER 相似日
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
2
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
3
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
4
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
5
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R2)高达99.91%. 展开更多
关键词 风速预测 群分解 TRANSFORMER Kolmogorov-Arnold网络
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
6
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 Transformer模型 精准识别 室内模型试验
原文传递
基于线性注意和类别关联特征学习的在线动作检测
7
作者 詹永照 孙慧敏 +1 位作者 夏惠芬 任晓鹏 《江苏大学学报(自然科学版)》 北大核心 2026年第1期39-47,63,共10页
为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Trans... 为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Transformer视频上下文特征学习,以减少计算开销;其次对训练样本动作特征进行聚类,将视频序列上下文特征与动作类别特征进行关联学习,有效获得与类别关联的特征表达;最后融合动作的上下文特征、与类别关联的特征和预测的未来特征检测相应时刻动作,以提升动作鉴别性.在典型数据集上进行性能试验,完成了超参取值分析,对比了不同方法的工作精度和运行效率.给出了消融试验和可视化分析.结果表明:在Thumos14(TSN-Anet)、Thumos14(TSN-Kinetics)和HDD数据集上,所提出方法的mAP比Colar方法分别提高了0.2、0.5、0.2百分点,可见新方法优于目前较先进的Colar方法. 展开更多
关键词 在线动作检测 深度学习 注意力机制 编码 上下文特征 TRANSFORMER 类别关联特征学习
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
8
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 TRANSFORMER 混合模型
在线阅读 下载PDF
基于动态优化细节感知网络的遥感图像分割方法
9
作者 梁书绮 王雷 +2 位作者 孙燕青 杨善良 李彬 《工程科学学报》 北大核心 2026年第1期177-189,共13页
现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transforme... 现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transformer混合框架,提出了一种全新的基于动态优化细节感知网络(Dynamic optimized detail-aware network,DODNet)的分割方法.首先,在编码器采用ResNext-50作为主干网络,提出一种多重减法感知模块(Multi-subtraction perception module,MSPM)来收集多尺度特征图之间的空间细节差异,有效减少冗余信息.然后,在解码器设计一个动态信息融合模块(Dynamic information fusion block,DIFB),它结合了全局双层路由自注意力分支和局部注意力分支,用于提高全局和局部信息的获取能力.最后,提出一种新的通道空间注意力模块—统一特征提取器(Unified feature extractor,UFE)以进一步获取语义和上下文信息.在Vaihingen、Potsdam和LoveDA三个经典公开数据集,通过对比和消融实验的定量和可视化分析表明,所提方法在F1分数、总体精度(Over accuracy,OA)和平均交并比(Mean intersection over union,mIoU)评价指标中优于十种最先进的分割方法,其中平均交并比分别达到了84.96%、87.64%和52.43%,验证了所提方法在分割具有复杂背景、内类方差大和类间方差小问题的高分辨率遥感图像的优越性能. 展开更多
关键词 遥感图像 语义分割 CNN-Transformer框架 动态Transformer 多尺度减法
在线阅读 下载PDF
基于深度学习的无人机单目标跟踪综述
10
作者 陈泷 石磊 +2 位作者 黎智辉 丁锰 潘亦伦 《计算机科学与探索》 北大核心 2026年第1期40-65,共26页
基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网... 基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网络架构特点,将基于深度学习的无人机单目标跟踪方法系统梳理为传统Siamese网络、CNN-Transformer混合架构和全Transformer三大技术路线,重点关注2022—2025年间的最新研究进展。创新性地提出了两个细化分类框架:针对CNN-Transformer混合架构提出模块替代、特征后融合和协同建模三分类;针对Transformer单流方法提出静态计算、混合机制和动态计算三分类。系统揭示了无人机单目标跟踪算法从追求性能最大化向性能与效率协同优化的演进趋势。通过在UAV123、DTB70、UAVDT、VisDrone2018等主流数据集上的性能对比分析,验证了不同技术路线的优势与局限性。识别当前技术面临的关键挑战并提出未来发展方向和工程部署指导。 展开更多
关键词 无人机 单目标跟踪 深度学习 Siamese网络 TRANSFORMER
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
11
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 TRANSFORMER 单节点惯性传感器 动作分类
暂未订购
基于KAN的无监督多元时间序列异常检测网络
12
作者 王成 金城 《计算机科学》 北大核心 2026年第1期89-96,共8页
时间序列数据在金融、医疗、工业和交通等领域中广泛存在,异常检测对确保系统稳定和安全至关重要。由于异常样本的收集十分困难,当前大多数时间序列异常检测方法是无监督的。然而,这些方法普遍存在过泛化问题,即模型不仅能重建正常样本... 时间序列数据在金融、医疗、工业和交通等领域中广泛存在,异常检测对确保系统稳定和安全至关重要。由于异常样本的收集十分困难,当前大多数时间序列异常检测方法是无监督的。然而,这些方法普遍存在过泛化问题,即模型不仅能重建正常样本,还能很好地重建异常样本。这一问题使得异常检测效果不佳。因此,提出了一种基于Kolmogorov-Arnold表示理论的时间序列异常检测方法TS-KAN,利用其参数高效性与局部可塑性,使模型更好地拟合正常样本并缓解过泛化问题。此外,提出了局部特征增强层Local-KAN,以增强时域特征的表达能力,提高上下文异常检测能力。在5个主流时间序列异常检测数据集上的实验表明,TS-KAN的异常检测能力显著优于现有方法。 展开更多
关键词 时间序列异常检测 KAN TRANSFORMER 记忆模块 深度学习
在线阅读 下载PDF
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
13
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 TRANSFORMER XGBoost 电池管理系统
在线阅读 下载PDF
基于协同模型的船舶运动状态预测
14
作者 刁峰 周利 +2 位作者 刘天宇 李费旭 韩森 《船舶工程》 北大核心 2026年第1期111-128,167,共19页
[目的]为解决以物理模型或者神经网络模型的单模式船舶运动状态预测方法适用性和精准度不足的问题,[方法]利用物理模型和长短期记忆网络相结合的方法对船舶运动状态进行预测分析,通过改变物理参数获得不同类型船舶的特性,融合Transforme... [目的]为解决以物理模型或者神经网络模型的单模式船舶运动状态预测方法适用性和精准度不足的问题,[方法]利用物理模型和长短期记忆网络相结合的方法对船舶运动状态进行预测分析,通过改变物理参数获得不同类型船舶的特性,融合Transformer对混合模型的稳定性和可行性进行验证。[结果]结果表明:相对于单模式模型,该协同模型在预测精度方面表现出明显优势,在模拟数据集下获得了良好的效果,且在实船数据下表现也较好,其中预测误差均控制在5%以内,决定系数稳定在0.85以上。[结论]研究成果可为船舶运动状态预测提供一定参考。 展开更多
关键词 船舶状态预测 物理模型 长短期记忆网络 TRANSFORMER
原文传递
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
15
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 Swin Transformer 级联群体注意力机制
原文传递
状态空间结合注意力的高光谱——LiDAR协同分类
16
作者 罗天 戴元杰 +5 位作者 万煌 朱甜甜 赵敏慧 马思奇 赵林 吴健辉 《软件导刊》 2026年第1期158-165,共8页
多源遥感数据为地物目标分类提供了丰富的高程信息支持,但现有分类方法常忽略单源与跨源数据间的样本关联。鉴于状态空间模型在多种复杂场景下的数据处理能力,Mamba深度学习架构近年来受到广泛关注。为缓解多源遥感数据异质性问题,提高... 多源遥感数据为地物目标分类提供了丰富的高程信息支持,但现有分类方法常忽略单源与跨源数据间的样本关联。鉴于状态空间模型在多种复杂场景下的数据处理能力,Mamba深度学习架构近年来受到广泛关注。为缓解多源遥感数据异质性问题,提高基于高光谱图像的地物分类性能,提出一种融合Mamba结构的多模态状态空间高光谱遥感图像分类网络。该网络利用三维卷积和二维卷积初步提取高光谱图像的光谱与空间特征,构建光谱—空间Mamba模块增强特征表示。针对视觉Transformer中随机初始化造成的分类标签泛化能力不足问题,采用LiDAR数据特征作为分类标签向量与高光谱图像特征进行拼接,通过交叉注意力机制实现多源数据特征融合。实验结果表明,该模型在高光谱图像分类任务中表现出色,在Houston2013和Trento数据集上分别达到99.46%和99.33%的总体分类精度。 展开更多
关键词 高光谱图像分类 多模态 特征标记化 状态空间模型 Mamba TRANSFORMER
在线阅读 下载PDF
一种基于特征融合和Transformer的日志异常检测方法
17
作者 高禧安 田金鹏 《计量与测试技术》 2026年第1期99-103,共5页
为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的... 为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的序列特征和参数特征进行深度融合。此外,采用多层Transformer构建编码器,结合因果卷积网络设计解码器,实现了高效的日志异常检测。实验表明,与现有主流方法相比,FFTLog在精度、召回率、稳定性和可靠性方面均最优。 展开更多
关键词 日志异常检测 TRANSFORMER 特征融合
在线阅读 下载PDF
基于DINO的海底管道掩埋状态识别算法
18
作者 谌贵军 崔学荣 《物联网技术》 2026年第1期26-29,33,共5页
浅地层剖面仪通过声波探测海底管道并生成浅剖图像,但传统人工判读效率低,现有算法在复杂背景下特征提取能力有限,难以准确判断管道掩埋状态。针对这些问题,文中提出了一种基于SK-DINO模型的检测方法,创新地结合选择性内核网络(SKNet)... 浅地层剖面仪通过声波探测海底管道并生成浅剖图像,但传统人工判读效率低,现有算法在复杂背景下特征提取能力有限,难以准确判断管道掩埋状态。针对这些问题,文中提出了一种基于SK-DINO模型的检测方法,创新地结合选择性内核网络(SKNet)和空间注意力模块(SAM),提出SK-SAM融合注意力机制,增强了目标特征提取能力。在此基础上,采用高斯误差线性单元激活函数提升模型的非线性表达能力,降低过拟合风险。实验结果表明,改进算法的mAP@0.5、AP@0.75:0.95和AR@0.5:0.95分别达到0.8995、0.3862和0.4184,显著提高了海底管道掩埋状态的识别准确率。 展开更多
关键词 图像识别 海底管道 DINO 浅地层剖面仪 注意力机制 TRANSFORMER
在线阅读 下载PDF
一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型
19
作者 马宇张 张伟 邵浩辰 《中国医学物理学杂志》 2026年第2期268-275,共8页
视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。... 视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。首先,设计双分支互补特征融合模块替代传统跳跃连接,通过动态权重分配策略实现CNN局部细节与Transformer全局上下文的协同优化以提升特征融合效率。其次,在Transformer编码器中引入全局注意力增强模块,利用多头自注意力机制建模像素级长距离依赖关系,结合深度可分离卷积增强边界区域的上下文感知能力,有效缓解视杯/视盘边缘不连续问题。在REFUGE数据集上的实验表明,该方法在视盘分割任务中Dice系数和IoU较U-Net分别提升4.11%和5.62%;该方法在视杯分割任务中Dice系数和IoU较U-Net分别提升11.75%和19.30%。 展开更多
关键词 视杯视盘分割 青光眼辅助诊断 TRANSFORMER 特征融合 注意力机制
在线阅读 下载PDF
基于CNN-Transformer-ARG的双护盾TBM掘进速度预测模型
20
作者 刘永胜 沈军宏 +1 位作者 李达 候超 《河海大学学报(自然科学版)》 北大核心 2026年第1期112-118,176,共8页
为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权... 为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权所提取的局部和全局特征,基于历史掘进段监测数据预测未来掘进段的掘进速度均值、最大值和最小值。采用四川某山地轨道交通项目提取的927组掘进数据对模型进行了验证,结果表明:模型预测的均方误差、平均绝对误差、均方根误差和决定系数分别为0.07、0.21、0.26和0.86,均优于3个对比模型;模型提取的多源特征经过权重分配关注重点信息后提升了预测结果的精度,验证了ARG机制对于多源模型的有效性,可为类似结构模型多源特征数据流的处理提供参考。 展开更多
关键词 双护盾TBM 掘进速度预测 TRANSFORMER 自适应残差门控
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部