期刊文献+
共找到15,651篇文章
< 1 2 250 >
每页显示 20 50 100
基于BSimilar优化PTransformer的光伏功率短期预测
1
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 transformer 相似日
在线阅读 下载PDF
一种基于时域融合Transformer的4D航迹预测方法
2
作者 孔建国 马珂昕 +2 位作者 梁海军 张向伟 常瀚文 《电讯技术》 北大核心 2026年第1期21-29,共9页
针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以... 针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以体现飞行过程中不同阶段的差异;采用TFT模型有效捕捉各特征之间的隐式相关性,从而提高了预测精度;同时,结合分位数回归实现不确定性量化,提供了具有置信区间的航迹预测结果。实验表明,所提方法在真实数据上优于传统模型:与CNNLSTM模型和LSTM模型相比,平均距离误差分别减少了22.7%和50.9%,纵向、横向和垂直误差分别为305.01 m、177.91 m和25.23 m,验证了模型在解决航迹预测问题上的有效性,能够为管制精细化调控提供有效支持。 展开更多
关键词 空中交通管制 4D航迹预测 自动相关监视系统数据 时域融合transformer 时间序列预测
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
3
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R2)高达99.91%. 展开更多
关键词 风速预测 群分解 transformer Kolmogorov-Arnold网络
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
4
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 transformer 预测模型 烟叶替代
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
5
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
原文传递
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
6
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformer 混合模型
在线阅读 下载PDF
层级特征融合Transformer的图像分类算法
7
作者 段士玺 王博 《电子科技》 2026年第2期72-78,共7页
针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级... 针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级的特征图,每个特征图包含不同层次的抽象特征表示。基于层级标签将ViT提取的特征映射为多级特征,运用层级特征融合策略整合不同层级信息,有效增强模型的分类性能。在CIFRA-10、CIFRA-100和CUB-200-2011这3个数据集将所提模型与多种先进深度学习模型进行对比和分析。在CIFRA-10数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为99.70%、98.80%和97.80%。在CIFRA-100数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为95.23%、93.54%和90.12%。在CUB-200-2011数据集,所提方法在第1层级和第2层级的分类精度分别为98.09%和93.66%。结果表明,所提模型的分类准确率优于其他对比模型。 展开更多
关键词 深度学习 卷积神经网络 transformer 图像分类 层级特征 特征融合 多头注意力 Vision transformer
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
8
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 transformer 单节点惯性传感器 动作分类
暂未订购
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
9
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformer XGBoost 电池管理系统
在线阅读 下载PDF
基于Transformer的壁画裂缝自动化数字修复方法
10
作者 刘晨玲 李炳焱 +3 位作者 米艳华 薛峰 王建华 戴震 《太原理工大学学报》 北大核心 2026年第1期186-194,共9页
【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多... 【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多依赖专家知识或人工辅助,无法实现壁画数字修复的自动化。【方法】本文结合北方地区长期缺水干燥的环境特征,针对壁画文物可能存在的撕扯断裂或裂缝错位问题,实现自动化数字修复。具体而言,本研究提出基于Transformer的壁画裂缝自动化数字修复方法;基于VGG16-Unet模型,创新性提出基于膨胀核的裂缝掩码优化方法,通过形态学膨胀操作显著提升裂缝覆盖率。此外,利用Transformer的全局结构学习能力与CNN上采样实现结构修复,并引入傅立叶卷积与大核注意力模块完成纹理细节还原和高保真修复。【结果】实验基于山西多地真实壁画数据验证了该方法的有效性,结果表明,该方法在裂缝识别覆盖度、结构还原度及纹理协调性方面均优于传统方法,尤其对北方干燥地区特有的断裂错位型裂缝修复效果显著。 展开更多
关键词 壁画修复 深度学习 壁画图像分割 transformer
在线阅读 下载PDF
基于改进特征金字塔和Transformer的多分支人群密度估计方法
11
作者 杨长敏 李泽滔 《现代电子技术》 北大核心 2026年第3期121-127,共7页
为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度... 为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度的通道和空间加权,从而增强特征表达的准确性;其次,构建Transformer分支,将VGG和CBAM处理后的特征作为输入,利用Transformer的自注意力机制进行全局特征建模;最后,采用IFPN进行多尺度特征融合,通过有效结合不同层级的特征,使模型同时关注目标的局部细节信息和全局上下文。在公开数据集上的实验结果表明,该方法在多个基准测试中的性能优于现有主流方法。在ShanghaiTechPartA数据集上,所提模型的MAE和RMSE分别达到55.6和94.1;在ShanghaiTechPartB数据集上,MAE和RMSE分别达到6.2和10.1;在UCF-QNRF数据集上,MAE和RMSE分别达到83.4和144.9。实验结果验证了该方法在背景噪声和人群尺度不一场景下的鲁棒性,并显著提高了人群密度估计的准确性。 展开更多
关键词 人群密度估计 深度学习 transformer CBAM 特征金字塔网络 多尺度特征融合
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
12
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
知识蒸馏Transformer的人物交互检测
13
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
14
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 Swin transformer 级联群体注意力机制
原文传递
一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型
15
作者 马宇张 张伟 邵浩辰 《中国医学物理学杂志》 2026年第2期268-275,共8页
视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。... 视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。首先,设计双分支互补特征融合模块替代传统跳跃连接,通过动态权重分配策略实现CNN局部细节与Transformer全局上下文的协同优化以提升特征融合效率。其次,在Transformer编码器中引入全局注意力增强模块,利用多头自注意力机制建模像素级长距离依赖关系,结合深度可分离卷积增强边界区域的上下文感知能力,有效缓解视杯/视盘边缘不连续问题。在REFUGE数据集上的实验表明,该方法在视盘分割任务中Dice系数和IoU较U-Net分别提升4.11%和5.62%;该方法在视杯分割任务中Dice系数和IoU较U-Net分别提升11.75%和19.30%。 展开更多
关键词 视杯视盘分割 青光眼辅助诊断 transformer 特征融合 注意力机制
在线阅读 下载PDF
一种基于特征融合和Transformer的日志异常检测方法
16
作者 高禧安 田金鹏 《计量与测试技术》 2026年第1期99-103,共5页
为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的... 为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的序列特征和参数特征进行深度融合。此外,采用多层Transformer构建编码器,结合因果卷积网络设计解码器,实现了高效的日志异常检测。实验表明,与现有主流方法相比,FFTLog在精度、召回率、稳定性和可靠性方面均最优。 展开更多
关键词 日志异常检测 transformer 特征融合
在线阅读 下载PDF
融合KAN与Transformer的分心驾驶行为增强检测模型
17
作者 陈万志 于南洋 范兴杰 《安全与环境学报》 北大核心 2026年第1期88-99,共12页
分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kol... 分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kolmogorov-Arnold网络,通过有理函数逼近与分组参数共享减少参数量,增强微动作特征的提取;其次,采用多尺度扩张注意力机制,通过滑动窗口稀疏采样与渐进扩张率分配,实现局部细节感知与长程上下文建模的协同优化;最后,通过训练优化模型实现分心驾驶行为的分类检测。试验结果表明,所提模型在典型数据集上检测精度达92.3%(较基线提升8.5百分点),实时速度为45帧/s,遮挡召回率提升11.7百分点。所提模型在平衡检测精度的同时实现了轻量化设计,满足智能驾驶安全预警中分心驾驶行为的实时检测需求。 展开更多
关键词 安全工程 驾驶安全 Kolmogorov-Arnold网络 transformer模型 分组共享 多尺度扩张注意力
原文传递
基于CNN-Transformer-ARG的双护盾TBM掘进速度预测模型
18
作者 刘永胜 沈军宏 +1 位作者 李达 候超 《河海大学学报(自然科学版)》 北大核心 2026年第1期112-118,176,共8页
为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权... 为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权所提取的局部和全局特征,基于历史掘进段监测数据预测未来掘进段的掘进速度均值、最大值和最小值。采用四川某山地轨道交通项目提取的927组掘进数据对模型进行了验证,结果表明:模型预测的均方误差、平均绝对误差、均方根误差和决定系数分别为0.07、0.21、0.26和0.86,均优于3个对比模型;模型提取的多源特征经过权重分配关注重点信息后提升了预测结果的精度,验证了ARG机制对于多源模型的有效性,可为类似结构模型多源特征数据流的处理提供参考。 展开更多
关键词 双护盾TBM 掘进速度预测 transformer 自适应残差门控
在线阅读 下载PDF
PT-MFR:一种基于Point Transformer的CAD模型加工特征识别方法
19
作者 何皓辰 方正 +2 位作者 卢政达 肖俊 王颖 《中国科学院大学学报(中英文)》 北大核心 2026年第1期115-124,共10页
加工特征识别在计算机辅助设计(CAD)和制造(CAM)中至关重要,是连接CAD和CAM系统的重要环节。研究者们提出了基于规则和基于学习的2类加工特征识别方法,其中基于学习的方法表现更出色且备受关注。然而,现有识别方法面临着几何信息利用不... 加工特征识别在计算机辅助设计(CAD)和制造(CAM)中至关重要,是连接CAD和CAM系统的重要环节。研究者们提出了基于规则和基于学习的2类加工特征识别方法,其中基于学习的方法表现更出色且备受关注。然而,现有识别方法面临着几何信息利用不足、加工特征定位不精准、实例分割过程复杂等挑战。针对这些问题,提出PT-MFR,一种基于Point Transformer的CAD模型加工特征识别方法,它执行语义分割和实例分割2个任务,分别预测模型每个面的加工特征语义类别并计算面相似度以分割加工特征实例,综合2个任务得到加工特征识别结果。实验结果表明,提出的方法性能优于现有的其他方法。 展开更多
关键词 加工特征识别 点云 神经网络 Point transformer
在线阅读 下载PDF
SwinHCAD: A Robust Multi-Modality Segmentation Model for Brain Tumors Using Transformer and Channel-Wise Attention
20
作者 Seyong Jin Muhammad Fayaz +2 位作者 L.Minh Dang Hyoung-Kyu Song Hyeonjoon Moon 《Computers, Materials & Continua》 2026年第1期511-533,共23页
Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the b... Brain tumors require precise segmentation for diagnosis and treatment plans due to their complex morphology and heterogeneous characteristics.While MRI-based automatic brain tumor segmentation technology reduces the burden on medical staff and provides quantitative information,existing methodologies and recent models still struggle to accurately capture and classify the fine boundaries and diverse morphologies of tumors.In order to address these challenges and maximize the performance of brain tumor segmentation,this research introduces a novel SwinUNETR-based model by integrating a new decoder block,the Hierarchical Channel-wise Attention Decoder(HCAD),into a powerful SwinUNETR encoder.The HCAD decoder block utilizes hierarchical features and channelspecific attention mechanisms to further fuse information at different scales transmitted from the encoder and preserve spatial details throughout the reconstruction phase.Rigorous evaluations on the recent BraTS GLI datasets demonstrate that the proposed SwinHCAD model achieved superior and improved segmentation accuracy on both the Dice score and HD95 metrics across all tumor subregions(WT,TC,and ET)compared to baseline models.In particular,the rationale and contribution of the model design were clarified through ablation studies to verify the effectiveness of the proposed HCAD decoder block.The results of this study are expected to greatly contribute to enhancing the efficiency of clinical diagnosis and treatment planning by increasing the precision of automated brain tumor segmentation. 展开更多
关键词 Attention mechanism brain tumor segmentation channel-wise attention decoder deep learning medical imaging MRI transformer U-Net
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部