期刊文献+
共找到255,431篇文章
< 1 2 250 >
每页显示 20 50 100
基于BSimilar优化PTransformer的光伏功率短期预测
1
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 transformER 相似日
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
2
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformER Kolmogorov-Arnold网络
在线阅读 下载PDF
一种基于时域融合Transformer的4D航迹预测方法
3
作者 孔建国 马珂昕 +2 位作者 梁海军 张向伟 常瀚文 《电讯技术》 北大核心 2026年第1期21-29,共9页
针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以... 针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以体现飞行过程中不同阶段的差异;采用TFT模型有效捕捉各特征之间的隐式相关性,从而提高了预测精度;同时,结合分位数回归实现不确定性量化,提供了具有置信区间的航迹预测结果。实验表明,所提方法在真实数据上优于传统模型:与CNNLSTM模型和LSTM模型相比,平均距离误差分别减少了22.7%和50.9%,纵向、横向和垂直误差分别为305.01 m、177.91 m和25.23 m,验证了模型在解决航迹预测问题上的有效性,能够为管制精细化调控提供有效支持。 展开更多
关键词 空中交通管制 4D航迹预测 自动相关监视系统数据 时域融合transformer 时间序列预测
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
4
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 transformER 预测模型 烟叶替代
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
5
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
原文传递
SPTJNet:用于图像去除雨条纹的稀疏Transformer和联合注意力轻量化网络
6
作者 尹震宇 石卓 《小型微型计算机系统》 北大核心 2026年第1期121-132,共12页
下雨天气会严重影响图像的清晰度,导致图像视觉质量下降.图像去雨技术能有效去除雨条纹的干扰,提升图像的清晰度和细节表现.然而,现有方法大多依赖卷积或单一注意力机制,限制了其在捕捉全局感受野和处理复杂雨条纹方面的能力,导致图像... 下雨天气会严重影响图像的清晰度,导致图像视觉质量下降.图像去雨技术能有效去除雨条纹的干扰,提升图像的清晰度和细节表现.然而,现有方法大多依赖卷积或单一注意力机制,限制了其在捕捉全局感受野和处理复杂雨条纹方面的能力,导致图像模糊和细节丢失.此外,单一注意力机制增加了模型的复杂度和计算成本,限制了实际应用效率.为此,本文提出了一种基于稀疏Transformer和联合注意力的轻量化图像去雨网络(SParse Transformer and Joint attention Network,SPTJNet).该网络设计了稀疏Transformer模块(SParse Transformer module,SPT),在提升性能的同时减少计算冗余,提高推理效率.并设计了联合注意力模块(Joint Attention Module,JAM),由通道注意力的压缩激励单元(Squeeze-and-Excitation,SE)和高效局部注意力单元(Efficient Local Attention Unit,ELAU)组成,能增强对复杂场景的处理能力.实验表明,SPTJNet在去雨任务中表现出色. 展开更多
关键词 图像去雨 稀疏transformer 联合注意力 通道注意力 高效局部注意力
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
7
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
8
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
DiST-DR:扩散模型驱动的Swin Transformer非线性医学图像微分同胚配准
9
作者 马可航 夏春潮 +3 位作者 陈梦遥 李飞 张思敏 孙怀强 《四川大学学报(自然科学版)》 北大核心 2026年第1期13-24,共12页
医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-D... 医学图像配准是医学图像分析中的关键任务。在深度学习框架下,实现同时具备平滑性、拓扑保持性与高精度的图像配准仍面临诸多挑战。为协同建模局部细节与全局上下文信息,并增强扩散模型的特征表达能力,提出了一种新型混合架构——DiST-DR(Diffusiondriven Swin Transformer for Diffeomorphic Registration)。该模型融合CNN与Swin Transformer作为骨干网络,并引入密集乘法连接(Dense Multiplicative Connection,DMC)模块,以有效融合多尺度特征。此外,DiST-DR引入微分同胚变换,以在配准过程中保持形变场的平滑性与拓扑结构。在心脏MRI与肝脏CT数据集上的实验证明,DiST-DR优于现有先进的配准方法,展现出其在实现精确且拓扑保持的图像配准任务中的应用潜力。 展开更多
关键词 医学图像配准 扩散模型 Swin transformer 微分同胚配准
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
10
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 transformER 单节点惯性传感器 动作分类
暂未订购
基于Transformer的壁画裂缝自动化数字修复方法
11
作者 刘晨玲 李炳焱 +3 位作者 米艳华 薛峰 王建华 戴震 《太原理工大学学报》 北大核心 2026年第1期186-194,共9页
【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多... 【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多依赖专家知识或人工辅助,无法实现壁画数字修复的自动化。【方法】本文结合北方地区长期缺水干燥的环境特征,针对壁画文物可能存在的撕扯断裂或裂缝错位问题,实现自动化数字修复。具体而言,本研究提出基于Transformer的壁画裂缝自动化数字修复方法;基于VGG16-Unet模型,创新性提出基于膨胀核的裂缝掩码优化方法,通过形态学膨胀操作显著提升裂缝覆盖率。此外,利用Transformer的全局结构学习能力与CNN上采样实现结构修复,并引入傅立叶卷积与大核注意力模块完成纹理细节还原和高保真修复。【结果】实验基于山西多地真实壁画数据验证了该方法的有效性,结果表明,该方法在裂缝识别覆盖度、结构还原度及纹理协调性方面均优于传统方法,尤其对北方干燥地区特有的断裂错位型裂缝修复效果显著。 展开更多
关键词 壁画修复 深度学习 壁画图像分割 transformER
在线阅读 下载PDF
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
12
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformER XGBoost 电池管理系统
在线阅读 下载PDF
融合Transformer和Inception的网络入侵检测研究
13
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformER INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于改进Transformer-无迹卡尔曼滤波器的智能车辆多模态3D目标检测方法
14
作者 张哲宁 刘祯 王化强 《汽车技术》 北大核心 2026年第2期39-47,共9页
为提升智能车辆环境感知目标检测的准确性,提出一种特征融合3D目标检测方法。首先,对Transformer模型进行改进,借助多头自注意力机制,充分考虑数据空间的局部特征信息,并保留不同的特征权重,以提取点云与图像特征;然后,借助无迹卡尔曼... 为提升智能车辆环境感知目标检测的准确性,提出一种特征融合3D目标检测方法。首先,对Transformer模型进行改进,借助多头自注意力机制,充分考虑数据空间的局部特征信息,并保留不同的特征权重,以提取点云与图像特征;然后,借助无迹卡尔曼滤波器(UKF)设计图像与点云多模态融合系统,最终实现3D目标检测;最后,采用KITTI数据集和实车数据集对模型进行训练和推理,并与多种主流算法进行对比。验证结果显示,与应用广泛的截锥卷积网络(F-ConvNet)、视锥点云网络(F-PointNet)等主流多模态融合算法相比,所提出的目标检测模型多类别平均精度分别提升了0.34百分点和3.03百分点,车辆和骑行者对象的检测平均精度分别提升了2.52百分点和9.32百分点,且该模型在实车数据推理中的表现与训练评测结果基本一致。 展开更多
关键词 3D目标检测 智能车辆 改进transformer 多模态融合
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
15
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
基于改进特征金字塔和Transformer的多分支人群密度估计方法
16
作者 杨长敏 李泽滔 《现代电子技术》 北大核心 2026年第3期121-127,共7页
为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度... 为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度的通道和空间加权,从而增强特征表达的准确性;其次,构建Transformer分支,将VGG和CBAM处理后的特征作为输入,利用Transformer的自注意力机制进行全局特征建模;最后,采用IFPN进行多尺度特征融合,通过有效结合不同层级的特征,使模型同时关注目标的局部细节信息和全局上下文。在公开数据集上的实验结果表明,该方法在多个基准测试中的性能优于现有主流方法。在ShanghaiTechPartA数据集上,所提模型的MAE和RMSE分别达到55.6和94.1;在ShanghaiTechPartB数据集上,MAE和RMSE分别达到6.2和10.1;在UCF-QNRF数据集上,MAE和RMSE分别达到83.4和144.9。实验结果验证了该方法在背景噪声和人群尺度不一场景下的鲁棒性,并显著提高了人群密度估计的准确性。 展开更多
关键词 人群密度估计 深度学习 transformER CBAM 特征金字塔网络 多尺度特征融合
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
17
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
18
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 Swin transformer 级联群体注意力机制
原文传递
一种基于特征融合和Transformer的日志异常检测方法
19
作者 高禧安 田金鹏 《计量与测试技术》 2026年第1期99-103,共5页
为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的... 为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的序列特征和参数特征进行深度融合。此外,采用多层Transformer构建编码器,结合因果卷积网络设计解码器,实现了高效的日志异常检测。实验表明,与现有主流方法相比,FFTLog在精度、召回率、稳定性和可靠性方面均最优。 展开更多
关键词 日志异常检测 transformER 特征融合
在线阅读 下载PDF
一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型
20
作者 马宇张 张伟 邵浩辰 《中国医学物理学杂志》 2026年第2期268-275,共8页
视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。... 视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。首先,设计双分支互补特征融合模块替代传统跳跃连接,通过动态权重分配策略实现CNN局部细节与Transformer全局上下文的协同优化以提升特征融合效率。其次,在Transformer编码器中引入全局注意力增强模块,利用多头自注意力机制建模像素级长距离依赖关系,结合深度可分离卷积增强边界区域的上下文感知能力,有效缓解视杯/视盘边缘不连续问题。在REFUGE数据集上的实验表明,该方法在视盘分割任务中Dice系数和IoU较U-Net分别提升4.11%和5.62%;该方法在视杯分割任务中Dice系数和IoU较U-Net分别提升11.75%和19.30%。 展开更多
关键词 视杯视盘分割 青光眼辅助诊断 transformER 特征融合 注意力机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部