期刊文献+
共找到10,627篇文章
< 1 2 250 >
每页显示 20 50 100
Millimeter-wave modeling based on transformer model for InP high electron mobility transistor
1
作者 ZHANG Ya-Xue ZHANG Ao GAO Jian-Jun 《红外与毫米波学报》 北大核心 2025年第4期534-539,共6页
In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are train... In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are trained and validated using the Transformer model.In the proposed model,the eight-layer transformer encoders are connected in series and the encoder layer of each Transformer consists of the multi-head attention layer and the feed-forward neural network layer.The experimental results show that the measured and modeled S-parameters of the HEMT device match well in the frequency range of 0.5-40 GHz,with the errors versus frequency less than 1%.Compared with other models,good accuracy can be achieved to verify the effectiveness of the proposed model. 展开更多
关键词 transformer model neural network high electron mobility transistor(HEMT) small signal model
在线阅读 下载PDF
Enhancing Multi-Class Cyberbullying Classification with Hybrid Feature Extraction and Transformer-Based Models
2
作者 Suliman Mohamed Fati Mohammed A.Mahdi +4 位作者 Mohamed A.G.Hazber Shahanawaj Ahamad Sawsan A.Saad Mohammed Gamal Ragab Mohammed Al-Shalabi 《Computer Modeling in Engineering & Sciences》 2025年第5期2109-2131,共23页
Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or... Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or indirect slurs.To address this gap,we propose a hybrid framework combining Term Frequency-Inverse Document Frequency(TF-IDF),word-to-vector(Word2Vec),and Bidirectional Encoder Representations from Transformers(BERT)based models for multi-class cyberbullying detection.Our approach integrates TF-IDF for lexical specificity and Word2Vec for semantic relationships,fused with BERT’s contextual embeddings to capture syntactic and semantic complexities.We evaluate the framework on a publicly available dataset of 47,000 annotated social media posts across five cyberbullying categories:age,ethnicity,gender,religion,and indirect aggression.Among BERT variants tested,BERT Base Un-Cased achieved the highest performance with 93%accuracy(standard deviation across±1%5-fold cross-validation)and an average AUC of 0.96,outperforming standalone TF-IDF(78%)and Word2Vec(82%)models.Notably,it achieved near-perfect AUC scores(0.99)for age and ethnicity-based bullying.A comparative analysis with state-of-the-art benchmarks,including Generative Pre-trained Transformer 2(GPT-2)and Text-to-Text Transfer Transformer(T5)models highlights BERT’s superiority in handling ambiguous language.This work advances cyberbullying detection by demonstrating how hybrid feature extraction and transformer models improve multi-class classification,offering a scalable solution for moderating nuanced harmful content. 展开更多
关键词 Cyberbullying classification multi-class classification BERT models machine learning TF-IDF Word2Vec social media analysis transformer models
在线阅读 下载PDF
Combining transformer and 3DCNN models to achieve co-design of structures and sequences of antibodies in a diffusional manner
3
作者 Yue Hu Feng Tao +3 位作者 Jiajie Xu Wen-Jun Lan Jing Zhang Wei Lan 《Journal of Pharmaceutical Analysis》 2025年第6期1406-1408,共3页
AlphaPanda(AlphaFold2[1]inspired protein-specific antibody design in a diffusional manner)is an advanced algorithm for designing complementary determining regions(CDRs)of the antibody targeted the specific epitope,com... AlphaPanda(AlphaFold2[1]inspired protein-specific antibody design in a diffusional manner)is an advanced algorithm for designing complementary determining regions(CDRs)of the antibody targeted the specific epitope,combining transformer[2]models,3DCNN[3],and diffusion[4]generative models. 展开更多
关键词 advanced algorithm diffusion generative models dcnn epitope targeting antibody design complementary determining regions complementary determining regions cdrs transformer models
在线阅读 下载PDF
基于Transformer的时间序列预测方法综述 被引量:4
4
作者 陈嘉俊 刘波 +2 位作者 林伟伟 郑剑文 谢家晨 《计算机科学》 北大核心 2025年第6期96-105,共10页
时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制... 时间序列预测作为分析历史数据以预测未来趋势的关键技术,已广泛应用于金融、气象等领域。然而,传统方法如自回归移动平均模型和指数平滑法等在处理非线性模式、捕捉长期依赖性时存在局限。最近,基于Transformer的方法因其自注意力机制,在自然语言处理与计算机视觉领域取得突破,也开始拓展至时间序列预测领域并取得显著成果。因此,探究如何将Transformer高效运用于时间序列预测,成为推动该领域发展的关键。首先,介绍了时间序列的特性,阐述了时间序列预测的常见任务类别及评估指标。接着,深入解析Transformer的基本架构,并挑选了近年来在时间序列预测中广受关注的Transfo-rmer衍生模型,从模块及架构层面进行分类,并分别从问题解决、创新点及局限性3个维度进行比较和分析。最后,进一步探讨了时间序列预测Transformer在未来可能的研究方向。 展开更多
关键词 时间序列 transformer模型 深度学习 注意力机制 预测
在线阅读 下载PDF
基于转置Transformer模型的电化学储能自适应SOH估计方法 被引量:1
5
作者 李鹏 葛儒哲 +3 位作者 董存 孙树敏 张元欣 王士柏 《高电压技术》 北大核心 2025年第6期2945-2953,I0015,共10页
为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因... 为了保障锂离子电池运行的可靠性和安全性,及时监测其健康状况,在Autoformer模型和iTransformer模型的基础上,结合线性回归模型,提出了一种基于转置Transformer的自适应特征感知电池健康状态融合估计模型。首先,从充电曲线中提取健康因子。其次,将容量退化分解为退化趋势部分和容量再生部分,利用线性回归模型预测电池容量的退化趋势,利用转置Transformer模型估计电池容量再生部分,两部分组合以获得电池容量退化的估计结果。最后,利用注意力权重对模型赋予可解释性。研究结果表明:此方法在NASA锂电池老化数据集上的仿真实验中,预测误差明显小于其他时序预测模型,验证了所提方法的预测精确性与可靠性。论文为电池健康状态精确估计的进一步深入研究提供了参考。 展开更多
关键词 锂离子电池 健康状态 深度学习 注意力机制 转置transformer模型 可解释性
原文传递
基于局部时序建模与Transformer的机器人运动技能学习
6
作者 朱晓庆 南博睿 +5 位作者 宫婉儒 毕兰越 郑忻宜 朱晓宇 吴通 张川 《北京理工大学学报》 北大核心 2025年第9期968-978,共11页
为了提高机器人运动技能学习的效率和精度,提出一种基于序列特征处理的动作决策Transformer模型,命名为门控机制Transformer(gated mechanism Transformer,GMT).模型以GPT-2为核心,结合门控机制提取隐藏状态特征,通过自回归建模捕捉时... 为了提高机器人运动技能学习的效率和精度,提出一种基于序列特征处理的动作决策Transformer模型,命名为门控机制Transformer(gated mechanism Transformer,GMT).模型以GPT-2为核心,结合门控机制提取隐藏状态特征,通过自回归建模捕捉时间依赖关系,解决机器人运动数据中深层特征难以提取的问题.同时,利用参数共享策略细化预测特征完成动作推理.GMT在MuJoCo平台的三个机器人运动技能任务中进行了验证.实验结果表明,GMT在学习效率和精度方面较Decision Transformer最高提升28.5%.研究表明,GMT能够高效建模机器人运动序列特征,为机器人动作决策提供新的技术方案. 展开更多
关键词 机器人运动 局部时序建模 transformER 门控机制 自回归建模
在线阅读 下载PDF
基于小波变换增强位置编码Transformer的空域流量预测
7
作者 唐卫贞 刘波 +1 位作者 黄洲升 田齐齐 《现代电子技术》 北大核心 2025年第8期127-132,共6页
随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪... 随着全球化进程的加快和航空技术的发展,对空中交通流量预测的精度要求也越来越高。为提高空中交通流量预测精度,减轻空中交通管制员的压力,提出一种增强位置编码的Transformer模型。利用小波变换对原始空域流量数据进行分析,通过信噪比选出性能最优的小波基函数,再进一步计算出小波系数并将其融入位置编码,以增强模型对时间序列数据的理解能力。实验结果表明,所提模型能够准确捕捉空中交通流量数据中的非平稳性和突变特征,其RMSE和MAPE评估指标较原始Transformer模型分别降低了29.9与2.9%,较LSTM模型分别降低了34.5与3.4%。该模型不仅提升了空域流量预测的准确性,也证实了小波变换在增强模型时间序列数据理解中的有效性,且为交通流量管理提供了一种新的技术方案。 展开更多
关键词 空域流量预测 增强位置编码 transformer模型 小波变换 LSTM模型 小波基函数
在线阅读 下载PDF
双向自回归Transformer与快速傅里叶卷积增强的壁画修复 被引量:1
8
作者 陈永 张世龙 杜婉君 《湖南大学学报(自然科学版)》 北大核心 2025年第4期1-15,共15页
针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer... 针对现有深度学习算法在壁画修复时,存在全局语义一致性约束不足及局部特征提取不充分,导致修复后的壁画易出现边界效应和细节模糊等问题,提出一种双向自回归Transformer与快速傅里叶卷积增强的壁画修复方法.首先,设计基于Transformer结构的全局语义特征修复模块,利用双向自回归机制与掩码语言模型(masked language modeling,MLM),提出改进的多头注意力全局语义壁画修复模块,提高对全局语义特征的修复能力.然后,构建了由门控卷积和残差模块组成的全局语义增强模块,增强全局语义特征一致性约束.最后,设计局部细节修复模块,采用大核注意力机制(large kernel attention,LKA)与快速傅里叶卷积提高细节特征的捕获能力,同时减少局部细节信息的丢失,提升修复壁画局部和整体特征的一致性.通过对敦煌壁画数字化修复实验,结果表明,所提算法修复性能更优,客观评价指标均优于比较算法. 展开更多
关键词 壁画修复 双向自回归transformer 掩码语言模型 快速傅里叶卷积 语义增强
在线阅读 下载PDF
Transformer在脑肿瘤MRI图像分割中的研究进展
9
作者 陈雷 李光宇 +2 位作者 杨锋 蔡婧欣 高梦谣 《磁共振成像》 北大核心 2025年第8期181-187,200,共8页
脑肿瘤精准分割至关重要,但传统卷积神经网络因局部感受野限制难以建模磁共振成像(magnetic resonance imaging,MRI)中的长距离依赖,影响对异质性高、边界模糊肿瘤的分割精度。Transformer凭借全局自注意力机制为此提供了新思路。本文... 脑肿瘤精准分割至关重要,但传统卷积神经网络因局部感受野限制难以建模磁共振成像(magnetic resonance imaging,MRI)中的长距离依赖,影响对异质性高、边界模糊肿瘤的分割精度。Transformer凭借全局自注意力机制为此提供了新思路。本文综述了Transformer在脑肿瘤MRI分割中的进展,重点分析了Transformer模型在层次化注意力、编解码结构、残差连接等关键技术上的改进,探讨了多模态融合、模态缺失应对、轻量化设计及注意力机制本身的创新策略;尽管Transformer显著提升了精度,仍面临数据稀缺、模态缺失鲁棒性、类别不平衡、计算成本高和可解释性不足等挑战,未来需聚焦数据高效利用、模态弹性建模、拓扑感知优化、轻量化与可解释性增强等方向。本文系统梳理了Transfomer在脑肿瘤MRI图像分割领域的研究现状,总结了目前研究的局限性并指出未来的研究方向,本文旨在为深入理解其技术演进、核心挑战与发展方向提供系统性参考。 展开更多
关键词 transformer模型 脑肿瘤分割 磁共振成像 多模态 注意力机制 轻量化设计
暂未订购
PAM结合TCN优化Transformer的光伏功率预测研究
10
作者 张红 李峰 +2 位作者 马彦宏 姬文宣 郑启鹏 《计算机工程》 北大核心 2025年第10期140-149,共10页
准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。... 准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。基于多种特征选择机制筛选输入特征,增强对光伏数据特征的表征能力;利用粗粒度构造模块和PAM优化Transformer编码器,在多尺度上捕获光伏功率的长期时间依赖特征;利用光伏功率日出日落效应约束机制和TCN优化Transformer解码器,增强光伏功率的短期变化特征,以更好地捕捉其短期变化模式。在澳大利亚Sanyo数据集上进行实验,结果表明,Solarformer能够有效提高光伏功率的预测精度,相比DLinear模型,其均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)分别降低了约7.45%、6.99%和14.10%。 展开更多
关键词 光伏功率预测 transformer模型 金字塔注意力模块 约束机制 时间卷积网络
在线阅读 下载PDF
基于VMD和改进Transformer模型的镍镉蓄电池SOH预测研究
11
作者 于天剑 冯恩来 +1 位作者 伍珣 张庆东 《铁道科学与工程学报》 北大核心 2025年第7期3266-3279,共14页
动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode d... 动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode decomposition,VMD)和改进的Transformer模型,提出一种综合预测框架。首先,通过白鲸优化算法(beluga whale optimization,BWO)对VMD的超参数进行优化,利用VMD分解重构准确捕捉电池在其整个生命周期中的容量退化特性,消除蓄电池记忆效应对SOH预测研究带来的不良影响;其次,在Transformer编码模块中嵌入了长短时记忆网络自编码模块(long short-term memory network autoencoder,LSTM Autoencoder),以有效提取电池健康退化的短期特征信息并压缩数据维度,从而降低模型复杂度;最后,将Transformer解码层替换为全连接神经网络,以降低模型复杂度和减少预测误差累积现象,从而提高模型的预测性能和运行效率。并且在验证方案中,以实际动车组蓄电池为研究对象,通过消融实验以及横向对比实验双向证明研究算法具有最高的预测精度,输出预测结果在均方根误差、平均绝对误差相较于其他模型平均降低了60.83%和62.14%,在决定系数上平均提升了6.73%,具有高度的准确性和鲁棒性。可以实现对电池SOH实现精确的预测,对电池健康状态进行有效监控,为电池检修工作提供数据支撑和方法支持。 展开更多
关键词 镍镉蓄电池 SOH预测 变分模态分解 长短时记忆网络自编码器 改进transformer模型
在线阅读 下载PDF
结合MoE与Transformer的生态翻译模型优化研究
12
作者 李玲 雷宏友 《自动化与仪器仪表》 2025年第4期178-181,186,共5页
生态翻译过程是译者进行适应与选择的过程,翻译原则是多维度的选择性适应以及适应性选择。虽然目前Transformer模型在生态翻译领域取得了显著的成果,然而在面对生态翻译中的复杂语义和多模态信息时,Transformer模型仍存在容量瓶颈和破... 生态翻译过程是译者进行适应与选择的过程,翻译原则是多维度的选择性适应以及适应性选择。虽然目前Transformer模型在生态翻译领域取得了显著的成果,然而在面对生态翻译中的复杂语义和多模态信息时,Transformer模型仍存在容量瓶颈和破坏模块化结构的问题。为此,研究提出结合专家混合与Transformer的生态翻译模型优化方法,通过引入专家混合机制,旨在提升模型对多样化输入的处理能力与翻译质量。研究结果表明,在Europarl数据集上,所提模型的翻译准确率总体保持在94%以上;在ParaCrawl数据集中,所提模型的准确率同样稳定在95%以上,且具有较强的稳定性,验证了此次研究的有效性。此次研究为生态翻译模型的优化提供了更广阔的思路和经验指导。 展开更多
关键词 生态翻译模型 transformER 专家混合 模型优化 神经机器翻译
原文传递
一种基于FastText-Transformer的微博作者身份识别
13
作者 蔡满春 陈政 何泉 《中国人民公安大学学报(自然科学版)》 2025年第1期54-59,共6页
随着网络文本的快速增长和社交媒体的普及,识别文本作者身份的需求日益增加,对来源追溯、网络安全以及社会管理等领域具有重要意义。而针对自媒体庞大且语义灵活的中文网络短文本作者身份识别仍然存在很大挑战。为实现自动化特征提取,... 随着网络文本的快速增长和社交媒体的普及,识别文本作者身份的需求日益增加,对来源追溯、网络安全以及社会管理等领域具有重要意义。而针对自媒体庞大且语义灵活的中文网络短文本作者身份识别仍然存在很大挑战。为实现自动化特征提取,提高识别准确率,通过基于深度学习框架和改进FastText模型,提升词向量表示质量,将FastText模型输出的词向量输入到改进的Transformer Encoder模型中,提升了分类质量。实验结果表明提出的算法模型对微博数据集文本作者身份识别准确率达92.3%,可以实现微博作者身份识别。 展开更多
关键词 作者识别 FastText模型 transformer模型
在线阅读 下载PDF
基于LSTM预训练-Transformer修正的船舶运动极短期预报 被引量:1
14
作者 张睿 孟帅 +2 位作者 张小卿 刘震 封培元 《船舶工程》 北大核心 2025年第4期37-45,共9页
[目的]为减少Transformer模型复杂度和推理时间,提高船舶运动极短期预报精度,[方法]提出将传统LSTM模型和改进的LSTM-OneShot模型进行预训练,借用梯度提升决策树(GBDT)算法和集成学习思路,基于Transformer模型引入注意力机制来修正预报... [目的]为减少Transformer模型复杂度和推理时间,提高船舶运动极短期预报精度,[方法]提出将传统LSTM模型和改进的LSTM-OneShot模型进行预训练,借用梯度提升决策树(GBDT)算法和集成学习思路,基于Transformer模型引入注意力机制来修正预报残差。采用某远洋船在三级海况下时历数据进行试验。[结果]研究发现:1)在船舶运动曲线预报方面,Transformer修正可显著提高LSTM模型预报精度。在预报时长2s时,拟合优度系数R^(2)可从0.807提高到0.940;Transformer修正在一定程度上可提高LSTM-OneShot模型预报精度。在预报时长2 s时,R^(2)可从0.938提高到0.941;Transformer修正的LSTM-OneShot模型整体表现最佳。2)在船舶运动包络线预报方面,包络线的周期性在可行的输入序列时间不显著,多层感知机提取的历史特征成为干扰信息,导致LSTM-OneShot模型预报结果明显不如传统LSTM模型。在预报时长2s时,R^(2)从0.938降低至0.881;注意力机制修正可以显著提高传统的LSTM模型预报精度。在预报时长2 s时,R^(2)从0.938提高到0.963;注意力机制修正在一定程度上可提高LSTM-OneShot模型的预报精度,但是无法从根本上去除多层感知机带来的干扰信息。在预报时长2s时,R^(2)可从0.881提高到0.887;Transformer修正的传统LSTM模型整体表现最佳。[结论]研究成果可为船舶运动极短期预报提供一定参考。 展开更多
关键词 船舶运动 极短期预报 长短期记忆循环神经网络 transformer模型 注意力机制
原文传递
基于特征选择与Transformer-LSTM的滚动轴承寿命预测 被引量:2
15
作者 李沁远 雷文平 +2 位作者 闫灏 娄永威 陈阳 《组合机床与自动化加工技术》 北大核心 2025年第2期200-206,211,共8页
滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩... 滚动轴承作为旋转机械设备中的关键部件,影响着设备的可靠性运行。针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度和不同特征组合对预测模型精度的影响,提出一种基于特征选择与Transformer-LSTM的剩余使用寿命预测模型。首先基于单调性、趋势性以及最大相关最小冗余特征选择算法对振动信号的时域、频域、时频域特征进行重要性排序和筛选,从而捕获特征与剩余寿命以及特征之间的相互的关系。然后将筛选后的特征输入Transformer-LSTM预测模型中,深度挖掘输入特征与RUL之间的复杂映射关系,从而更准确地进行预测。通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越。 展开更多
关键词 剩余使用寿命 特征选择 最大相关最小冗余 transformer-LSTM模型
在线阅读 下载PDF
前额叶皮层启发的Transformer模型应用及其进展 被引量:1
16
作者 潘雨辰 贾克斌 张铁林 《自动化学报》 北大核心 2025年第7期1403-1422,共20页
聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物... 聚焦于生物结构与类脑智能的交叉研究方向,探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发.前额叶皮层在认知控制和决策制定中扮演着关键角色.首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展,然后探讨这些生物机制如何启发新型的类脑Transformer架构,重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性.最后,总结前额叶皮层启发的类脑新模型,在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力,为生物和人工智能两大领域之间交叉融合构建桥梁. 展开更多
关键词 生物结构 类脑智能 前额叶皮层 transformER 世界模型
在线阅读 下载PDF
基于Transformer和LSTM算法的河套灌区土壤水分预测研究 被引量:1
17
作者 王钥 郑方元 +3 位作者 雍婷 查元源 周龙才 徐祥森 《节水灌溉》 北大核心 2025年第2期1-8,14,共9页
土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有... 土壤水是土壤中的关键指标,其变化直接影响着作物生长,并影响着水资源利用的管理决策。因此,准确地预测土壤水分有利于对农业水资源进行合理的规划利用。使用深度学习算法进行土壤水分预测在当前的农业、水资源管理和生态学等领域具有重要性。深度学习算法能够从大规模数据中学习土壤水分的复杂模式和时空关系,为土壤水的准确预测提供了新的机会。为了探索新兴深度学习方法Transformer在土壤水分预测中的有效性,选择河套灌区义长灌域为研究区域,利用地下水位观测数据、气象数据、SMAP土壤水数据等作为训练数据,设置了1、5、10 d共3种数据滞后情况,验证Transformer算法在土壤水时间序列预测任务中的有效性,并与目前广泛应用于时序预测任务中的LSTM进行对比。研究表明Transformer在土壤水分时间序列预测任务中具有更好的预测能力,相比于LSTM,其R^(2)平均提升约0.181,RMSE平均下降27.6%。同时,Transformer在应对滞后变化带来的影响时更具鲁棒性,在3种数据滞后情况下Transformer的预测平均R^(2)分别比LSTM高出了0.121、0.167、0.256,站点平均RMSE分别降低了30.7%、28.6%、23.5%。此外,Transformer对于土壤水序列中的非线性信息的提取能力更强,对于高频振幅的土壤水时间序列Transformer拥有更强的预测能力。 展开更多
关键词 土壤水分预测 深度学习 时序预测 transformer模型 LSTM模型 数据滞后
在线阅读 下载PDF
CRAKUT:融合对比区域注意力机制与临床先验知识的U-Transformer用于放射学报告生成 被引量:1
18
作者 梁业东 朱雄峰 +3 位作者 黄美燕 张文聪 郭翰宇 冯前进 《南方医科大学学报》 北大核心 2025年第6期1343-1352,共10页
目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意... 目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意力图像编码器,利用数据集中常见的正常影像提取增强的视觉特征;外部知识注入模块,融合临床先验知识;U型Transformer,通过U型连接架构完成从视觉到语言的跨模态信息转换。在图像编码器中引入的对比区域注意力机制,通过强调正常与异常语义特征之间的差异,增强了异常区域的特征表示。此外,文本编码器中的临床先验知识注入模块结合了临床历史信息及由ChatGPT生成的知识图谱,从而提升了报告生成的上下文理解能力。U型Transformer在多模态编码器与报告解码器之间建立连接,融合多种类型的信息以生成最终的报告。结果 在2个公开的CXR数据集(IU-Xray和MIMIC-CXR)对CRAKUT模型进行评估,结果显示,CRAKUT在报告生成任务中实现了当前最先进的性能。在MIMIC-CXR数据集,CRAKUT取得了BLEU-4分数0.159、ROUGE-L分数0.353、CIDEr分数0.500;在IU-Xray数据集上,METEOR分数达到0.258,均优于以往模型的表现。结论 本文提出的方法在临床疾病诊断和报告生成中具有巨大的应用潜力。 展开更多
关键词 胸部X光 对比区域注意力 临床先验知识 跨模态交互 U-transformer模型
在线阅读 下载PDF
基于LogSparse Transformer模型的高校网络舆情预测与分析
19
作者 张友海 《佛山科学技术学院学报(自然科学版)》 2025年第3期61-68,共8页
针对高校网络舆情的快速变化和复杂性问题,提出一种基于LogSparse Transformer时序模型的预测方法。通过对数据进行预处理、长时序相关性挖掘以及长程依赖建模,构建了LogSparse Transformer模型并进行评估实验。实验结果表明,LogSparse ... 针对高校网络舆情的快速变化和复杂性问题,提出一种基于LogSparse Transformer时序模型的预测方法。通过对数据进行预处理、长时序相关性挖掘以及长程依赖建模,构建了LogSparse Transformer模型并进行评估实验。实验结果表明,LogSparse Transformer模型在预测准确性上优于传统方法和机器学习算法,同时具有更快的响应速度和实时处理能力。该模型能够有效捕捉高校舆情事件中的远距离依赖关系,并减少模型的时间复杂性,为高校舆情预测及管理提供了一种新的有效工具,有助于高校管理者及时响应和管理网络舆情。 展开更多
关键词 网络舆情 LogSparse transformer时序模型 高校管理 数据清洗 注意力机制
在线阅读 下载PDF
改进Transformer架构的混合时频域增强分解模型的重大装备剩余寿命预测
20
作者 蔡志强 胡昌华 +1 位作者 王兆强 李榕泽 《火箭军工程大学学报》 2025年第3期76-89,共14页
针对航空航天领域重大装备的剩余寿命(remaining useful life,RUL)预测问题,提出一种基于改进Transformer架构的混合时频域增强分解模型。首先,通过融合时域与频域特征,全面提取多层次的设备退化特征;然后,设计了频域增强模块,结合傅里... 针对航空航天领域重大装备的剩余寿命(remaining useful life,RUL)预测问题,提出一种基于改进Transformer架构的混合时频域增强分解模型。首先,通过融合时域与频域特征,全面提取多层次的设备退化特征;然后,设计了频域增强模块,结合傅里叶变换和小波变换,从频域角度提取信号的周期性和局部特征;接着,利用分解趋势学习模块对信号进行多尺度趋势分解,提取周期性与趋势性成分;最后,通过基于分层预测的残差学习模块,进一步提高RUL预测的精度。为验证模型的性能,使用NASA C-MAPSS数据集进行了实验。结果表明:模型在FD001、FD002、FD003、FD004四个数据集上的均方根误差分别为10.83、17.53、11.42和20.56,相较于现有的深度学习方法,具有更优的预测性能和更快的收敛速度,在多工况和多传感器环境下具有更强的鲁棒性与泛化能力。 展开更多
关键词 重大装备 健康管理 剩余寿命预测 改进transformer架构 混合模型 深度学习
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部