期刊文献+
共找到254,658篇文章
< 1 2 250 >
每页显示 20 50 100
基于改进时间融合Transformers的中国大豆需求预测方法
1
作者 刘佳佳 秦晓婧 +5 位作者 李乾川 许世卫 赵继春 王一罡 熊露 梁晓贺 《智慧农业(中英文)》 2025年第4期187-199,共13页
[目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方... [目的/意义]精准预测大豆需求对保障国家粮食安全、优化产业决策与应对国际贸易变局有着重要的现实意义,而利用时间融合Transformers(Temporal Fusion Transformers,TFT)模型开展中国大豆需求预测时,在特征交互层与注意力权重分配等方面仍存在一定局限。为此,亟需探索一种基于改进TFT模型的预测方法,以提升需求预测的准确性与可解释性。[方法]本研究将深度学习的TFT模型应用到中国大豆需求预测中,提出了一种基于多层动态特征交互(Multi-layer Dynamic Feature Interaction,MDFI)与自适应注意力权重优化(Adaptive Attention Weight Optimization,AAWO)改进的MA-TFT(Improved TFT Model Based on MDFI and AAWO)模型。对包含1980—2024年4652个相关指标的中国大豆需求分析数据集进行数据预处理和特征工程,设计实验将MA-TFT模型分别与自回归差分移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)、长短期记忆网络(Long Short-Term Memory,LSTM)模型及TFT模型进行预测性能对比,进行了消融实验,同时利用SHAP(SHapley Additive exPlanations)工具可解释性分析影响中国大豆需求的关键特征变量,开展了未来10年的中国大豆需求量预测。[结果和讨论]MA-TFT模型的均方误差(Mean Squared Error,MSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)分别为0.036和5.89%,决定系数R^(2)为0.91,均高于对比模型,均方根误差(Root Mean Square Error,RMSE)和MAPE分别较基准模型TFT累计降低21.84%和3.44%,表明改进TFT的MA-TFT模型能够捕捉特征间复杂关系,提升预测性能;研究利用SHAP工具可解释性分析发现,MA-TFT模型对影响中国大豆需求关键特征变量的解释稳定性较高;预计2025、2030和2034年中国大豆需求量分别达到11799万吨、11033万吨和11378万吨。[结论]基于改进TFT的MA-TFT模型方法为解决现有大豆需求预测方法精度不足、可解释性不强的实际问题提供了解决思路,也为其他农产品时间序列预测的方法优化与应用提供了参考和借鉴。 展开更多
关键词 时间融合transformers(TFT) 大豆需求预测 多层动态特征交互 自适应注意力权重优化 可解释性分析
在线阅读 下载PDF
基于BSimilar优化PTransformer的光伏功率短期预测
2
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 transformER 相似日
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
3
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R2)高达99.91%. 展开更多
关键词 风速预测 群分解 transformER Kolmogorov-Arnold网络
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
4
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
原文传递
新解码器的CNNs-Transformers融合网络及其病理图像肿瘤分割应用 被引量:1
5
作者 马丽晶 王朝立 +2 位作者 孙占全 程树群 王康 《小型微型计算机系统》 北大核心 2025年第6期1442-1449,共8页
病理图像是肿瘤诊断的"金标准",但超高分辨率的病理图像使得医生需要消耗大量的精力和时间,而且诊断结果主观性比较强.随着人工智能技术的发展,深度学习模型提供了计算机代替人对病理图像进行快速、准确和可靠诊断的可能性.然... 病理图像是肿瘤诊断的"金标准",但超高分辨率的病理图像使得医生需要消耗大量的精力和时间,而且诊断结果主观性比较强.随着人工智能技术的发展,深度学习模型提供了计算机代替人对病理图像进行快速、准确和可靠诊断的可能性.然而,目前大多数的网络更注重如何在编码器部分提取更准确的特征,而对于同等重要的解码器部分的结构设计研究则稍显不足.针对该问题,本文提出了由三类上采样模块组成的新网络,而编码器部分采用Swin Transformer和ConvNeXt作为网络的双分支并行独立结构.三类上采样模块分别是多重转置卷积采样、双线性上采样和Swin Transformer上采样,其特点是可以充分利用病理图像特征之间局部和全局的依赖关系.该网络分别在肝癌数据集和GLAS数据集上进行了验证,并与不同类型的主流网络进行了对比,性能指标皆达到比较好的结果. 展开更多
关键词 医学图像分割 深度学习 卷积神经网络 Swin transformer
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
6
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
7
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 transformER 单节点惯性传感器 动作分类
暂未订购
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
8
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformER XGBoost 电池管理系统
在线阅读 下载PDF
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
9
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 Swin transformer 级联群体注意力机制
原文传递
Generating Abstractive Summaries from Social Media Discussions Using Transformers
10
作者 Afrodite Papagiannopoulou Chrissanthi Angeli Mazida Ahmad 《Open Journal of Applied Sciences》 2025年第1期239-258,共20页
The rise of social media platforms has revolutionized communication, enabling the exchange of vast amounts of data through text, audio, images, and videos. These platforms have become critical for sharing opinions and... The rise of social media platforms has revolutionized communication, enabling the exchange of vast amounts of data through text, audio, images, and videos. These platforms have become critical for sharing opinions and insights, influencing daily habits, and driving business, political, and economic decisions. Text posts are particularly significant, and natural language processing (NLP) has emerged as a powerful tool for analyzing such data. While traditional NLP methods have been effective for structured media, social media content poses unique challenges due to its informal and diverse nature. This has spurred the development of new techniques tailored for processing and extracting insights from unstructured user-generated text. One key application of NLP is the summarization of user comments to manage overwhelming content volumes. Abstractive summarization has proven highly effective in generating concise, human-like summaries, offering clear overviews of key themes and sentiments. This enhances understanding and engagement while reducing cognitive effort for users. For businesses, summarization provides actionable insights into customer preferences and feedback, enabling faster trend analysis, improved responsiveness, and strategic adaptability. By distilling complex data into manageable insights, summarization plays a vital role in improving user experiences and empowering informed decision-making in a data-driven landscape. This paper proposes a new implementation framework by fine-tuning and parameterizing Transformer Large Language Models to manage and maintain linguistic and semantic components in abstractive summary generation. The system excels in transforming large volumes of data into meaningful summaries, as evidenced by its strong performance across metrics like fluency, consistency, readability, and semantic coherence. 展开更多
关键词 Abstractive Summarization transformers Social Media Summarization transformer Language Models
在线阅读 下载PDF
一种基于特征融合和Transformer的日志异常检测方法
11
作者 高禧安 田金鹏 《计量与测试技术》 2026年第1期99-103,共5页
为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的... 为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的序列特征和参数特征进行深度融合。此外,采用多层Transformer构建编码器,结合因果卷积网络设计解码器,实现了高效的日志异常检测。实验表明,与现有主流方法相比,FFTLog在精度、召回率、稳定性和可靠性方面均最优。 展开更多
关键词 日志异常检测 transformER 特征融合
在线阅读 下载PDF
Analysis and modeling of on-chip transformers under two ground conditions
12
作者 韦家驹 王志功 +1 位作者 李智群 唐路 《Journal of Semiconductors》 EI CAS CSCD 2012年第6期109-113,共5页
Two fabricated on-chip transformers under different ground conditions(i.e.,CG and IG types) have been measured to compare their different characteristics.With the aid of the electromagnetic(EM) solver,we have anal... Two fabricated on-chip transformers under different ground conditions(i.e.,CG and IG types) have been measured to compare their different characteristics.With the aid of the electromagnetic(EM) solver,we have analyzed the differences from the electric and magnetic aspects,and different effects in these aspects can be described with the lumped capacitor and inductor from the perspective of the equivalent circuit model.A physicsbased equivalent circuit model is proposed to model transformers under different ground conditions.In addition, the simple parameter extraction procedure for the corresponding model is also provided.All the model parameters are extracted and agree with the analysis.In order to verify the model's validity and accuracy,we have compared the modeled and measured S-parameters,and an excellent agreement has been found over a broad frequency range. 展开更多
关键词 transformer model equivalent circuit ground on-chip RFIC
原文传递
一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型
13
作者 马宇张 张伟 邵浩辰 《中国医学物理学杂志》 2026年第2期268-275,共8页
视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。... 视杯与视盘的精准分割是青光眼早期筛查中形态学参数计算的关键环节,针对现有方法因局部-全局特征融合效率低、长距离依赖建模不足导致的边界模糊和分割精度受限问题,提出一种基于CNN-Transformer的青光眼辅助诊断双编码分割网络模型。首先,设计双分支互补特征融合模块替代传统跳跃连接,通过动态权重分配策略实现CNN局部细节与Transformer全局上下文的协同优化以提升特征融合效率。其次,在Transformer编码器中引入全局注意力增强模块,利用多头自注意力机制建模像素级长距离依赖关系,结合深度可分离卷积增强边界区域的上下文感知能力,有效缓解视杯/视盘边缘不连续问题。在REFUGE数据集上的实验表明,该方法在视盘分割任务中Dice系数和IoU较U-Net分别提升4.11%和5.62%;该方法在视杯分割任务中Dice系数和IoU较U-Net分别提升11.75%和19.30%。 展开更多
关键词 视杯视盘分割 青光眼辅助诊断 transformER 特征融合 注意力机制
在线阅读 下载PDF
基于LSTM-Transformer模型的突水条件下矿井涌水量预测
14
作者 李振华 姜雨菲 +1 位作者 杜锋 王文强 《河南理工大学学报(自然科学版)》 北大核心 2026年第1期77-85,共9页
目的矿井涌水量精准预测对预防矿井水害和保障矿井安全生产具有重要意义,为精准预测矿井涌水量,构建适用于华北型煤田受底板L_(1-4)灰岩含水层和奥陶系灰岩含水层水害威胁的矿井涌水量预测模型。方法以河南某典型矿井的水文监测数据为基... 目的矿井涌水量精准预测对预防矿井水害和保障矿井安全生产具有重要意义,为精准预测矿井涌水量,构建适用于华北型煤田受底板L_(1-4)灰岩含水层和奥陶系灰岩含水层水害威胁的矿井涌水量预测模型。方法以河南某典型矿井的水文监测数据为基础,提出LSTMTransformer模型。利用LSTM捕捉矿井涌水量的动态时序特征,通过Transformer的多头注意力机制分析含水层水位变化和矿井涌水量之间的复杂时序关联,构建水位动态变化驱动下的矿井涌水量精准预测框架。结果结果表明,LSTM-Transformer模型预测精度显著优于LSTM,CNN,Transformer和CNN-LSTM模型的,其均方根误差为20.91 m^(3)/h,平均绝对误差为16.08 m^(3)/h,平均绝对百分比误差为1.12%,且和单因素涌水量预测模型相比,水位-涌水量双因素预测模型预测结果更加稳定。结论LSTM-Transformer模型成功克服传统方法在捕捉复杂水文地质系统中水位-涌水量动态关联上的局限,为矿井涌水量动态预测提供可解释性强、鲁棒性好的解决方案,也为类似地质条件下矿井涌水量预测提供了新方法。 展开更多
关键词 涌水量预测 水位动态响应 LSTM-transformer耦合模型 时间序列预测 注意力机制 矿井安全生产
在线阅读 下载PDF
基于CNN-Transformer-ARG的双护盾TBM掘进速度预测模型
15
作者 刘永胜 沈军宏 +1 位作者 李达 候超 《河海大学学报(自然科学版)》 北大核心 2026年第1期112-118,176,共8页
为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权... 为准确预测双护盾TBM掘进速度,提出了一种结合CNN、Transformer以及自适应残差门控(ARG)机制的智能预测模型。该模型通过双层卷积模块提取不同视角下掘进参数的局部特征,通过Transformer捕捉掘进参数的全局特征,并引入ARG机制动态加权所提取的局部和全局特征,基于历史掘进段监测数据预测未来掘进段的掘进速度均值、最大值和最小值。采用四川某山地轨道交通项目提取的927组掘进数据对模型进行了验证,结果表明:模型预测的均方误差、平均绝对误差、均方根误差和决定系数分别为0.07、0.21、0.26和0.86,均优于3个对比模型;模型提取的多源特征经过权重分配关注重点信息后提升了预测结果的精度,验证了ARG机制对于多源模型的有效性,可为类似结构模型多源特征数据流的处理提供参考。 展开更多
关键词 双护盾TBM 掘进速度预测 transformER 自适应残差门控
在线阅读 下载PDF
Token Masked Pose Transformers Are Efficient Learners
16
作者 Xinyi Song Haixiang Zhang Shaohua Li 《Computers, Materials & Continua》 2025年第5期2735-2750,共16页
In recent years,Transformer has achieved remarkable results in the field of computer vision,with its built-in attention layers effectively modeling global dependencies in images by transforming image features into tok... In recent years,Transformer has achieved remarkable results in the field of computer vision,with its built-in attention layers effectively modeling global dependencies in images by transforming image features into token forms.However,Transformers often face high computational costs when processing large-scale image data,which limits their feasibility in real-time applications.To address this issue,we propose Token Masked Pose Transformers(TMPose),constructing an efficient Transformer network for pose estimation.This network applies semantic-level masking to tokens and employs three different masking strategies to optimize model performance,aiming to reduce computational complexity.Experimental results show that TMPose reduces computational complexity by 61.1%on the COCO validation dataset,with negligible loss in accuracy.Additionally,our performance on the MPII dataset is also competitive.This research not only enhances the accuracy of pose estimation but also significantly reduces the demand for computational resources,providing new directions for further studies in this field. 展开更多
关键词 Pattern recognition image processing neural network pose transformer
在线阅读 下载PDF
Leveraging Transformers for Detection of Arabic Cyberbullying on Social Media: Hybrid Arabic Transformers
17
作者 Amjad A.Alsuwaylimi Zaid S.Alenezi 《Computers, Materials & Continua》 2025年第5期3165-3185,共21页
Cyberbullying is a remarkable issue in the Arabic-speaking world,affecting children,organizations,and businesses.Various efforts have been made to combat this problem through proposed models using machine learning(ML)... Cyberbullying is a remarkable issue in the Arabic-speaking world,affecting children,organizations,and businesses.Various efforts have been made to combat this problem through proposed models using machine learning(ML)and deep learning(DL)approaches utilizing natural language processing(NLP)methods and by proposing relevant datasets.However,most of these endeavors focused predominantly on the English language,leaving a substantial gap in addressing Arabic cyberbullying.Given the complexities of the Arabic language,transfer learning techniques and transformers present a promising approach to enhance the detection and classification of abusive content by leveraging large and pretrained models that use a large dataset.Therefore,this study proposes a hybrid model using transformers trained on extensive Arabic datasets.It then fine-tunes the hybrid model on a newly curated Arabic cyberbullying dataset collected from social media platforms,in particular Twitter.Additionally,the following two hybrid transformer models are introduced:the first combines CAmelid Morphologically-aware pretrained Bidirectional Encoder Representations from Transformers(CAMeLBERT)with Arabic Generative Pre-trained Transformer 2(AraGPT2)and the second combines Arabic BERT(AraBERT)with Cross-lingual Language Model-RoBERTa(XLM-R).Two strategies,namely,feature fusion and ensemble voting,are employed to improve the model performance accuracy.Experimental results,measured through precision,recall,F1-score,accuracy,and AreaUnder the Curve-Receiver Operating Characteristic(AUC-ROC),demonstrate that the combined CAMeLBERT and AraGPT2 models using feature fusion outperformed traditional DL models,such as Long Short-Term Memory(LSTM)and Bidirectional Long Short-Term Memory(BiLSTM),as well as other independent Arabic-based transformer models. 展开更多
关键词 CYBERBULLYING transformers pre-trained models arabic cyberbullying detection deep learning
在线阅读 下载PDF
Research on the Selection and Layout Scheme of Main Transformers in the Primary Electrical Design of New Energy Step-Up Stations
18
作者 Yuekai Liao 《Journal of Electronic Research and Application》 2025年第4期254-260,共7页
This paper focuses on the research of the main transformer selection and layout scheme for new energy step-up substations.From the perspective of engineering design,it analyzes the principles of main transformer selec... This paper focuses on the research of the main transformer selection and layout scheme for new energy step-up substations.From the perspective of engineering design,it analyzes the principles of main transformer selection,key parameters,and their matching with the characteristics of new energy.It also explores the layout methods and optimization strategies.Combined with typical case studies,optimization suggestions are proposed for the design of main transformers in new energy step-up substations.The research shows that rational main transformer selection and scientific layout schemes can better adapt to the characteristics of new energy projects while effectively improving land use efficiency and economic viability.This study can provide technical experience support for the design of new energy projects. 展开更多
关键词 New energy step-up substation Engineering design Main transformer selection
在线阅读 下载PDF
Analysis of the effects of strong stray magnetic fields generated by tokamak device on transformers assembled in electronic power converters
19
作者 Xingjian ZHAO Ge GAO +2 位作者 Li JIANG Yong YANG Hong LEI 《Plasma Science and Technology》 2025年第5期81-93,共13页
As the plasma current power in tokamak devices increases,a significant number of stray magnetic fields are generated around the equipment.These stray magnetic fields can disrupt the operation of electronic power devic... As the plasma current power in tokamak devices increases,a significant number of stray magnetic fields are generated around the equipment.These stray magnetic fields can disrupt the operation of electronic power devices,particularly transformers in switched-mode power supplies.Testing flyback converters with transformers under strong background magnetic fields highlights electromagnetic compatibility(EMC)issues for such switched-mode power supplies.This study utilizes finite element analysis software to simulate the electromagnetic environment of switched-mode power supply transformers and investigates the impact of variations in different magnetic field parameters on the performance of switched-mode power supplies under strong stray magnetic fields.The findings indicate that EMC issues are associated with transformer core saturation and can be alleviated through appropriate configurations of the core size,air gap,fillet radius,and installation direction.This study offers novel solutions for addressing EMC issues in high magnetic field environments. 展开更多
关键词 transformers magnetic field interference magnetic components power electronics magnetic field simulation
在线阅读 下载PDF
Improving Fashion Sentiment Detection on X through Hybrid Transformers and RNNs
20
作者 Bandar Alotaibi Aljawhara Almutarie +1 位作者 Shuaa Alotaibi Munif Alotaibi 《Computers, Materials & Continua》 2025年第9期4451-4467,共17页
X(formerly known as Twitter)is one of the most prominent social media platforms,enabling users to share short messages(tweets)with the public or their followers.It serves various purposes,from real-time news dissemina... X(formerly known as Twitter)is one of the most prominent social media platforms,enabling users to share short messages(tweets)with the public or their followers.It serves various purposes,from real-time news dissemination and political discourse to trend spotting and consumer engagement.X has emerged as a key space for understanding shifting brand perceptions,consumer preferences,and product-related sentiment in the fashion industry.However,the platform’s informal,dynamic,and context-dependent language poses substantial challenges for sentiment analysis,mainly when attempting to detect sarcasm,slang,and nuanced emotional tones.This study introduces a hybrid deep learning framework that integrates Transformer encoders,recurrent neural networks(i.e.,Long Short-Term Memory(LSTM)and Gated Recurrent Unit(GRU)),and attention mechanisms to improve the accuracy of fashion-related sentiment classification.These methods were selected due to their proven strength in capturing both contextual dependencies and sequential structures,which are essential for interpreting short-form text.Our model was evaluated on a dataset of 20,000 fashion tweets.The experimental results demonstrate a classification accuracy of 92.25%,outperforming conventional models such as Logistic Regression,Linear Support Vector Machine(SVM),and even standalone LSTM by a margin of up to 8%.This improvement highlights the importance of hybrid architectures in handling noisy,informal social media data.This study’s findings offer strong implications for digital marketing and brand management,where timely sentiment detection is critical.Despite the promising results,challenges remain regarding the precise identification of negative sentiments,indicating that further work is needed to detect subtle and contextually embedded expressions. 展开更多
关键词 Sentiment analysis deep learning natural language processing transformers recurrent neural networks
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部