期刊文献+
共找到11,006篇文章
< 1 2 250 >
每页显示 20 50 100
一种面向地图综合建筑多边形化简的Transformer模型
1
作者 刘鹏程 成晓强 +2 位作者 肖天元 杨敏 艾廷华 《测绘学报》 北大核心 2026年第1期124-137,共14页
针对地图综合中建筑多边形化简方法依赖人工规则、自动化程度低且难以利用已有化简成果的问题,本文提出了一种基于Transformer机制的建筑多边形化简模型。该模型首先把建筑多边形映射至一定范围的网格空间,将建筑多边形的坐标串表达为... 针对地图综合中建筑多边形化简方法依赖人工规则、自动化程度低且难以利用已有化简成果的问题,本文提出了一种基于Transformer机制的建筑多边形化简模型。该模型首先把建筑多边形映射至一定范围的网格空间,将建筑多边形的坐标串表达为网格序列,从而获取建筑多边形化简前后的Token序列,构建出建筑多边形化简样本对数据;随后采用Transformer架构建立模型,基于样本数据利用模型的掩码自注意力机制学习点序列之间的依赖关系,最终逐点生成新的简化多边形,从而实现建筑多边形的化简。在训练过程中,模型使用结构化的样本数据,设计了忽略特定索引的交叉熵损失函数以提升化简质量。试验设计包括主试验与泛化验证两部分。主试验基于洛杉矶1∶2000建筑数据集,分别采用0.2、0.3和0.5 mm 3种网格尺寸对多边形进行编码,实现了目标比例尺为1∶5000与1∶10000的化简。试验结果表明,在0.3 mm的网格尺寸下模型性能最优,验证集上的化简结果与人工标注的一致率超过92.0%,且针对北京部分区域的建筑多边形数据的泛化试验验证了模型的迁移能力;与LSTM模型的对比分析显示,在参数规模相近的条件下,LSTM模型无法形成有效收敛,并生成可用结果。本文证实了Transformer在处理空间几何序列任务中的潜力,且能够有效复用已有化简样本,为智能建筑多边形化简提供了具有工程实用价值的途径。 展开更多
关键词 地图综合 建筑多边形化简 TOKENIZATION transformer模型 上下文工程
在线阅读 下载PDF
基于LSTM-Transformer模型的突水条件下矿井涌水量预测 被引量:1
2
作者 李振华 姜雨菲 +1 位作者 杜锋 王文强 《河南理工大学学报(自然科学版)》 北大核心 2026年第1期77-85,共9页
目的矿井涌水量精准预测对预防矿井水害和保障矿井安全生产具有重要意义,为精准预测矿井涌水量,构建适用于华北型煤田受底板L_(1-4)灰岩含水层和奥陶系灰岩含水层水害威胁的矿井涌水量预测模型。方法以河南某典型矿井的水文监测数据为基... 目的矿井涌水量精准预测对预防矿井水害和保障矿井安全生产具有重要意义,为精准预测矿井涌水量,构建适用于华北型煤田受底板L_(1-4)灰岩含水层和奥陶系灰岩含水层水害威胁的矿井涌水量预测模型。方法以河南某典型矿井的水文监测数据为基础,提出LSTMTransformer模型。利用LSTM捕捉矿井涌水量的动态时序特征,通过Transformer的多头注意力机制分析含水层水位变化和矿井涌水量之间的复杂时序关联,构建水位动态变化驱动下的矿井涌水量精准预测框架。结果结果表明,LSTM-Transformer模型预测精度显著优于LSTM,CNN,Transformer和CNN-LSTM模型的,其均方根误差为20.91 m^(3)/h,平均绝对误差为16.08 m^(3)/h,平均绝对百分比误差为1.12%,且和单因素涌水量预测模型相比,水位-涌水量双因素预测模型预测结果更加稳定。结论LSTM-Transformer模型成功克服传统方法在捕捉复杂水文地质系统中水位-涌水量动态关联上的局限,为矿井涌水量动态预测提供可解释性强、鲁棒性好的解决方案,也为类似地质条件下矿井涌水量预测提供了新方法。 展开更多
关键词 涌水量预测 水位动态响应 LSTM-transformer耦合模型 时间序列预测 注意力机制 矿井安全生产
在线阅读 下载PDF
基于多尺度特征提取与ResNet-Transformer的抽油机故障诊断
3
作者 韩东颖 朱志洲 +1 位作者 葛子轩 时培明 《计量学报》 北大核心 2026年第1期35-41,共7页
提出了一种多尺度特征提取与ResNet-Transformer算法用于抽油机故障诊断。首先,利用深度残差网络ResNet-34的局部特征提取能力捕获示功图空间细节,并借助Transformer编码器上下文建模能力获取全局特征,构建了端到端的抽油机故障诊断框架... 提出了一种多尺度特征提取与ResNet-Transformer算法用于抽油机故障诊断。首先,利用深度残差网络ResNet-34的局部特征提取能力捕获示功图空间细节,并借助Transformer编码器上下文建模能力获取全局特征,构建了端到端的抽油机故障诊断框架;其次,引入多尺度特征提取模块,通过1×1、3×3和5×5卷积核并行提取不同尺度的特征信息,增强对示功图细节的感知能力;最后,设计了特征融合注意力机制,自适应地整合多尺度特征和全局语义信息。在包含7种典型工况的示功图数据集上进行实验,结果表明,该算法在故障诊断任务中取得了94%准确率,验证了所提算法的有效性。 展开更多
关键词 力学计量 故障诊断 抽油机 示功图 多尺度特征提取 ResNet-transformer模型
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
4
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
原文传递
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测 被引量:1
5
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
6
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 transformER 预测模型 烟叶替代
在线阅读 下载PDF
结合Transformer的扩散模型用于人脸美丽预测
7
作者 甘俊英 黎慧聪 +2 位作者 陈汉添 庄圳鑫 陈真 《机电工程技术》 2026年第3期74-79,共6页
模型过度拟合数据库中的噪声标签,导致人脸美丽预测任务中存在泛化能力较弱、预测准确率降低的问题。针对此问题,提出了一种结合Transformer的扩散模型用于训练过程中的标签去噪和重建。模型学习条件概率分布,以“分类器引导”方式控制... 模型过度拟合数据库中的噪声标签,导致人脸美丽预测任务中存在泛化能力较弱、预测准确率降低的问题。针对此问题,提出了一种结合Transformer的扩散模型用于训练过程中的标签去噪和重建。模型学习条件概率分布,以“分类器引导”方式控制生成过程,包含条件信息编码器和去噪网络。首先,迁移Swin Transformer的预训练权重,微调并获取初步预测,作为输出先验;其次,将先验知识作为扩散模型后向过程端点的均值,并调节每一个时间步的去噪转换;最后,提取人脸美丽特征,经扩散模型推理得到预测结果。基于3个人脸美丽数据库进行了实验验证,结果表明,所提模型优于基准扩散模型及人脸美丽预测方法。就准确率而言,所提模型在SCUT-FBP5500、LSAFBD、CelebA数据库上分别取得76.50%、72.65%、81.78%的准确率,分别比基准扩散模型提升了0.73%、1.76%、1.12%,比人脸美丽预测方法提升了1.00%、4.42%、0.37%,较好地解决了噪声标签的问题,提高了预测性能,可广泛应用于其他图像分类任务或相关领域。 展开更多
关键词 人脸美丽预测 扩散模型 transformER 条件信息编码器
在线阅读 下载PDF
多尺度非对称注意力遥感去雾Transformer
8
作者 王旭阳 梁宇航 《广西师范大学学报(自然科学版)》 北大核心 2026年第2期77-89,共13页
雾霾干扰会导致遥感图像结构模糊、细节丢失,严重影响下游视觉任务的准确性。为此,本文提出一种异构增强的遥感图像去雾网络,从空间结构建模与频率信息整合2个层面提升特征恢复能力。具体而言,设计多尺度非对称注意力Transformer模块,... 雾霾干扰会导致遥感图像结构模糊、细节丢失,严重影响下游视觉任务的准确性。为此,本文提出一种异构增强的遥感图像去雾网络,从空间结构建模与频率信息整合2个层面提升特征恢复能力。具体而言,设计多尺度非对称注意力Transformer模块,引入方向感知机制以增强模糊边缘与纹理细节的建模;同时构建基于小波变换高低频自适应增强模块,使用Haar小波分解分离频域信息,分别通过高频与低频子模块强化边缘轮廓与结构表达。2个模块分别嵌入特征提取与融合阶段,协同缓解传统方法方向性建模不足与高频特征易丢失等问题。在保持低计算开销的前提下,本文方法在HAZE1K与RICE数据集上的平均PSNR/SSIM性能分别达到24.9936/0.9099与33.1802/0.8942,在细节恢复方面表现出显著优势。 展开更多
关键词 遥感图像去雾 transformER 非对称注意力 高低频特征增强 小波变换 方向感知建模 深度学习
在线阅读 下载PDF
The 3D-Geoformer for ENSO studies:a Transformer-based model with integrated gradient methods for enhanced explainability 被引量:1
9
作者 Lu ZHOU Rong-Hua ZHANG 《Journal of Oceanology and Limnology》 2025年第6期1688-1708,共21页
Deep learning(DL)has become a crucial technique for predicting the El Niño-Southern Oscillation(ENSO)and evaluating its predictability.While various DL-based models have been developed for ENSO predictions,many f... Deep learning(DL)has become a crucial technique for predicting the El Niño-Southern Oscillation(ENSO)and evaluating its predictability.While various DL-based models have been developed for ENSO predictions,many fail to capture the coherent multivariate evolution within the coupled ocean-atmosphere system of the tropical Pacific.To address this three-dimensional(3D)limitation and represent ENSO-related ocean-atmosphere interactions more accurately,a novel this 3D multivariate prediction model was proposed based on a Transformer architecture,which incorporates a spatiotemporal self-attention mechanism.This model,named 3D-Geoformer,offers several advantages,enabling accurate ENSO predictions up to one and a half years in advance.Furthermore,an integrated gradient method was introduced into the model to identify the sources of predictability for sea surface temperature(SST)variability in the eastern equatorial Pacific.Results reveal that the 3D-Geoformer effectively captures ENSO-related precursors during the evolution of ENSO events,particularly the thermocline feedback processes and ocean temperature anomaly pathways on and off the equator.By extending DL-based ENSO predictions from one-dimensional Niño time series to 3D multivariate fields,the 3D-Geoformer represents a significant advancement in ENSO prediction.This study provides details in the model formulation,analysis procedures,sensitivity experiments,and illustrative examples,offering practical guidance for the application of the model in ENSO research. 展开更多
关键词 transformer model 3 D-Geoformer El Niño-Southern Oscillation(ENSO)prediction explainable artificial intelligence(XAI) integrated gradient method
在线阅读 下载PDF
Millimeter-wave modeling based on transformer model for InP high electron mobility transistor
10
作者 ZHANG Ya-Xue ZHANG Ao GAO Jian-Jun 《红外与毫米波学报》 北大核心 2025年第4期534-539,共6页
In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are train... In this paper,the small-signal modeling of the Indium Phosphide High Electron Mobility Transistor(InP HEMT)based on the Transformer neural network model is investigated.The AC S-parameters of the HEMT device are trained and validated using the Transformer model.In the proposed model,the eight-layer transformer encoders are connected in series and the encoder layer of each Transformer consists of the multi-head attention layer and the feed-forward neural network layer.The experimental results show that the measured and modeled S-parameters of the HEMT device match well in the frequency range of 0.5-40 GHz,with the errors versus frequency less than 1%.Compared with other models,good accuracy can be achieved to verify the effectiveness of the proposed model. 展开更多
关键词 transformer model neural network high electron mobility transistor(HEMT) small signal model
在线阅读 下载PDF
超临界翼型流场预测:Transformer与卷积神经网络的结合
11
作者 贺子舟 唐维劭 +2 位作者 王龑 杨韫加 张宇飞 《国防科技大学学报》 北大核心 2026年第1期16-27,共12页
为解决超临界翼型流场快速预测问题,基于当前深度学习流场预测模型的两种主要思路——卷积神经网络和Transformer,提出一种综合结构的深度学习模型,称为TransCNN-FoilNet。该模型能够预测一系列不同厚度的超临界翼型在不同攻角下的流场... 为解决超临界翼型流场快速预测问题,基于当前深度学习流场预测模型的两种主要思路——卷积神经网络和Transformer,提出一种综合结构的深度学习模型,称为TransCNN-FoilNet。该模型能够预测一系列不同厚度的超临界翼型在不同攻角下的流场,相较于基准模型最高可减少79.5%的平均绝对值误差。还针对超临界翼型流场预测模型的训练提出了一种新的组合损失函数,称为加权L1SSIM损失函数。结果表明,该损失函数可以改善对升阻力系数的预测,阻力系数相对误差最多可以减少17.8%。所提出的模型实现了在降低复杂度的同时提升预测准确性和泛化性能,能够为超临界翼型流场的快速可靠预测提供有力支持。 展开更多
关键词 超临界翼型 深度学习 流场预测 transformer模型
在线阅读 下载PDF
基于Transformer的区域整车投放量多属性决策
12
作者 高蕴慧 孙林夫 +1 位作者 吴奇石 蒋志强 《计算机集成制造系统》 北大核心 2026年第1期317-338,共22页
整车制造厂在直营模式下,科学的整车投放决策是提升企业市场竞争力的关键。现有的投放量决策方法主要存在两个局限:①传统人工经验决策方法忽视了数据的时序关联性;②简单神经网络算法虽然考虑了时序性,但未能有效整合区域特征、车型属... 整车制造厂在直营模式下,科学的整车投放决策是提升企业市场竞争力的关键。现有的投放量决策方法主要存在两个局限:①传统人工经验决策方法忽视了数据的时序关联性;②简单神经网络算法虽然考虑了时序性,但未能有效整合区域特征、车型属性、消费价格指数等多维度信息。为此,提出了基于Transformer的区域整车投放量多属性决策(TransMADM)方法。该方法包含两个阶段,预测阶段利用了Transformer模型中的自注意力机制捕捉时序数据的内在关联,将多类型数据嵌入至高维向量空间,构建了综合考虑时序关联性与多维特征的投放量预测模型。决策阶段基于预测结果,引入了语言真值格蕴涵代数,更好地表达决策过程中的不确定性,建立了基于语言值的区域整车多属性决策框架,实现了对整车制造厂多属性决策的有效整合。通过第三方云平台真实数据验证,实验结果表明提出的预测模型相较于广泛应用的神经网络方法LSTM和RNN,在均方误差(MSE)方面分别提高了2.47%和1.25%。通过进一步与经典多属性决策方法的对比,验证了基于语言值的多属性决策方法的结果更符合人类的日常表达。所提方法不仅提升了预测精度,还通过多属性决策方法增强了区域市场动态的适应能力,为整车制造厂提供了更科学的投放量优化方案。 展开更多
关键词 区域整车投放量 transformer模型 多属性决策 注意力机制
在线阅读 下载PDF
基于TCN-Transformer模型的毫米波雷达船舶目标识别方法
13
作者 方梦瑶 张贞凯 《电光与控制》 北大核心 2026年第3期90-95,110,共7页
针对毫米波雷达回波信号的目标分类问题,提出一种基于TCN-Transformer模型的船舶目标识别方法。通过时间积累方式采集数据并对采集的回波信号预处理得到与时间有关的序列数据。由于得到的序列数据为长序列,而传统方法在长序列目标分类... 针对毫米波雷达回波信号的目标分类问题,提出一种基于TCN-Transformer模型的船舶目标识别方法。通过时间积累方式采集数据并对采集的回波信号预处理得到与时间有关的序列数据。由于得到的序列数据为长序列,而传统方法在长序列目标分类时表现较差,为解决此问题,采用TCN和Transformer相结合来提取长序列数据特征。首先,利用改进的卷积结构捕获序列连续特征,然后,利用TCN中因果膨胀卷积来输出局部稳定特征,并通过Transformer来增强模型对长序列数据的建模能力,从而提取序列的全局特征;为解决小数据集情况下深层模型容易出现的过拟合问题,在损失函数中加入弹性权重,改进后的损失函数加快了模型收敛速度;最后,通过仿真实验的结果表明,所提方法在识别准确率方面有较好的表现。 展开更多
关键词 毫米波雷达 TCN-transformer模型 弹性权重损失 目标识别
在线阅读 下载PDF
基于变分模态分解和Transformer模型的轴承故障诊断方法
14
作者 周博 王振华 +4 位作者 韩瑞光 孔斌 谷守奥 唐俊 余涛 《舰船科学技术》 北大核心 2026年第2期179-185,共7页
本文基于XJTU-SY全寿命周期轴承振动数据设计了信号切割与采样方法,构建了包含保持架损坏、内圈损坏和外圈损坏的数据集3类故障状态。并使用变分模态分解(VMD)方法作为信号处理模块,构建了输入序列。最后将序列输入到Transformer模型进... 本文基于XJTU-SY全寿命周期轴承振动数据设计了信号切割与采样方法,构建了包含保持架损坏、内圈损坏和外圈损坏的数据集3类故障状态。并使用变分模态分解(VMD)方法作为信号处理模块,构建了输入序列。最后将序列输入到Transformer模型进行特征提取,再使用MLP分类器对3类故障进行诊断分析,对比了不同模态提取数下模型性能与分类效果。研究结果表明,使用VMD+Transformer的故障诊断模型在识别滚动轴承故障任务方面的准确率最高可达到90.7%。研究验证了Transformer模型在轴承故障信号处理与特征提取应用方面的可能性,可为船舶机械轴承健康管理提供技术支持。 展开更多
关键词 故障诊断 深度学习 振动信号处理 变分模态分解 注意力机制 transformer模型
在线阅读 下载PDF
基于Transformer模型的自动调制识别
15
作者 程石磊 肖飞 +2 位作者 周军 王姗姗 陈庭盈 《通信技术》 2026年第1期23-30,共8页
CNN模型在计算机视觉、自然语言处理、时序信号处理领域取得了显著的效果,而无线信号相比于图像、文本、语音等模态,具有语义表征不足、可辨识度弱的特点,Transformer模型在无线信号处理中能捕捉到信号中的长距离依赖关系,可通过自注意... CNN模型在计算机视觉、自然语言处理、时序信号处理领域取得了显著的效果,而无线信号相比于图像、文本、语音等模态,具有语义表征不足、可辨识度弱的特点,Transformer模型在无线信号处理中能捕捉到信号中的长距离依赖关系,可通过自注意力机制获取全局特征,提高识别的准确性。通过综述重点分析了基于Transformer模型的无线信号处理方法,并利用Grad-CAM模型进行可视化,一定程度上验证了Transformer模型在调制识别任务中相较于CNN的优越性。 展开更多
关键词 调制识别 transformer模型 机器学习 Grad-CAM模型 无线信号处理
在线阅读 下载PDF
Enhancing Multi-Class Cyberbullying Classification with Hybrid Feature Extraction and Transformer-Based Models
16
作者 Suliman Mohamed Fati Mohammed A.Mahdi +4 位作者 Mohamed A.G.Hazber Shahanawaj Ahamad Sawsan A.Saad Mohammed Gamal Ragab Mohammed Al-Shalabi 《Computer Modeling in Engineering & Sciences》 2025年第5期2109-2131,共23页
Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or... Cyberbullying on social media poses significant psychological risks,yet most detection systems over-simplify the task by focusing on binary classification,ignoring nuanced categories like passive-aggressive remarks or indirect slurs.To address this gap,we propose a hybrid framework combining Term Frequency-Inverse Document Frequency(TF-IDF),word-to-vector(Word2Vec),and Bidirectional Encoder Representations from Transformers(BERT)based models for multi-class cyberbullying detection.Our approach integrates TF-IDF for lexical specificity and Word2Vec for semantic relationships,fused with BERT’s contextual embeddings to capture syntactic and semantic complexities.We evaluate the framework on a publicly available dataset of 47,000 annotated social media posts across five cyberbullying categories:age,ethnicity,gender,religion,and indirect aggression.Among BERT variants tested,BERT Base Un-Cased achieved the highest performance with 93%accuracy(standard deviation across±1%5-fold cross-validation)and an average AUC of 0.96,outperforming standalone TF-IDF(78%)and Word2Vec(82%)models.Notably,it achieved near-perfect AUC scores(0.99)for age and ethnicity-based bullying.A comparative analysis with state-of-the-art benchmarks,including Generative Pre-trained Transformer 2(GPT-2)and Text-to-Text Transfer Transformer(T5)models highlights BERT’s superiority in handling ambiguous language.This work advances cyberbullying detection by demonstrating how hybrid feature extraction and transformer models improve multi-class classification,offering a scalable solution for moderating nuanced harmful content. 展开更多
关键词 Cyberbullying classification multi-class classification BERT models machine learning TF-IDF Word2Vec social media analysis transformer models
在线阅读 下载PDF
Combining transformer and 3DCNN models to achieve co-design of structures and sequences of antibodies in a diffusional manner
17
作者 Yue Hu Feng Tao +3 位作者 Jiajie Xu Wen-Jun Lan Jing Zhang Wei Lan 《Journal of Pharmaceutical Analysis》 2025年第6期1406-1408,共3页
AlphaPanda(AlphaFold2[1]inspired protein-specific antibody design in a diffusional manner)is an advanced algorithm for designing complementary determining regions(CDRs)of the antibody targeted the specific epitope,com... AlphaPanda(AlphaFold2[1]inspired protein-specific antibody design in a diffusional manner)is an advanced algorithm for designing complementary determining regions(CDRs)of the antibody targeted the specific epitope,combining transformer[2]models,3DCNN[3],and diffusion[4]generative models. 展开更多
关键词 advanced algorithm diffusion generative models dcnn epitope targeting antibody design complementary determining regions complementary determining regions cdrs transformer models
在线阅读 下载PDF
Multi⁃Step Short⁃Term Traffic Flow Prediction of Urban Road Network Based on ISTA⁃Transformer Model
18
作者 Leyao Xiao Qian Chen 《Journal of Harbin Institute of Technology(New Series)》 2025年第6期1-14,共14页
Short⁃term traffic flow prediction plays a crucial role in the planning of intelligent transportation systems.Nowadays,there is a large amount of traffic flow data generated from the monitoring devices of urban road n... Short⁃term traffic flow prediction plays a crucial role in the planning of intelligent transportation systems.Nowadays,there is a large amount of traffic flow data generated from the monitoring devices of urban road networks,which contains road network traffic information with high application value.In this study,an improved spatio⁃temporal attention transformer model(ISTA⁃transformer model)is proposed to provide a more accurate method for predicting multi⁃step short⁃term traffic flow based on monitoring data.By embedding a temporal attention layer and a spatial attention layer in the model,the model learns the relationship between traffic flows at different time intervals and different geographic locations,and realizes more accurate multi⁃step short⁃time flow prediction.Finally,we validate the superiority of the model with monitoring data spanning 15 days from 620 monitoring points in Qingdao,China.In the four time steps of prediction,the MAPE(Mean Absolute Percentage Error)values of ISTA⁃transformers prediction results are 0.22,0.29,0.37,and 0.38,respectively,and its prediction accuracy is usually better than that of six baseline models(Transformer,GRU,CNN,LSTM,Seq2Seq and LightGBM),which indicates that the proposed model in this paper always has a better ability to explain the prediction results with the time steps in the multi⁃step prediction. 展开更多
关键词 urban road network traffic flow prediction spatio⁃temporal feature ISTA⁃transformer model
在线阅读 下载PDF
一种改进扩散Transformer的文本到图像生成方法
19
作者 童至慧 孙立洋 +1 位作者 董雪 许硕贵 《计算机与现代化》 2026年第1期76-82,共7页
扩散Transformer模型是当前文本到图像生成任务的主流模型,但其往往存在图像结构性刻画较差、高分辨率图像训练代价大等问题,针对这些问题,本文提出一种改进的扩散Transformer模型U-CrossDiT。考虑图像数据的二维位置特征,本文首先引入... 扩散Transformer模型是当前文本到图像生成任务的主流模型,但其往往存在图像结构性刻画较差、高分辨率图像训练代价大等问题,针对这些问题,本文提出一种改进的扩散Transformer模型U-CrossDiT。考虑图像数据的二维位置特征,本文首先引入二维的旋转位置编码来增强模型对图像二维结构位置信息的理解;同时,改进注意力机制和网络结构,进一步提升模型能力。为解决高分辨率图像生成时训练代价大的问题,本文引入位置内插的方式,利用二维旋转位置编码的位置外推能力,显著降低从低分辨率到高分辨率训练的计算成本。该模型在MS-COCO数据上的自动评估指标和人工评估结论均明显优于其他文本到图像的生成模型,同时消融实验验证了二维旋转位置编码和网络结构改进的有效性,结果表明本文模型在生成图像的画面质量、主体结构刻画、图像与文本输入的相关性等层面都具备明显的效果优势。 展开更多
关键词 文本到图像生成 扩散模型 transformer模型 位置编码 深度学习
在线阅读 下载PDF
基于贝叶斯参数优化Transformer时间段分割模型的超短期风电功率预测方法
20
作者 江善和 徐小艳 +1 位作者 涂亮 陈文胜 《太阳能学报》 北大核心 2026年第1期593-603,共11页
针对风电场数据具有复杂的非线性关系,且难以捕捉长距离依赖关系的问题,引入时间段分割策略,提出一种新的基于贝叶斯参数优化Transformer时间段分割模型的超短期风电功率预测方法(PBY-Trans)。该方法采用时间段分割技术分割风电场数据... 针对风电场数据具有复杂的非线性关系,且难以捕捉长距离依赖关系的问题,引入时间段分割策略,提出一种新的基于贝叶斯参数优化Transformer时间段分割模型的超短期风电功率预测方法(PBY-Trans)。该方法采用时间段分割技术分割风电场数据为子序列,将其作为Transformer模型编码器的输入,从而更好地适应时间序列的非线性特征;使用贝叶斯算法搜索Transformer模型参数的最优配置,实现模型性能提升,进一步提高预测准确度。采用Bengaluru某风电场数据集对所提方法的预测性能进行比较验证,相较于SVM、RNN、Informer、LSTM、GRU和TCN模型,所提PBY-Trans方法在平均绝对误差(MAE)分别下降33.56%、59.75%、47.27%、32.34%、40.46%和27.71%,均方根误差(RMSE)分别下降68.99%、37.05%、27.60%、14.43%、16.42%和12.29%。结果表明,该文提出的Transform时间段分割模型的风电功率预测方法能够进一步提高预测精度,鲁棒性能得到有效提升。 展开更多
关键词 风电功率 预测模型 贝叶斯优化 transformer模型 时间段分割
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部