期刊文献+
共找到8,316篇文章
< 1 2 250 >
每页显示 20 50 100
基于跨尺度Transformer全局-局部交互的遥感图像连续超分辨率
1
作者 熊承义 王薇 高志荣 《中南民族大学学报(自然科学版)》 2026年第3期353-363,共11页
遥感图像连续超分辨率技术对多尺度地物识别、变化检测与语义分析等任务至关重要.然而,现有方法在复杂背景干扰和大尺度跨度场景下,难以兼顾局部细节重建与全局语义一致性.为此,提出了一种跨尺度Transformer全局-局部交互的遥感图像连... 遥感图像连续超分辨率技术对多尺度地物识别、变化检测与语义分析等任务至关重要.然而,现有方法在复杂背景干扰和大尺度跨度场景下,难以兼顾局部细节重建与全局语义一致性.为此,提出了一种跨尺度Transformer全局-局部交互的遥感图像连续超分辨率方法.设计了结合上下文注意力机制(CAM)的多尺度参数生成器,使之选择性地增强不同尺度下的局部高频特征;构建了一种跨尺度Transformer交互模块,利用自注意力机制实现全局语义建模与局部特征融合;提出双分支全局-局部解析器,联合优化坐标相关的位置编码与上下文依赖的语义解码,提升不同缩放倍数下的重建精度.实验结果表明:所提出方法相比先进的连续超分辨率方法可获得近0.17dB的PSNR增益. 展开更多
关键词 连续超分辨率 遥感图像 自注意力机制 transformer网络 全局-局部交互
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测 被引量:1
2
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
3
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformER Kolmogorov-Arnold网络
在线阅读 下载PDF
基于PyConv-Transformer的锂离子电池剩余寿命预测
4
作者 吴忠强 吴江浩 《计量学报》 北大核心 2026年第1期102-110,共9页
锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL... 锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL预测模型,选取容量作为健康因子,利用金字塔卷积网络中不同大小的卷积核提取容量序列的特征信息,利用Transformer中的多头注意力机制进一步学习序列的时序特征。采用加权Huber损失函数,提高模型的鲁棒性;采用Dropout技术,提高模型的泛化能力,防止训练过程中出现过拟合。将所提预测模型在NASA和CALCE数据集上实验,并与其他模型比较。实验结果表明,所提模型的预测精度更高,在NASA和CALCE数据集上的相对误差分别为0.008 6、0.019 3;平均绝对误差分别为0.011 5、0.012 6;均方根误差分别为0.017 3、0.018 9。 展开更多
关键词 电学计量 剩余使用寿命 锂电池容量 金字塔卷积网络 transformER 加权Huber损失函数 DROPOUT
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
5
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测 被引量:1
6
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
Transformer网络在集装箱箱号自动识别中的应用
7
作者 张明 涂昊 +1 位作者 程文明 杜润 《机械设计与制造》 北大核心 2026年第3期206-209,214,共5页
集装箱作为现代物流中最重要的载体之一,其箱号的自动识别技术对于提高集装箱码头的自动化和信息化程度起着至关重要的作用。然而,现有的研究并不能够满足码头实时、准确地识别集装箱箱号的要求。因此,我们提出了一种轻量化的箱号识别... 集装箱作为现代物流中最重要的载体之一,其箱号的自动识别技术对于提高集装箱码头的自动化和信息化程度起着至关重要的作用。然而,现有的研究并不能够满足码头实时、准确地识别集装箱箱号的要求。因此,我们提出了一种轻量化的箱号识别算法。该方法分为两个模块:定位模块与识别模块。在定位模块中,基于YOLO v3算法进行改进,提出了一个新的轻量化定位网络—swift-YOLO;在识别模块中,设计了基于Transformer的字符识别网络对箱号进行识别。实验结果表明,所提方法识别成功率达到了98.3%,且单帧识别时间仅为20ms,显著优于现有的最佳结果。 展开更多
关键词 深度学习 集装箱箱号 字符识别 目标检测 transformer网络
在线阅读 下载PDF
基于Lasso-Transformer神经网络模型的海南省碳排放预测
8
作者 金雨洁 金晓斌 +3 位作者 洪星明 张舟遥 韩博 周寅康 《环境科学》 北大核心 2026年第2期781-792,共12页
海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响... 海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响因素进行分解和筛选,并纳入4种Lasso-Transformer神经网络模型对2024~2030年海南省碳排放量进行预测.结果表明:①海南省2004~2023年碳汇总量变化趋势较为平稳,净碳排放量变化趋势与碳源总量基本保持一致.②海南省碳排放的主要影响因素由强到弱分别为:能源强度、土地碳排放强度、经济效率、土地利用结构、人口规模和土地利用效率.③通过模型优选,利用Lasso-PatchTST模型对海南省2024~2030年碳排放量及各影响因素进行预测,得出2030年的碳排放量为4345.53万t,土地利用效率因素增长速度最快,人口规模因素增长速度最慢.通过优化产业结构、提升资源利用效率并加强生态系统保护,可以促进海南省减排降碳与经济协调发展.研究结果可为海南省低碳经济发展提供决策参考. 展开更多
关键词 碳排放 Lasso-transformer神经网络模型 海南省 LMDI模型 预测
原文传递
多尺度Transformer结合残差卷积的管道微泄漏孔径识别
9
作者 王新颖 田豪杰 +2 位作者 蒋婷婷 江志伟 陈俨 《安全与环境学报》 北大核心 2026年第3期1025-1035,共11页
为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution co... 为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution combined model,MS Transformer-Residual)来预测微泄漏孔径。该模型通过模拟燃气管道系统采集不同孔径泄漏下的声发射信号,利用残差卷积模块提取局部时序特征,并采用多尺度Transformer自注意力机制建模全局信号依赖关系,使用五折交叉验证及独立测试集评估模型性能,并与三种消融基准模型进行对比。结果表明:MS Transformer-Residual模型的微泄漏孔径识别准确率达99.96%,与CNN、CNN-Transformer、残差CNN-Transformer模型相比,模型的最高准确率至少提升4.53百分点。研究证实多尺度特征融合策略显著提升了毫米级泄漏孔径的辨识精度,为工业管道健康监测提供了新的解决方案。 展开更多
关键词 安全工程 多尺度学习 transformER 微泄漏检测 残差卷积神经网络
原文传递
An Image Inpainting Approach Based on Parallel Dual-Branch Learnable Transformer Network
10
作者 Rongrong Gong Tingxian Zhang +2 位作者 Yawen Wei Dengyong Zhang Yan Li 《Computers, Materials & Continua》 2025年第10期1221-1234,共14页
Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of im... Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of image in tasks and the growth of data scale,existing deep learning methods still have some limitations.For example,they lack the ability to capture long-range dependencies and their performance in handling multi-scale image structures is suboptimal.To solve this problem,the paper proposes an image inpainting method based on the parallel dual-branch learnable Transformer network.The encoder of the proposed model generator consists of a dual-branch parallel structure with stacked CNN blocks and Transformer blocks,aiming to extract global and local feature information from images.Furthermore,a dual-branch fusion module is adopted to combine the features obtained from both branches.Additionally,a gated full-scale skip connection module is proposed to further enhance the coherence of the inpainting results and alleviate information loss.Finally,experimental results from the three public datasets demonstrate the superior performance of the proposed method. 展开更多
关键词 Artificial intelligence image inpainting transformer network dual-branch fusion gated full-scale skip connection
在线阅读 下载PDF
基于Transformer的胸部CT图像肺癌分割系统的设计
11
作者 马凤英 宗彦辰 +1 位作者 王智 付承彩 《齐鲁工业大学学报》 2026年第1期18-25,共8页
随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出... 随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出了TransUnet-SE分割网络,此网络是基于残差感知的Transformer的U型肺癌区域分割网络进行改进,将SENet注意力机制嵌入解码器上采样过程,通过“压缩、激励、尺度调整”三步流程精准缓解多通道特征差异。为验证模型的泛化性能,首先在公共医学数据集Synapse多脏器CT数据集上进行了实验验证,然后在Lung-PET-CT-Dx数据集上选取肺癌患者的CT图像进行实验,评估所提模型与先进模型的性能并进行了比较。实验结果表明,Dice相似系数达到了86.05%,并基于PyQt5设计胸部CT图像肺癌辅助分割系统调用TransUnet-SE模型权重实现分割功能,为临床诊断提供支持。 展开更多
关键词 胸部CT图像 transformER 肺癌分割 系统设计 U型网络
在线阅读 下载PDF
基于Takens-Transformer与GCN的DDoS攻击检测
12
作者 邓钰洋 芦天亮 +2 位作者 李知皓 孟昊阳 李锦儒 《计算机应用研究》 北大核心 2026年第2期567-576,共10页
针对现有分布式拒绝服务(DDoS)攻击检测适应性弱、计算成本高的问题,提出基于时间延迟嵌入和图卷积网络的Transformer模型(TDE-TGCN)。该模型利用Takens定理将网络流量建模为动力学系统,通过时间延迟嵌入揭示DDoS攻击对流量非线性特征... 针对现有分布式拒绝服务(DDoS)攻击检测适应性弱、计算成本高的问题,提出基于时间延迟嵌入和图卷积网络的Transformer模型(TDE-TGCN)。该模型利用Takens定理将网络流量建模为动力学系统,通过时间延迟嵌入揭示DDoS攻击对流量非线性特征的影响;采用Transformer模型将流量序列映射至高维空间,通过多头注意力机制捕捉突发性和全局关联;结合图卷积网络挖掘拓扑信息及跨节点攻击模式。在CIC-IDS2017等数据集和特征变异模拟的未知攻击场景下,TDE-TGCN检测准确率达到98.7%,误报率降低至1.2%,计算效率提升35%;消融实验验证了各组件对模型性能的显著贡献。该研究从动力学系统角度重新审视网络流量特征,提出理论与实践相结合的检测框架,为复杂网络环境下的DDoS攻击检测提供了有效技术方案。 展开更多
关键词 网络流量 DDOS攻击检测 Takens定理 图卷积网络 transformER
在线阅读 下载PDF
基于卷积与交叉条纹Transformer混合编码器的云检测方法
13
作者 吝欣然 王倩 +3 位作者 秦建峰 杨维发 颜国跑 袁文波 《自然资源遥感》 北大核心 2026年第1期75-83,共9页
云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度... 云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度和高度也各不相同。针对云形态复杂多变的特点,该文设计了一种基于卷积与Transformer混合编码器的云检测模型UCT-Net。UCT-Net基于U型网络结构,在编码器部分融合卷积和Transformer编码器来联合提取卫星云图的特征。同时,针对云层特征的多样性,该文设计了一种基于交叉条纹的Transformer模块,以增强对不同形态云的适应性。此外,还提出了一种交叉条纹与卷积融合模块(cross stripe encoder and conv encoder merge module,CCM),有效促进了卷积编码器与交叉条纹Transformer编码器的深度融合。利用GF-1和GF-2卫星数据来源的GF12MS WHU数据集以及Google Earth提供的HRC WHU数据集进行了评估和测试,实验结果表明,UCT-Net在GF12MS WHU和HRC WHU数据集上的精确率分别为92.70%和94.20%,均优于经典语义分割算法,展现了其在云检测任务中的优越性能。 展开更多
关键词 云检测 遥感图像处理 transformER 卷积神经网络 深度学习
在线阅读 下载PDF
非高斯噪声下基于Transformer的多用户频谱感知算法
14
作者 曹秀俐 朱晓梅 +1 位作者 李想 杨家辉 《计算机应用与软件》 北大核心 2026年第2期271-277,330,共8页
以模型驱动的频谱感知算法难以精确模拟复杂的通信环境所以频谱感知准确性不高,同时由于算法复杂度高因而系统实时性较低。针对上述问题,将深度学习与频谱感知相结合,提出Alpha噪声下基于Transformer的频谱感知模型。首先对观测数据进... 以模型驱动的频谱感知算法难以精确模拟复杂的通信环境所以频谱感知准确性不高,同时由于算法复杂度高因而系统实时性较低。针对上述问题,将深度学习与频谱感知相结合,提出Alpha噪声下基于Transformer的频谱感知模型。首先对观测数据进行采集并做分数低阶矩(FLOM)处理,随后将数据送入谱卷积层进行局部特征粗提取,最后通过具有多头注意力机制模块的Transformer网络完成最终决策。仿真结果表明,即使在低广义信噪比(GSNR)的情况下,该算法依然能够增强信号的关联性,加强网络并行运算的能力,表现出优越的频谱感知性能。 展开更多
关键词 频谱感知 分数低阶矩 transformer网络 非高斯噪声
在线阅读 下载PDF
有效诊断Vision Transformer网络的滚动轴承故障诊断方法
15
作者 罗志勇 李明周 董鑫 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期146-155,共10页
针对滚动轴承故障诊断中特征提取不完整和诊断效率低的问题,提出了有效诊断Vision Transformer(EDViT)网络。采用基于峰度的加权融合策略,合并传感器信息;利用短时傅里叶变换,将融合后的信号转换为时频图像;依次应用EDViT的双重注意卷... 针对滚动轴承故障诊断中特征提取不完整和诊断效率低的问题,提出了有效诊断Vision Transformer(EDViT)网络。采用基于峰度的加权融合策略,合并传感器信息;利用短时傅里叶变换,将融合后的信号转换为时频图像;依次应用EDViT的双重注意卷积模块和双分支补丁视觉变换模块来提取局部和全局特征,使用分类器进行故障分类。实验验证在凯斯西储大学轴承数据集上进行。结果表明,EDViT模型具有出色的特征提取能力、快速的收敛速度和较高的诊断准确性。与其他方法的对比表明,EDViT模型具有很强的泛化能力和鲁棒性。 展开更多
关键词 有效诊断Vision transformer网络 滚动轴承 故障诊断
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
16
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
Multimodal Trajectory Generation for Robotic Motion Planning Using Transformer-Based Fusion and Adversarial Learning
17
作者 Shtwai Alsubai Ahmad Almadhor +3 位作者 Abdullah Al Hejaili Najib Ben Aoun Tahani Alsubait Vincent Karovic 《Computer Modeling in Engineering & Sciences》 2026年第2期848-869,共22页
In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we devel... In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we develop a multimodal framework that integrates symbolic task reasoning with continuous trajectory generation.The approach employs transformer models and adversarial training to map high-level intent to robotic motion.Information from multiple data sources,such as voice traits,hand and body keypoints,visual observations,and recorded paths,is integrated simultaneously.These signals are mapped into a shared representation that supports interpretable reasoning while enabling smooth and realistic motion generation.Based on this design,two different learning strategies are investigated.In the first step,grammar-constrained Linear Temporal Logic(LTL)expressions are created from multimodal human inputs.These expressions are subsequently decoded into robot trajectories.The second method generates trajectories directly from symbolic intent and linguistic data,bypassing an intermediate logical representation.Transformer encoders combine multiple types of information,and autoregressive transformer decoders generate motion sequences.Adding smoothness and speed limits during training increases the likelihood of physical feasibility.To improve the realism and stability of the generated trajectories during training,an adversarial discriminator is also included to guide them toward the distribution of actual robot motion.Tests on the NATSGLD dataset indicate that the complete system exhibits stable training behaviour and performance.In normalised coordinates,the logic-based pipeline has an Average Displacement Error(ADE)of 0.040 and a Final Displacement Error(FDE)of 0.036.The adversarial generator makes substantially more progress,reducing ADE to 0.021 and FDE to 0.018.Visual examination confirms that the generated trajectories closely align with observed motion patterns while preserving smooth temporal dynamics. 展开更多
关键词 Multimodal trajectory generation robotic motion planning transformer networks sensor fusion reinforcement learning generative adversarial networks
在线阅读 下载PDF
基于联邦学习和Transformer的工业互联网入侵检测方法
18
作者 王凯鹏 王军 付强 《沈阳化工大学学报》 2026年第2期200-210,共11页
提出了一种新的入侵检测方法,用来检测针对工业互联网的网络威胁.利用卷积神经网络和门控循环单元,结合Transformer模型的核心模块Transformer Block构建了一个新的深度学习入侵检测模型.同时为了保护本地客户端数据隐私并满足工业网络... 提出了一种新的入侵检测方法,用来检测针对工业互联网的网络威胁.利用卷积神经网络和门控循环单元,结合Transformer模型的核心模块Transformer Block构建了一个新的深度学习入侵检测模型.同时为了保护本地客户端数据隐私并满足工业网络的分布式特点,将新的入侵检测模型融合联邦学习框架,允许多个工业互联网共同构建一个综合性的入侵检测模型,提高了针对工业网络攻击检测的准确率.在真实工业数据集上进行的实验证明了提出的模型在工业网络环境下的检测准确率高于现有方法,在检测工业互联网威胁方面有较好的效果. 展开更多
关键词 工业互联网 入侵检测 联邦学习 神经网络 transformER
在线阅读 下载PDF
基于GRU-Transformer与随机矩阵的机动群目标跟踪
19
作者 陈烨 梁苑 +1 位作者 李银伢 戚国庆 《兵工学报》 北大核心 2026年第1期282-295,共14页
针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更... 针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更新,实现群目标质心与扩展外形的联合跟踪。基于机动群目标时间序列量测数据,提取群目标运动多项特征参数,输入所提深度神经网络,实现机动群目标运动模型(匀速(Constant Velocity,CV)模型、匀加速(Constant Acceleration,CA)模型、CS模型)的精准辨别,若目标模型为CS运动模型,同时输出机动频率参数α的精确估计结果。运用随机矩阵群目标跟踪理论,提出一种基于贝叶斯状态估计架构的椭圆机动群目标跟踪方法。仿真实验结果分析表明:新方法可实现对机动椭圆群目标的精确稳健跟踪,相较于传统交互式多模型群目标跟踪方法,跟踪精度有显著提升。 展开更多
关键词 机动群目标跟踪 注意力GRU-transformer深度神经网络 群目标跟踪 运动模型辨识 机动频率参数估计
在线阅读 下载PDF
基于TCN特征提取及LSTM-Transformer的轴承剩余寿命预测方法
20
作者 王志国 张新元 +1 位作者 肖子鸣 钱东海 《机床与液压》 北大核心 2026年第4期37-44,共8页
针对滚动轴承剩余使用寿命(RUL)预测中存在的单纯局部时序特征预测或单纯全局退化趋势预测不足的问题,提出一种融合时间卷积网络(TCN)特征提取与LSTM-Transformer特征融合的预测模型。基于时间卷积网络(TCN)构建原始振动信号特征提取器... 针对滚动轴承剩余使用寿命(RUL)预测中存在的单纯局部时序特征预测或单纯全局退化趋势预测不足的问题,提出一种融合时间卷积网络(TCN)特征提取与LSTM-Transformer特征融合的预测模型。基于时间卷积网络(TCN)构建原始振动信号特征提取器,通过膨胀因果卷积同步捕获多尺度退化特征,有效避免传统时频变换导致的相位信息损失;构建LSTM与Transformer的双流特征融合模型,其中LSTM分支通过门控机制捕捉局部细粒度时序演变模式,Transformer分支利用Transformer编码器的自注意力机制建立跨周期全局退化趋势;最后,设计改进型通道注意力动态融合模块,基于退化阶段的特征分布熵值自适应调整LSTM与Transformer双分支的权重分配,显著增强关键退化特征的表达能力。为验证模型的有效性,在XJTU-SY和PHM2012轴承数据集上与LSTM、Transformer及CNN-LSTM进行对比。结果表明:在XJTU-SY数据集上,所提模型的平均绝对误差(MAE)为0.0189,均方根误差(RMSE)为0.0230,其MAE相比LSTM、Transformer和CNN-LSTM模型分别降低了70.74%、82.20%和77.36%,其RMSE分别降低了71.03%、79.57%和75.10%;在PHM2012数据集上,所提模型的MAE为0.0467,RMSE为0.0566,其MAE相比LSTM、Transformer和CNN-LSTM模型分别降低了18.21%、17.05%和31.72%,其RMSE分别降低了18.32%、19.37%和22.03%。所提模型的预测精度更高,并具有较好的泛化性。 展开更多
关键词 剩余使用寿命 时间卷积网络 长短时记忆神经网络 transformer模型 通道注意力
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部