期刊文献+
共找到8,124篇文章
< 1 2 250 >
每页显示 20 50 100
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测 被引量:1
1
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
基于PyConv-Transformer的锂离子电池剩余寿命预测
2
作者 吴忠强 吴江浩 《计量学报》 北大核心 2026年第1期102-110,共9页
锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL... 锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL预测模型,选取容量作为健康因子,利用金字塔卷积网络中不同大小的卷积核提取容量序列的特征信息,利用Transformer中的多头注意力机制进一步学习序列的时序特征。采用加权Huber损失函数,提高模型的鲁棒性;采用Dropout技术,提高模型的泛化能力,防止训练过程中出现过拟合。将所提预测模型在NASA和CALCE数据集上实验,并与其他模型比较。实验结果表明,所提模型的预测精度更高,在NASA和CALCE数据集上的相对误差分别为0.008 6、0.019 3;平均绝对误差分别为0.011 5、0.012 6;均方根误差分别为0.017 3、0.018 9。 展开更多
关键词 电学计量 剩余使用寿命 锂电池容量 金字塔卷积网络 transformER 加权Huber损失函数 DROPOUT
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
3
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
4
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformER Kolmogorov-Arnold网络
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
5
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
An Image Inpainting Approach Based on Parallel Dual-Branch Learnable Transformer Network
6
作者 Rongrong Gong Tingxian Zhang +2 位作者 Yawen Wei Dengyong Zhang Yan Li 《Computers, Materials & Continua》 2025年第10期1221-1234,共14页
Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of im... Image inpainting refers to synthesizing missing content in an image based on known information to restore occluded or damaged regions,which is a typical manifestation of this trend.With the increasing complexity of image in tasks and the growth of data scale,existing deep learning methods still have some limitations.For example,they lack the ability to capture long-range dependencies and their performance in handling multi-scale image structures is suboptimal.To solve this problem,the paper proposes an image inpainting method based on the parallel dual-branch learnable Transformer network.The encoder of the proposed model generator consists of a dual-branch parallel structure with stacked CNN blocks and Transformer blocks,aiming to extract global and local feature information from images.Furthermore,a dual-branch fusion module is adopted to combine the features obtained from both branches.Additionally,a gated full-scale skip connection module is proposed to further enhance the coherence of the inpainting results and alleviate information loss.Finally,experimental results from the three public datasets demonstrate the superior performance of the proposed method. 展开更多
关键词 Artificial intelligence image inpainting transformer network dual-branch fusion gated full-scale skip connection
在线阅读 下载PDF
基于ResNet-GCN-Transformer的多时间粒度地铁短时客流预测
7
作者 杜姿晨 郑长江 +2 位作者 郑树康 马庚华 陆野 《交通运输工程与信息学报》 2026年第1期64-79,共16页
【背景】随着城镇化进程的加快,城市轨道交通压力越来越大,准确的地铁客流预测对于优化列车时刻表、减少高峰时段拥堵、提高地铁系统服务水平具有重要的作用。【目标】综合考虑地铁客流的时空特性,充分利用多时间粒度客流数据,提高较大... 【背景】随着城镇化进程的加快,城市轨道交通压力越来越大,准确的地铁客流预测对于优化列车时刻表、减少高峰时段拥堵、提高地铁系统服务水平具有重要的作用。【目标】综合考虑地铁客流的时空特性,充分利用多时间粒度客流数据,提高较大时间粒度客流预测任务的准确性。【方方法法】分析不同时间粒度的地铁客流数据之间的相关性,确定多时间粒度融合机制。提出一种Resnet-GCN-Transformer模型:利用图卷积神经网络(Graph Convolutional Neural Network,GCN)提取不同站点客流的空间相关性;利用残差块构建深度卷积神经网络,对不同时间粒度的数据从小到大进行聚合,得到多时间粒度的多通道特征图;利用Transformer Encoder对客流数据的长时间依赖特性进行建模,并通过多个由全连接层构成的预测头输出预测结果。同时基于Optuna框架进行超参数优化,得到最优的超参数组合。【数据】对杭州市地铁刷卡数据集进行降噪处理并构建不同时间粒度的地铁客流数据集,基于10 min和30 min的数据集对模型进行验证。【结果】在两组不同目标时间粒度的数据集上,所提模型的平均绝对百分比误差分别为12.62%和10.61%,均优于6个基线模型,表明融合多时间粒度的特征在地铁客流预测任务中的重要性,模型能够充分捕捉多时间粒度的客流特征,地铁站点的连通关系,以及客流数据的时间依赖关系,从而显著提升客流预测效果。 展开更多
关键词 城市交通 客流预测 多时间粒度 图卷积神经网络 残差网络 transformER
在线阅读 下载PDF
融合Transformer和Inception的网络入侵检测研究
8
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformER INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于Lasso-Transformer神经网络模型的海南省碳排放预测
9
作者 金雨洁 金晓斌 +3 位作者 洪星明 张舟遥 韩博 周寅康 《环境科学》 北大核心 2026年第2期781-792,共12页
海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响... 海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响因素进行分解和筛选,并纳入4种Lasso-Transformer神经网络模型对2024~2030年海南省碳排放量进行预测.结果表明:①海南省2004~2023年碳汇总量变化趋势较为平稳,净碳排放量变化趋势与碳源总量基本保持一致.②海南省碳排放的主要影响因素由强到弱分别为:能源强度、土地碳排放强度、经济效率、土地利用结构、人口规模和土地利用效率.③通过模型优选,利用Lasso-PatchTST模型对海南省2024~2030年碳排放量及各影响因素进行预测,得出2030年的碳排放量为4345.53万t,土地利用效率因素增长速度最快,人口规模因素增长速度最慢.通过优化产业结构、提升资源利用效率并加强生态系统保护,可以促进海南省减排降碳与经济协调发展.研究结果可为海南省低碳经济发展提供决策参考. 展开更多
关键词 碳排放 Lasso-transformer神经网络模型 海南省 LMDI模型 预测
原文传递
一种基于多层融合-CNN-Transformer的防火切断阀故障诊断模型
10
作者 何阳 熊晓燕 +2 位作者 王伟杰 李翔宇 兰媛 《机电工程》 北大核心 2026年第2期269-279,共11页
防火切断阀作为飞机液压系统中的关键组件,一旦发生堵塞或阀芯偏移等故障,会使主回路供油不足、压力降低,导致液压负载元件故障,造成严重后果。因此,提出了一种基于多层融合-卷积神经网络(CNN)-Transformer的模型,用于防火切断阀的故障... 防火切断阀作为飞机液压系统中的关键组件,一旦发生堵塞或阀芯偏移等故障,会使主回路供油不足、压力降低,导致液压负载元件故障,造成严重后果。因此,提出了一种基于多层融合-卷积神经网络(CNN)-Transformer的模型,用于防火切断阀的故障诊断。首先,由于切断阀出口处缺乏压力测点,无法利用压差信号进行故障诊断,需采集三轴加速度信号并对其进行特征层预处理;然后,将处理好的数据输入至CNN-Transformer网络进行了训练与分类,CNN的小卷积层能够有效提取局部特征,Transformer则能够对全局特征进行捕捉;最后,针对发动机泵和增压泵等其他元件的振动干扰,利用Dempster-Shafer(DS)证据理论对位于切断阀入口处和出口处的两个加速度传感器的训练结果进行了决策层融合,以提高最终诊断的准确性和可靠性;在搭建的飞机液压系统试验台上对基于多层融合-CNN-Transformer的防火切断阀的故障诊断方法进行了实验验证,并与现有主流方法进行了对比。研究结果表明:基于多层融合-CNN-Transformer的防火切断阀的故障诊断方法在防火切断阀故障诊断中表现出最高的准确率,实验数据在阀芯开口为70%、80%、90%和100%的工况下的平均识别准确率达到99.5%。该方法可为飞行器液压系统中关键元件的智能诊断提供一种高可靠性的技术路线。 展开更多
关键词 防火切断阀 故障诊断 卷积神经网络 transformER Dempster-Shafer(DS)证据理论 多层融合模型
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
11
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
融合KAN与Transformer的分心驾驶行为增强检测模型
12
作者 陈万志 于南洋 范兴杰 《安全与环境学报》 北大核心 2026年第1期88-99,共12页
分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kol... 分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kolmogorov-Arnold网络,通过有理函数逼近与分组参数共享减少参数量,增强微动作特征的提取;其次,采用多尺度扩张注意力机制,通过滑动窗口稀疏采样与渐进扩张率分配,实现局部细节感知与长程上下文建模的协同优化;最后,通过训练优化模型实现分心驾驶行为的分类检测。试验结果表明,所提模型在典型数据集上检测精度达92.3%(较基线提升8.5百分点),实时速度为45帧/s,遮挡召回率提升11.7百分点。所提模型在平衡检测精度的同时实现了轻量化设计,满足智能驾驶安全预警中分心驾驶行为的实时检测需求。 展开更多
关键词 安全工程 驾驶安全 Kolmogorov-Arnold网络 transformer模型 分组共享 多尺度扩张注意力
原文传递
基于条件生成对抗网络和Vision Transformer的胎儿颅脑超声标准切面识别方法
13
作者 李惠莲 林艺榕 +1 位作者 刘中华 柳培忠 《临床超声医学杂志》 2026年第2期164-169,共6页
胎儿颅脑超声检查是产前常规筛查中至关重要的一环,准确识别标准切面对于评估胎儿大脑发育状况具有重要意义。然而,由于超声图像质量差异和切面获取的复杂性,准确识别标准切面具有较大的挑战性。本文提出了一种基于条件对抗生成网络(CG... 胎儿颅脑超声检查是产前常规筛查中至关重要的一环,准确识别标准切面对于评估胎儿大脑发育状况具有重要意义。然而,由于超声图像质量差异和切面获取的复杂性,准确识别标准切面具有较大的挑战性。本文提出了一种基于条件对抗生成网络(CGAN)和Vision Transformer的胎儿颅脑超声标准切面识别方法,利用CGAN对原始数据进行增强,生成额外的标准切面和非标准切面图像,解决数据不足的问题;同时采用YOLOv9模型对超声图像中的颅骨区域进行自动裁剪,去除无关信息,确保模型专注于关键区域。在分类模型中采用Vision Transformer对所有输入图像进行归一化和尺寸调整,使用了数据增强技术如随机水平或垂直翻转、调整图像对比度、中心裁剪和调整图像饱和度等。结果显示,相较于现有最优模型CSwin Transformer的方法,本文提出的方法在胎儿颅脑超声标准切面识别任务中表现出色,其精确率、召回率、F1分数及准确率分别为92.5%、92.3%、92.4%和93.3%。该方法在提升识别精度方面具有显著优势,为临床超声检查提供了有效技术支持。 展开更多
关键词 条件生成对抗网络 Vision transformer 颅脑超声 胎儿 标准切面识别方法
暂未订购
PT-MFR:一种基于Point Transformer的CAD模型加工特征识别方法
14
作者 何皓辰 方正 +2 位作者 卢政达 肖俊 王颖 《中国科学院大学学报(中英文)》 北大核心 2026年第1期115-124,共10页
加工特征识别在计算机辅助设计(CAD)和制造(CAM)中至关重要,是连接CAD和CAM系统的重要环节。研究者们提出了基于规则和基于学习的2类加工特征识别方法,其中基于学习的方法表现更出色且备受关注。然而,现有识别方法面临着几何信息利用不... 加工特征识别在计算机辅助设计(CAD)和制造(CAM)中至关重要,是连接CAD和CAM系统的重要环节。研究者们提出了基于规则和基于学习的2类加工特征识别方法,其中基于学习的方法表现更出色且备受关注。然而,现有识别方法面临着几何信息利用不足、加工特征定位不精准、实例分割过程复杂等挑战。针对这些问题,提出PT-MFR,一种基于Point Transformer的CAD模型加工特征识别方法,它执行语义分割和实例分割2个任务,分别预测模型每个面的加工特征语义类别并计算面相似度以分割加工特征实例,综合2个任务得到加工特征识别结果。实验结果表明,提出的方法性能优于现有的其他方法。 展开更多
关键词 加工特征识别 点云 神经网络 Point transformer
在线阅读 下载PDF
基于Transformer的胸部CT图像肺癌分割系统的设计
15
作者 马凤英 宗彦辰 +1 位作者 王智 付承彩 《齐鲁工业大学学报》 2026年第1期18-25,共8页
随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出... 随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出了TransUnet-SE分割网络,此网络是基于残差感知的Transformer的U型肺癌区域分割网络进行改进,将SENet注意力机制嵌入解码器上采样过程,通过“压缩、激励、尺度调整”三步流程精准缓解多通道特征差异。为验证模型的泛化性能,首先在公共医学数据集Synapse多脏器CT数据集上进行了实验验证,然后在Lung-PET-CT-Dx数据集上选取肺癌患者的CT图像进行实验,评估所提模型与先进模型的性能并进行了比较。实验结果表明,Dice相似系数达到了86.05%,并基于PyQt5设计胸部CT图像肺癌辅助分割系统调用TransUnet-SE模型权重实现分割功能,为临床诊断提供支持。 展开更多
关键词 胸部CT图像 transformER 肺癌分割 系统设计 U型网络
在线阅读 下载PDF
Multimodal Trajectory Generation for Robotic Motion Planning Using Transformer-Based Fusion and Adversarial Learning
16
作者 Shtwai Alsubai Ahmad Almadhor +3 位作者 Abdullah Al Hejaili Najib Ben Aoun Tahani Alsubait Vincent Karovic 《Computer Modeling in Engineering & Sciences》 2026年第2期848-869,共22页
In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we devel... In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we develop a multimodal framework that integrates symbolic task reasoning with continuous trajectory generation.The approach employs transformer models and adversarial training to map high-level intent to robotic motion.Information from multiple data sources,such as voice traits,hand and body keypoints,visual observations,and recorded paths,is integrated simultaneously.These signals are mapped into a shared representation that supports interpretable reasoning while enabling smooth and realistic motion generation.Based on this design,two different learning strategies are investigated.In the first step,grammar-constrained Linear Temporal Logic(LTL)expressions are created from multimodal human inputs.These expressions are subsequently decoded into robot trajectories.The second method generates trajectories directly from symbolic intent and linguistic data,bypassing an intermediate logical representation.Transformer encoders combine multiple types of information,and autoregressive transformer decoders generate motion sequences.Adding smoothness and speed limits during training increases the likelihood of physical feasibility.To improve the realism and stability of the generated trajectories during training,an adversarial discriminator is also included to guide them toward the distribution of actual robot motion.Tests on the NATSGLD dataset indicate that the complete system exhibits stable training behaviour and performance.In normalised coordinates,the logic-based pipeline has an Average Displacement Error(ADE)of 0.040 and a Final Displacement Error(FDE)of 0.036.The adversarial generator makes substantially more progress,reducing ADE to 0.021 and FDE to 0.018.Visual examination confirms that the generated trajectories closely align with observed motion patterns while preserving smooth temporal dynamics. 展开更多
关键词 Multimodal trajectory generation robotic motion planning transformer networks sensor fusion reinforcement learning generative adversarial networks
在线阅读 下载PDF
层级特征融合Transformer的图像分类算法
17
作者 段士玺 王博 《电子科技》 2026年第2期72-78,共7页
针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级... 针对传统ViT(Vision Transformer)模型难以完成图像多层级分类问题,文中提出了基于ViT的图像分类模型层级特征融合视觉Transformer(Hierarchical Feature Fusion Vision Transformer,HICViT)。输入数据经过ViT提取模块生成多个不同层级的特征图,每个特征图包含不同层次的抽象特征表示。基于层级标签将ViT提取的特征映射为多级特征,运用层级特征融合策略整合不同层级信息,有效增强模型的分类性能。在CIFRA-10、CIFRA-100和CUB-200-2011这3个数据集将所提模型与多种先进深度学习模型进行对比和分析。在CIFRA-10数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为99.70%、98.80%和97.80%。在CIFRA-100数据集,所提方法在第1层级、第2层级和第3层级的分类精度分别为95.23%、93.54%和90.12%。在CUB-200-2011数据集,所提方法在第1层级和第2层级的分类精度分别为98.09%和93.66%。结果表明,所提模型的分类准确率优于其他对比模型。 展开更多
关键词 深度学习 卷积神经网络 transformER 图像分类 层级特征 特征融合 多头注意力 Vision transformer
在线阅读 下载PDF
基于卷积与交叉条纹Transformer混合编码器的云检测方法
18
作者 吝欣然 王倩 +3 位作者 秦建峰 杨维发 颜国跑 袁文波 《自然资源遥感》 北大核心 2026年第1期75-83,共9页
云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度... 云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度和高度也各不相同。针对云形态复杂多变的特点,该文设计了一种基于卷积与Transformer混合编码器的云检测模型UCT-Net。UCT-Net基于U型网络结构,在编码器部分融合卷积和Transformer编码器来联合提取卫星云图的特征。同时,针对云层特征的多样性,该文设计了一种基于交叉条纹的Transformer模块,以增强对不同形态云的适应性。此外,还提出了一种交叉条纹与卷积融合模块(cross stripe encoder and conv encoder merge module,CCM),有效促进了卷积编码器与交叉条纹Transformer编码器的深度融合。利用GF-1和GF-2卫星数据来源的GF12MS WHU数据集以及Google Earth提供的HRC WHU数据集进行了评估和测试,实验结果表明,UCT-Net在GF12MS WHU和HRC WHU数据集上的精确率分别为92.70%和94.20%,均优于经典语义分割算法,展现了其在云检测任务中的优越性能。 展开更多
关键词 云检测 遥感图像处理 transformER 卷积神经网络 深度学习
在线阅读 下载PDF
有效诊断Vision Transformer网络的滚动轴承故障诊断方法
19
作者 罗志勇 李明周 董鑫 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期146-155,共10页
针对滚动轴承故障诊断中特征提取不完整和诊断效率低的问题,提出了有效诊断Vision Transformer(EDViT)网络。采用基于峰度的加权融合策略,合并传感器信息;利用短时傅里叶变换,将融合后的信号转换为时频图像;依次应用EDViT的双重注意卷... 针对滚动轴承故障诊断中特征提取不完整和诊断效率低的问题,提出了有效诊断Vision Transformer(EDViT)网络。采用基于峰度的加权融合策略,合并传感器信息;利用短时傅里叶变换,将融合后的信号转换为时频图像;依次应用EDViT的双重注意卷积模块和双分支补丁视觉变换模块来提取局部和全局特征,使用分类器进行故障分类。实验验证在凯斯西储大学轴承数据集上进行。结果表明,EDViT模型具有出色的特征提取能力、快速的收敛速度和较高的诊断准确性。与其他方法的对比表明,EDViT模型具有很强的泛化能力和鲁棒性。 展开更多
关键词 有效诊断Vision transformer网络 滚动轴承 故障诊断
在线阅读 下载PDF
非高斯噪声下基于Transformer的多用户频谱感知算法
20
作者 曹秀俐 朱晓梅 +1 位作者 李想 杨家辉 《计算机应用与软件》 北大核心 2026年第2期271-277,330,共8页
以模型驱动的频谱感知算法难以精确模拟复杂的通信环境所以频谱感知准确性不高,同时由于算法复杂度高因而系统实时性较低。针对上述问题,将深度学习与频谱感知相结合,提出Alpha噪声下基于Transformer的频谱感知模型。首先对观测数据进... 以模型驱动的频谱感知算法难以精确模拟复杂的通信环境所以频谱感知准确性不高,同时由于算法复杂度高因而系统实时性较低。针对上述问题,将深度学习与频谱感知相结合,提出Alpha噪声下基于Transformer的频谱感知模型。首先对观测数据进行采集并做分数低阶矩(FLOM)处理,随后将数据送入谱卷积层进行局部特征粗提取,最后通过具有多头注意力机制模块的Transformer网络完成最终决策。仿真结果表明,即使在低广义信噪比(GSNR)的情况下,该算法依然能够增强信号的关联性,加强网络并行运算的能力,表现出优越的频谱感知性能。 展开更多
关键词 频谱感知 分数低阶矩 transformer网络 非高斯噪声
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部