期刊文献+
共找到8,872篇文章
< 1 2 250 >
每页显示 20 50 100
Advancing Breast Cancer Molecular Subtyping:A Comparative Study of Convolutional Neural Networks and Vision Transformers on Mammograms
1
作者 Chee Chin Lim Hui Wen Tiu +2 位作者 Qi Wei Oung Chiew Chea Lau Xiao Jian Tan 《Computers, Materials & Continua》 2026年第3期1287-1308,共22页
critical for guiding treatment and improving patient outcomes.Traditional molecular subtyping via immuno-histochemistry(IHC)test is invasive,time-consuming,and may not fully represent tumor heterogeneity.This study pr... critical for guiding treatment and improving patient outcomes.Traditional molecular subtyping via immuno-histochemistry(IHC)test is invasive,time-consuming,and may not fully represent tumor heterogeneity.This study proposes a non-invasive approach using digital mammography images and deep learning algorithm for classifying breast cancer molecular subtypes.Four pretrained models,including two Convolutional Neural Networks(MobileNet_V3_Large and VGG-16)and two Vision Transformers(ViT_B_16 and ViT_Base_Patch16_Clip_224)were fine-tuned to classify images into HER2-enriched,Luminal,Normal-like,and Triple Negative subtypes.Hyperparameter tuning,including learning rate adjustment and layer freezing strategies,was applied to optimize performance.Among the evaluated models,ViT_Base_Patch16_Clip_224 achieved the highest test accuracy(94.44%),with equally high precision,recall,and F1-score of 0.94,demonstrating excellent generalization.MobileNet_V3_Large achieved the same accuracy but showed less training stability.In contrast,VGG-16 recorded the lowest performance,indicating a limitation in its generalizability for this classification task.The study also highlighted the superior performance of the Vision Transformer models over CNNs,particularly due to their ability to capture global contextual features and the benefit of CLIP-based pretraining in ViT_Base_Patch16_Clip_224.To enhance clinical applicability,a graphical user interface(GUI)named“BCMS Dx”was developed for streamlined subtype prediction.Deep learning applied to mammography has proven effective for accurate and non-invasive molecular subtyping.The proposed Vision Transformer-based model and supporting GUI offer a promising direction for augmenting diagnostic workflows,minimizing the need for invasive procedures,and advancing personalized breast cancer management. 展开更多
关键词 Artificial intelligence breast cancer classification convolutional neural network deep learning hyperparameter tuning MAMMOGRAPHY medical imaging molecular subtypes vision transformer
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测 被引量:1
2
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformer 混合模型
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
3
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformer Kolmogorov-Arnold网络
在线阅读 下载PDF
基于Transformer的胸部CT图像肺癌分割系统的设计
4
作者 马凤英 宗彦辰 +1 位作者 王智 付承彩 《齐鲁工业大学学报》 2026年第1期18-25,共8页
随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出... 随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出了TransUnet-SE分割网络,此网络是基于残差感知的Transformer的U型肺癌区域分割网络进行改进,将SENet注意力机制嵌入解码器上采样过程,通过“压缩、激励、尺度调整”三步流程精准缓解多通道特征差异。为验证模型的泛化性能,首先在公共医学数据集Synapse多脏器CT数据集上进行了实验验证,然后在Lung-PET-CT-Dx数据集上选取肺癌患者的CT图像进行实验,评估所提模型与先进模型的性能并进行了比较。实验结果表明,Dice相似系数达到了86.05%,并基于PyQt5设计胸部CT图像肺癌辅助分割系统调用TransUnet-SE模型权重实现分割功能,为临床诊断提供支持。 展开更多
关键词 胸部CT图像 transformer 肺癌分割 系统设计 U型网络
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
5
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
基于PyConv-Transformer的锂离子电池剩余寿命预测
6
作者 吴忠强 吴江浩 《计量学报》 北大核心 2026年第1期102-110,共9页
锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL... 锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL预测模型,选取容量作为健康因子,利用金字塔卷积网络中不同大小的卷积核提取容量序列的特征信息,利用Transformer中的多头注意力机制进一步学习序列的时序特征。采用加权Huber损失函数,提高模型的鲁棒性;采用Dropout技术,提高模型的泛化能力,防止训练过程中出现过拟合。将所提预测模型在NASA和CALCE数据集上实验,并与其他模型比较。实验结果表明,所提模型的预测精度更高,在NASA和CALCE数据集上的相对误差分别为0.008 6、0.019 3;平均绝对误差分别为0.011 5、0.012 6;均方根误差分别为0.017 3、0.018 9。 展开更多
关键词 电学计量 剩余使用寿命 锂电池容量 金字塔卷积网络 transformer 加权Huber损失函数 DROPOUT
在线阅读 下载PDF
基于Lasso-Transformer神经网络模型的海南省碳排放预测
7
作者 金雨洁 金晓斌 +3 位作者 洪星明 张舟遥 韩博 周寅康 《环境科学》 北大核心 2026年第2期781-792,共12页
海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响... 海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响因素进行分解和筛选,并纳入4种Lasso-Transformer神经网络模型对2024~2030年海南省碳排放量进行预测.结果表明:①海南省2004~2023年碳汇总量变化趋势较为平稳,净碳排放量变化趋势与碳源总量基本保持一致.②海南省碳排放的主要影响因素由强到弱分别为:能源强度、土地碳排放强度、经济效率、土地利用结构、人口规模和土地利用效率.③通过模型优选,利用Lasso-PatchTST模型对海南省2024~2030年碳排放量及各影响因素进行预测,得出2030年的碳排放量为4345.53万t,土地利用效率因素增长速度最快,人口规模因素增长速度最慢.通过优化产业结构、提升资源利用效率并加强生态系统保护,可以促进海南省减排降碳与经济协调发展.研究结果可为海南省低碳经济发展提供决策参考. 展开更多
关键词 碳排放 Lasso-transformer神经网络模型 海南省 LMDI模型 预测
原文传递
知识蒸馏Transformer的人物交互检测
8
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
9
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
融合Transformer和Inception的网络入侵检测研究
10
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformer INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于卷积与交叉条纹Transformer混合编码器的云检测方法
11
作者 吝欣然 王倩 +3 位作者 秦建峰 杨维发 颜国跑 袁文波 《自然资源遥感》 北大核心 2026年第1期75-83,共9页
云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度... 云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度和高度也各不相同。针对云形态复杂多变的特点,该文设计了一种基于卷积与Transformer混合编码器的云检测模型UCT-Net。UCT-Net基于U型网络结构,在编码器部分融合卷积和Transformer编码器来联合提取卫星云图的特征。同时,针对云层特征的多样性,该文设计了一种基于交叉条纹的Transformer模块,以增强对不同形态云的适应性。此外,还提出了一种交叉条纹与卷积融合模块(cross stripe encoder and conv encoder merge module,CCM),有效促进了卷积编码器与交叉条纹Transformer编码器的深度融合。利用GF-1和GF-2卫星数据来源的GF12MS WHU数据集以及Google Earth提供的HRC WHU数据集进行了评估和测试,实验结果表明,UCT-Net在GF12MS WHU和HRC WHU数据集上的精确率分别为92.70%和94.20%,均优于经典语义分割算法,展现了其在云检测任务中的优越性能。 展开更多
关键词 云检测 遥感图像处理 transformer 卷积神经网络 深度学习
在线阅读 下载PDF
LFSepNet:融合Transformer的照明和面部特征解耦人脸识别方法
12
作者 黎克迅 高治军 《计算机工程与应用》 北大核心 2026年第4期201-209,共9页
在低光环境下,人脸识别面临图像质量低、特征模糊等诸多挑战,导致现有方法难以提取鲁棒且辨识度高的特征,从而严重影响识别性能。为应对这一问题,提出了一种新颖的非成对低光人脸识别模型LFSepNet(low-light face separation network)... 在低光环境下,人脸识别面临图像质量低、特征模糊等诸多挑战,导致现有方法难以提取鲁棒且辨识度高的特征,从而严重影响识别性能。为应对这一问题,提出了一种新颖的非成对低光人脸识别模型LFSepNet(low-light face separation network)。与传统基于卷积神经网络(convolutional neural network,CNN)架构的训练方法不同,LFSepNet采用Transformer架构,更有效地捕捉长距离依赖关系,从而克服卷积神经网络在局部感受野上的限制。由于低光环境下的人脸图像往往整体偏暗,仅有少数区域可能包含较丰富的照明信息,传统CNN在特征提取时容易受限于局部区域,难以充分利用这些关键信息。相比之下,Transformer通过自注意力机制实现全局信息建模,使网络能够更全面地整合亮度不均的人脸图像信息,从而提升特征解耦的效果和低光人脸识别的准确性。LFSepNet模型包含自适应亮度分离模块和自适应照明间隙损失,通过动态分离人脸与光照特征,减少光照干扰,同时进一步优化特征分离效果,使模型能够提取更加精确和鲁棒的特征。实验结果表明,LFSepNet在多个低光人脸数据集上的性能均优于现有方法,特别是在极端低光条件下,其识别精度显著提升。该研究为低光人脸识别提供了基于非成对设置的有效解决方案,并在实际应用中展现了良好的潜力。 展开更多
关键词 低光人脸识别 深度学习 transformer 特征解耦 卷积神经网络(CNN) LFSepNet
在线阅读 下载PDF
Multimodal Trajectory Generation for Robotic Motion Planning Using Transformer-Based Fusion and Adversarial Learning
13
作者 Shtwai Alsubai Ahmad Almadhor +3 位作者 Abdullah Al Hejaili Najib Ben Aoun Tahani Alsubait Vincent Karovic 《Computer Modeling in Engineering & Sciences》 2026年第2期848-869,共22页
In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we devel... In Human–Robot Interaction(HRI),generating robot trajectories that accurately reflect user intentions while ensuring physical realism remains challenging,especially in unstructured environments.In this study,we develop a multimodal framework that integrates symbolic task reasoning with continuous trajectory generation.The approach employs transformer models and adversarial training to map high-level intent to robotic motion.Information from multiple data sources,such as voice traits,hand and body keypoints,visual observations,and recorded paths,is integrated simultaneously.These signals are mapped into a shared representation that supports interpretable reasoning while enabling smooth and realistic motion generation.Based on this design,two different learning strategies are investigated.In the first step,grammar-constrained Linear Temporal Logic(LTL)expressions are created from multimodal human inputs.These expressions are subsequently decoded into robot trajectories.The second method generates trajectories directly from symbolic intent and linguistic data,bypassing an intermediate logical representation.Transformer encoders combine multiple types of information,and autoregressive transformer decoders generate motion sequences.Adding smoothness and speed limits during training increases the likelihood of physical feasibility.To improve the realism and stability of the generated trajectories during training,an adversarial discriminator is also included to guide them toward the distribution of actual robot motion.Tests on the NATSGLD dataset indicate that the complete system exhibits stable training behaviour and performance.In normalised coordinates,the logic-based pipeline has an Average Displacement Error(ADE)of 0.040 and a Final Displacement Error(FDE)of 0.036.The adversarial generator makes substantially more progress,reducing ADE to 0.021 and FDE to 0.018.Visual examination confirms that the generated trajectories closely align with observed motion patterns while preserving smooth temporal dynamics. 展开更多
关键词 Multimodal trajectory generation robotic motion planning transformer networks sensor fusion reinforcement learning generative adversarial networks
在线阅读 下载PDF
基于GRU-Transformer与随机矩阵的机动群目标跟踪
14
作者 陈烨 梁苑 +1 位作者 李银伢 戚国庆 《兵工学报》 北大核心 2026年第1期282-295,共14页
针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更... 针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更新,实现群目标质心与扩展外形的联合跟踪。基于机动群目标时间序列量测数据,提取群目标运动多项特征参数,输入所提深度神经网络,实现机动群目标运动模型(匀速(Constant Velocity,CV)模型、匀加速(Constant Acceleration,CA)模型、CS模型)的精准辨别,若目标模型为CS运动模型,同时输出机动频率参数α的精确估计结果。运用随机矩阵群目标跟踪理论,提出一种基于贝叶斯状态估计架构的椭圆机动群目标跟踪方法。仿真实验结果分析表明:新方法可实现对机动椭圆群目标的精确稳健跟踪,相较于传统交互式多模型群目标跟踪方法,跟踪精度有显著提升。 展开更多
关键词 机动群目标跟踪 注意力GRU-transformer深度神经网络 群目标跟踪 运动模型辨识 机动频率参数估计
在线阅读 下载PDF
Enhancing convolution for Transformer-based weakly supervised semantic segmentation
15
作者 LIU Yu TAN Diaoyin +1 位作者 ZHOU Wen XIAO Huaxin 《Journal of Systems Engineering and Electronics》 2026年第1期84-93,共10页
Weakly supervised semantic segmentation(WSSS)is a tricky task,which only provides category information for segmentation prediction.Thus,the key stage of WSSS is to generate the pseudo labels.For convolutional neural n... Weakly supervised semantic segmentation(WSSS)is a tricky task,which only provides category information for segmentation prediction.Thus,the key stage of WSSS is to generate the pseudo labels.For convolutional neural network(CNN)based methods,in which class activation mapping(CAM)is proposed to obtain the pseudo labels,and only concentrates on the most discriminative parts.Recently,transformer-based methods utilize attention map from the multi-headed self-attention(MHSA)module to predict pseudo labels,which usually contain obvious background noise and incoherent object area.To solve the above problems,we use the Conformer as our backbone,which is a parallel network based on convolutional neural network(CNN)and Transformer.The two branches generate pseudo labels and refine them independently,and can effectively combine the advantages of CNN and Transformer.However,the parallel structure is not close enough in the information communication.Thus,parallel structure can result in poor details about pseudo labels,and the background noise still exists.To alleviate this problem,we propose enhancing convolution CAM(ECCAM)model,which have three improved modules based on enhancing convolution,including deeper stem(DStem),convolutional feed-forward network(CFFN)and feature coupling unit with convolution(FCUConv).The ECCAM could make Conformer have tighter interaction between CNN and Transformer branches.After experimental verification,the improved modules we propose can help the network perceive more local information from images,making the final segmentation results more refined.Compared with similar architecture,our modules greatly improve the semantic segmentation performance and achieve70.2%mean intersection over union(mIoU)on the PASCAL VOC 2012 dataset. 展开更多
关键词 weakly supervised semantic segmentation transformer convolutional neural network
在线阅读 下载PDF
CSWin-Transformer与可形变卷积相结合的图像修复技术研究与实现
16
作者 刘海洋 胡永 《软件导刊》 2026年第1期119-126,共8页
针对现有图像修复模型修复大面积不规则缺损图像效果不佳、计算资源消耗大的问题,提出了一种CSWinTransformer与可形变卷积残差密集网络相结合的图像修复方法。首先,构建一个由全局层网络和局部层网络组成的生成模型,利用全局层CSWin-Tr... 针对现有图像修复模型修复大面积不规则缺损图像效果不佳、计算资源消耗大的问题,提出了一种CSWinTransformer与可形变卷积残差密集网络相结合的图像修复方法。首先,构建一个由全局层网络和局部层网络组成的生成模型,利用全局层CSWin-Transformer模块的条纹窗口在较低的计算复杂度下获取更大的感受野,增强其图像特征提取能力;其次,在CSWin-Transformer中加入一种新的门控深度卷积前馈网络,其能够进行有选择性的特征转换,即过滤掉信息量不足的特征,仅保留有价值的信息继续在网络的层级结构中流动;再次,通过并行局部层的可形变卷积残差密集块灵活对图像进行采样,增强结构纹理修复的精确度,同时,在上述并行生成模型之间,构建共享的注意力机制来促进全局和局部特征之间的信息交流;最终,采用谱归一化的马尔科夫判别模型进行对抗性训练。实验结果表明,提出的方法相较于其他方法在PSNR和SSIM指标上分别提升了2.47dB和0.075 2,在LPIPS指标上下降了0.092 4。 展开更多
关键词 深度学习 CSWin-transformer 门控深度卷积前馈网络 可形变卷积残差密集网络
在线阅读 下载PDF
基于ResNet-GCN-Transformer的多时间粒度地铁短时客流预测
17
作者 杜姿晨 郑长江 +2 位作者 郑树康 马庚华 陆野 《交通运输工程与信息学报》 2026年第1期64-79,共16页
【背景】随着城镇化进程的加快,城市轨道交通压力越来越大,准确的地铁客流预测对于优化列车时刻表、减少高峰时段拥堵、提高地铁系统服务水平具有重要的作用。【目标】综合考虑地铁客流的时空特性,充分利用多时间粒度客流数据,提高较大... 【背景】随着城镇化进程的加快,城市轨道交通压力越来越大,准确的地铁客流预测对于优化列车时刻表、减少高峰时段拥堵、提高地铁系统服务水平具有重要的作用。【目标】综合考虑地铁客流的时空特性,充分利用多时间粒度客流数据,提高较大时间粒度客流预测任务的准确性。【方方法法】分析不同时间粒度的地铁客流数据之间的相关性,确定多时间粒度融合机制。提出一种Resnet-GCN-Transformer模型:利用图卷积神经网络(Graph Convolutional Neural Network,GCN)提取不同站点客流的空间相关性;利用残差块构建深度卷积神经网络,对不同时间粒度的数据从小到大进行聚合,得到多时间粒度的多通道特征图;利用Transformer Encoder对客流数据的长时间依赖特性进行建模,并通过多个由全连接层构成的预测头输出预测结果。同时基于Optuna框架进行超参数优化,得到最优的超参数组合。【数据】对杭州市地铁刷卡数据集进行降噪处理并构建不同时间粒度的地铁客流数据集,基于10 min和30 min的数据集对模型进行验证。【结果】在两组不同目标时间粒度的数据集上,所提模型的平均绝对百分比误差分别为12.62%和10.61%,均优于6个基线模型,表明融合多时间粒度的特征在地铁客流预测任务中的重要性,模型能够充分捕捉多时间粒度的客流特征,地铁站点的连通关系,以及客流数据的时间依赖关系,从而显著提升客流预测效果。 展开更多
关键词 城市交通 客流预测 多时间粒度 图卷积神经网络 残差网络 transformer
在线阅读 下载PDF
Anisotropy of Phase Transformation in Aluminum and Copper under Shock Compression:Atomistic Simulations and Neural Network Model
18
作者 Evgenii V.Fomin Ilya A.Bryukhanov +1 位作者 Natalya A.Grachyova Alexander E.Mayer 《Computers, Materials & Continua》 2026年第4期548-577,共30页
It is well known that aluminum and copper exhibit structural phase transformations in quasi-static and dynamic measurements,including shock wave loading.However,the dependence of phase transformations in a wide range ... It is well known that aluminum and copper exhibit structural phase transformations in quasi-static and dynamic measurements,including shock wave loading.However,the dependence of phase transformations in a wide range of crystallographic directions of shock loading has not been revealed.In this work,we calculated the shock Hugoniot for aluminum and copper in different crystallographic directions([100],[110],[111],[112],[102],[114],[123],[134],[221]and[401])of shock compression using molecular dynamics(MD)simulations.The results showed a high pressure(>160 GPa for Cu and>40 GPa for Al)of the FCC-to-BCC transition.In copper,different characteristics of the phase transition are observed depending on the loading direction with the[100]compression direction being the weakest.The FCC-to-BCC transition for copper is in the range of 150–220 GPa,which is consistent with the existing experimental data.Due to the high transition pressure,the BCC phase transition in copper competes with melting.In aluminum,the FCC-to-BCC transition is observed for all studied directions at pressures between 40 and 50 GPa far beyond the melting.In all considered cases we observe the coexistence of HCP and BCC phases during the FCC-to-BCC transition,which is consistent with the experimental data and atomistic calculations;this HCP phase forms in the course of accompanying plastic deformation with dislocation activity in the parent FCC phase.The plasticity incipience is also anisotropic in bothmetals,which is due to the difference in the projections of stress on the slip plane for different orientations of the FCC crystal.MD modeling results demonstrate a strong dependence of the FCC-to-BCC transition on the crystallographic direction,in which the material is loaded in the copper crystals.However,MD simulations data can only be obtained for specific points in the stereographic direction space;therefore,for more comprehensive understanding of the phase transition process,a feed-forward neural network was trained using MD modeling data.The trained machine learning model allowed us to construct continuous stereographic maps of phase transitions as a function of stress in the shock-compressed state of metal.Due to appearance and growth of multiple centers of new phase,the FCC-to-BCC transition leads to formation of a polycrystalline structure from the parent single crystal. 展开更多
关键词 Molecular dynamics(MD) ALUMINUM COPPER shock wave polymorphic phase transformation polycrystalline structure neural network model
在线阅读 下载PDF
Spatio-Temporal Graph Neural Networks with Elastic-Band Transform for Solar Radiation Prediction
19
作者 Guebin Choi 《Computer Modeling in Engineering & Sciences》 2026年第1期848-872,共25页
This study proposes a novel forecasting framework that simultaneously captures the strong periodicity and irregular meteorological fluctuations inherent in solar radiation time series.Existing approaches typically def... This study proposes a novel forecasting framework that simultaneously captures the strong periodicity and irregular meteorological fluctuations inherent in solar radiation time series.Existing approaches typically define inter-regional correlations using either simple correlation coefficients or distance-based measures when applying spatio-temporal graph neural networks(STGNNs).However,such definitions are prone to generating spurious correlations due to the dominance of periodic structures.To address this limitation,we adopt the Elastic-Band Transform(EBT)to decompose solar radiation into periodic and amplitude-modulated components,which are then modeled independently with separate graph neural networks.The periodic component,characterized by strong nationwide correlations,is learned with a relatively simple architecture,whereas the amplitude-modulated component is modeled with more complex STGNNs that capture climatological similarities between regions.The predictions from the two components are subsequently recombined to yield final forecasts that integrate both periodic patterns and aperiodic variability.The proposed framework is validated with multiple STGNN architectures,and experimental results demonstrate improved predictive accuracy and interpretability compared to conventional methods. 展开更多
关键词 Spatio-temporal graph neural network(STGNN) elastic-band transform(EBT) solar radiation fore-casting spurious correlation time series decomposition
在线阅读 下载PDF
基于Vision Transformer的轻量化单目深度估计
20
作者 张凯 唐嘉宁 +2 位作者 李叶嘉 马孟星 周思达 《现代电子技术》 北大核心 2026年第4期64-72,共9页
深度估计能为无人机提供精确的三维环境感知能力,而对边缘设备而言,实时推理与极低的计算资源消耗至关重要。目前大多数单目深度估计网络都侧重于提高在高端GPU上运行时的精度,难以满足边缘设备的实时性要求。为解决该问题,提出一种新... 深度估计能为无人机提供精确的三维环境感知能力,而对边缘设备而言,实时推理与极低的计算资源消耗至关重要。目前大多数单目深度估计网络都侧重于提高在高端GPU上运行时的精度,难以满足边缘设备的实时性要求。为解决该问题,提出一种新型编码器-解码器网络,以实现边缘设备上的实时单目深度估计。所提网络通过一个高效的语义模块合并全局的语义信息,为深度估计提供更多的物体边缘细节;并将基于Transformer的模块集成到编码器-解码器架构的最低分辨率层级,从而大大减少视觉变换器(ViT)的参数。此外,还提出了用于深度解码的Upconv层。该网络在精度和速度之间实现了较好的权衡,通过TensorRT优化,在NVIDIA Jetson Orin设备上具备实时推理性能,优于目前多数先进的实时性算法。 展开更多
关键词 单目深度估计网络 边缘设备 编码器 解码器 transformer技术 视觉变换器
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部