期刊文献+
共找到9,065篇文章
< 1 2 250 >
每页显示 20 50 100
3D medical image segmentation using the serial-parallel convolutional neural network and transformer based on crosswindow self-attention 被引量:1
1
作者 Bin Yu Quan Zhou +3 位作者 Li Yuan Huageng Liang Pavel Shcherbakov Xuming Zhang 《CAAI Transactions on Intelligence Technology》 2025年第2期337-348,共12页
Convolutional neural network(CNN)with the encoder-decoder structure is popular in medical image segmentation due to its excellent local feature extraction ability but it faces limitations in capturing the global featu... Convolutional neural network(CNN)with the encoder-decoder structure is popular in medical image segmentation due to its excellent local feature extraction ability but it faces limitations in capturing the global feature.The transformer can extract the global information well but adapting it to small medical datasets is challenging and its computational complexity can be heavy.In this work,a serial and parallel network is proposed for the accurate 3D medical image segmentation by combining CNN and transformer and promoting feature interactions across various semantic levels.The core components of the proposed method include the cross window self-attention based transformer(CWST)and multi-scale local enhanced(MLE)modules.The CWST module enhances the global context understanding by partitioning 3D images into non-overlapping windows and calculating sparse global attention between windows.The MLE module selectively fuses features by computing the voxel attention between different branch features,and uses convolution to strengthen the dense local information.The experiments on the prostate,atrium,and pancreas MR/CT image datasets consistently demonstrate the advantage of the proposed method over six popular segmentation models in both qualitative evaluation and quantitative indexes such as dice similarity coefficient,Intersection over Union,95%Hausdorff distance and average symmetric surface distance. 展开更多
关键词 convolution neural network cross window self‐attention medical image segmentation transformer
在线阅读 下载PDF
Brief application notes for vision transformer (ViT) and convolutional neural network (CNN) in medical imaging
2
作者 Wei Kitt Wong Melinda Melinda 《Medical Data Mining》 2026年第2期34-42,共9页
In contemporary computer vision,convolutional neural networks(CNNs)and vision transformers(ViTs)represent the two primary architectural paradigms for image recognition.While both approaches have been widely adopted in... In contemporary computer vision,convolutional neural networks(CNNs)and vision transformers(ViTs)represent the two primary architectural paradigms for image recognition.While both approaches have been widely adopted in medical imaging applications,they operate based on fundamentally different computational principles.This report attempts to provide brief application notes on ViTs and CNNs,particularly focusing on scenarios that guide the selection of one architecture over the other in practical medical implementations.Generally,CNNs rely on convolutional kernels,localized receptive fields,and weight sharing,enabling efficient hierarchical feature extraction.These properties contribute to strong performance in detecting spatially constrained patterns such as textures,edges,and anatomical boundaries,while maintaining relatively low computational requirements.ViTs,on the other hand,decompose images into smaller segments referred to as tokens and employ self-attention mechanisms to model relationships across the entire image.This global modeling capability allows ViTs to capture long-range dependencies that may be difficult for convolution-based architectures to learn.However,ViTs typically achieve optimal performance when trained on extremely large datasets or when supported by extensive pretraining,as their reduced inductive bias requires greater data exposure to learn robust representations.This report briefly examines the architectural structure,underlying mathematical foundations,and relative performance characteristics of CNNs and ViTs,drawing upon recent findings from contemporary research.Emphasis is placed on understanding how differences in data availability,computational resources,and task requirements influence model effectiveness across medical imaging domains.Most importantly,the report serves as a concise application guide for practitioners seeking informed implementation decisions between these two influential deep learning frameworks. 展开更多
关键词 convolutional neural network vision transformer comparative study medical imaging
在线阅读 下载PDF
Advancing Breast Cancer Molecular Subtyping:A Comparative Study of Convolutional Neural Networks and Vision Transformers on Mammograms
3
作者 Chee Chin Lim Hui Wen Tiu +2 位作者 Qi Wei Oung Chiew Chea Lau Xiao Jian Tan 《Computers, Materials & Continua》 2026年第3期1287-1308,共22页
critical for guiding treatment and improving patient outcomes.Traditional molecular subtyping via immuno-histochemistry(IHC)test is invasive,time-consuming,and may not fully represent tumor heterogeneity.This study pr... critical for guiding treatment and improving patient outcomes.Traditional molecular subtyping via immuno-histochemistry(IHC)test is invasive,time-consuming,and may not fully represent tumor heterogeneity.This study proposes a non-invasive approach using digital mammography images and deep learning algorithm for classifying breast cancer molecular subtypes.Four pretrained models,including two Convolutional Neural Networks(MobileNet_V3_Large and VGG-16)and two Vision Transformers(ViT_B_16 and ViT_Base_Patch16_Clip_224)were fine-tuned to classify images into HER2-enriched,Luminal,Normal-like,and Triple Negative subtypes.Hyperparameter tuning,including learning rate adjustment and layer freezing strategies,was applied to optimize performance.Among the evaluated models,ViT_Base_Patch16_Clip_224 achieved the highest test accuracy(94.44%),with equally high precision,recall,and F1-score of 0.94,demonstrating excellent generalization.MobileNet_V3_Large achieved the same accuracy but showed less training stability.In contrast,VGG-16 recorded the lowest performance,indicating a limitation in its generalizability for this classification task.The study also highlighted the superior performance of the Vision Transformer models over CNNs,particularly due to their ability to capture global contextual features and the benefit of CLIP-based pretraining in ViT_Base_Patch16_Clip_224.To enhance clinical applicability,a graphical user interface(GUI)named“BCMS Dx”was developed for streamlined subtype prediction.Deep learning applied to mammography has proven effective for accurate and non-invasive molecular subtyping.The proposed Vision Transformer-based model and supporting GUI offer a promising direction for augmenting diagnostic workflows,minimizing the need for invasive procedures,and advancing personalized breast cancer management. 展开更多
关键词 Artificial intelligence breast cancer classification convolutional neural network deep learning hyperparameter tuning MAMMOGRAPHY medical imaging molecular subtypes vision transformer
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测 被引量:1
4
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformer 混合模型
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
5
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R^(2))高达99.91%. 展开更多
关键词 风速预测 群分解 transformer Kolmogorov-Arnold网络
在线阅读 下载PDF
基于跨尺度Transformer全局-局部交互的遥感图像连续超分辨率
6
作者 熊承义 王薇 高志荣 《中南民族大学学报(自然科学版)》 2026年第3期353-363,共11页
遥感图像连续超分辨率技术对多尺度地物识别、变化检测与语义分析等任务至关重要.然而,现有方法在复杂背景干扰和大尺度跨度场景下,难以兼顾局部细节重建与全局语义一致性.为此,提出了一种跨尺度Transformer全局-局部交互的遥感图像连... 遥感图像连续超分辨率技术对多尺度地物识别、变化检测与语义分析等任务至关重要.然而,现有方法在复杂背景干扰和大尺度跨度场景下,难以兼顾局部细节重建与全局语义一致性.为此,提出了一种跨尺度Transformer全局-局部交互的遥感图像连续超分辨率方法.设计了结合上下文注意力机制(CAM)的多尺度参数生成器,使之选择性地增强不同尺度下的局部高频特征;构建了一种跨尺度Transformer交互模块,利用自注意力机制实现全局语义建模与局部特征融合;提出双分支全局-局部解析器,联合优化坐标相关的位置编码与上下文依赖的语义解码,提升不同缩放倍数下的重建精度.实验结果表明:所提出方法相比先进的连续超分辨率方法可获得近0.17dB的PSNR增益. 展开更多
关键词 连续超分辨率 遥感图像 自注意力机制 transformer网络 全局-局部交互
在线阅读 下载PDF
多尺度Transformer结合残差卷积的管道微泄漏孔径识别
7
作者 王新颖 田豪杰 +2 位作者 蒋婷婷 江志伟 陈俨 《安全与环境学报》 北大核心 2026年第3期1025-1035,共11页
为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution co... 为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution combined model,MS Transformer-Residual)来预测微泄漏孔径。该模型通过模拟燃气管道系统采集不同孔径泄漏下的声发射信号,利用残差卷积模块提取局部时序特征,并采用多尺度Transformer自注意力机制建模全局信号依赖关系,使用五折交叉验证及独立测试集评估模型性能,并与三种消融基准模型进行对比。结果表明:MS Transformer-Residual模型的微泄漏孔径识别准确率达99.96%,与CNN、CNN-Transformer、残差CNN-Transformer模型相比,模型的最高准确率至少提升4.53百分点。研究证实多尺度特征融合策略显著提升了毫米级泄漏孔径的辨识精度,为工业管道健康监测提供了新的解决方案。 展开更多
关键词 安全工程 多尺度学习 transformer 微泄漏检测 残差卷积神经网络
原文传递
基于Transformer的胸部CT图像肺癌分割系统的设计
8
作者 马凤英 宗彦辰 +1 位作者 王智 付承彩 《齐鲁工业大学学报》 2026年第1期18-25,共8页
随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出... 随着医学影像技术的不断发展,胸部CT图像在肺部疾病的早期诊断和治疗中扮演着至关重要的角色,同时辅助识别系统的设计可以给医护人员提供参考,降低因人为因素而引发错误的概率。针对胸部CT图像肺癌任务中多通道特征重要性差异问题,提出了TransUnet-SE分割网络,此网络是基于残差感知的Transformer的U型肺癌区域分割网络进行改进,将SENet注意力机制嵌入解码器上采样过程,通过“压缩、激励、尺度调整”三步流程精准缓解多通道特征差异。为验证模型的泛化性能,首先在公共医学数据集Synapse多脏器CT数据集上进行了实验验证,然后在Lung-PET-CT-Dx数据集上选取肺癌患者的CT图像进行实验,评估所提模型与先进模型的性能并进行了比较。实验结果表明,Dice相似系数达到了86.05%,并基于PyQt5设计胸部CT图像肺癌辅助分割系统调用TransUnet-SE模型权重实现分割功能,为临床诊断提供支持。 展开更多
关键词 胸部CT图像 transformer 肺癌分割 系统设计 U型网络
在线阅读 下载PDF
结合双路径骨干与Transformer增强的道路场景检测方法
9
作者 邱云飞 姚曦彤 辛浩 《计算机工程与应用》 北大核心 2026年第2期302-312,共11页
道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DAN... 道路场景检测要求模型能够做出快速和精确的判断,然而在实际场景中由于目标尺度间的差异、误检及漏检情况,导致小模型不太准确,而大模型速度较慢。针对上述问题,提出一种结合双路径骨干与Transformer增强的道路场景检测方法(Dynamic-DANet)。提出复合双路径骨干网络,通过级联高分辨率与低分辨率骨干,促进骨干网络语义特征与空间细节的交互。提出邻层特征交互网络,通过逐层地对相邻层特征进行拼接,并引入加权系数自适应地捕获不同层级特征,利用Transformer增强的自注意机制促进全局上下文信息的融合。应用MPDIoU边界回归损失函数,进一步简化模型计算量,加速模型收敛。以复合双路径骨干网络为基础,基于多尺度特征设计分类路由,实现模型动态决策。在KITTI和BDD100K数据集上验证所提方法的有效性,平均检测精度值(mAP)分别达到了88.7%和40.2%,检测速度(FPS)分别实现了每秒178帧和每秒166帧。相较于主流的YOLOv7-tiny、YOLOv8和YOLOv10等算法在评价指标数值和可视化效果上均有明显改善。实验结果表明,所提方法提升了复杂道路场景下的检测性能,并且实现了将两个静态检测器融合为一个动态检测器,以更优的计算消耗实现更佳的检测效果。 展开更多
关键词 道路场景检测 复合骨干网络 视觉transformer 上下文信息 动态推理 MPDIoU边界损失
在线阅读 下载PDF
基于PyConv-Transformer的锂离子电池剩余寿命预测
10
作者 吴忠强 吴江浩 《计量学报》 北大核心 2026年第1期102-110,共9页
锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL... 锂离子电池的剩余使用寿命(RUL)是电池健康管理的重要参数。电池在实际使用过程中会出现容量再生现象,而且在电池数据采集过程中,通常难以避免噪声干扰,影响数据质量。针对以上问题提出一种基于Transformer结合金字塔卷积网络的电池RUL预测模型,选取容量作为健康因子,利用金字塔卷积网络中不同大小的卷积核提取容量序列的特征信息,利用Transformer中的多头注意力机制进一步学习序列的时序特征。采用加权Huber损失函数,提高模型的鲁棒性;采用Dropout技术,提高模型的泛化能力,防止训练过程中出现过拟合。将所提预测模型在NASA和CALCE数据集上实验,并与其他模型比较。实验结果表明,所提模型的预测精度更高,在NASA和CALCE数据集上的相对误差分别为0.008 6、0.019 3;平均绝对误差分别为0.011 5、0.012 6;均方根误差分别为0.017 3、0.018 9。 展开更多
关键词 电学计量 剩余使用寿命 锂电池容量 金字塔卷积网络 transformer 加权Huber损失函数 DROPOUT
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测 被引量:1
11
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
Transformer网络在集装箱箱号自动识别中的应用
12
作者 张明 涂昊 +1 位作者 程文明 杜润 《机械设计与制造》 北大核心 2026年第3期206-209,214,共5页
集装箱作为现代物流中最重要的载体之一,其箱号的自动识别技术对于提高集装箱码头的自动化和信息化程度起着至关重要的作用。然而,现有的研究并不能够满足码头实时、准确地识别集装箱箱号的要求。因此,我们提出了一种轻量化的箱号识别... 集装箱作为现代物流中最重要的载体之一,其箱号的自动识别技术对于提高集装箱码头的自动化和信息化程度起着至关重要的作用。然而,现有的研究并不能够满足码头实时、准确地识别集装箱箱号的要求。因此,我们提出了一种轻量化的箱号识别算法。该方法分为两个模块:定位模块与识别模块。在定位模块中,基于YOLO v3算法进行改进,提出了一个新的轻量化定位网络—swift-YOLO;在识别模块中,设计了基于Transformer的字符识别网络对箱号进行识别。实验结果表明,所提方法识别成功率达到了98.3%,且单帧识别时间仅为20ms,显著优于现有的最佳结果。 展开更多
关键词 深度学习 集装箱箱号 字符识别 目标检测 transformer网络
在线阅读 下载PDF
基于Takens-Transformer与GCN的DDoS攻击检测
13
作者 邓钰洋 芦天亮 +2 位作者 李知皓 孟昊阳 李锦儒 《计算机应用研究》 北大核心 2026年第2期567-576,共10页
针对现有分布式拒绝服务(DDoS)攻击检测适应性弱、计算成本高的问题,提出基于时间延迟嵌入和图卷积网络的Transformer模型(TDE-TGCN)。该模型利用Takens定理将网络流量建模为动力学系统,通过时间延迟嵌入揭示DDoS攻击对流量非线性特征... 针对现有分布式拒绝服务(DDoS)攻击检测适应性弱、计算成本高的问题,提出基于时间延迟嵌入和图卷积网络的Transformer模型(TDE-TGCN)。该模型利用Takens定理将网络流量建模为动力学系统,通过时间延迟嵌入揭示DDoS攻击对流量非线性特征的影响;采用Transformer模型将流量序列映射至高维空间,通过多头注意力机制捕捉突发性和全局关联;结合图卷积网络挖掘拓扑信息及跨节点攻击模式。在CIC-IDS2017等数据集和特征变异模拟的未知攻击场景下,TDE-TGCN检测准确率达到98.7%,误报率降低至1.2%,计算效率提升35%;消融实验验证了各组件对模型性能的显著贡献。该研究从动力学系统角度重新审视网络流量特征,提出理论与实践相结合的检测框架,为复杂网络环境下的DDoS攻击检测提供了有效技术方案。 展开更多
关键词 网络流量 DDOS攻击检测 Takens定理 图卷积网络 transformer
在线阅读 下载PDF
基于Lasso-Transformer神经网络模型的海南省碳排放预测
14
作者 金雨洁 金晓斌 +3 位作者 洪星明 张舟遥 韩博 周寅康 《环境科学》 北大核心 2026年第2期781-792,共12页
海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响... 海南省作为我国生态文明试验区和自由贸易港,在当前“碳达峰、碳中和”战略实施背景下,承担着减排降碳与经济协同发展的重要任务.在对海南省2004~2023年的碳源、碳汇和净碳排放量核算基础上,运用LMDI模型和Lasso分析对海南省碳排放影响因素进行分解和筛选,并纳入4种Lasso-Transformer神经网络模型对2024~2030年海南省碳排放量进行预测.结果表明:①海南省2004~2023年碳汇总量变化趋势较为平稳,净碳排放量变化趋势与碳源总量基本保持一致.②海南省碳排放的主要影响因素由强到弱分别为:能源强度、土地碳排放强度、经济效率、土地利用结构、人口规模和土地利用效率.③通过模型优选,利用Lasso-PatchTST模型对海南省2024~2030年碳排放量及各影响因素进行预测,得出2030年的碳排放量为4345.53万t,土地利用效率因素增长速度最快,人口规模因素增长速度最慢.通过优化产业结构、提升资源利用效率并加强生态系统保护,可以促进海南省减排降碳与经济协调发展.研究结果可为海南省低碳经济发展提供决策参考. 展开更多
关键词 碳排放 Lasso-transformer神经网络模型 海南省 LMDI模型 预测
原文传递
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
15
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
融合Transformer和Inception的网络入侵检测研究
16
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformer INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于TCN特征提取及LSTM-Transformer的轴承剩余寿命预测方法
17
作者 王志国 张新元 +1 位作者 肖子鸣 钱东海 《机床与液压》 北大核心 2026年第4期37-44,共8页
针对滚动轴承剩余使用寿命(RUL)预测中存在的单纯局部时序特征预测或单纯全局退化趋势预测不足的问题,提出一种融合时间卷积网络(TCN)特征提取与LSTM-Transformer特征融合的预测模型。基于时间卷积网络(TCN)构建原始振动信号特征提取器... 针对滚动轴承剩余使用寿命(RUL)预测中存在的单纯局部时序特征预测或单纯全局退化趋势预测不足的问题,提出一种融合时间卷积网络(TCN)特征提取与LSTM-Transformer特征融合的预测模型。基于时间卷积网络(TCN)构建原始振动信号特征提取器,通过膨胀因果卷积同步捕获多尺度退化特征,有效避免传统时频变换导致的相位信息损失;构建LSTM与Transformer的双流特征融合模型,其中LSTM分支通过门控机制捕捉局部细粒度时序演变模式,Transformer分支利用Transformer编码器的自注意力机制建立跨周期全局退化趋势;最后,设计改进型通道注意力动态融合模块,基于退化阶段的特征分布熵值自适应调整LSTM与Transformer双分支的权重分配,显著增强关键退化特征的表达能力。为验证模型的有效性,在XJTU-SY和PHM2012轴承数据集上与LSTM、Transformer及CNN-LSTM进行对比。结果表明:在XJTU-SY数据集上,所提模型的平均绝对误差(MAE)为0.0189,均方根误差(RMSE)为0.0230,其MAE相比LSTM、Transformer和CNN-LSTM模型分别降低了70.74%、82.20%和77.36%,其RMSE分别降低了71.03%、79.57%和75.10%;在PHM2012数据集上,所提模型的MAE为0.0467,RMSE为0.0566,其MAE相比LSTM、Transformer和CNN-LSTM模型分别降低了18.21%、17.05%和31.72%,其RMSE分别降低了18.32%、19.37%和22.03%。所提模型的预测精度更高,并具有较好的泛化性。 展开更多
关键词 剩余使用寿命 时间卷积网络 长短时记忆神经网络 transformer模型 通道注意力
在线阅读 下载PDF
基于卷积与交叉条纹Transformer混合编码器的云检测方法
18
作者 吝欣然 王倩 +3 位作者 秦建峰 杨维发 颜国跑 袁文波 《自然资源遥感》 北大核心 2026年第1期75-83,共9页
云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度... 云检测是遥感图像处理领域的重要研究方向,在气象监测、环境评估、农业管理和军事侦察等领域广泛应用。准确检测和分割云区域对提升遥感数据的利用效率至关重要。然而,云的形态复杂多样,包括卷云、积云、层云等不同类型,其厚度、透明度和高度也各不相同。针对云形态复杂多变的特点,该文设计了一种基于卷积与Transformer混合编码器的云检测模型UCT-Net。UCT-Net基于U型网络结构,在编码器部分融合卷积和Transformer编码器来联合提取卫星云图的特征。同时,针对云层特征的多样性,该文设计了一种基于交叉条纹的Transformer模块,以增强对不同形态云的适应性。此外,还提出了一种交叉条纹与卷积融合模块(cross stripe encoder and conv encoder merge module,CCM),有效促进了卷积编码器与交叉条纹Transformer编码器的深度融合。利用GF-1和GF-2卫星数据来源的GF12MS WHU数据集以及Google Earth提供的HRC WHU数据集进行了评估和测试,实验结果表明,UCT-Net在GF12MS WHU和HRC WHU数据集上的精确率分别为92.70%和94.20%,均优于经典语义分割算法,展现了其在云检测任务中的优越性能。 展开更多
关键词 云检测 遥感图像处理 transformer 卷积神经网络 深度学习
在线阅读 下载PDF
LFSepNet:融合Transformer的照明和面部特征解耦人脸识别方法
19
作者 黎克迅 高治军 《计算机工程与应用》 北大核心 2026年第4期201-209,共9页
在低光环境下,人脸识别面临图像质量低、特征模糊等诸多挑战,导致现有方法难以提取鲁棒且辨识度高的特征,从而严重影响识别性能。为应对这一问题,提出了一种新颖的非成对低光人脸识别模型LFSepNet(low-light face separation network)... 在低光环境下,人脸识别面临图像质量低、特征模糊等诸多挑战,导致现有方法难以提取鲁棒且辨识度高的特征,从而严重影响识别性能。为应对这一问题,提出了一种新颖的非成对低光人脸识别模型LFSepNet(low-light face separation network)。与传统基于卷积神经网络(convolutional neural network,CNN)架构的训练方法不同,LFSepNet采用Transformer架构,更有效地捕捉长距离依赖关系,从而克服卷积神经网络在局部感受野上的限制。由于低光环境下的人脸图像往往整体偏暗,仅有少数区域可能包含较丰富的照明信息,传统CNN在特征提取时容易受限于局部区域,难以充分利用这些关键信息。相比之下,Transformer通过自注意力机制实现全局信息建模,使网络能够更全面地整合亮度不均的人脸图像信息,从而提升特征解耦的效果和低光人脸识别的准确性。LFSepNet模型包含自适应亮度分离模块和自适应照明间隙损失,通过动态分离人脸与光照特征,减少光照干扰,同时进一步优化特征分离效果,使模型能够提取更加精确和鲁棒的特征。实验结果表明,LFSepNet在多个低光人脸数据集上的性能均优于现有方法,特别是在极端低光条件下,其识别精度显著提升。该研究为低光人脸识别提供了基于非成对设置的有效解决方案,并在实际应用中展现了良好的潜力。 展开更多
关键词 低光人脸识别 深度学习 transformer 特征解耦 卷积神经网络(CNN) LFSepNet
在线阅读 下载PDF
基于胶囊网络与Transformer的细粒度图像分类
20
作者 刘正华 龚小玉 +1 位作者 梁彧骁 梁艳洁 《现代电子技术》 北大核心 2026年第8期137-144,共8页
花卉细粒度图像分类在品种鉴定、精准园艺和智能育种等领域具有重要的应用价值,但形态相似品种间特征差异微小、背景复杂干扰显著,导致现有方法的精度识别不高。针对该问题,提出一种基于胶囊网络与视觉Transformer的细粒度图像分类架构... 花卉细粒度图像分类在品种鉴定、精准园艺和智能育种等领域具有重要的应用价值,但形态相似品种间特征差异微小、背景复杂干扰显著,导致现有方法的精度识别不高。针对该问题,提出一种基于胶囊网络与视觉Transformer的细粒度图像分类架构,以提升特征表征能力与分类性能。首先,设计双频注意力特征提取模块,通过高频与低频并行分支并结合基于Sobel梯度的空间注意力、频域注意力、ECA通道注意力,实现纹理边缘与结构信息的高效建模;其次,构建基于胶囊的视觉Transformer框架,该框架包括胶囊视觉嵌入模块和改进型胶囊感知Transformer编码器,通过显式解耦胶囊模长与方向并引入门控残差与squash非线性,协同建模局部与全局特征;最后,提出联合损失优化策略,从判别性、重构性与泛化能力等角度对模型训练进行优化。实验结果表明,所提方法在Flowers数据集上的识别准确率较高,鲁棒性强,验证了其在复杂场景下的有效性与先进性。 展开更多
关键词 细粒度图像分类 视觉transformer 融合机制 胶囊网络 联合损失优化 双频注意力
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部