期刊文献+
共找到437,595篇文章
< 1 2 250 >
每页显示 20 50 100
一种3D可变形卷积结合Transformer的视频压缩感知方法
1
作者 杜秀丽 朱金耀 +2 位作者 高星 吕亚娜 邱少明 《计算机科学》 北大核心 2025年第11期150-156,共7页
面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有... 面对视频的分辨率越来越高导致数据量越来越大的挑战,以更低的采样率实现视频的高质量重构可降低对通信资源的占用,进而降低采样端的部署难度。然而,现有的视频压缩感知方法对视频的帧间相关性无法充分利用,低采样率下的视频重构质量有待进一步提高。随着深度学习技术的引入,基于深度学习的分布式视频压缩感知给视频压缩感知重构提供了新思路。因此,结合3D可变形卷积与Transformer构建CS3Dformer网络,利用3D可变形卷积捕获视频的局部特征和时空特征的有效性,学习视频帧间的时空特征;同时,利用Transformer捕获长距离依赖特征的优点,一定程度上弥补了卷积神经网络方法在捕获图像的非局部相似性方面的缺陷,能更好地实现对视频的建模。所提方法是一种端到端的视频压缩感知方法,在多个数据集上的实验结果验证了该方法的有效性。 展开更多
关键词 压缩感知 视频重构 可变形卷积 transformER 卷积神经网络
在线阅读 下载PDF
CNN结合Transformer的高光谱图像和LiDAR数据协同地物分类方法
2
作者 吴海滨 左云逸 +2 位作者 王爱丽 吕浩然 王敏慧 《仪器仪表学报》 北大核心 2025年第8期286-301,共16页
在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Tran... 在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Transformer的高光谱图像和LiDAR数据的多模态遥感数据协同地物分类方法。首先,该模型通过主成分分析对高光谱图像进行降维处理以去除光谱的冗余信息,继而利用CNN分层捕获局部纹理特征,同时借助Transformer自注意力机制构建全局光谱-空间表征。然后通过双向特征交互机制,将Transformer输出的全局上下文信息注入CNN特征通道,同时将CNN通道提取的局部细节反馈至Transformer支路,经特征耦合单元实现跨尺度特征对齐,强化模型对高光谱图像全局结构与局部细节的联合提取能力。对于LiDAR数据,采用动态卷积级联模块有效捕获高程信息和上下文关系,最终通过跨模态特征融合模块实现双源数据特征的深度交互与融合,在双模态语义互补中提升复杂地物的分类精度。在Houston2013、Trento和Augsburg这3个公开数据集上的实验表明,该方法总体分类精度分别达到99.85%、99.68%和97.34%,平均准确率分别达到99.87%、99.34%和90.60%,较GLT、HCT等主流方法的分类精度有所提高,充分证明所提方法进行多模态数据协同分类的优势和有效性。 展开更多
关键词 高光谱图像 LIdAR数据 transformER 卷积神经网络 多模态数据
原文传递
基于VMD和改进Transformer模型的镍镉蓄电池SOH预测研究
3
作者 于天剑 冯恩来 +1 位作者 伍珣 张庆东 《铁道科学与工程学报》 北大核心 2025年第7期3266-3279,共14页
动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode d... 动车组镍镉电池容量表现出非线性特性和“记忆效应”等特征,严重影响传统动车组电池健康状态(state of health,SOH)预测模型的准确性。为准确预测动车组的SOH并提高其蓄电池管理系统的效率和可靠性,基于变分模态分解(variational mode decomposition,VMD)和改进的Transformer模型,提出一种综合预测框架。首先,通过白鲸优化算法(beluga whale optimization,BWO)对VMD的超参数进行优化,利用VMD分解重构准确捕捉电池在其整个生命周期中的容量退化特性,消除蓄电池记忆效应对SOH预测研究带来的不良影响;其次,在Transformer编码模块中嵌入了长短时记忆网络自编码模块(long short-term memory network autoencoder,LSTM Autoencoder),以有效提取电池健康退化的短期特征信息并压缩数据维度,从而降低模型复杂度;最后,将Transformer解码层替换为全连接神经网络,以降低模型复杂度和减少预测误差累积现象,从而提高模型的预测性能和运行效率。并且在验证方案中,以实际动车组蓄电池为研究对象,通过消融实验以及横向对比实验双向证明研究算法具有最高的预测精度,输出预测结果在均方根误差、平均绝对误差相较于其他模型平均降低了60.83%和62.14%,在决定系数上平均提升了6.73%,具有高度的准确性和鲁棒性。可以实现对电池SOH实现精确的预测,对电池健康状态进行有效监控,为电池检修工作提供数据支撑和方法支持。 展开更多
关键词 镍镉蓄电池 SOH预测 变分模态分解 长短时记忆网络自编码器 改进transformer模型
在线阅读 下载PDF
基于DRSN-Transformer编码器的域自适应辐射源个体识别方法研究
4
作者 张冠杰 李艳斌 +1 位作者 畅鑫 闫红超 《河北工业科技》 2025年第4期303-313,共11页
为了使深度神经网络能够准确识别不同传输信道的辐射源个体,提出了一种基于深度残差收缩网络(deep residual shrinkage network,DRSN)融合Transformer编码器的域自适应个体识别方法。采用DRSN软阈值模块自动去掉I/Q接收信号中的噪声,利... 为了使深度神经网络能够准确识别不同传输信道的辐射源个体,提出了一种基于深度残差收缩网络(deep residual shrinkage network,DRSN)融合Transformer编码器的域自适应个体识别方法。采用DRSN软阈值模块自动去掉I/Q接收信号中的噪声,利用Transformer编码器进一步提取信号中各符号间的依赖特征,使用域自适应对抗学习方法将不同域的目标信号映射为相同分布的目标特征,使得DRSN-Transformer编码器网络模型能够准确提取与信道无关的射频指纹特征(radio frequency fingerprint,RFF),实现信道变化时目标辐射源个体的精准识别,并利用调制器畸变信号模型进行了仿真试验。结果表明:与ResNet和DRSN网络模型相比,所提DRSN-Transformer网络模型的平均识别准确率分别提升了2.98个百分点和1.65个百分点;采用域自适应对抗学习方法的DRSN-Transformer编码器网络模型能够有效降低源域和目标域信号特征分布的不一致性,与传统方法训练的DRSN-Transformer编码器网络模型相比,在信噪比为27 dB时,识别准确率提升了20.73个百分点,显著改善了信道变化时的辐射源个体识别性能。与传统学习方法相比,所提方法虽然增加了特征提取网络与域判别网络的对抗训练过程,但训练完成的特征提取网络能够准确提取与信道变化无关的指纹特征,在辐射源个体识别领域具有一定的应用价值。 展开更多
关键词 计算机神经网络 深度残差收缩网络 transformer编码器 域对抗神经网络 特定辐射源识别 信道自适应
在线阅读 下载PDF
基于Transformer-DCGAR-SAC的移动机器人路径规划 被引量:1
5
作者 张文科 李宏涛 +1 位作者 王科平 杨艺 《传感器与微系统》 北大核心 2025年第5期152-158,共7页
为提升移动机器人在静态或动态场景下处理环境信息的能力及基于随机性策略的动作选取机制,通过深入探讨随机性策略梯度算法,提出了一种基于Transformer的双重Critic网络引导的动作选择机制-柔性策略-评估(Transformer DCGAR-SAC)算法的... 为提升移动机器人在静态或动态场景下处理环境信息的能力及基于随机性策略的动作选取机制,通过深入探讨随机性策略梯度算法,提出了一种基于Transformer的双重Critic网络引导的动作选择机制-柔性策略-评估(Transformer DCGAR-SAC)算法的移动机器人路径规划方法。首先,利用了Transformer的高效序列处理能力可以捕捉环境动态变化的特点,将Transformer模型与SAC算法的随机性策略网络融合。随后,提出一种基于双重Critic网络引导的动作选择机制。该机制引入了V网络,并与Q网络共同评估价值差异,指导动作根据相对价值进行选择,减小偏向过估计动作的风险。在仿真实验方面,与两种随机性策略算法进行了对比,所提算法在样本利用率和成功率等多个关键指标上优于其他算法。此外,在真实场景中进行算法的实车实验,并成功在真实场景下实现了路径规划,验证了算法的可行性和有效性。 展开更多
关键词 动态场景 路径规划 深度强化学习 transformER 动作选择机制
在线阅读 下载PDF
基于3D-CNN和融合Transformer的步态识别算法 被引量:1
6
作者 李金成 代雪晶 闫睿骜 《科学技术与工程》 北大核心 2025年第17期7276-7284,共9页
当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经... 当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经网络算法(3D convolutional gait recognition network based on adaptFormer and spect-conv,3D-ASgaitNet)。首先,初始残差卷积层将二进制轮廓数据转换为浮点编码特征图,以提供密集的低级结构特征;在此基础上,光谱层通过频域和时域的联合处理增强特征提取能力,并使用伪3D残差卷积模块进一步提取高级时空特征;最后融合AdaptFormer模块,通过轻量级的下采样-上采样网络结构,以适应不同的数据分布和任务需求,提供灵活的特征变换能力。3D-ASgaitNet分别在4个公开的室内数据集(CASIA-B、OU-MVLP)、室外数据集(GREW、Gait3D)上进行,分别取得99.84%、87.83%、45.32%、72.12%的识别准确率。实验结果表明,所提出方法在CASIA-B、Gait3D数据集中的识别准确率接近SOTA性能。 展开更多
关键词 步态识别 融合transformer 3d残差卷积 二进制轮廓数据
在线阅读 下载PDF
基于Transformer模型的3D NAND闪存剩余寿命预测方法
7
作者 石颖 杨少华 +2 位作者 周斌 吴福根 胡湘洪 《微电子学》 北大核心 2025年第2期327-334,共8页
为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAN... 为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAND闪存的剩余使用寿命进行预测。与LSTM、GRU相比,所建立模型在高温擦写实验数据集中的均方根误差分别下降了20.5%、21.0%;在温度循环擦写实验数据集中则分别下降2.5%和7.8%。实验结果表明,该模型可以准确预测3D NAND闪存的剩余寿命,优化闪存寿命管理策略。 展开更多
关键词 3d NANd闪存 剩余使用寿命 transformer模型 寿命预测
原文传递
基于SVMD-BKA-Transformer的IGBT寿命预测模型 被引量:1
8
作者 邓阳 柴琳 汪亮 《半导体技术》 北大核心 2025年第7期698-706,共9页
绝缘栅双极型晶体管(IGBT)在持续运行过程中易老化失效,引发电力电子装置故障,因此需对IGBT进行寿命预测。提出了一种改进模型用于IGBT寿命预测。首先,以集射极关断尖峰电压(V_(ce-p))为退化特征,对IGBT进行功率循环加速老化试验;获取... 绝缘栅双极型晶体管(IGBT)在持续运行过程中易老化失效,引发电力电子装置故障,因此需对IGBT进行寿命预测。提出了一种改进模型用于IGBT寿命预测。首先,以集射极关断尖峰电压(V_(ce-p))为退化特征,对IGBT进行功率循环加速老化试验;获取相关参数数据并进行处理;利用逐次变分模态分解(SVMD)技术将退化特征数据分解为多个模态。其次,构建Transformer模型,并采用黑翅鸢算法(BKA)寻找其最优超参数以提升预测精度。最后,通过实际IGBT退化特征数据对所提模型进行性能验证。实验结果表明,SVMD-BKA-Transformer模型提升了预测精度:决定系数(R^(2))达到0.9583,平均绝对误差(MAE)降至0.0295 V,均方根误差(RMSE)减小至0.0365 V,性能优于对比模型。 展开更多
关键词 绝缘栅双极型晶体管(IGBT) 寿命预测 模态分解 黑翅鸢算法(BKA) transformER
原文传递
基于改进Transformer模型的Ad Hoc网络MAC协议识别技术
9
作者 何文雯 李盛祥 +3 位作者 王莉 李浩 李盈达 马鹏飞 《电讯技术》 北大核心 2025年第8期1240-1247,共8页
针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分... 针对现有的媒体访问控制(Media Access Control,MAC)协议识别模型存在特征数据选取不完善和只关注局部特征的问题,首先,基于Transformer模型提出了Conv-Transformer模型。该模型将卷积操作引入到模型中,对卷积后特征图中的特征值进行分割拼接,并添加类别信息编码。其次,基于Exata平台搭建不同拓扑结构的Ad Hoc网络仿真场景,收集所有物理层的数据对Conv-Transformer模型进行训练和测试。测试结果表明,在Ad Hoc网络中对ALOHA、CSMA/CA、MACA和TDMA 4种MAC协议的识别任务上,提出的模型与经典深度学习模型递归神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Network,CNN)和Transformer相比,比RNN模型的准确率提高了20.8%,比CNN模型的准确率提高了14.6%,比Transformer模型的准确率提高了68.8%。 展开更多
关键词 Ad Hoc网络 MAC协议识别 深度学习 transformer模型
在线阅读 下载PDF
基于改进VMD与Transformer的GIS局部放电信号识别 被引量:1
10
作者 苑超 丁晓森 +3 位作者 朱雷 胡天羽 申张亮 马宏忠 《机械与电子》 2025年第4期27-34,39,共9页
针对GIS局部放电识别方法在特征选择上处理过程复杂且识别准确率相对较低的问题,提出了一种基于改进海马优化变分模态分解(ISHO-VMD)和改进Transformer的局部放电信号识别方法。首先,通过ISHO-VMD对含噪声的局部放电信号进行分解,提取... 针对GIS局部放电识别方法在特征选择上处理过程复杂且识别准确率相对较低的问题,提出了一种基于改进海马优化变分模态分解(ISHO-VMD)和改进Transformer的局部放电信号识别方法。首先,通过ISHO-VMD对含噪声的局部放电信号进行分解,提取噪声最少的信号作为模型输入,从而降低识别过程中的计算复杂度,并避免了传统特征提取方法中可能出现的信息缺失。然后,通过改进Transformer的自适应特征捕捉能力,实现对不同局部放电类型的高精度识别。实验结果表明,所提方法显著提升了GIS局部放电类型识别的准确性,为GIS故障诊断提供了新思路。 展开更多
关键词 气体绝缘开关 局部放电 注意力机制 优化算法 transformER
在线阅读 下载PDF
基于DCNN-Transformer模型的XSS攻击检测方法 被引量:1
11
作者 何志伟 高大鹏 《信息技术》 2025年第3期93-100,共8页
为进一步提高XSS攻击的检测效果,文中提出一种基于DCNN-Transformer模型的XSS攻击检测方法。通过对收集的数据依次进行解码、规范化、分词、TF-IDF选词、构建词典和编码预处理,用于模型的训练和测试。文中提出的DCNN-Transformer模型引... 为进一步提高XSS攻击的检测效果,文中提出一种基于DCNN-Transformer模型的XSS攻击检测方法。通过对收集的数据依次进行解码、规范化、分词、TF-IDF选词、构建词典和编码预处理,用于模型的训练和测试。文中提出的DCNN-Transformer模型引入了Embedding层,还综合了一维深度卷积神经网络快速处理序列数据和Transformer模型并行处理序列数据及学习序列元素间依赖关系的能力。实验结果表明,DCNN-Transformer模型相比于LSTM、GRU、DCNN和DCNN-GRU模型,收敛速度最快且效果更优,准确率、召回率和f1值最高,模型轻量、检测速度快,综合表现显著优于其他4个模型,为XSS攻击检测提供了一个更优的方法。 展开更多
关键词 XSS攻击检测 卷积神经网络 transformer Embedding层 TF-IdF
在线阅读 下载PDF
基于CEEMDAN-FESC-OVMD-Transformer耦合模型的长江上游月径流预测
12
作者 徐嘉远 邹磊 +2 位作者 张利平 王飞宇 夏军 《水资源保护》 北大核心 2025年第4期197-209,共13页
为提升水文要素非一致性变异背景下的长江上游月径流预测精度,基于宜昌与寸滩水文站1961—2022年逐月径流数据,构建了基于自适应噪声完备集合经验模态分解(CEEMDAN)、模糊熵(FE)、谱聚类(SC)、最优变分模态分解(OVMD)与Transformer深度... 为提升水文要素非一致性变异背景下的长江上游月径流预测精度,基于宜昌与寸滩水文站1961—2022年逐月径流数据,构建了基于自适应噪声完备集合经验模态分解(CEEMDAN)、模糊熵(FE)、谱聚类(SC)、最优变分模态分解(OVMD)与Transformer深度学习模型耦合的CEEMDAN-FESC-OVMD-Transformer混合预测模型对长江上游月径流进行模拟预测。结果表明:CEEMDAN-FESC-OVMD-Transformer混合预测模型在宜昌与寸滩水文站具有较好的月径流预测效果,训练期纳什效率系数高于0.9,测试期纳什效率系数分别达到0.84与0.89;CEEMDAN-FESC-OVMD分解框架可提升汛期峰值流量预测精度;OVMD二次分解结构可有效降低月径流高频序列复杂度,提升径流的预测稳定性。 展开更多
关键词 月径流预测 CEEMdAN VMd transformer 耦合模型 长江上游
在线阅读 下载PDF
基于VMD-T2V-Transformer的太阳辐射预测
13
作者 胡雅彬 史加荣 +1 位作者 陈应瑞 雍龙泉 《太阳能学报》 北大核心 2025年第7期778-784,共7页
太阳辐射的不确定性导致太阳能发电具有明显的随机性和不稳定性。针对此问题,该文结合变分模态分解(VMD)、Time2Vec(T2V)和Transformer,提出一种用于太阳辐射预测的VMD-T2V-Transformer模型。首先利用VMD将太阳辐射序列分解为若干子序列... 太阳辐射的不确定性导致太阳能发电具有明显的随机性和不稳定性。针对此问题,该文结合变分模态分解(VMD)、Time2Vec(T2V)和Transformer,提出一种用于太阳辐射预测的VMD-T2V-Transformer模型。首先利用VMD将太阳辐射序列分解为若干子序列;接着采用T2V对分解后的每个子序列进行时间特征嵌入;然后对嵌入时间特征后的子序列建立Transformer预测模型;最后将各模型的预测结果进行叠加,得到最终预测值。实验结果表明:该文所提模型优于其他主流模型,RMSE和MAE至少降低13.81%和16.44%。 展开更多
关键词 太阳辐射 太阳能发电 变分模态分解 Time2Vec transformER
原文传递
锂离子电池健康状态的DCAE-Transformer预测方法研究 被引量:2
14
作者 李浩平 于波涛 +3 位作者 孟荣华 金朱鸿 杜昕毅 李景瑞 《三峡大学学报(自然科学版)》 CAS 北大核心 2025年第1期106-112,共7页
提出了一种基于Transformer的DCAE-Transformer模型,旨在改善健康状态(SOH)估计的准确性.该方法通过Pearson相关系数筛选关键特征,利用去噪自编码器(DAE)和卷积神经网络(CNN)相结合进行数据预处理和特征提取,再将数据输入Transformer框... 提出了一种基于Transformer的DCAE-Transformer模型,旨在改善健康状态(SOH)估计的准确性.该方法通过Pearson相关系数筛选关键特征,利用去噪自编码器(DAE)和卷积神经网络(CNN)相结合进行数据预处理和特征提取,再将数据输入Transformer框架完成预测.使用NASA和CALCE提供的数据集进行验证,DCAE-Transformer模型在NASA电池样本上的误差指标(EMA、EMAP和ERMS)均低于1%,R2值超过99.5%;在CALCE样本上,误差指标低于5%,R2值超过98%.结果表明,该模型在锂电池SOH估计方面具有较高的精确性和泛化性. 展开更多
关键词 锂电池 健康状态估计 卷积去噪自编码器 transformER 预测性能
在线阅读 下载PDF
基于Transformer全局-局部特征融合的RGB-D显著性检测 被引量:1
15
作者 宋梦柯 王芸 郑元超 《计算机应用与软件》 北大核心 2025年第3期176-182,共7页
现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融... 现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融合后特征送入Transformer编码器通过在所有位置同时整合多尺度和多模态的特征来进行充分的特征融合,获得全局特征依赖关系之后再送入主干网络提取全局—局部融合特征。同时提出双重注意力模块,用来增强两个分支特征的融合效果。在五个公开数据集上进行的实验表明,该网络在三个评价指标上均取得了较好的表现。 展开更多
关键词 RGB-d显著性检测 全局-局部特征 跨模态融合 多尺度 transformER
在线阅读 下载PDF
SwinIdentity-YOLO:基于Transformer改进YOLOv5的缺陷检测算法及其应用
16
作者 陈榕榕 陈壹华 +3 位作者 余松森 徐芳 曾易文浩 杨明樟 《微电子学与计算机》 2025年第7期136-148,共13页
近年来,基于深度学习的表面缺陷检测方法虽然显著提升了检测精度,但由于存在CNN检测模型全局特征提取能力不足以及CNN-Transformer混合模型计算资源消耗过大的问题,限制了其在工业生产中的应用。为了解决这些问题,提出了一种Swin-Identi... 近年来,基于深度学习的表面缺陷检测方法虽然显著提升了检测精度,但由于存在CNN检测模型全局特征提取能力不足以及CNN-Transformer混合模型计算资源消耗过大的问题,限制了其在工业生产中的应用。为了解决这些问题,提出了一种Swin-IdentityFormer网络结构,用于替代YOLOv5中的CSP-Darknet53骨干网络。与直接使用Swin Transformer作为骨干网络对比,模型参数量下降了大约49.4%。同时,引入了skipconcatFPN结构、深度可分离卷积、C2f模块和微小目标检测层,增加网络各层中的特征信息的利用率,实现特征融合,以提高检测精度。此外,还使用MPDIoU损失函数替代CIoU损失函数,以简化损失函数的计算。实验结果表明:该模型在NEUDET数据集和GC10-DET数据集上的检测精度mAP分别为79.59%和74.4%,展现出了良好的泛化能力和鲁棒性。提出的改进方法不仅在保持较高检测精度的同时降低计算资源开销,还为工业生产中的自动化表面缺陷检测应用提供了有价值的理论基础和实用指导。 展开更多
关键词 缺陷检测 YOLOv5 Swin transformer IdentityFormer
在线阅读 下载PDF
基于CBDAE和TCN-Transformer的工业传感器时间序列预测
17
作者 许涛 南新元 +1 位作者 蔡鑫 赵濮 《南京信息工程大学学报》 北大核心 2025年第4期455-466,共12页
在真实的工业物联网环境中,传感器信号常受外界噪声干扰,难以获取纯净数据,这影响了基于数据驱动的时间序列预测任务的准确性.为此,基于改进的对比盲去噪自编码器(Contrast Blind Denoising AutoEncoder,CBDAE)和TCN-Transformer网络,... 在真实的工业物联网环境中,传感器信号常受外界噪声干扰,难以获取纯净数据,这影响了基于数据驱动的时间序列预测任务的准确性.为此,基于改进的对比盲去噪自编码器(Contrast Blind Denoising AutoEncoder,CBDAE)和TCN-Transformer网络,本文提出一种新型时间序列预测框架,称为MoCo-CBDAE-TCN-Transformer.该框架通过引入额外的动量编码器、动态队列和信息噪声对比估计正则化,增强了对时间序列数据动态特征的捕捉能力,并有效利用历史负样本信息.在无需噪声先验知识和传感器纯净数据的前提下,通过捕捉和对比时间相关性和噪声特征,实现传感器数据的盲去噪.去噪后的数据通过TCN-Transformer网络进行时间序列预测.TCN-Transformer网络结合残差连接和膨胀卷积的优势以及Transformer的注意力机制,显著提高了预测的准确性和效率.最后,在公开的四缸过程数据集上进行仿真验证,实验结果表明,与传统的去噪方法和时间序列预测模型相比,本文设计的模型能够获得更好的去噪效果和更高的预测精度,其实时处理能力适合部署在实际的工业环境中,为工业物联网中的数据处理和分析提供了一种有效的技术方案. 展开更多
关键词 去噪自编码器 动量编码器 动态队列 信息噪声对比估计 时间卷积网络 transformER
在线阅读 下载PDF
基于Transformer编码器的CAN/CAN-FD协议入侵检测研究
18
作者 曹举阳 王思山 +4 位作者 司华超 张贵海 吴奇 汪涛 王文涛 《计算机工程与应用》 北大核心 2025年第18期300-308,共9页
汽车总线CAN/CAN-FD协议以广播的形式传播信息,报文容易被截取,极易受到攻击。为解决智能网联汽车CAN/CAN-FD总线的入侵攻击识别问题,提出了一种改进的Transformer编码器入侵检测模型。该模型在公开数据集CAN-FD Intrusion上进行各种攻... 汽车总线CAN/CAN-FD协议以广播的形式传播信息,报文容易被截取,极易受到攻击。为解决智能网联汽车CAN/CAN-FD总线的入侵攻击识别问题,提出了一种改进的Transformer编码器入侵检测模型。该模型在公开数据集CAN-FD Intrusion上进行各种攻击的入侵检测,检测率、精确率、召回率和F1均超过99.9%。通过在公开数据集上与典型模型的对比评测,实验结果表明改进的Transformer编码器模型在各项评价指标均优于对比模型。为了验证此模型的泛化性,通过在智能网联汽车实车CAN/CAN-FD总线上注入DoS和Fuzzing攻击制作实车数据集,并使用该模型对数据集进行检测,实验结果表明该模型具有较高的识别率和较好的泛化性。 展开更多
关键词 CAN-Fd 入侵检测 transformer编码器 doS攻击 Fuzzing攻击
在线阅读 下载PDF
A Hybrid Approach for Pavement Crack Detection Using Mask R-CNN and Vision Transformer Model 被引量:2
19
作者 Shorouq Alshawabkeh Li Wu +2 位作者 Daojun Dong Yao Cheng Liping Li 《Computers, Materials & Continua》 SCIE EI 2025年第1期561-577,共17页
Detecting pavement cracks is critical for road safety and infrastructure management.Traditional methods,relying on manual inspection and basic image processing,are time-consuming and prone to errors.Recent deep-learni... Detecting pavement cracks is critical for road safety and infrastructure management.Traditional methods,relying on manual inspection and basic image processing,are time-consuming and prone to errors.Recent deep-learning(DL)methods automate crack detection,but many still struggle with variable crack patterns and environmental conditions.This study aims to address these limitations by introducing the Masker Transformer,a novel hybrid deep learning model that integrates the precise localization capabilities of Mask Region-based Convolutional Neural Network(Mask R-CNN)with the global contextual awareness of Vision Transformer(ViT).The research focuses on leveraging the strengths of both architectures to enhance segmentation accuracy and adaptability across different pavement conditions.We evaluated the performance of theMaskerTransformer against other state-of-theartmodels such asU-Net,TransformerU-Net(TransUNet),U-NetTransformer(UNETr),SwinU-NetTransformer(Swin-UNETr),You Only Look Once version 8(YoloV8),and Mask R-CNN using two benchmark datasets:Crack500 and DeepCrack.The findings reveal that the MaskerTransformer significantly outperforms the existing models,achieving the highest Dice SimilarityCoefficient(DSC),precision,recall,and F1-Score across both datasets.Specifically,the model attained a DSC of 80.04%on Crack500 and 91.37%on DeepCrack,demonstrating superior segmentation accuracy and reliability.The high precision and recall rates further substantiate its effectiveness in real-world applications,suggesting that the Masker Transformer can serve as a robust tool for automated pavement crack detection,potentially replacing more traditional methods. 展开更多
关键词 Pavement crack segmentation TRANSPORTATION deep learning vision transformer Mask R-CNN image segmentation
在线阅读 下载PDF
VoxTNT:基于多尺度Transformer的点云3D目标检测方法
20
作者 郑强文 吴升 魏婧卉 《地球信息科学学报》 北大核心 2025年第6期1361-1380,共20页
【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究... 【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究提出基于均衡化感受野的3D目标检测方法VoxTNT,通过局部-全局协同注意力机制提升检测性能。在局部层面,设计了PointSetFormer模块,引入诱导集注意力模块(Induced Set Attention Block,ISAB),通过约简的交叉注意力聚合高密度点云的细粒度几何特征,突破传统体素均值池化的信息损失瓶颈;在全局层面,设计了VoxelFormerFFN模块,将非空体素抽象为超点集并实施跨体素ISAB交互,建立长程上下文依赖关系,并将全局特征学习计算负载从O(N^(2))压缩至O(M^(2))(M<<N,M为非空体素数量),规避了复杂的Transformer直接使用在原始点云造成的高计算复杂度。该双域耦合架构实现了局部细粒度感知与全局语义关联的动态平衡,有效缓解固定感受野和多尺度融合导致的特征建模偏差。【结果】实验表明,该方法在KITTI数据集单阶段检测下,中等难度级别的行人检测精度AP(Average Precision)值达到59.56%,较SECOND基线提高约12.4%,两阶段检测下以66.54%的综合指标mAP(mean Average Precision)领先次优方法BSAODet的66.10%。同时,在WOD数据集中验证了方法的有效性,综合指标mAP达到66.09%分别超越SECOND和PointPillars基线7.7%和8.5%。消融实验进一步表明,均衡化局部和全局感受野的3D特征学习机制能显著提升小目标检测精度(如在KITTI数据集中全组件消融的情况下,中等难度级别的行人和骑行者检测精度分别下降10.8%和10.0%),同时保持大目标检测的稳定性。【结论】本研究为解决自动驾驶多尺度目标检测难题提供了新思路,未来将优化模型结构以进一步提升效能。 展开更多
关键词 智能交通工程 自动驾驶 点云 三维目标检测 体素 transformER
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部