期刊文献+
共找到1,128篇文章
< 1 2 57 >
每页显示 20 50 100
An infrared and visible image fusion method based upon multi-scale and top-hat transforms 被引量:1
1
作者 Gui-Qing He Qi-Qi Zhang +3 位作者 Hai-Xi Zhang Jia-Qi Ji Dan-Dan Dong Jun Wang 《Chinese Physics B》 SCIE EI CAS CSCD 2018年第11期340-348,共9页
The high-frequency components in the traditional multi-scale transform method are approximately sparse, which can represent different information of the details. But in the low-frequency component, the coefficients ar... The high-frequency components in the traditional multi-scale transform method are approximately sparse, which can represent different information of the details. But in the low-frequency component, the coefficients around the zero value are very few, so we cannot sparsely represent low-frequency image information. The low-frequency component contains the main energy of the image and depicts the profile of the image. Direct fusion of the low-frequency component will not be conducive to obtain highly accurate fusion result. Therefore, this paper presents an infrared and visible image fusion method combining the multi-scale and top-hat transforms. On one hand, the new top-hat-transform can effectively extract the salient features of the low-frequency component. On the other hand, the multi-scale transform can extract highfrequency detailed information in multiple scales and from diverse directions. The combination of the two methods is conducive to the acquisition of more characteristics and more accurate fusion results. Among them, for the low-frequency component, a new type of top-hat transform is used to extract low-frequency features, and then different fusion rules are applied to fuse the low-frequency features and low-frequency background; for high-frequency components, the product of characteristics method is used to integrate the detailed information in high-frequency. Experimental results show that the proposed algorithm can obtain more detailed information and clearer infrared target fusion results than the traditional multiscale transform methods. Compared with the state-of-the-art fusion methods based on sparse representation, the proposed algorithm is simple and efficacious, and the time consumption is significantly reduced. 展开更多
关键词 infrared and visible image fusion multi-scale transform mathematical morphology top-hat trans- form
原文传递
基于多尺度特征提取与ResNet-Transformer的抽油机故障诊断
2
作者 韩东颖 朱志洲 +1 位作者 葛子轩 时培明 《计量学报》 北大核心 2026年第1期35-41,共7页
提出了一种多尺度特征提取与ResNet-Transformer算法用于抽油机故障诊断。首先,利用深度残差网络ResNet-34的局部特征提取能力捕获示功图空间细节,并借助Transformer编码器上下文建模能力获取全局特征,构建了端到端的抽油机故障诊断框架... 提出了一种多尺度特征提取与ResNet-Transformer算法用于抽油机故障诊断。首先,利用深度残差网络ResNet-34的局部特征提取能力捕获示功图空间细节,并借助Transformer编码器上下文建模能力获取全局特征,构建了端到端的抽油机故障诊断框架;其次,引入多尺度特征提取模块,通过1×1、3×3和5×5卷积核并行提取不同尺度的特征信息,增强对示功图细节的感知能力;最后,设计了特征融合注意力机制,自适应地整合多尺度特征和全局语义信息。在包含7种典型工况的示功图数据集上进行实验,结果表明,该算法在故障诊断任务中取得了94%准确率,验证了所提算法的有效性。 展开更多
关键词 力学计量 故障诊断 抽油机 示功图 多尺度特征提取 ResNet-transformer模型
在线阅读 下载PDF
基于TCN-Transformer混合架构的中低速磁浮列车制动模型
3
作者 王果 石开 +3 位作者 闵永智 吕微熹 夏楷哲 吴艾玲 《科学技术与工程》 北大核心 2026年第6期2579-2591,共13页
针对中低速磁浮列车传统单质点制动模型电制动响应延迟、液压补偿离散导致的列车制动建模问题,提出了基于TCN-Transformer(temporal convolutional network-transformer)混合架构的制动模型。通过三级预处理体系构建:涡流测速数据缺失... 针对中低速磁浮列车传统单质点制动模型电制动响应延迟、液压补偿离散导致的列车制动建模问题,提出了基于TCN-Transformer(temporal convolutional network-transformer)混合架构的制动模型。通过三级预处理体系构建:涡流测速数据缺失值插补、运行状态分解和多尺度窗口特征生成,融合时间卷积网络的局部时序模式捕获能力,结合Transformer的全局动态关联建模优势,建立中低速磁浮列车制动特性预测方法。实验表明,该模型在50步长预测时平均绝对误差为1.114 km/h,较单体Transformer模型降低7.2%;线路实测数据集验证显示,模型制动响应时间较传统动力学模型提前22.1 s,消除最高限速段超限波动,停车位移误差缩小32.4%。研究表明,混合架构通过多尺度特征融合有效解决了电-液混合制动动态补偿的非线性建模问题,为磁浮列车智能制动系统提供了具有实时预测能力的解决方案。 展开更多
关键词 中低速磁浮列车 TCN-transformer混合架构 制动建模 多尺度特征融合 时间序列预测
在线阅读 下载PDF
基于Transformer多尺度融合网络的暖通空调能耗预测模型
4
作者 于水 韩府宏 +1 位作者 罗宇晨 孙圣坤 《太阳能学报》 北大核心 2026年第2期300-309,共10页
提出一种基于Transformer的多尺度融合网络模型,用于预测建筑暖通空调的能耗。通过引入多尺度金字塔模块与时间卷积网络结构,该模型能够有效捕捉时序特征的局部与整体信息,从而提高预测的准确性。实验结果表明,该模型在预测性能上优于... 提出一种基于Transformer的多尺度融合网络模型,用于预测建筑暖通空调的能耗。通过引入多尺度金字塔模块与时间卷积网络结构,该模型能够有效捕捉时序特征的局部与整体信息,从而提高预测的准确性。实验结果表明,该模型在预测性能上优于传统的单一模型,均方根误差(RMSE)与平均绝对误差(MAE)均显著降低,决定系数(R2)达到0.9826。该模型可为建筑能耗管理提供一种高效且准确的预测工具,有助于实现更高效的建筑能源管理与节能策略。 展开更多
关键词 HVAC 特征提取 深度学习 负荷预测 多尺度特征 transformer模型
原文传递
多尺度Transformer结合残差卷积的管道微泄漏孔径识别
5
作者 王新颖 田豪杰 +2 位作者 蒋婷婷 江志伟 陈俨 《安全与环境学报》 北大核心 2026年第3期1025-1035,共11页
为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution co... 为了解决传统机器学习与卷积神经网络(Convolutional Neural Networks,CNN)在输气管道微泄漏孔径识别中精度低和性能不佳的问题,提出了一种多尺度Transformer与残差卷积结合的模型(Multi-Scale Transformer and Residual convolution combined model,MS Transformer-Residual)来预测微泄漏孔径。该模型通过模拟燃气管道系统采集不同孔径泄漏下的声发射信号,利用残差卷积模块提取局部时序特征,并采用多尺度Transformer自注意力机制建模全局信号依赖关系,使用五折交叉验证及独立测试集评估模型性能,并与三种消融基准模型进行对比。结果表明:MS Transformer-Residual模型的微泄漏孔径识别准确率达99.96%,与CNN、CNN-Transformer、残差CNN-Transformer模型相比,模型的最高准确率至少提升4.53百分点。研究证实多尺度特征融合策略显著提升了毫米级泄漏孔径的辨识精度,为工业管道健康监测提供了新的解决方案。 展开更多
关键词 安全工程 多尺度学习 transformER 微泄漏检测 残差卷积神经网络
原文传递
基于多尺度特征增强和时序Transformer的SiC外延生长浓度预测模型
6
作者 张忠义 王朗 +6 位作者 芦伟立 李帅 杨建业 高楠 王波 潘国平 房玉龙 《硅酸盐学报》 北大核心 2026年第1期35-48,共14页
碳化硅(SiC)外延层掺杂浓度直接决定功率器件性能,现有调控依赖人工经验与离线测试,存在成本高、滞后性强的问题。为此,提出一种多尺度特征增强时序Transformer(Multi-scale Feature-enhanced Temporal Transformer Network,MFT-Net)模... 碳化硅(SiC)外延层掺杂浓度直接决定功率器件性能,现有调控依赖人工经验与离线测试,存在成本高、滞后性强的问题。为此,提出一种多尺度特征增强时序Transformer(Multi-scale Feature-enhanced Temporal Transformer Network,MFT-Net)模型,整合多尺度卷积、压缩和激励(SE)模块、Transformer及门控循环单元(GRU)模块,构建“当炉-下炉”双场景浓度预测体系。多尺度卷积捕捉毫秒至小时级参数动态,SE强化核心特征,Transformer建模全参数耦合,GRU传递跨炉状态。基于1200炉数据实验表明,模型当炉预测相对误差低至1.35%、决定系数R_(2)达0.89,下炉预测相对误差为1.66%,R_(2)达到0.87,显著优于传统模型。经统计,该模型预计可降低离线测试成本约30%、提升工艺稳定性约15%,为SiC外延智能化提供支撑。 展开更多
关键词 碳化硅外延生长 核心层掺杂浓度 多尺度卷积 transformER 工艺参数预测 深度学习
原文传递
Denoising of seismic data via multi-scale ridgelet transform 被引量:4
7
作者 Henglei Zhang Tianyou Liu Yuncui Zhang 《Earthquake Science》 CSCD 2009年第5期493-498,共6页
Noise has traditionally been suppressed or eliminated in seismic data sets by the use of Fourier filters and, to a lesser degree, nonlinear statistical filters. Although these methods are quite useful under specific c... Noise has traditionally been suppressed or eliminated in seismic data sets by the use of Fourier filters and, to a lesser degree, nonlinear statistical filters. Although these methods are quite useful under specific conditions, they may produce undesirable effects for the low signal to noise ratio data. In this paper, a new method, multi-scale ridgelet transform, is used in the light of the theory of ridgelet transform. We employ wavelet transform to do sub-band decomposition for the signals and then use non-linear thresholding in ridgelet domain for every block. In other words, it is based on the idea of partition, at sufficiently fine scale, a curving singularity looks straight, and so ridgelet transform can work well in such cases. Applications on both synthetic data and actual seismic data from Sichuan basin, South China, show that the new method eliminates the noise portion of the signal more efficiently and retains a greater amount of geologic data than other methods, the quality and consecutiveness of seismic event are improved obviously as well as the quality of section is improved. 展开更多
关键词 ridgelet transform multi-scale random noise sub-band decomposition complex Morlet wavelet
在线阅读 下载PDF
融合Transformer和Inception的网络入侵检测研究
8
作者 张万琪 王家兴 宋振峰 《电信科学》 北大核心 2026年第1期127-144,共18页
针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transf... 针对当前入侵检测模型流量特征提取信息能力不足且检测效率低的问题,提出一种结合特征预提取模块和残差注意力模块(feature pre-extraction module-residual attention module,FRAM)、Transformer-DSCInception-金字塔注意力机制(Transformer-DSC-Inception-pyramid squeeze attention,T-DIPSA)的入侵检测方法,即T-DIPSA-FRAM。该方法融合自适应过采样(adaptive synthetic sampling,ADASYN)、精简编辑最近邻(reduced edited nearest neighbors,RENN)和局部离群因子(local outlier factor,LOF)算法,提高模型在复杂网络流量环境下的检测性能。首先,采用自适应混合采样与离群点检测(AR-LOF)算法平衡数据集;其次,设计包含残差注意力模块的特征预提取模块,初步高效提取网络流量中的关键特征,改善高维特征的学习稳定性;最后,设计局部特征增强注意力模块,利用Transformer编码器结构捕捉长距离依赖关系的同时,融合DIPSA的前馈网络聚焦多尺度局部空间特征,增强模型对动态、非均匀分布流量的敏感性。实验结果表明,在UNSW-NB15数据集和ToN-IoT数据集的二分类和多分类检测任务中,T-DIPSA-FRAM取得的F1值分别为93.58%、95.35%,加权F1值分别为88.26%、91.03%。研究表明,T-DIPSA-FRAM方法能够有效提升网络入侵检测的可靠性。 展开更多
关键词 网络入侵检测 transformER INCEPTION 残差注意力模块 多尺度卷积
在线阅读 下载PDF
基于改进特征金字塔和Transformer的多分支人群密度估计方法
9
作者 杨长敏 李泽滔 《现代电子技术》 北大核心 2026年第3期121-127,共7页
为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度... 为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度的通道和空间加权,从而增强特征表达的准确性;其次,构建Transformer分支,将VGG和CBAM处理后的特征作为输入,利用Transformer的自注意力机制进行全局特征建模;最后,采用IFPN进行多尺度特征融合,通过有效结合不同层级的特征,使模型同时关注目标的局部细节信息和全局上下文。在公开数据集上的实验结果表明,该方法在多个基准测试中的性能优于现有主流方法。在ShanghaiTechPartA数据集上,所提模型的MAE和RMSE分别达到55.6和94.1;在ShanghaiTechPartB数据集上,MAE和RMSE分别达到6.2和10.1;在UCF-QNRF数据集上,MAE和RMSE分别达到83.4和144.9。实验结果验证了该方法在背景噪声和人群尺度不一场景下的鲁棒性,并显著提高了人群密度估计的准确性。 展开更多
关键词 人群密度估计 深度学习 transformER CBAM 特征金字塔网络 多尺度特征融合
在线阅读 下载PDF
多源异频数据多尺度融合:基于Transformer的煤炭需求预测研究
10
作者 邵枫 冯雨 +3 位作者 沈浩楠 耿国强 黄鹏 邵虎 《煤炭经济研究》 2026年第1期37-45,共9页
准确预测煤炭需求对于保障国家能源安全、稳定市场价格及制定宏观经济政策具有至关重要的作用。然而,影响煤炭需求的因素众多,其相关数据往往来源于不同部门,具有日度、旬度、月度等多样的采集频率,给传统预测模型带来了巨大挑战。为解... 准确预测煤炭需求对于保障国家能源安全、稳定市场价格及制定宏观经济政策具有至关重要的作用。然而,影响煤炭需求的因素众多,其相关数据往往来源于不同部门,具有日度、旬度、月度等多样的采集频率,给传统预测模型带来了巨大挑战。为解决该问题,提出一种融合多频率特征的深度学习模型——多频时间序列Transformer(MFT-Former),用于煤炭需求预测。该方法首先通过一套系统化的数据处理流程,将多源异构的原始数据清洗、对齐并重采样为3个时间同步的高、中、低频特征矩阵。随后,将此3个矩阵作为并行输入,送入一个特殊设计的多输入Transformer网络。该网络包含3个独立的编码器分支,分别捕捉各频率下的时间依赖模式,并通过一个融合层将提取到的深层特征进行整合,实现对未来煤炭需求的预测。利用包含多个经济与行业指标的真实数据集,以过去12个月的数据预测未来6个月的需求为任务,对模型预测表现进行评估。实验结果表明,MFT-Former模型能够有效融合不同时间尺度的信息,其在测试集上的平均绝对百分比误差达到6.24%,证明了该方法在处理复杂、多频时间序列预测问题上的有效性和准确性。 展开更多
关键词 煤炭需求预测 多源异频数据 多尺度特征融合 transformER 时间序列预测
原文传递
Multi-scale phase average waveform of electroencephalogram signals in childhood absence epilepsy using wavelet transformation 被引量:1
11
作者 Meiyun Zhang Benshu Zhang +2 位作者 Fenglou Wang Ying Chen Nan Jiang 《Neural Regeneration Research》 SCIE CAS CSCD 2010年第10期774-780,共7页
BACKGROUND: Recent studies have focused on various methods of wavelet transformation for electroencephalogram (EEG) signals. However, there are very few studies reporting characteristics of multi-scale phase waves ... BACKGROUND: Recent studies have focused on various methods of wavelet transformation for electroencephalogram (EEG) signals. However, there are very few studies reporting characteristics of multi-scale phase waves during epileptic discharge.OBJECTIVE: To extract multi-scale phase average waveforms from childhood absence epilepsy EEG signals between time and frequency domains using wavelet transformation, and to compare EEG signals of absence seizure with pre-epileptic seizure and normal children, and to quantify multi-scale phase average waveforms from childhood absence epilepsy EEG signals. DESIGN, TIME AND SETTING: The case-comparative experiment was performed at the Department of Neuroelectrophysiology, Tianjin Medical University from August 2002 to May 2005. PARTICIPANTS: A total of 15 patients with childhood absence epilepsy from the General Hospital of Tianjin Medical University were enrolled in the study. The patients were not administered anti-epileptic drugs or sedatives prior to EEG testing. In addition, 12 healthy, age- and gender-matched children were also enrolled.METHODS: EEG signals were tested on 15 patients with childhood absence epilepsy and 12 normal children. Epileptic discharge signals during clinical and subclinical seizures were collected 10 and 20 times, respectively. The collected EEG signals were treated with wavelet transformation to extract multi-scale characteristics during absence epilepsy seizure using a conditional sampling method. Multi-scale phase average waveforms were collected using a conditional phase averaging technique. Amplitude of phase average waveform from EEG signals of epilepsy seizure, subclinical epileptic discharge, and EEG signals of normal children were compared and statistically analyzed in the first half-cycle.MAIN OUTCOME MEASURES: Multi-scale wavelet coefficient and the evolution of EEG signals were observed during childhood absence epilepsy seizures using wavelet transformation. Multi-scale phase average waveforms from EEG signals were observed using a conditional sampling method and phase averaging technique.RESULTS: Multi-scale characteristics of EEG signals demonstrated that 12-scale (3 Hz) rhythmical activity was significantly enhanced during childhood absence epilepsy seizure and co-existed with background structure (〈1 Hz, low frequency discharge). The phase average wave exhibited opposed phase abnormal rhythm at 3 Hz. Prior to childhood absence epilepsy seizure, EEG detected opposed abnormal a rhythm and 3 Hz composition, which were not detected with traditional EEG. Compared to EEG signals from normal children, epileptic discharges from clinical and subclinical childhood absence epilepsy seizures were positive and amplitude was significantly greater (P〈0.05).CONCLUSION: Wavelet transformation was used to analyze EEG signals from childhood absence epilepsy to obtain multi-scale quantitative characteristics and phase average waveforms. Multi-scale wavelet coefficients of EEG signals correlated with childhood absence epilepsy seizure, and multi-scale waveforms prior to epilepsy seizure were similar to characteristics during the onset period. Compared to normal children, EEG signals during epilepsy seizure exhibited an opposed phase model. 展开更多
关键词 EEG multi-scale absence epilepsy wavelet transform phase average waveform neuroelectrophysiology neural regeneration
暂未订购
基于特征增强的Transformer-RegNet_Y网络的车道线检测研究
12
作者 柏月鸿 张昕 《通信与信息技术》 2026年第2期53-58,共6页
针对车道线在遮挡、缺失与强光干扰等复杂路况下难以准确检测的问题,提出了一种融合RegNet_Y与Transformer的特征增强型车道线检测方法,基于RegNet_Y的高效特征提取能力,结合Transformer强大的上下文建模能力,实现了对细长车道线特征的... 针对车道线在遮挡、缺失与强光干扰等复杂路况下难以准确检测的问题,提出了一种融合RegNet_Y与Transformer的特征增强型车道线检测方法,基于RegNet_Y的高效特征提取能力,结合Transformer强大的上下文建模能力,实现了对细长车道线特征的有效提取与远距离点之间偏移关系的精准捕捉。在此基础上,引入多尺度特征融合策略,提升了网络的多尺度建模能力并抑制冗余信息干扰;同时,设计指数滑动平均(EMA)特征增强模块,通过特征平滑机制增强训练稳定性与细粒度信息表达能力,从而提高检测精度。在TuSimple数据集上的实验结果表明,该方法在准确率和召回率上分别达到93.4%和91.9%,显著优于对比方法,验证了其在复杂环境下的检测鲁棒性与有效性。 展开更多
关键词 车道线检测 RegNet_Y transformER 多尺度卷积 指数滑动平均
在线阅读 下载PDF
融合时间空间的多尺度Transformer人脸伪造检测
13
作者 杜利莎 杨高明 《兰州工业学院学报》 2026年第1期15-20,共6页
针对目前人脸伪造检测无法充分提取时间特征、检测效率低等问题,提出一种融合时间特征和空间特征的多尺度人脸伪造检测方法MST-ViT。MST-ViT方法设计双流结构提取包含全局信息和细节信息的多尺度特征,设计帧间差异捕获模块增强对时间伪... 针对目前人脸伪造检测无法充分提取时间特征、检测效率低等问题,提出一种融合时间特征和空间特征的多尺度人脸伪造检测方法MST-ViT。MST-ViT方法设计双流结构提取包含全局信息和细节信息的多尺度特征,设计帧间差异捕获模块增强对时间伪影的提取,并通过时空Transformer提取时间特征和空间特征。实验结果表明:所提模型在FF++数据集内的AUC结果提升1.71%;在具有挑战性的DFDC跨数据集实验中AUC提升2.06%。 展开更多
关键词 人脸伪造检测 空间特征 时间特征 多尺度特征 transformER
在线阅读 下载PDF
基于Transformer统一多尺度时序卷积网络的煤矿井下输送机堆煤检测
14
作者 张锦洋 吴浩 +1 位作者 王铭耀 杨甫杰 《科学技术与工程》 北大核心 2026年第4期1415-1422,共8页
堆煤是输送机常见故障之一,为了保障煤矿工业生产的安全,需要对煤矿井下输送机的堆煤情况进行检测。然而现有的检测方法存在容易误触、检测可靠性较差等缺点,针对这些问题提出一种基于Transformer统一多尺度时序卷积(unified multi-scal... 堆煤是输送机常见故障之一,为了保障煤矿工业生产的安全,需要对煤矿井下输送机的堆煤情况进行检测。然而现有的检测方法存在容易误触、检测可靠性较差等缺点,针对这些问题提出一种基于Transformer统一多尺度时序卷积(unified multi-scale temporal ConvTransformer,UnMS-TCT)网络用于输送机堆煤检测。首先融合RGB帧和光流帧提取的特征,使网络更全面地建模时空关系;然后在时序编码器中,将动态位置嵌入(dynamic position embedding,DPE),多头关系聚合器(multi-head relation aggregator,MHRA)以及多层感知机(multilayer perceptron,MLP)组成的全局模块,交叉注意力(cross-attention,CA)组成的局部模块,以交替方式形成全局-局部关系模块,增强多尺度下获取全局和局部时间关系的能力;其次利用残差全局-局部融合(residual global and local fusion,ResGLFus)模块融合多尺度特征,有效地提高融合过程的稳定性,最终实现高精度堆煤预测。实验结果表明:该方法能够实现对输送机堆煤的检测,mAP达到98.17%。 展开更多
关键词 堆煤 输送机 transformER 多尺度 全局-局部关系模块
在线阅读 下载PDF
融合KAN与Transformer的分心驾驶行为增强检测模型
15
作者 陈万志 于南洋 范兴杰 《安全与环境学报》 北大核心 2026年第1期88-99,共12页
分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kol... 分心驾驶行为的精准检测对于驾驶安全预警至关重要。为解决复杂驾驶场景中现有安全监测模型易受噪声干扰、细粒度行为识别不足及实时性差等问题,提出一种融合Kolmogorov-Arnold网络与Transformer的增强检测模型。首先,重构分组共享的Kolmogorov-Arnold网络,通过有理函数逼近与分组参数共享减少参数量,增强微动作特征的提取;其次,采用多尺度扩张注意力机制,通过滑动窗口稀疏采样与渐进扩张率分配,实现局部细节感知与长程上下文建模的协同优化;最后,通过训练优化模型实现分心驾驶行为的分类检测。试验结果表明,所提模型在典型数据集上检测精度达92.3%(较基线提升8.5百分点),实时速度为45帧/s,遮挡召回率提升11.7百分点。所提模型在平衡检测精度的同时实现了轻量化设计,满足智能驾驶安全预警中分心驾驶行为的实时检测需求。 展开更多
关键词 安全工程 驾驶安全 Kolmogorov-Arnold网络 transformer模型 分组共享 多尺度扩张注意力
原文传递
基于自适应卷积和动态Transformer的红外与可见光图像融合
16
作者 杨国荣 李鹏辉 +1 位作者 赵皓阳 赵文彬 《电子技术应用》 2026年第3期121-131,共11页
在红外与可见光图像融合任务中,传统卷积网络多依赖固定卷积核,难以根据场景差异自适应提取跨模态特征,也难以兼顾局部纹理与全局语义关系。因此,提出一种结合自适应卷积和多尺度动态Transformer的融合方法。自适应卷积用于提升不同模... 在红外与可见光图像融合任务中,传统卷积网络多依赖固定卷积核,难以根据场景差异自适应提取跨模态特征,也难以兼顾局部纹理与全局语义关系。因此,提出一种结合自适应卷积和多尺度动态Transformer的融合方法。自适应卷积用于提升不同模态特征的空间对齐与互补信息交互能力;动态Transformer在此基础上强化远程依赖建模,同时抑制局部细节的退化,多尺度结构设计进一步广泛捕获多层次关键信息。解码器端到端生成融合图像,并结合像素、梯度与结构三元组损失进行优化。实验在TNO与RoadScene数据集上开展,对比六种主流方法,结果表明本方法在图像质量、信息保持与细节增强方面均取得优越性能,并在推理效率与性能稳定性方面取得良好平衡,能够有效兼顾红外目标的显著性与可见光纹理的保真。 展开更多
关键词 红外光与可见光图像 自适应卷积 动态transformer 图像融合 多尺度
在线阅读 下载PDF
基于时序二维变换和多尺度Transformer的电能质量扰动分类方法 被引量:3
17
作者 王守相 李慧强 +3 位作者 赵倩宇 郭陆阳 王同勋 王洋 《电力系统自动化》 北大核心 2025年第7期198-207,共10页
随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利... 随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利用时序二维变换将一维PQD时间序列转换为一组基于多个周期的二维张量,以实现在二维空间中深入挖掘PQD信号中所包含的特征信息。然后,通过多尺度Transformer编码器模块提取PQD信号的多尺度特征图,利用多尺度Transformer解码器模块对多尺度特征图进行拼接和特征融合,有效合并在不同尺度上提取的特征图。最后,通过全连接层和Softmax分类器完成PQD分类任务。为验证所提方法的有效性,建立了含24种PQD的数据集对模型进行测试,结果表明所提方法对PQD信号具有较高的分类准确率和噪声鲁棒性。 展开更多
关键词 电能质量 扰动 分类 时序二维变换 多尺度transformer 特征提取 特征融合
在线阅读 下载PDF
多维度聚合Transformer的图像超分辨率重建 被引量:3
18
作者 陈清江 陈鹏民 《光学精密工程》 北大核心 2025年第12期1955-1970,共16页
针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。... 针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。其次,设计了空间-通道交互模块,并将其集成于Transformer层中,利用四种形式的注意力机制充分提取关键特征并实现特征融合,从而提升模型性能。最后,提出了特征重用Transformer模块,深入挖掘各层特征之间的关联,精准提取并高效重用重要特征,进一步加强模型表现。实验结果表明,在五个基准测试集上,所提方法优于其他先进算法。在不同放大倍数的超分辨率任务中,相较于基于Swin Transformer的图像恢复方法,峰值信噪比和结构相似度分别平均提升了约0.26 dB和0.0024,且重建效果更加清晰。该方法有效克服了现有方法的不足,在超分辨率任务中展现出显著的性能提升和应用潜力。 展开更多
关键词 图像超分辨率 transformER 注意力机制 特征交互 特征重用 多尺度
在线阅读 下载PDF
基于Transformer和门控融合机制的图像去雾算法 被引量:2
19
作者 王燕 陈燕燕 +1 位作者 刘晶晶 胡津源 《计算机系统应用》 2025年第2期1-10,共10页
针对现有的图像去雾算法仍然存在去雾不彻底、去雾后的图像边缘模糊、细节信息丢失等问题,本文提出了一种基于Transformer和门控融合机制的图像去雾算法.通过改进的通道自注意力机制提取图像的全局特征,提高模型处理图像的效率,设计多... 针对现有的图像去雾算法仍然存在去雾不彻底、去雾后的图像边缘模糊、细节信息丢失等问题,本文提出了一种基于Transformer和门控融合机制的图像去雾算法.通过改进的通道自注意力机制提取图像的全局特征,提高模型处理图像的效率,设计多尺度门控融合块捕获不同尺度的特征,门控融合机制通过动态调整权重,提高模型对不同雾化程度的适应能力,同时更好地保留图像边缘及细节信息,并使用残差连接增强特征的重用性,提高模型泛化能力.经实验验证,所提出的去雾算法可以有效恢复真实有雾图像中的内容信息,在合成的有雾图像数据集SOTS上的峰值信噪比达到了34.841 dB,结构相似性达到了0.984,去雾后的图像内容信息完整且没有出现细节信息模糊和去雾不彻底等现象. 展开更多
关键词 图像去雾 transformER 自注意力机制 门控融合机制 多尺度特征融合
在线阅读 下载PDF
结合空间通道特征与图注意力的分层Transformer微表情识别方法
20
作者 曹春萍 魏金鑫 《模式识别与人工智能》 北大核心 2025年第11期1027-1040,共14页
针对现有微表情识别方法存在多尺度特征提取能力不足、区域协同关系建模不充分及计算复杂度较高等缺点,提出结合空间通道特征与图注意力的分层Transformer微表情识别方法(Hierarchical Transformer for Micro-Expression Recognition wi... 针对现有微表情识别方法存在多尺度特征提取能力不足、区域协同关系建模不充分及计算复杂度较高等缺点,提出结合空间通道特征与图注意力的分层Transformer微表情识别方法(Hierarchical Transformer for Micro-Expression Recognition with Spatial-Channel Features and Graph Attention,HT-SCGA).首先,设计多尺度动态窗口模块,通过自适应窗口扩展实现从局部到全局的特征层次化提取.然后,设计双域特征关联模块,在空间维度与通道维度建模细粒度依赖关系,有效提升特征表达能力并降低计算复杂度.最后,构建图注意力聚合模块,显式建模面部关键区域间的语义依赖,增强面部动作单元的联动特征.在多个数据集上的实验表明,HT-SCGA性能较优,由此表明其在微表情识别任务中的有效性与高效性. 展开更多
关键词 微表情识别 transformER 图注意力 多尺度特征提取
在线阅读 下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部