期刊文献+
共找到254,101篇文章
< 1 2 250 >
每页显示 20 50 100
New SAR Imaging Algorithm via the Optimal Time-Frequency Transform Domain 被引量:1
1
作者 Zhenli Wang Qun Wang +2 位作者 Jiayin Liu Zheng Liang Jingsong Xu 《Computers, Materials & Continua》 SCIE EI 2020年第12期2351-2363,共13页
To address the low-resolution imaging problem in relation to traditional Range Doppler(RD)algorithm,this paper intends to propose a new algorithm based on Fractional Fourier Transform(FrFT),which proves highly advanta... To address the low-resolution imaging problem in relation to traditional Range Doppler(RD)algorithm,this paper intends to propose a new algorithm based on Fractional Fourier Transform(FrFT),which proves highly advantageous in the acquisition of high-resolution Synthetic Aperture Radar(SAR)images.The expression of the optimal order of SAR range signals using FrFT is deduced in detail,and the corresponding expression of the azimuth signal is also given.Theoretical analysis shows that,the optimal order in range(azimuth)direction,which turns out to be very unique,depends on the known imaging parameters of SAR,therefore the engineering practicability of FrFT-RD algorithm can be greatly improved without the need of order iteration.The FrFT-RD algorithm is established after an analysis of the optimal time-frequency transform.Experimental results demonstrate that,compared with traditional RD algorithm,the main-lobe width of the peak-point target of FrFT-RD algorithm is narrow in both range and azimuth directions.While the peak amplitude of the first side-lobe is reduced significantly,those of other side-lobes also drop in various degrees.In this way,the imaging resolution of range and azimuth can be increased considerably. 展开更多
关键词 Fourier transform fractional Fourier transform synthetic aperture radar range doppler algorithm
在线阅读 下载PDF
Ground roll attenuation using a time-frequency dependent polarization filter based on the S transform 被引量:8
2
作者 谭玉阳 何川 +1 位作者 王艳冬 赵忠 《Applied Geophysics》 SCIE CSCD 2013年第3期279-294,358,共17页
The ground roll and body wave usually show significant differences in arrival time, frequency content, and polarization characteristics, and conventional polarization filters that operate in either the time or frequen... The ground roll and body wave usually show significant differences in arrival time, frequency content, and polarization characteristics, and conventional polarization filters that operate in either the time or frequency domain cannot consider all these elements. Therefore, we have developed a time-frequency dependent polarization filter based on the S transform to attenuate the ground roll in seismic records. Our approach adopts the complex coefficients of the S transform of the multi-component seismic data to estimate the local polarization attributes and utilizes the estimated attributes to construct the filter function. In this study, we select the S transform to design this polarization filter because its scalable window length can ensure the same number of cycles of a Fourier sinusoid, thereby rendering more precise estimation of local polarization attributes. The results of applying our approach in synthetic and real data examples demonstrate that the proposed polarization filter can effectively attenuate the ground roll and successfully preserve the body wave. 展开更多
关键词 Ground roll S transform spectral matrix polarization attributes polarization filter
在线阅读 下载PDF
Convolutional sparse coding network for sparse seismic time-frequency representation
3
作者 Qiansheng Wei Zishuai Li +3 位作者 Haonan Feng Yueying Jiang Yang Yang Zhiguo Wang 《Artificial Intelligence in Geosciences》 2025年第1期299-304,共6页
Seismic time-frequency(TF)transforms are essential tools in reservoir interpretation and signal processing,particularly for characterizing frequency variations in non-stationary seismic data.Recently,sparse TF trans-f... Seismic time-frequency(TF)transforms are essential tools in reservoir interpretation and signal processing,particularly for characterizing frequency variations in non-stationary seismic data.Recently,sparse TF trans-forms,which leverage sparse coding(SC),have gained significant attention in the geosciences due to their ability to achieve high TF resolution.However,the iterative approaches typically employed in sparse TF transforms are computationally intensive,making them impractical for real seismic data analysis.To address this issue,we propose an interpretable convolutional sparse coding(CSC)network to achieve high TF resolution.The proposed model is generated based on the traditional short-time Fourier transform(STFT)transform and a modified UNet,named ULISTANet.In this design,we replace the conventional convolutional layers of the UNet with learnable iterative shrinkage thresholding algorithm(LISTA)blocks,a specialized form of CSC.The LISTA block,which evolves from the traditional iterative shrinkage thresholding algorithm(ISTA),is optimized for extracting sparse features more effectively.Furthermore,we create a synthetic dataset featuring complex frequency-modulated signals to train ULISTANet.Finally,the proposed method’s performance is subsequently validated using both synthetic and field data,demonstrating its potential for enhanced seismic data analysis. 展开更多
关键词 time-frequency transform Iteration shrinkage threshold algorithm Deep learning UNet
在线阅读 下载PDF
Effects of Gabor transform parameters on signa time-frequency resolution
4
作者 尹陈 贺振华 黄德济 《Applied Geophysics》 SCIE CSCD 2006年第3期169-173,共5页
In this paper, it is described that the time-frequency resolution of geophysical signals is affected by the time window function attenuation coefficient and sampling interval and how such effects are eliminated effect... In this paper, it is described that the time-frequency resolution of geophysical signals is affected by the time window function attenuation coefficient and sampling interval and how such effects are eliminated effectively. Improving the signal resolution is the key to signal time-frequency analysis processing and has wide use in geophysical data processing and extraction of attribute parameters. In this paper, authors research the effects of the attenuation coefficient choice of the Gabor transform window function and sampling interval on signal resolution. Unsuitable parameters not only decrease the signal resolution on the frequency spectrum but also miss the signals. It is essential to first give the optimum window and range of parameters through time-frequency analysis simulation using the Gabor transform. In the paper, the suggestions about the range and choice of the optimum sampling interval and processing methods of general seismic signals are given. 展开更多
关键词 Gabor transform time-frequency analysis RESOLUTION Gaussion window sampling interval.
在线阅读 下载PDF
基于BSimilar优化PTransformer的光伏功率短期预测
5
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 transformER 相似日
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
6
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R2)高达99.91%. 展开更多
关键词 风速预测 群分解 transformER Kolmogorov-Arnold网络
在线阅读 下载PDF
一种基于时域融合Transformer的4D航迹预测方法
7
作者 孔建国 马珂昕 +2 位作者 梁海军 张向伟 常瀚文 《电讯技术》 北大核心 2026年第1期21-29,共9页
针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以... 针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以体现飞行过程中不同阶段的差异;采用TFT模型有效捕捉各特征之间的隐式相关性,从而提高了预测精度;同时,结合分位数回归实现不确定性量化,提供了具有置信区间的航迹预测结果。实验表明,所提方法在真实数据上优于传统模型:与CNNLSTM模型和LSTM模型相比,平均距离误差分别减少了22.7%和50.9%,纵向、横向和垂直误差分别为305.01 m、177.91 m和25.23 m,验证了模型在解决航迹预测问题上的有效性,能够为管制精细化调控提供有效支持。 展开更多
关键词 空中交通管制 4D航迹预测 自动相关监视系统数据 时域融合transformer 时间序列预测
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
8
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 transformER 预测模型 烟叶替代
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
9
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 transformer模型 精准识别 室内模型试验
原文传递
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
10
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 transformER 混合模型
在线阅读 下载PDF
Quasi-LFM radar waveform recognition based on fractional Fourier transform and time-frequency analysis 被引量:3
11
作者 XIE Cunxiang ZHANG Limin ZHONG Zhaogen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2021年第5期1130-1142,共13页
Recent advances in electronics have increased the complexity of radar signal modulation.The quasi-linear frequency modulation(quasi-LFM)radar waveforms(LFM,Frank code,P1−P4 code)have similar time-frequency distributio... Recent advances in electronics have increased the complexity of radar signal modulation.The quasi-linear frequency modulation(quasi-LFM)radar waveforms(LFM,Frank code,P1−P4 code)have similar time-frequency distributions,and it is difficult to identify such signals using traditional time-frequency analysis methods.To solve this problem,this paper proposes an algorithm for automatic recognition of quasi-LFM radar waveforms based on fractional Fourier transform and time-frequency analysis.First of all,fractional Fourier transform and the Wigner-Ville distribution(WVD)are used to determine the number of main ridgelines and the tilt angle of the target component in WVD.Next,the standard deviation of the target component's width in the signal's WVD is calculated.Finally,an assembled classifier using neural network is built to recognize different waveforms by automatically combining the three features.Simulation results show that the overall recognition rate of the proposed algorithm reaches 94.17%under 0 dB.When the training data set and the test data set are mixed with noise,the recognition rate reaches 89.93%.The best recognition accuracy is achieved when the size of the training set is taken as 400.The algorithm complexity can meet the requirements of real-time recognition. 展开更多
关键词 quasi-linear frequency modulation(quasi-LFM)radar waveform time-frequency distribution fractional Fourier transform(FrFT) assembled classifier
在线阅读 下载PDF
The W transform and its improved methods for time-frequency analysis of seismic data 被引量:1
12
作者 WANG Yanghua RAO Ying ZHAO Zhencong 《Petroleum Exploration and Development》 SCIE 2024年第4期886-896,共11页
The conventional linear time-frequency analysis method cannot achieve high resolution and energy focusing in the time and frequency dimensions at the same time,especially in the low frequency region.In order to improv... The conventional linear time-frequency analysis method cannot achieve high resolution and energy focusing in the time and frequency dimensions at the same time,especially in the low frequency region.In order to improve the resolution of the linear time-frequency analysis method in the low-frequency region,we have proposed a W transform method,in which the instantaneous frequency is introduced as a parameter into the linear transformation,and the analysis time window is constructed which matches the instantaneous frequency of the seismic data.In this paper,the W transform method is compared with the Wigner-Ville distribution(WVD),a typical nonlinear time-frequency analysis method.The WVD method that shows the energy distribution in the time-frequency domain clearly indicates the gravitational center of time and the gravitational center of frequency of a wavelet,while the time-frequency spectrum of the W transform also has a clear gravitational center of energy focusing,because the instantaneous frequency corresponding to any time position is introduced as the transformation parameter.Therefore,the W transform can be benchmarked directly by the WVD method.We summarize the development of the W transform and three improved methods in recent years,and elaborate on the evolution of the standard W transform,the chirp-modulated W transform,the fractional-order W transform,and the linear canonical W transform.Through three application examples of W transform in fluvial sand body identification and reservoir prediction,it is verified that W transform can improve the resolution and energy focusing of time-frequency spectra. 展开更多
关键词 time-frequency analysis W transform Wigner-Ville distribution matching pursuit energy focusing RESOLUTION
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
13
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 transformER 单节点惯性传感器 动作分类
暂未订购
基于Transformer的壁画裂缝自动化数字修复方法
14
作者 刘晨玲 李炳焱 +3 位作者 米艳华 薛峰 王建华 戴震 《太原理工大学学报》 北大核心 2026年第1期186-194,共9页
【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多... 【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多依赖专家知识或人工辅助,无法实现壁画数字修复的自动化。【方法】本文结合北方地区长期缺水干燥的环境特征,针对壁画文物可能存在的撕扯断裂或裂缝错位问题,实现自动化数字修复。具体而言,本研究提出基于Transformer的壁画裂缝自动化数字修复方法;基于VGG16-Unet模型,创新性提出基于膨胀核的裂缝掩码优化方法,通过形态学膨胀操作显著提升裂缝覆盖率。此外,利用Transformer的全局结构学习能力与CNN上采样实现结构修复,并引入傅立叶卷积与大核注意力模块完成纹理细节还原和高保真修复。【结果】实验基于山西多地真实壁画数据验证了该方法的有效性,结果表明,该方法在裂缝识别覆盖度、结构还原度及纹理协调性方面均优于传统方法,尤其对北方干燥地区特有的断裂错位型裂缝修复效果显著。 展开更多
关键词 壁画修复 深度学习 壁画图像分割 transformER
在线阅读 下载PDF
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
15
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformER XGBoost 电池管理系统
在线阅读 下载PDF
卷积神经网络与Vision Transformer在胶质瘤中的研究进展
16
作者 杨浩辉 徐涛 +3 位作者 王伟 安良良 敖用芳 朱家宝 《磁共振成像》 北大核心 2026年第1期168-174,共7页
胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部... 胶质瘤因高度异质性、强侵袭性及预后差,传统诊疗面临巨大挑战。深度学习技术的引入为其精准诊疗提供了新路径,其中卷积神经网络(convolutional neural network,CNN)与Vision Transformer(ViT)是核心工具。CNN凭借层级化卷积操作在局部特征提取(如肿瘤边缘、纹理细节)上具有天然优势,而ViT基于自注意力机制在全局上下文建模(如肿瘤跨区域异质性、多模态关联)方面表现突出,二者的融合策略通过整合局部精细特征与全局关联信息,在应对胶质瘤边界模糊、跨模态数据异构性等临床难题中展现出显著优势。本文综述了二者在胶质瘤检测与分割、病理分级、分子分型、预后评估等关键临床任务中的研究进展,阐述了原理、单独应用及融合策略。同时,本文也探讨了当前研究中存在的挑战,诸如对数据标注的强依赖性、模型可解释性不足等问题,并展望了未来的发展方向,例如构建轻量化架构、发展自监督学习以及推进多组学融合等前沿,以期为胶质瘤智能诊断提供系统性参考。 展开更多
关键词 胶质瘤 深度学习 卷积神经网络 Vision transformer 磁共振成像
暂未订购
基于改进特征金字塔和Transformer的多分支人群密度估计方法
17
作者 杨长敏 李泽滔 《现代电子技术》 北大核心 2026年第3期121-127,共7页
为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度... 为了应对人群密度估计任务中背景噪声和人群尺度不一的问题,文中提出一种人群密度估计方法,通过结合多尺度特征提取和全局信息建模,可有效应对背景噪声和尺度变化的挑战。首先,在VGG19提取的高层特征基础上,引入CBAM对特征图进行细粒度的通道和空间加权,从而增强特征表达的准确性;其次,构建Transformer分支,将VGG和CBAM处理后的特征作为输入,利用Transformer的自注意力机制进行全局特征建模;最后,采用IFPN进行多尺度特征融合,通过有效结合不同层级的特征,使模型同时关注目标的局部细节信息和全局上下文。在公开数据集上的实验结果表明,该方法在多个基准测试中的性能优于现有主流方法。在ShanghaiTechPartA数据集上,所提模型的MAE和RMSE分别达到55.6和94.1;在ShanghaiTechPartB数据集上,MAE和RMSE分别达到6.2和10.1;在UCF-QNRF数据集上,MAE和RMSE分别达到83.4和144.9。实验结果验证了该方法在背景噪声和人群尺度不一场景下的鲁棒性,并显著提高了人群密度估计的准确性。 展开更多
关键词 人群密度估计 深度学习 transformER CBAM 特征金字塔网络 多尺度特征融合
在线阅读 下载PDF
知识蒸馏Transformer的人物交互检测
18
作者 陈东吉 赖惠成 +3 位作者 高古学 马骏 李俊凯 权虎拓 《计算机工程》 北大核心 2026年第1期206-216,共11页
得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务... 得到广泛应用的跨界之星Transformer,在人-物交互(HOI)检测领域同样取得了很好的效果。基于此,提出全新的基于知识蒸馏的Transformer(KDT)网络来进行端到端的HOI检测。由于Transformer网络建模的HOI整体特征粗糙,针对HOI检测的3个子任务:预测人框,预测物框与物体类别,预测人物之间的交互动作,构建基础多分支Transformer结构,包含一个人体实例分支、一个物体实例分支和一个交互分支,并利用人、物分支的解码器为交互分支解码器提供人、物的区域线索。为了给Transformer结构提供关键的语义、空间信息,预先生成物体类别和交互动词语义特征,以及人物框的空间特征为不同的Transformer分支提供语义、空间线索,进一步提升解码器对于不同HOI任务的特征提取能力。并在此基础上构建另一个多分支Transformer结构作为教师网络,教师网络的解码器以预生成特征为解码器查询,输出更精确的HOI特征。在训练过程中让基础多分支网络模仿教师网络的输出,构建额外的类相似度损失度量两个网络输出预测之间的类内、类间向量相似度,从而达到提升基础网络解码器性能的目的。实验结果表明,在人-物交互基准数据集HICO-DET所有类别、稀有类别和非稀有类别上的均值平均精度(mAP)分别为32.13%、28.57%和33.19%,对比基线取得了最多4.65百分点的提升。 展开更多
关键词 transformer网络 人-物交互 预生成特征 教师网络 类相似度损失
在线阅读 下载PDF
样本生成与Swin Transformer-YOLO网络结合的声呐图像目标检测
19
作者 罗雨薇 霍冠英 成振 《声学学报》 北大核心 2026年第1期201-215,共15页
由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOL... 由于目标投放成本高和实验条件限制,声呐图像样本稀缺且质量较差,导致现有目标检测方法难以有效学习特征,限制了性能提升。为解决这一问题,本文提出了一种基于扩散模型样本生成与Swin Transformer-级联群体注意力机制(CGA)融合的改进YOLO模型(STC-YOLO)的声呐图像目标检测方法。首先,利用LoRA对稳定扩散模型进行参数调整,并结合BLIP文本模型的语义特征,生成高质量、多样化的声呐图像,以构建新的数据集。其次,将Swin Transformer结构引入YOLOv8的主干网络,增强小目标的多尺度特征提取能力,同时在C2f模块中融合CGA机制,以增强小目标的感知能力。最后,采用偏斜交并比损失函数(SIoU)以适应复杂的水下场景。实验结果表明,所训练的生成模型能够在数据有限的情况下生成多样且真实的新样本。与原YOLOv8模型相比,改进后的STC-YOLO模型检测精度提升了5%,平均精度提升了12.6%,实现了对水下小目标的高精度检测。 展开更多
关键词 声呐图像 小目标检测 稳定扩散模型 Swin transformer 级联群体注意力机制
原文传递
一种基于特征融合和Transformer的日志异常检测方法
20
作者 高禧安 田金鹏 《计量与测试技术》 2026年第1期99-103,共5页
为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的... 为解决现有的日志解析方法普遍存在泛化能力不足和检测准确率不稳定的问题,本文提出了一种基于特征融合的日志异常检测方法(FFTLog)。FFTLog创新性地利用SBert向量化模型构建日志特征数据,并采用迭代注意力特征融合网络(iAFF)对日志的序列特征和参数特征进行深度融合。此外,采用多层Transformer构建编码器,结合因果卷积网络设计解码器,实现了高效的日志异常检测。实验表明,与现有主流方法相比,FFTLog在精度、召回率、稳定性和可靠性方面均最优。 展开更多
关键词 日志异常检测 transformER 特征融合
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部