期刊文献+
共找到6,001篇文章
< 1 2 250 >
每页显示 20 50 100
Data Transformation for Super-totalstation Positioning System Integrated by GPS and Totalstation 被引量:2
1
作者 GUO Jiming ZHANG Zhenglu LUO Nianxue HUANG Quanyi 《Geo-Spatial Information Science》 2003年第1期38-42,共5页
This paper focuses on the integration and data transformation between GPS and totalstation.It emphasizes on the way to transfer the WGS84 Cartesian coordinates to the local two_dimensional plane coordinates and the or... This paper focuses on the integration and data transformation between GPS and totalstation.It emphasizes on the way to transfer the WGS84 Cartesian coordinates to the local two_dimensional plane coordinates and the orthometric height GPS receiver,totalstation,radio,notebook computer and the corresponding software work together to form a new surveying system,the super_totalstation positioning system(SPS) and a new surveying model for terrestrial surveying.With the help of this system,the positions of detail points can be measured. 展开更多
关键词 GPS TPS SPS data transformation
在线阅读 下载PDF
Performances of Clustering Methods Considering Data Transformation and Sample Size: An Evaluation with Fisheries Survey Data
2
作者 WO Jia ZHANG Chongliang +2 位作者 XU Binduo XUE Ying REN Yiping 《Journal of Ocean University of China》 SCIE CAS CSCD 2020年第3期659-668,共10页
Clustering is a group of unsupervised statistical techniques commonly used in many disciplines. Considering their applications to fish abundance data, many technical details need to be considered to ensure reasonable ... Clustering is a group of unsupervised statistical techniques commonly used in many disciplines. Considering their applications to fish abundance data, many technical details need to be considered to ensure reasonable interpretation. However, the reliability and stability of the clustering methods have rarely been studied in the contexts of fisheries. This study presents an intensive evaluation of three common clustering methods, including hierarchical clustering(HC), K-means(KM), and expectation-maximization(EM) methods, based on fish community surveys in the coastal waters of Shandong, China. We evaluated the performances of these three methods considering different numbers of clusters, data size, and data transformation approaches, focusing on the consistency validation using the index of average proportion of non-overlap(APN). The results indicate that the three methods tend to be inconsistent in the optimal number of clusters. EM showed relatively better performances to avoid unbalanced classification, whereas HC and KM provided more stable clustering results. Data transformation including scaling, square-root, and log-transformation had substantial influences on the clustering results, especially for KM. Moreover, transformation also influenced clustering stability, wherein scaling tended to provide a stable solution at the same number of clusters. The APN values indicated improved stability with increasing data size, and the effect leveled off over 70 samples in general and most quickly in EM. We conclude that the best clustering method can be chosen depending on the aim of the study and the number of clusters. In general, KM is relatively robust in our tests. We also provide recommendations for future application of clustering analyses. This study is helpful to ensure the credibility of the application and interpretation of clustering methods. 展开更多
关键词 hierarchical cluster K-means cluster expectation-maximization cluster optimal number of clusters stability data transformation
在线阅读 下载PDF
CodeLin: An in situ visualization method for understanding data transformation scripts
3
作者 Xiwen Cai Kai Xiong +3 位作者 Zhongsu Luo Di Weng Shuainan Ye Yingcai Wu 《Visual Informatics》 2025年第2期1-13,共13页
Understanding data transformation scripts is an essential task for data analysts who write code to process data.However,this can be challenging,especially when encountering unfamiliar scripts.Comments can help users u... Understanding data transformation scripts is an essential task for data analysts who write code to process data.However,this can be challenging,especially when encountering unfamiliar scripts.Comments can help users understand data transformation code,but well-written comments are not always present.Visualization methods have been proposed to help analysts understand data transformations,but they generally require a separate view,which may distract users and entail efforts for connecting visualizations and code.In this work,we explore the use of in situ program visualization to help data analysts understand data transformation scripts.We present CodeLin,a new visualization method that combines word-sized glyphs for presenting transformation semantics and a lineage graph for presenting data lineage in an in situ manner.Through a use case,code pattern demonstrations,and a preliminary user study,we demonstrate the effectiveness and usability of CodeLin.We further discuss how visualization can help users understand data transformation code. 展开更多
关键词 data transformation Program visualization In situ visualization
原文传递
自适应Transformer-LSTM的滚动轴承故障预测方法研究
4
作者 董辛旻 职帅轩 崔富源 《重庆理工大学学报(自然科学)》 北大核心 2026年第2期96-104,共9页
针对滚动轴承故障预测中,模型预测精度低、参数难以确定等问题,提出一种自适应Transformer编码器与长短期记忆神经网络(long short-term memory, LSTM)的滚动轴承故障预测方法。提取轴承全周期振动信号24维时频特征,并基于信息熵、鲁棒... 针对滚动轴承故障预测中,模型预测精度低、参数难以确定等问题,提出一种自适应Transformer编码器与长短期记忆神经网络(long short-term memory, LSTM)的滚动轴承故障预测方法。提取轴承全周期振动信号24维时频特征,并基于信息熵、鲁棒性和相关性构建综合指标对特征进行筛选。采用核主元分析将优选特征进行融合,构建能够反应轴承退化状态的退化指标。综合时间序列全局特性与长短期特性,构建Transformer编码器与LSTM结合的故障预测模型,并引入极光优化算法(polar lights optimization, PLO)进行参数自适应寻优,应用XJTU-SY与IMS滚动轴承数据集进行方法分析验证。结果表明:所提模型在轴承故障预测中表现出良好效果,相较于经典的时域卷积网络(temporal convolutional network, TCN)、双向门控循环神经网络(gate recurrent unit, GRU)等,预测精度有较大提升。 展开更多
关键词 滚动轴承 故障预测 数据驱动 transformER 优化算法
在线阅读 下载PDF
一种基于时域融合Transformer的4D航迹预测方法
5
作者 孔建国 马珂昕 +2 位作者 梁海军 张向伟 常瀚文 《电讯技术》 北大核心 2026年第1期21-29,共9页
针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以... 针对传统4D航迹预测方法在数据单一和特征选择上的局限,提出了一种基于时域融合Transformer(Temporal Fusion Transformer,TFT)模型的4D航迹预测方法。引入下降率、时序分量等多元特征,并将数据按是否随时间变化及数值属性进行分类,以体现飞行过程中不同阶段的差异;采用TFT模型有效捕捉各特征之间的隐式相关性,从而提高了预测精度;同时,结合分位数回归实现不确定性量化,提供了具有置信区间的航迹预测结果。实验表明,所提方法在真实数据上优于传统模型:与CNNLSTM模型和LSTM模型相比,平均距离误差分别减少了22.7%和50.9%,纵向、横向和垂直误差分别为305.01 m、177.91 m和25.23 m,验证了模型在解决航迹预测问题上的有效性,能够为管制精细化调控提供有效支持。 展开更多
关键词 空中交通管制 4D航迹预测 自动相关监视系统数据 时域融合transformer 时间序列预测
在线阅读 下载PDF
基于Transformer的第三代测序数据缺失变异检测方法研究
6
作者 蒋佳巧 王晗 +1 位作者 万静 高敬阳 《北京化工大学学报(自然科学版)》 北大核心 2026年第1期90-102,共13页
缺失变异是一种重要的结构变异,与癌症、阿尔兹海默症和孤独症等多种病症有关。由于缺失变异和比对信息的复杂性,现有方法检测结果假阳性较高,为后续的下游分析带来了困难。针对该问题,提出了一种基于Transformer的第三代测序数据缺失... 缺失变异是一种重要的结构变异,与癌症、阿尔兹海默症和孤独症等多种病症有关。由于缺失变异和比对信息的复杂性,现有方法检测结果假阳性较高,为后续的下游分析带来了困难。针对该问题,提出了一种基于Transformer的第三代测序数据缺失变异检测方法—Transformer deletion detection(TDD)。首先,通过分析BAM文件中的CIGAR字段和相邻reads的间隔距离来提取候选的变异位点集合;然后将变异区间划分为连续的子区间,在每个子区间上构建特征矩阵;接着通过Transformer的Encoder模块来编码特征矩阵,再输出到分类层判断其变异与否;最后,进行断点估计、合并变异子区间,得到最终的缺失变异集。将所提方法与主流的4个检测工具在4个真实数据集上进行了对比,实验结果表明,所提方法取得了更好的F1分数,能降低检测结果中的假阳性,从而更好地检测缺失变异。 展开更多
关键词 缺失变异检测 第三代测序数据 transformER
在线阅读 下载PDF
基于Transformer-XGBoost框架的轨交车辆电池多视角数据健康诊断研究
7
作者 王健 毛建 +4 位作者 唐超伟 孙小康 候晓双 王春生 廖垠钦 《电源技术》 北大核心 2026年第1期129-142,共14页
锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规... 锂离子电池凭借其高能量密度和长寿命,在轨道交通与储能系统中得到了广泛应用,但随着充放电循环次数的增加,其健康状态(SOH)逐步衰退,给电池管理带来安全风险与维护挑战。传统的SOH预测方法主要依赖单一视角的增量容量分析(ICA)及常规数据驱动模型,难以全面捕捉电池退化过程中电化学特性与时序动态的多尺度变化,导致预测精度和鲁棒性均受限。提出了一种基于多视角数据分析的SOH预测方法,通过融合电压视图与时间视图下的增量容量(IC)曲线信息构建多视图健康因子(HI),并设计了结合Transformer与极限梯度提升(XGBoost)的预测框架。其中,Transformer采用动态时间窗调整和双尺度注意力机制,以适应不同退化阶段下的时序特征提取。而XGBoost则通过引入物理信息约束,进一步提升了预测的稳定性与鲁棒性。在马里兰大学的PL13电池训练集中,该方法实现的均方根误差(RMSE)仅为3.13×10^(−3),决定系数R^(2)高达0.997;而在PL11电池测试集中,RMSE仅为4.57×10^(−3),R^(2)达到0.994,充分验证了该方法在多视角特征融合和动态时序建模方面的卓越性能。 展开更多
关键词 健康状态 多视角数据分析 transformER XGBoost 电池管理系统
在线阅读 下载PDF
Explainable data transformation recommendation for automatic visualization 被引量:1
8
作者 Ziliang WU Wei CHEN +5 位作者 Yuxin MA Tong XU Fan YAN Lei LV Zhonghao QIAN Jiazhi XIA 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第7期1007-1027,共21页
Automatic visualization generates meaningful visualizations to support data analysis and pattern finding for novice or casual users who are not familiar with visualization design.Current automatic visualization approa... Automatic visualization generates meaningful visualizations to support data analysis and pattern finding for novice or casual users who are not familiar with visualization design.Current automatic visualization approaches adopt mainly aggregation and filtering to extract patterns from the original data.However,these limited data transformations fail to capture complex patterns such as clusters and correlations.Although recent advances in feature engineering provide the potential for more kinds of automatic data transformations,the auto-generated transformations lack explainability concerning how patterns are connected with the original features.To tackle these challenges,we propose a novel explainable recommendation approach for extended kinds of data transformations in automatic visualization.We summarize the space of feasible data transformations and measures on explainability of transformation operations with a literature review and a pilot study,respectively.A recommendation algorithm is designed to compute optimal transformations,which can reveal specified types of patterns and maintain explainability.We demonstrate the effectiveness of our approach through two cases and a user study. 展开更多
关键词 data transformation data transformation recommendation Automatic visualization Explainability
原文传递
基于局部自注意力Transformer的长期车辆轨迹预测模型
9
作者 严利鑫 利健华 +1 位作者 李黄承成 陶璐 《地球信息科学学报》 北大核心 2026年第1期194-208,共15页
【背景】当前城市交通环境复杂且交通流呈现高度非线性特征,现有的基于统计方法、深度学习及注意力机制的预测模型虽已能刻画短期非线性演化,但在城市尺度下面对长时序和强噪声时,仍存在长期依赖表征不足和误差累积明显等问题,不能准确... 【背景】当前城市交通环境复杂且交通流呈现高度非线性特征,现有的基于统计方法、深度学习及注意力机制的预测模型虽已能刻画短期非线性演化,但在城市尺度下面对长时序和强噪声时,仍存在长期依赖表征不足和误差累积明显等问题,不能准确实现车辆长期轨迹预测。【方法】针对上述问题,本文提出一种基于局部自注意力Transformer的长期车辆轨迹预测模型。该模型基于城市车辆轨迹数据局部相关性强与易受噪声干扰的特性,以局部自注意力机制替代了传统Transformer的全局自注意力结构,并在数据预处理、嵌入层及输出方式等方面进行了适配车辆轨迹的调整,采用离散高维嵌入增强输入轨迹的空间表达,构建双独立嵌入向量和解码结构以提升坐标预测精度,从而提升了对轨迹数据的捕获能力。【结果】基于罗马320辆出租车连续一个月GPS轨迹数据所开展的实验结果表明,所提模型在短、中、长期预测任务的平均误差和单步误差均优于主流基线模型,平均位移误差和均方根误差分别最大下降了41%和35%。此外,进一步分析表明,适当的局部自注意力时间窗能够提高模型对轨迹特征的捕获能力,而当时间窗从最优的30 min扩大至35 min和40 min时,平均位移误差相较30 min分别上升约3.78%与5.17%,说明过大的时间窗会引入额外噪声并削弱模型的预测性能。【结论】研究成果可为个性化导航推荐、实时交通管理和轨迹数据恢复等实际应用提供技术方法和数据支持。 展开更多
关键词 城市交通 车辆轨迹预测 GPS轨迹数据 transformer模型 局部自注意力 城市车辆 交通数据挖掘 深度学习
原文传递
基于Transformer-MLSTM联合模型的营运车辆行驶轨迹预测
10
作者 杜宇程 朱立伟 +1 位作者 李会民 陈方华 《客车技术与研究》 2026年第1期15-21,49,共8页
本文选取NGSIM数据集中的运营车辆行驶数据作为研究对象,采用小波降噪方法处理干扰数据,进而提出一种基于Transformer-MLSTM的车辆换道轨迹预测模型。该模型集成了Transformer模块的多头注意力机制和高效并行处理能力,可对周边车辆运动... 本文选取NGSIM数据集中的运营车辆行驶数据作为研究对象,采用小波降噪方法处理干扰数据,进而提出一种基于Transformer-MLSTM的车辆换道轨迹预测模型。该模型集成了Transformer模块的多头注意力机制和高效并行处理能力,可对周边车辆运动轨迹特征进行权重计算;MLSTM模块在捕获长期依赖的同时,加强各层间的信息传递,从而增强模型的整体表达能力。结果表明:在Transformer-MLSTM联合模型最优超参数组合下,预测车辆横向和纵向轨迹变化的RMSE值分别达到0.364和1.492,该模型的预测速度和准确度均优于采用LSTM、MLSTM和Transformer等方法建立的单一网络模型。 展开更多
关键词 行驶数据 NGSIM 换道轨迹预测 LSTM transformER
在线阅读 下载PDF
基于TCN-BiGRU-Transformer模型的双护盾TBM掘进速度预测研究
11
作者 李栋伟 张广 +4 位作者 刘东鑫 桑兆才 孙明浩 宋卿 龚秋明 《现代隧道技术》 北大核心 2026年第1期24-33,共10页
针对TBM掘进速度预测中单一模型特征提取能力有限、预测精度不足等问题,提出一种基于TCN-BiGRU-Transformer多模块融合的TBM掘进速度智能预测模型。通过融合时域卷积网络(TCN)的多尺度特征提取能力、双向门控循环单元(BiGRU)的长时序依... 针对TBM掘进速度预测中单一模型特征提取能力有限、预测精度不足等问题,提出一种基于TCN-BiGRU-Transformer多模块融合的TBM掘进速度智能预测模型。通过融合时域卷积网络(TCN)的多尺度特征提取能力、双向门控循环单元(BiGRU)的长时序依赖建模优势及Transformer的自注意力机制,实现对双护盾TBM掘进速度的精准预测。以鄂坪调水TBM隧洞工程为例,选取TBM完整掘进循环上升段的总推力、刀盘扭矩、刀盘转速和掘进速度作为输入特征,采用STL分解数据增强方法构建包含3308组样本的数据集,进而预测TBM稳定段的掘进速度。结果表明:TCN-BiGRU-Transformer模型的R2最大(0.9626),MAE和MAPE最小(2.18 mm/min和4.18%),显著优于对比模型。同时,模型在不同围岩等级下均能保持较高的预测精度,其R2均大于0.95,验证了多模块融合架构在提高TBM掘进速度预测精度方面的有效性及在复杂地质条件下的适应性。 展开更多
关键词 双护盾TBM 掘进速度预测 TCN-BiGRU-transformer 围岩等级 数据增强
在线阅读 下载PDF
基于多源掘进参数与LSTM-Transformer的复杂地层盾构姿态预测方法
12
作者 邹道恒 《国防交通工程与技术》 2026年第1期6-12,共7页
针对深大城际黄麻布—石岩中心盾构区间的复杂地层及纵坡变化问题,提出一种基于多源数据融合与深度神经网络的盾构姿态实时预测方法。方法整合掘进参数、地质信息、渣样分析等数据,经特征筛选和规范化处理后,构建LSTM-Transformer混合... 针对深大城际黄麻布—石岩中心盾构区间的复杂地层及纵坡变化问题,提出一种基于多源数据融合与深度神经网络的盾构姿态实时预测方法。方法整合掘进参数、地质信息、渣样分析等数据,经特征筛选和规范化处理后,构建LSTM-Transformer混合神经网络模型,结合两者优势动态学习姿态变化规律,并在复杂地层转换处引入状态残差校正机制。以区间实测数据验证,该方法姿态预测均方误差较传统方法降低36%以上、提前预警时间达2环,能有效辅助掘进参数调控与风险预警、减少管片破损等事故,提升施工效率与安全性。 展开更多
关键词 多源数据融合 LSTM-transformer混合模型 盾构姿态预测 复杂地层 状态残差校正
在线阅读 下载PDF
基于transformer解码器架构的数据循证临床路径生成
13
作者 田文琪 刘嘉祯 +1 位作者 王之义 崔欣 《中国卫生信息管理杂志》 2026年第1期25-33,共9页
目的为解决传统路径制定高度依赖专家共识、主观性强、效率低且更新周期长的问题,本研究旨在构建一个能够自动化生成数据循证的临床路径的深度学习模型。方法提出数据循证临床路径生成模型CliPathGPT,该模型基于transformer解码器架构,... 目的为解决传统路径制定高度依赖专家共识、主观性强、效率低且更新周期长的问题,本研究旨在构建一个能够自动化生成数据循证的临床路径的深度学习模型。方法提出数据循证临床路径生成模型CliPathGPT,该模型基于transformer解码器架构,利用真实电子病例,进行从零开始学习住院诊疗数据中的时序结构和阶段模式,并以甲状腺良性肿瘤切除术住院数据进行实验。结果生成路径在高频项目覆盖率、顺序连贯性及完整性方面与真实数据高度一致。结论该方法具备无监督训练、自学习及快速迭代优势,可为住院流程标准化、个性化路径推荐及路径偏离预警提供数据循证支撑,为多病种路径生成与医疗管理优化提供新方法。 展开更多
关键词 数据循证 临床路径 transformER 生成式语言模型 甲状腺良性肿瘤
暂未订购
多源异频数据多尺度融合:基于Transformer的煤炭需求预测研究
14
作者 邵枫 冯雨 +3 位作者 沈浩楠 耿国强 黄鹏 邵虎 《煤炭经济研究》 2026年第1期37-45,共9页
准确预测煤炭需求对于保障国家能源安全、稳定市场价格及制定宏观经济政策具有至关重要的作用。然而,影响煤炭需求的因素众多,其相关数据往往来源于不同部门,具有日度、旬度、月度等多样的采集频率,给传统预测模型带来了巨大挑战。为解... 准确预测煤炭需求对于保障国家能源安全、稳定市场价格及制定宏观经济政策具有至关重要的作用。然而,影响煤炭需求的因素众多,其相关数据往往来源于不同部门,具有日度、旬度、月度等多样的采集频率,给传统预测模型带来了巨大挑战。为解决该问题,提出一种融合多频率特征的深度学习模型——多频时间序列Transformer(MFT-Former),用于煤炭需求预测。该方法首先通过一套系统化的数据处理流程,将多源异构的原始数据清洗、对齐并重采样为3个时间同步的高、中、低频特征矩阵。随后,将此3个矩阵作为并行输入,送入一个特殊设计的多输入Transformer网络。该网络包含3个独立的编码器分支,分别捕捉各频率下的时间依赖模式,并通过一个融合层将提取到的深层特征进行整合,实现对未来煤炭需求的预测。利用包含多个经济与行业指标的真实数据集,以过去12个月的数据预测未来6个月的需求为任务,对模型预测表现进行评估。实验结果表明,MFT-Former模型能够有效融合不同时间尺度的信息,其在测试集上的平均绝对百分比误差达到6.24%,证明了该方法在处理复杂、多频时间序列预测问题上的有效性和准确性。 展开更多
关键词 煤炭需求预测 多源异频数据 多尺度特征融合 transformER 时间序列预测
原文传递
基于Enhanced Transformer的铁路客运站节假日客流预测研究
15
作者 朱友蓉 李得伟 +2 位作者 李涛 吴迪 李华 《铁道经济研究》 2026年第1期97-108,共12页
节假日作为居民集中出行的高峰期,其客流特征直接关系到铁路运营的安全、运力配置效率和服务质量。节假日期间的铁路客流呈现出与日常显著不同的特殊性,主要表现为长距离出行需求剧增、旅游流与探亲流高度叠加,以及客流分布的时空不均衡... 节假日作为居民集中出行的高峰期,其客流特征直接关系到铁路运营的安全、运力配置效率和服务质量。节假日期间的铁路客流呈现出与日常显著不同的特殊性,主要表现为长距离出行需求剧增、旅游流与探亲流高度叠加,以及客流分布的时空不均衡性,为铁路运营管理带来了挑战。一是客流需求的突增,热门线路和高峰时段的运输能力趋于饱和,传统时间序列模型难以捕捉这种剧烈的非平稳波动;二是预售数据不完整性,旅客购票行为贯穿整个预售期,不同时间点获取的预售数据反映的未来客流信息是动态变化的;三是客流受时间、节假日效应、列车运行安排等多种因素共同影响,这些特征之间存在复杂的非线性耦合关系。为解决上述问题,提出一种基于Enhanced Transformer的铁路客运站节假日客流预测模型。在特征工程方面,主要从时间特征、节假日特征和运营特征3个维度构建了多源特征体系:时间特征包括预售提前量和小时周期编码,用于捕捉旅客出行决策行为和一天内客流的规律性波动;节假日特征涵盖周末指示、节假日标记、节前高峰和节假日周末叠加效应,用于精确捕捉节假日期间客流模式的突变特征;运营特征则提取了每小时上下行列车班次数,反映车站的实时运力供给情况。通过多头自注意力机制,模型能够在不同的表示子空间中并行学习这些多源特征间的复杂交互模式,实现对客流驱动因素的深度理解。创新性地将动态变化的预售数据作为关键输入特征,结合模型的时序信息处理能力,实现对未来客流的滚动预测,突破传统方法在处理预售期动态性上的局限,通过选取苏州地区4个核心铁路客站(苏州北站、苏州站、苏州新区站、苏州园区站)在2025年春节期间的客流数据进行案例分析。实验结果表明,Enhanced Transformer模型对于苏州北站和苏州站等客流规模大的枢纽站,预测准确率可达84.06%,证明了模型在处理高流量、高波动性时间序列数据时的有效性。与Transformer,XGBoost,LSTM,Bi-LSTM的4种基准模型的对比实验显示,Enhanced Transformer在MSE,RMSE,MAE和准确率等所有评估指标上均全面优于其他模型。相较于标准Transformer模型,其预测准确率提升了约6.29%~6.89%;相较于LSTM,准确率提升约3.4%。这些性能提升归因于模型在长序列依赖捕捉、非平稳数据适应和多源特征交互方面的结构优势,为铁路管理部门提供了有力的技术支持,有助于实现节假日期间运力的精准配置、提升旅客服务质量和保障运营安全。 展开更多
关键词 铁路客流预测 节假日 Enhanced transformer 动态预售数据获取时间 时间序列预测 多源特征 注意力机制 铁路运营
在线阅读 下载PDF
Defect Detection Model Using Time Series Data Augmentation and Transformation 被引量:1
16
作者 Gyu-Il Kim Hyun Yoo +1 位作者 Han-Jin Cho Kyungyong Chung 《Computers, Materials & Continua》 SCIE EI 2024年第2期1713-1730,共18页
Time-series data provide important information in many fields,and their processing and analysis have been the focus of much research.However,detecting anomalies is very difficult due to data imbalance,temporal depende... Time-series data provide important information in many fields,and their processing and analysis have been the focus of much research.However,detecting anomalies is very difficult due to data imbalance,temporal dependence,and noise.Therefore,methodologies for data augmentation and conversion of time series data into images for analysis have been studied.This paper proposes a fault detection model that uses time series data augmentation and transformation to address the problems of data imbalance,temporal dependence,and robustness to noise.The method of data augmentation is set as the addition of noise.It involves adding Gaussian noise,with the noise level set to 0.002,to maximize the generalization performance of the model.In addition,we use the Markov Transition Field(MTF)method to effectively visualize the dynamic transitions of the data while converting the time series data into images.It enables the identification of patterns in time series data and assists in capturing the sequential dependencies of the data.For anomaly detection,the PatchCore model is applied to show excellent performance,and the detected anomaly areas are represented as heat maps.It allows for the detection of anomalies,and by applying an anomaly map to the original image,it is possible to capture the areas where anomalies occur.The performance evaluation shows that both F1-score and Accuracy are high when time series data is converted to images.Additionally,when processed as images rather than as time series data,there was a significant reduction in both the size of the data and the training time.The proposed method can provide an important springboard for research in the field of anomaly detection using time series data.Besides,it helps solve problems such as analyzing complex patterns in data lightweight. 展开更多
关键词 Defect detection time series deep learning data augmentation data transformation
在线阅读 下载PDF
基于Transformer模型的时序数据预测方法综述 被引量:21
17
作者 孟祥福 石皓源 《计算机科学与探索》 北大核心 2025年第1期45-64,共20页
时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据... 时序数据预测(TSF)是指通过分析历史数据的趋势性、季节性等潜在信息,预测未来时间点或时间段的数值和趋势。时序数据由传感器生成,在金融、医疗、能源、交通、气象等众多领域都发挥着重要作用。随着物联网传感器的发展,海量的时序数据难以使用传统的机器学习解决,而Transformer在自然语言处理和计算机视觉等领域的诸多任务表现优秀,学者们利用Transformer模型有效捕获长期依赖关系,使得时序数据预测任务取得了飞速发展。综述了基于Transformer模型的时序数据预测方法,按时间梳理了时序数据预测的发展进程,系统介绍了时序数据预处理过程和方法,介绍了常用的时序预测评价指标和数据集。以算法框架为研究内容系统阐述了基于Transformer的各类模型在TSF任务中的应用方法和工作原理。通过实验对比了各个模型的性能、优点和局限性,并对实验结果展开了分析与讨论。结合Transformer模型在时序数据预测任务中现有工作存在的挑战提出了该方向未来发展趋势。 展开更多
关键词 深度学习 时序数据预测 数据预处理 transformer模型
在线阅读 下载PDF
CNN结合Transformer的高光谱图像和LiDAR数据协同地物分类方法 被引量:1
18
作者 吴海滨 左云逸 +2 位作者 王爱丽 吕浩然 王敏慧 《仪器仪表学报》 北大核心 2025年第8期286-301,共16页
在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Tran... 在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Transformer的高光谱图像和LiDAR数据的多模态遥感数据协同地物分类方法。首先,该模型通过主成分分析对高光谱图像进行降维处理以去除光谱的冗余信息,继而利用CNN分层捕获局部纹理特征,同时借助Transformer自注意力机制构建全局光谱-空间表征。然后通过双向特征交互机制,将Transformer输出的全局上下文信息注入CNN特征通道,同时将CNN通道提取的局部细节反馈至Transformer支路,经特征耦合单元实现跨尺度特征对齐,强化模型对高光谱图像全局结构与局部细节的联合提取能力。对于LiDAR数据,采用动态卷积级联模块有效捕获高程信息和上下文关系,最终通过跨模态特征融合模块实现双源数据特征的深度交互与融合,在双模态语义互补中提升复杂地物的分类精度。在Houston2013、Trento和Augsburg这3个公开数据集上的实验表明,该方法总体分类精度分别达到99.85%、99.68%和97.34%,平均准确率分别达到99.87%、99.34%和90.60%,较GLT、HCT等主流方法的分类精度有所提高,充分证明所提方法进行多模态数据协同分类的优势和有效性。 展开更多
关键词 高光谱图像 LIDAR数据 transformER 卷积神经网络 多模态数据
原文传递
An Efficient Schema Transformation Technique for Data Migration from Relational to Column-Oriented Databases
19
作者 Norwini Zaidi Iskandar Ishak +1 位作者 Fatimah Sidi Lilly Suriani Affendey 《Computer Systems Science & Engineering》 SCIE EI 2022年第12期1175-1188,共14页
Data transformation is the core process in migrating database from relational database to NoSQL database such as column-oriented database. However,there is no standard guideline for data transformation from relational... Data transformation is the core process in migrating database from relational database to NoSQL database such as column-oriented database. However,there is no standard guideline for data transformation from relational database toNoSQL database. A number of schema transformation techniques have been proposed to improve data transformation process and resulted better query processingtime when compared to the relational database query processing time. However,these approaches produced redundant tables in the resulted schema that in turnconsume large unnecessary storage size and produce high query processing timedue to the generated schema with redundant column families in the transformedcolumn-oriented database. In this paper, an efficient data transformation techniquefrom relational database to column-oriented database is proposed. The proposedschema transformation technique is based on the combination of denormalizationapproach, data access pattern and multiple-nested schema. In order to validate theproposed work, the proposed technique is implemented by transforming data fromMySQL database to MongoDB database. A benchmark transformation techniqueis also performed in which the query processing time and the storage size arecompared. Based on the experimental results, the proposed transformation technique showed significant improvement in terms query processing time and storagespace usage due to the reduced number of column families in the column-orienteddatabase. 展开更多
关键词 data migration data transformation column-oriented database relational database big data
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部