期刊文献+
共找到899篇文章
< 1 2 45 >
每页显示 20 50 100
An Intelligent Early Warning Method of Press-Assembly Quality Based on Outlier Data Detection and Linear Regression
1
作者 XUE Shanliang LI Chen 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2020年第4期597-606,共10页
Focusing on controlling the press-assembly quality of high-precision servo mechanism,an intelligent early warning method based on outlier data detection and linear regression is proposed.Linear regression is used to d... Focusing on controlling the press-assembly quality of high-precision servo mechanism,an intelligent early warning method based on outlier data detection and linear regression is proposed.Linear regression is used to deal with the relationship between assembly quality and press-assembly process,then the mathematical model of displacement-force in press-assembly process is established and a qualified press-assembly force range is defined for assembly quality control.To preprocess the raw dataset of displacement-force in the press-assembly process,an improved local outlier factor based on area density and P weight(LAOPW)is designed to eliminate the outliers which will result in inaccuracy of the mathematical model.A weighted distance based on information entropy is used to measure distance,and the reachable distance is replaced with P weight.Experiments show that the detection efficiency of the algorithm is improved by 5.6 ms compared with the traditional local outlier factor(LOF)algorithm,and the detection accuracy is improved by about 2%compared with the local outlier factor based on area density(LAOF)algorithm.The application of LAOPW algorithm and the linear regression model shows that it can effectively carry out intelligent early warning of press-assembly quality of high precision servo mechanism. 展开更多
关键词 quality early warning outlier data detection linear regression local outlier factor based on area density and P weight(LAOPW) information entropy P weight
在线阅读 下载PDF
An Efficient Outlier Detection Approach on Weighted Data Stream Based on Minimal Rare Pattern Mining 被引量:2
2
作者 Saihua Cai Ruizhi Sun +2 位作者 Shangbo Hao Sicong Li Gang Yuan 《China Communications》 SCIE CSCD 2019年第10期83-99,共17页
The distance-based outlier detection method detects the implied outliers by calculating the distance of the points in the dataset, but the computational complexity is particularly high when processing multidimensional... The distance-based outlier detection method detects the implied outliers by calculating the distance of the points in the dataset, but the computational complexity is particularly high when processing multidimensional datasets. In addition, the traditional outlier detection method does not consider the frequency of subsets occurrence, thus, the detected outliers do not fit the definition of outliers (i.e., rarely appearing). The pattern mining-based outlier detection approaches have solved this problem, but the importance of each pattern is not taken into account in outlier detection process, so the detected outliers cannot truly reflect some actual situation. Aimed at these problems, a two-phase minimal weighted rare pattern mining-based outlier detection approach, called MWRPM-Outlier, is proposed to effectively detect outliers on the weight data stream. In particular, a method called MWRPM is proposed in the pattern mining phase to fast mine the minimal weighted rare patterns, and then two deviation factors are defined in outlier detection phase to measure the abnormal degree of each transaction on the weight data stream. Experimental results show that the proposed MWRPM-Outlier approach has excellent performance in outlier detection and MWRPM approach outperforms in weighted rare pattern mining. 展开更多
关键词 outlier detection WEIGHTED data STREAM MINIMAL WEIGHTED RARE pattern MINING deviation factors
在线阅读 下载PDF
Outliers Mining in Time Series Data Sets 被引量:3
3
作者 Zheng Binxiang,Du Xiuhua & Xi Yugeng Institute of Automation, Shanghai Jiaotong University,Shanghai 200030,P.R.China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2002年第1期93-97,共5页
In this paper, we present a cluster-based algorithm for time series outlier mining.We use discrete Fourier transformation (DFT) to transform time series from time domain to frequency domain. Time series thus can be ma... In this paper, we present a cluster-based algorithm for time series outlier mining.We use discrete Fourier transformation (DFT) to transform time series from time domain to frequency domain. Time series thus can be mapped as the points in k -dimensional space.For these points, a cluster-based algorithm is developed to mine the outliers from these points.The algorithm first partitions the input points into disjoint clusters and then prunes the clusters,through judgment that can not contain outliers.Our algorithm has been run in the electrical load time series of one steel enterprise and proved to be effective. 展开更多
关键词 data mining Time series outlier mining.
在线阅读 下载PDF
Top-k Outlier Detection from Uncertain Data 被引量:2
4
作者 Salman Ahmed Shaikh Hiroyuki Kitagawa 《International Journal of Automation and computing》 EI CSCD 2014年第2期128-142,共15页
Uncertain data are common due to the increasing usage of sensors, radio frequency identification(RFID), GPS and similar devices for data collection. The causes of uncertainty include limitations of measurements, inclu... Uncertain data are common due to the increasing usage of sensors, radio frequency identification(RFID), GPS and similar devices for data collection. The causes of uncertainty include limitations of measurements, inclusion of noise, inconsistent supply voltage and delay or loss of data in transfer. In order to manage, query or mine such data, data uncertainty needs to be considered. Hence,this paper studies the problem of top-k distance-based outlier detection from uncertain data objects. In this work, an uncertain object is modelled by a probability density function of a Gaussian distribution. The naive approach of distance-based outlier detection makes use of nested loop. This approach is very costly due to the expensive distance function between two uncertain objects. Therefore,a populated-cells list(PC-list) approach of outlier detection is proposed. Using the PC-list, the proposed top-k outlier detection algorithm needs to consider only a fraction of dataset objects and hence quickly identifies candidate objects for top-k outliers. Two approximate top-k outlier detection algorithms are presented to further increase the efficiency of the top-k outlier detection algorithm.An extensive empirical study on synthetic and real datasets is also presented to prove the accuracy, efficiency and scalability of the proposed algorithms. 展开更多
关键词 Top-k distance-based outlier detection uncertain data Gaussian uncertainty cell-based approach PC-list based approach
原文传递
Constructing Three-Dimension Space Graph for Outlier Detection Algorithms in Data Mining 被引量:1
5
作者 ZHANG Jing 1,2 , SUN Zhi-hui 1 1.Department of Computer Science and Engineering, Southeast University, Nanjing 210096, Jiangsu, China 2.Department of Electricity and Information Engineering, Jiangsu University, Zhenjiang 212001, Jiangsu, China 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期585-589,共5页
Outlier detection has very important applied value in data mining literature. Different outlier detection algorithms based on distinct theories have different definitions and mining processes. The three-dimensional sp... Outlier detection has very important applied value in data mining literature. Different outlier detection algorithms based on distinct theories have different definitions and mining processes. The three-dimensional space graph for constructing applied algorithms and an improved GridOf algorithm were proposed in terms of analyzing the existing outlier detection algorithms from criterion and theory. Key words outlier - detection - three-dimensional space graph - data mining CLC number TP 311. 13 - TP 391 Foundation item: Supported by the National Natural Science Foundation of China (70371015)Biography: ZHANG Jing (1975-), female, Ph. D, lecturer, research direction: data mining and knowledge discovery. 展开更多
关键词 outlier DETECTION three-dimensional space graph data mining
在线阅读 下载PDF
Outlier Detection of Air Quality for Two Indian Urban Cities Using Functional Data Analysis
6
作者 Mohammad Ahmad Weihu Cheng +1 位作者 Zhao Xu Abdul Kalam 《Open Journal of Air Pollution》 2023年第3期79-91,共13页
Human living would be impossible without air quality. Consistent advancements in practically every aspect of contemporary human life have harmed air quality. Everyday industrial, transportation, and home activities tu... Human living would be impossible without air quality. Consistent advancements in practically every aspect of contemporary human life have harmed air quality. Everyday industrial, transportation, and home activities turn up dangerous contaminants in our surroundings. This study investigated two years’ worth of air quality and outlier detection data from two Indian cities. Studies on air pollution have used numerous types of methodologies, with various gases being seen as a vector whose components include gas concentration values for each observation per-formed. We use curves to represent the monthly average of daily gas emissions in our technique. The approach, which is based on functional depth, was used to find outliers in the city of Delhi and Kolkata’s gas emissions, and the outcomes were compared to those from the traditional method. In the evaluation and comparison of these models’ performances, the functional approach model studied well. 展开更多
关键词 Functional data Analysis outlierS Air Quality Gas Emission Classical Statistics
在线阅读 下载PDF
面向二分类问题的直觉模糊深度随机配置网络
7
作者 丁世飞 朱姜兰 +2 位作者 张成龙 郭丽丽 张健 《软件学报》 北大核心 2025年第10期4660-4670,共11页
深度随机配置网络(deep stochastic configuration network,DSCN)采取前馈学习方式,基于特有的监督机制随机分配节点参数,具有全局逼近性.但是,在实际场景下,数据采集过程中潜在的离群值和噪声,易对分类结果产生负面影响.为提高DSCN解... 深度随机配置网络(deep stochastic configuration network,DSCN)采取前馈学习方式,基于特有的监督机制随机分配节点参数,具有全局逼近性.但是,在实际场景下,数据采集过程中潜在的离群值和噪声,易对分类结果产生负面影响.为提高DSCN解决二分类问题的性能,基于DSCN引入直觉模糊数思想,提出了一种直觉模糊深度随机配置网络(intuitionistic fuzzy deep stochastic configuration network,IFDSCN).与标准DSCN不同,IFDSCN通过计算样本隶属度和非隶属度,为每个样本分配一个直觉模糊数,通过加权的方法来生成最优分类器,以克服噪声和异常值对数据分类的负面影响.在8个基准数据集上的实验结果表明,所提出的模型与直觉模糊孪生支持向量机(intuitionistic fuzzy twin support vector machine,IFTWSVM)、核岭回归(kernel ridge regression,KRR)、直觉模糊核岭回归(intuitionistic fuzzy kernel ridge regression,IFKRR)、随机函数向量链接神经网络(random vector functional link neural network,RVFL)和SCN等学习模型相比,IFDSCN具有更好的二分类性能. 展开更多
关键词 直觉模糊数 随机配置网络 二分类 数据噪声 神经网络
在线阅读 下载PDF
多源数据融合的焊接质量监测技术 被引量:1
8
作者 张发平 孙昊 +1 位作者 魏剑峰 宋紫阳 《北京理工大学学报》 北大核心 2025年第5期471-481,共11页
针对焊接质量的图像信息检测方法难以发现隐性焊接缺陷的问题,提出基于多源数据融合的焊接隐性异常检测和识别方法,以期增加缺陷检测的种类和提高精度.首先,对采集的焊接过程中的声音、电压、光谱、温度等多维度信息进行特征值计算,并... 针对焊接质量的图像信息检测方法难以发现隐性焊接缺陷的问题,提出基于多源数据融合的焊接隐性异常检测和识别方法,以期增加缺陷检测的种类和提高精度.首先,对采集的焊接过程中的声音、电压、光谱、温度等多维度信息进行特征值计算,并将这些特征值与焊接的熔池图像特征值结合,构成焊接质量的原始特征空间;然后采用线性判别方法,降维形成焊接信息的低维特征空间;最后,使用孤立森林法筛选邻域搜索空间,并将该邻域搜索空间中的焊接数据点划分为多个重叠子集.采用局部离群因子法对新数据点在多个重叠子集中进行邻域搜索,对焊接过程进行异常检测,该方法充分考虑了焊接质量数据的全局特征并且计算复杂度大为降低.最后,采用基于人工蜂群算法优化的概率神经网络进行焊接质量数据的精确细分和异常的精准识别,该方法增强了全局搜索能力,同时避免陷入局部最优.试验验证结果显示所提方法都焊接异常的检测精度可达97.44%,对综合焊接异常的识别精度可达96.03%,证明了方法的有效性. 展开更多
关键词 隐性焊接异常 多源数据 局部离群因子 概率神经网络 线性判别方法 人工蜂群算法
在线阅读 下载PDF
南海多波束测量中水深数据异常的精细处理与成因分析 被引量:1
9
作者 陈星铨 朱俊江 +7 位作者 朱庆龙 焦钰涵 丁小笑 刘政渊 丁咚 贾永刚 李三忠 刘永江 《地球科学》 北大核心 2025年第2期535-550,共16页
高分辨率的海底多波束地形数据广泛应用于海洋测绘、深海调查、海底勘探等海洋研究和资源开发领域.多波束系统海上测量时受海况的复杂性以及海洋噪声等因素的干扰,严重影响了数据的质量,消除数据中的各种异常能够还原真实的海底地形,对... 高分辨率的海底多波束地形数据广泛应用于海洋测绘、深海调查、海底勘探等海洋研究和资源开发领域.多波束系统海上测量时受海况的复杂性以及海洋噪声等因素的干扰,严重影响了数据的质量,消除数据中的各种异常能够还原真实的海底地形,对研究海底精细地貌及解释具有重要意义.依托“东方红3”号科考船搭载的EM122多波束系统,近年来在南海北部采集了大范围的深水多波束数据,通过对数据的精细处理和分析,在水深数据中发现并识别了5种典型的异常.根据异常在地形图中的几何形态和异常点在二维测深点云数据中的离散特征,本研究解释和命名为地形褶皱弯曲异常、点状异常、线状异常、放射状异常、空白区异常5类.对5类异常使用不同的滤波方式能够很好的消除异常数据,使用条带滤波或子区滤波处理线状异常、使用子区滤波处理点状异常和放射状异常、通过折射编辑器校正处理地形褶皱弯曲异常、使用插值法处理空白区异常.对采集的多波束数据经过交互式滤波处理,很好地消除了多波束测量中存在的异常数据,为进一步对海底地形地貌的解释和分析提供了强有力的支撑. 展开更多
关键词 深水多波束系统 水深数据异常 多波束数据处理 条带滤波 子区滤波 南海 海洋地质
原文传递
基于快速SVDD的无线传感器网络Outlier检测 被引量:8
10
作者 谢迎新 陈祥光 +2 位作者 余向明 岳彬 郭静 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第1期46-51,共6页
Outlier是基于无线传感器网络的数据收集应用中常见的数据故障类型,严重影响数据质量。本文提出一种基于快速SVDD的无线传感器网络Outlier检测方法,其基本思想是:首先利用快速SVDD算法获得包含正常样本的最小球形边界,然后通过该边界判... Outlier是基于无线传感器网络的数据收集应用中常见的数据故障类型,严重影响数据质量。本文提出一种基于快速SVDD的无线传感器网络Outlier检测方法,其基本思想是:首先利用快速SVDD算法获得包含正常样本的最小球形边界,然后通过该边界判断未知样本的类别,本法采用训练集约减策略和基于二阶逼近的SMO算法来加速SVDD的训练。基于合成数据和真实数据的仿真实验表明,该方法在确保分类精度的同时,运行速度快,内存开销小,适用于资源有限的无线传感器网络。 展开更多
关键词 无线传感器网络 outlier检测 SVDD 训练集约简 SMO算法
在线阅读 下载PDF
一种用于异常数据流挖掘的改进Apriori算法研究 被引量:1
11
作者 金兰 陈荆亮 《计算机仿真》 2025年第1期480-484,共5页
Apriori算法需要多次扫描数据库,算法运行时间长,不利于实际应用,导致现阶段的异常流数据挖掘存在准确度低、时间长等问题,为此提出一种用于异常数据流挖掘的改进Apriori算法。通过压缩矩阵改进Apriori算法,并通过改进Apriori算法获取... Apriori算法需要多次扫描数据库,算法运行时间长,不利于实际应用,导致现阶段的异常流数据挖掘存在准确度低、时间长等问题,为此提出一种用于异常数据流挖掘的改进Apriori算法。通过压缩矩阵改进Apriori算法,并通过改进Apriori算法获取数据流的数据特征量;通过局部离群因子方法剔除数据流中的远距离聚类离群点,以提高数据流聚类效果;通过改进K-means算法的最大最小距离方法完成异常数据流挖掘。实验结果表明,所提方法的异常数据流挖掘方法准确度更高、挖掘效率更快、效果更好,更适合于实际应用。 展开更多
关键词 异常数据流挖掘 局部离群因子 压缩矩阵
在线阅读 下载PDF
基于改进生成对抗网络的供应链数据异常识别模型研究
12
作者 邹昕彤 金辉 《计算机应用与软件》 北大核心 2025年第7期107-110,174,共5页
针对供应链数据设计一种基于改进GAN(Generative Adversarial Network)的异常识别模型。运用联合分布和多配对样本Friedman检验对供应链数据进行探索性分析。针对数据特性进行异常检测,为了捕捉数据的时间相关性,利用LSTM(Long Short-Te... 针对供应链数据设计一种基于改进GAN(Generative Adversarial Network)的异常识别模型。运用联合分布和多配对样本Friedman检验对供应链数据进行探索性分析。针对数据特性进行异常检测,为了捕捉数据的时间相关性,利用LSTM(Long Short-Term Memory)作为生成器和判别器的基础模型,并在生成器中用Cycle Consistency损失防止编码器和解码器矛盾,判别器中用Wasserstein损失克服模式崩溃问题,同时引入非参数动态阈值方法进行优化,进而识别异常。运用精确率、召回率、F1值进行模型评价,并与基线方法进行比较研究。结果表明,该改进模型更贴近供应链数据的实际情况,可增强供应链柔性,具有较高的异常识别性能。 展开更多
关键词 数据分析 异常值识别 TadGAN 非参数动态阈值
在线阅读 下载PDF
滑坡变形监测数据的不同平滑方法对比试验研究
13
作者 安炯 张燕 +2 位作者 夏勇 邓兴富 吴晓妮 《自然灾害学报》 北大核心 2025年第5期94-104,共11页
滑坡变形监测数据具有非线性、非平稳性和不确定性等复杂特征,给数据平滑处理带来了诸多挑战。为寻求一种适用于复杂变形数据的高效平滑方法,该文对4种平滑算法的性能进行了比较研究。首先采用局部异常因子算法识别并剔除监测数据中的... 滑坡变形监测数据具有非线性、非平稳性和不确定性等复杂特征,给数据平滑处理带来了诸多挑战。为寻求一种适用于复杂变形数据的高效平滑方法,该文对4种平滑算法的性能进行了比较研究。首先采用局部异常因子算法识别并剔除监测数据中的异常值,然后选取移动平均法、指数平滑法、多项式拟合法和局部加权散点平滑法4种算法,对3个库水滑坡的6条不同类型的实测变形数据进行了平滑对比试验。利用均方根误差、决定系数和赤池信息量准则3个指标,定量评估各算法的平滑性能。研究结果表明,局部加权散点平滑法在宏观趋势把握和局部细节刻画上均优于其他方法,展现出优异的鲁棒性和自适应性,生成的平滑曲线能够较好逼近原始监测数据,整体趋势准确,局部特征清晰,即使在数据存在多次阶跃和剧烈变化等复杂情况下,仍能保持良好的平滑效果。与其他方法相比,局部加权散点平滑法的均方根误差平均降低了53.8%,赤池信息量准则平均降低了12.7%,决定系数平均提高了0.2%,普遍达到0.997以上。局部加权散点平滑法适用于复杂滑坡变形监测数据的平滑处理,为基于滑坡变形数据的预警指标计算提供支撑。 展开更多
关键词 变形监测 异常值剔除 数据平滑 鲁棒性
原文传递
试飞数据分析与处理方法
14
作者 胡莹 林志强 +1 位作者 刘海峰 王强 《直升机技术》 2025年第3期49-55,共7页
试飞数据处理是飞行器试飞过程的关键环节。针对目前试飞数据处理和分析过程中遇到的数据噪声大、异常值多、数据维度高等问题,通过野值剔除、平滑处理以及数据扩容的方法,提高数据处理的效率和准确性。首先,利用统计方法识别并剔除数... 试飞数据处理是飞行器试飞过程的关键环节。针对目前试飞数据处理和分析过程中遇到的数据噪声大、异常值多、数据维度高等问题,通过野值剔除、平滑处理以及数据扩容的方法,提高数据处理的效率和准确性。首先,利用统计方法识别并剔除数据中的野值;其次,通过平滑处理和滤波算法减少数据噪声,提高数据平滑度和稳定性;最后,采用数据扩容技术填补数据缺失部分,提高数据完整性。与现有方法相比,所提方法在处理野值、减少误差以及提高数据可读性方面表现出显著优势,为试飞数据的处理提供了新的解决方案,可应用于飞行器的性能评估、模型搭建和修正、模拟机主客观鉴定测试等诸多领域。 展开更多
关键词 飞行试验 野值 数据分析 数据处理 平滑 滤波
在线阅读 下载PDF
基于改进K-Medoids算法的新能源发电功率异常值识别
15
作者 殷立军 陈安 +1 位作者 贺林钰 卞世敏 《电子设计工程》 2025年第20期67-70,75,共5页
功率异常值能够反映能源生产的波动或故障问题,因此对异常值的有效识别能够实现能源的优化调度。为准确识别发电过程中的异常功率参量,提出一种基于改进K-Medoids算法的新能源发电功率异常值识别方法。根据改进K-Medoids算法的定义方程... 功率异常值能够反映能源生产的波动或故障问题,因此对异常值的有效识别能够实现能源的优化调度。为准确识别发电过程中的异常功率参量,提出一种基于改进K-Medoids算法的新能源发电功率异常值识别方法。根据改进K-Medoids算法的定义方程,清洗发电数据,并推导功率特性表达式,实现功率特性分析。提取功率异常值,利用时序关联性条件,确定识别阈值指标的取值范围,完成新能源发电功率异常值识别算法的设计。实验结果表明,应用上述方法识别的异常功率参量所处发电周期阶段,与实际异常发电行为特征完全一致,可有效反映能源生产波动或故障问题,为发电系统优化调度提供数据支撑。 展开更多
关键词 改进K-Medoids算法 新能源发电 功率异常值 数据清洗 时序关联性
在线阅读 下载PDF
基于Hampel滤波的海洋磁测数据异常值检测方法研究
16
作者 谢宇轩 范琳琳 +2 位作者 郭鑫 黄彦铭 张锦昌 《海洋学报》 北大核心 2025年第4期53-64,共12页
海洋磁测数据易受导航误差、仪器故障及人工记录错误等因素干扰,导致异常值频现。这些异常值不仅扭曲磁异常形态,还会破坏磁条带的连续性,严重影响数据质量及后续解释的可靠性。因此,异常值的检测与去除是海洋磁测数据处理中的关键环节... 海洋磁测数据易受导航误差、仪器故障及人工记录错误等因素干扰,导致异常值频现。这些异常值不仅扭曲磁异常形态,还会破坏磁条带的连续性,严重影响数据质量及后续解释的可靠性。因此,异常值的检测与去除是海洋磁测数据处理中的关键环节。然而,传统方法难以有效区分不同类型的异常值,尤其是上下文异常值,且人工检测既耗时又易产生误判,效率较低。针对这一问题,本研究提出了一种基于局部中位数加权策略的自适应Hampel滤波方法。该方法通过动态调整数据点权重,能够更精准地识别和去除海洋磁测数据中的异常值,尤其在数据分布异质性较大的区域表现优异。与自回归模型、孤立森林及自编码器等传统方法相比,加权Hampel滤波器不仅能够有效检测并去除全局异常值和上下文异常值,还能更好地保留数据的原始特征,显著提升了检测精度。在对中西太平洋麦哲伦海隆地区实测数据的验证中,加权Hampel滤波器的F1分数始终领先于其他方法,证明其在异常值检测中的优越性。该方法为提升海洋磁测数据质量及可解释性提供了重要技术支持,并为未来大规模数据的自动化处理奠定基础。 展开更多
关键词 海洋磁学 海洋磁测数据处理 异常值检测 Hampel滤波
在线阅读 下载PDF
基于局部离群因子的配电网低电压异常数据检测
17
作者 李强 范李平 +5 位作者 杜丰夷 黄宇 刘云飞 漆曾 张作轩 马辉 《电力学报》 2025年第1期33-40,共8页
在低压配电网系统中,受设备故障、网络延迟及恶劣天气等因素的影响,电力数据异常的现象时有发生。为了提高配电网低电压监测中异常数据处理技术的可靠性和稳定性,提出了一种基于局部离群因子的配电网低电压异常数据检测法。首先介绍了... 在低压配电网系统中,受设备故障、网络延迟及恶劣天气等因素的影响,电力数据异常的现象时有发生。为了提高配电网低电压监测中异常数据处理技术的可靠性和稳定性,提出了一种基于局部离群因子的配电网低电压异常数据检测法。首先介绍了低电压智能监测模型,基于残差U型网络架构+归一化方法建立了数据预处理模型。针对数据缺失问题,模型采用掩码描述法阐释数据缺失情况,采用反向神经网络调整损失函数,提升数据点重构精度,实现缺失数据填补。随后,使用基于局部离群因子的异常数据检测方法,对异常值进行判断、检测与剔除。在仿真分析中,利用Python搭建了异常数据检测模型,并进行了模拟验证。结果显示,所建模型可以筛选出异常数据点。最后,以某供电公司10 kV母线电压监测数据为例,抽取其中30%进行缺失测试,对此异常数据检测方法的有效性进行了仿真分析。结果显示,该模型可实现数据补全并导出结果图;在K=10时,能够在保证模型稳定性的同时准确识别异常数据点,并绘制出处理后的异常数据检测图。仿真结果验证了所提方法的有效性,可为提升配电网监测的数据质量提供技术支持。 展开更多
关键词 配电网 大数据挖掘 低电压监测 数据清洗 局部离群因子
在线阅读 下载PDF
伪周期数据流局部异常离群因子检测仿真
18
作者 陈玉姝 王丽楠 王晨华 《计算机仿真》 2025年第4期386-390,共5页
为了精准检测伪周期数据流异常,提出一种基于局部离群因子的伪周期数据流异常检测方法。通过伪周期数据流的空间维度,展开网格划分处理。对邻域粗糙集模型展开分析构建特征冗余度度量特征冗余图,采用图割理论得到特征划分子集。引入聚... 为了精准检测伪周期数据流异常,提出一种基于局部离群因子的伪周期数据流异常检测方法。通过伪周期数据流的空间维度,展开网格划分处理。对邻域粗糙集模型展开分析构建特征冗余度度量特征冗余图,采用图割理论得到特征划分子集。引入聚类簇数评估方法确定最优特征分割,同时根据建立最优类簇结构评估指标展开伪周期数据流特征选择。利用改进孤立森林(iForest)和局部离群因子相结合的方式分别展开周期数据流异常检测,将获取的检测结果融合进而得到最终的伪周期数据流异常检测结果。实验结果表明,所提方法可以有效检测出伪周期数据流异常,获取良好的检测效果。 展开更多
关键词 局部离群因子 伪周期 数据流 异常检测
在线阅读 下载PDF
流数据上的快速离群点检测
19
作者 聂丹凤 马庆岩 周含 《微处理机》 2025年第6期40-47,共8页
数据流环境下的离群点检测是流数据管理与分析中的重要问题,具有广泛的应用。基于距离阈值的方法判断窗口中的对象是否为离群点。对于窗口中的任意对象o,如果窗口中与其距离小于距离阈值r的对象少于对象个数阈值k,则称o为离群点。给定... 数据流环境下的离群点检测是流数据管理与分析中的重要问题,具有广泛的应用。基于距离阈值的方法判断窗口中的对象是否为离群点。对于窗口中的任意对象o,如果窗口中与其距离小于距离阈值r的对象少于对象个数阈值k,则称o为离群点。给定离群点检测参数q<r,k>,q监听窗口中的对象。当窗口滑动时,算法会返回窗口中的离群点。基于此,本文提出一种新的索引结构——GQDT,用于实现对流数据的高效管理。GQDT是一个双层索引结构,其第一层是用于探测数据分布程度的网格索引,第二层是四叉树索引结构。在数据分布密集的区域,GQDT会进一步采用四叉树进行索引,以方便离群点检测。与传统方法中的网格索引和四叉树索引相比,GQDT既继承了网格索引快速判断部分离群点的优势,又能通过四叉树索引加快对部分无法直接判断的对象的范围查询,从而返回所有离群点。 展开更多
关键词 流数据 离群点检测 索引
在线阅读 下载PDF
一种融合Akaike信息检验的多粗差识别方法
20
作者 余航 宁一鹏 +1 位作者 李黎 赵伟 《苏州科技大学学报(自然科学版)》 2025年第1期66-73,共8页
对于多粗差的识别问题,可通过建立多重备选假设模型,构建局部检验统计量,并以最大值统计量作为识别粗差的依据。然而,当粗差量级较大时,由于数值计算精度的问题,最大统计量反而无法区分两个或多个备选假设模型,导致“湮没”现象频发。... 对于多粗差的识别问题,可通过建立多重备选假设模型,构建局部检验统计量,并以最大值统计量作为识别粗差的依据。然而,当粗差量级较大时,由于数值计算精度的问题,最大统计量反而无法区分两个或多个备选假设模型,导致“湮没”现象频发。本文提出将Akaike信息检验与多粗差识别方法进行融合应用,在不改变多粗差识别方法中探测、识别与调节改正框架的基础上,通过以Akaike信息最小为准则确定备选模型,避免上述“湮没”现象的发生。数值实验结果表明,相较于迭代数据探测法,融合Akaike信息检验的多粗差识别方法对于量级较大的多粗差问题具有较好的识别成功率,且粗差识别过程中该方法不受整体虚警率的影响。 展开更多
关键词 多重备选假设 Akaike信息检验 粗差探测 迭代数据探测法
在线阅读 下载PDF
上一页 1 2 45 下一页 到第
使用帮助 返回顶部