The unified weighing scheme for the local-linear smoother in analysing functional data can deal with data that are dense,sparse or of neither type.In this paper,we focus on the convergence rate of functional principal...The unified weighing scheme for the local-linear smoother in analysing functional data can deal with data that are dense,sparse or of neither type.In this paper,we focus on the convergence rate of functional principal component analysis using this method.Almost sure asymptotic consistency and rates of convergence for the estimators of eigenvalues and eigenfunctions have been established.We also provide the convergence rate of the variance estimation of the measurement error.Based on the results,the number of observations within each curve can be of any rate relative to the sample size,which is consistent with the earlier conclusions about the asymptotic properties of the mean and covariance estimators.展开更多
局部线性嵌入算法采用欧氏距离选择邻域点,这通常会损失数据集本身的非线性特征,造成邻域点选取错误,且仅使用欧氏距离构造权重会导致信息挖掘不充分。针对以上问题,提出基于概率模型与信息熵的局部线性嵌入算法(Probability informatio...局部线性嵌入算法采用欧氏距离选择邻域点,这通常会损失数据集本身的非线性特征,造成邻域点选取错误,且仅使用欧氏距离构造权重会导致信息挖掘不充分。针对以上问题,提出基于概率模型与信息熵的局部线性嵌入算法(Probability information entropy-LLE,PIE-LLE)。首先,为了使邻域点选择更加合理,从数据集的概率分布角度出发,考虑样本点及其邻域的概率分布,为样本点构造符合局部分布的邻域集合。其次,为了充分提取样本的局部结构信息,在权重构造阶段,分别计算样本所属邻域概率以及每个样本的信息熵,融合二者信息重构低维样本。最后,在两个轴承故障数据集上的实验表明,所提方法故障识别准确度最高达到了100%,高于其他对比算法;在邻域点个数5~15范围内,PIE-LLE算法展现出良好的低维可视化效果;在参数敏感性实验中,该算法可以保持Fisher指标较大,有效提高了算法的分类准确度和稳定性。展开更多
局部线性嵌入(Local linear embedding,LLE)算法在挖掘高维空间的局部结构时,需要人工指定近邻点的个数,无法保证算法的特征提取能力。为了解决这个问题,提出了一种样本密度自适应的局部增强线性嵌入算法(Local enhanced linear embeddi...局部线性嵌入(Local linear embedding,LLE)算法在挖掘高维空间的局部结构时,需要人工指定近邻点的个数,无法保证算法的特征提取能力。为了解决这个问题,提出了一种样本密度自适应的局部增强线性嵌入算法(Local enhanced linear embedding algorithm with sample density adaptation,SDA-LELE)。首先,利用样本点与其近邻点之间的距离之和,衡量样本分布的稀疏稠密程度,从而自适应地选取近邻点个数。其次,采用局部增强算法,增加相邻样本间的权重,从而使样本在保持局部线性结构的同时也保持局部近邻结构,增强算法特征提取能力。最后,将算法应用在凯斯西储大学和东北石油大学轴承数据集上,并进行了可视化、Fisher信息等实验。实验结果表明,SDALELE算法比其他算法能提取出更多的显著特征,获得更好的降维效果。展开更多
针对电力机车牵引变流器中故障率最高的单相脉宽调制(pulse width modulation,PWM)整流器,提出一种流形学习算法融合多域特征的故障诊断方法。根据整流器在不同工作状态下的时域、频域和时频域特征构建多域特征向量;采用Hessian局部线...针对电力机车牵引变流器中故障率最高的单相脉宽调制(pulse width modulation,PWM)整流器,提出一种流形学习算法融合多域特征的故障诊断方法。根据整流器在不同工作状态下的时域、频域和时频域特征构建多域特征向量;采用Hessian局部线性嵌入(Hessian local linear embedding,HLLE)算法融合多域特征,根据故障样本数和聚类结果,解决高维数据中固有维数和最近邻数选取困难的问题,得到用于描述故障特征的最优低维特征向量,减少特征之间的冲突和冗余;采用支持向量机进行模式识别,实现对整流器的故障诊断。结果表明:对不同的输出电压,不同的训练和测试比,15种故障模式均具有较高的诊断率。与其他方法相比,本文方法具有较好的融合效果和较强的鲁棒性。展开更多
针对目前低压台区用户相位识别不精确的问题,提出一种基于用户电压数据的局部线性嵌入(locally linear embedding,LLE)降维和高斯混合模型(Gaussian mixture model,GMM)聚类算法的相位识别方法。先提取台区用户智能电表中的电压数据,并...针对目前低压台区用户相位识别不精确的问题,提出一种基于用户电压数据的局部线性嵌入(locally linear embedding,LLE)降维和高斯混合模型(Gaussian mixture model,GMM)聚类算法的相位识别方法。先提取台区用户智能电表中的电压数据,并采用主成分分析法(principal component analysis,PCA)实现降噪和去冗余;再采用导数动态时间弯曲(derivative dynamic time warping,DDTW)度量用户电压之间的相关性;然后,采用LLE降维提取用户的电压数据特征,采用GMM聚类算法对用户进行相位识别;最后,在实际台区进行了仿真验证,所提方法准确度高达100%。研究结果表明,所提方法能有效解决台区用户相位识别问题。展开更多
基金supported by National Natural Science Foundation of China(project number:11771146,11831008,81530086,11771145)the National Social Science Foundation Key Program(17ZDA091)+2 种基金the 111 Project(B14019)Programof Shanghai Subject Chief Scientist(14XD1401600)supported by the China Postdoctoral Science Foundation(2018M630393).
文摘The unified weighing scheme for the local-linear smoother in analysing functional data can deal with data that are dense,sparse or of neither type.In this paper,we focus on the convergence rate of functional principal component analysis using this method.Almost sure asymptotic consistency and rates of convergence for the estimators of eigenvalues and eigenfunctions have been established.We also provide the convergence rate of the variance estimation of the measurement error.Based on the results,the number of observations within each curve can be of any rate relative to the sample size,which is consistent with the earlier conclusions about the asymptotic properties of the mean and covariance estimators.
文摘局部线性嵌入算法采用欧氏距离选择邻域点,这通常会损失数据集本身的非线性特征,造成邻域点选取错误,且仅使用欧氏距离构造权重会导致信息挖掘不充分。针对以上问题,提出基于概率模型与信息熵的局部线性嵌入算法(Probability information entropy-LLE,PIE-LLE)。首先,为了使邻域点选择更加合理,从数据集的概率分布角度出发,考虑样本点及其邻域的概率分布,为样本点构造符合局部分布的邻域集合。其次,为了充分提取样本的局部结构信息,在权重构造阶段,分别计算样本所属邻域概率以及每个样本的信息熵,融合二者信息重构低维样本。最后,在两个轴承故障数据集上的实验表明,所提方法故障识别准确度最高达到了100%,高于其他对比算法;在邻域点个数5~15范围内,PIE-LLE算法展现出良好的低维可视化效果;在参数敏感性实验中,该算法可以保持Fisher指标较大,有效提高了算法的分类准确度和稳定性。
文摘局部线性嵌入(Local linear embedding,LLE)算法在挖掘高维空间的局部结构时,需要人工指定近邻点的个数,无法保证算法的特征提取能力。为了解决这个问题,提出了一种样本密度自适应的局部增强线性嵌入算法(Local enhanced linear embedding algorithm with sample density adaptation,SDA-LELE)。首先,利用样本点与其近邻点之间的距离之和,衡量样本分布的稀疏稠密程度,从而自适应地选取近邻点个数。其次,采用局部增强算法,增加相邻样本间的权重,从而使样本在保持局部线性结构的同时也保持局部近邻结构,增强算法特征提取能力。最后,将算法应用在凯斯西储大学和东北石油大学轴承数据集上,并进行了可视化、Fisher信息等实验。实验结果表明,SDALELE算法比其他算法能提取出更多的显著特征,获得更好的降维效果。
文摘针对电力机车牵引变流器中故障率最高的单相脉宽调制(pulse width modulation,PWM)整流器,提出一种流形学习算法融合多域特征的故障诊断方法。根据整流器在不同工作状态下的时域、频域和时频域特征构建多域特征向量;采用Hessian局部线性嵌入(Hessian local linear embedding,HLLE)算法融合多域特征,根据故障样本数和聚类结果,解决高维数据中固有维数和最近邻数选取困难的问题,得到用于描述故障特征的最优低维特征向量,减少特征之间的冲突和冗余;采用支持向量机进行模式识别,实现对整流器的故障诊断。结果表明:对不同的输出电压,不同的训练和测试比,15种故障模式均具有较高的诊断率。与其他方法相比,本文方法具有较好的融合效果和较强的鲁棒性。
文摘针对目前低压台区用户相位识别不精确的问题,提出一种基于用户电压数据的局部线性嵌入(locally linear embedding,LLE)降维和高斯混合模型(Gaussian mixture model,GMM)聚类算法的相位识别方法。先提取台区用户智能电表中的电压数据,并采用主成分分析法(principal component analysis,PCA)实现降噪和去冗余;再采用导数动态时间弯曲(derivative dynamic time warping,DDTW)度量用户电压之间的相关性;然后,采用LLE降维提取用户的电压数据特征,采用GMM聚类算法对用户进行相位识别;最后,在实际台区进行了仿真验证,所提方法准确度高达100%。研究结果表明,所提方法能有效解决台区用户相位识别问题。