针对传统K-NN分类方法预测效率低的问题,提出一种基于待测样本标记的加速K-NN分类(Speeding K-NN Classification Based on Testing Sample Label,KNN_TSL)方法。该方法首先采用传统K-NN分类方法得到一定数量的待测样本类别;然后对于再...针对传统K-NN分类方法预测效率低的问题,提出一种基于待测样本标记的加速K-NN分类(Speeding K-NN Classification Based on Testing Sample Label,KNN_TSL)方法。该方法首先采用传统K-NN分类方法得到一定数量的待测样本类别;然后对于再进入的待测样本,计算其与已标记类别待测样本的距离,如果该距离小于给定的阈值,则将该新进入的样本赋予相同的类别标签,反之则重新分类。这种方法对于后续进入的易分类待测样本,只需要计算其与少数比原始标记样本更有代表性的已标记待测样本的距离即可进行类别决策,而只有少数的待测样本需要重新分类。由于已标记待测样本包含了部分类别信息,因此采用这种方法可以在大大提高分类预测效率的同时保证模型的泛化性能。实验结果表明,本文提出的KNN_TSL方法能够获得较高的样本预测速度和较好的预测准确率。展开更多
标准K-近邻分类方法(K-Nearest Neighbor,K-NN)在进行样本预测过程时,需要计算每一个待预测类别标记的样本与所有已知标记样本的距离,因此复杂度较高,无法处理含有大规模有标记样本的分类问题。针对这个问题,本文提出一种基于采样压缩...标准K-近邻分类方法(K-Nearest Neighbor,K-NN)在进行样本预测过程时,需要计算每一个待预测类别标记的样本与所有已知标记样本的距离,因此复杂度较高,无法处理含有大规模有标记样本的分类问题。针对这个问题,本文提出一种基于采样压缩的加速K-NN分类方法(K-NN Method Based on Sampling Compress,KNN__S)。该方法将采样思想引入到K-NN分类过程当中,即对于每一个新来的未知类别的待测样本,不是计算其与所有带类别标签样本的距离,而是通过采集一定数量的有标记样本,计算这部分有标记样本中距离待测样本最近的近邻样本,来对待测样本进行分类。实验结果表明,本文提出的KNN__S方法能够加速K-NN分类的过程。展开更多
文摘针对传统K-NN分类方法预测效率低的问题,提出一种基于待测样本标记的加速K-NN分类(Speeding K-NN Classification Based on Testing Sample Label,KNN_TSL)方法。该方法首先采用传统K-NN分类方法得到一定数量的待测样本类别;然后对于再进入的待测样本,计算其与已标记类别待测样本的距离,如果该距离小于给定的阈值,则将该新进入的样本赋予相同的类别标签,反之则重新分类。这种方法对于后续进入的易分类待测样本,只需要计算其与少数比原始标记样本更有代表性的已标记待测样本的距离即可进行类别决策,而只有少数的待测样本需要重新分类。由于已标记待测样本包含了部分类别信息,因此采用这种方法可以在大大提高分类预测效率的同时保证模型的泛化性能。实验结果表明,本文提出的KNN_TSL方法能够获得较高的样本预测速度和较好的预测准确率。
文摘标准K-近邻分类方法(K-Nearest Neighbor,K-NN)在进行样本预测过程时,需要计算每一个待预测类别标记的样本与所有已知标记样本的距离,因此复杂度较高,无法处理含有大规模有标记样本的分类问题。针对这个问题,本文提出一种基于采样压缩的加速K-NN分类方法(K-NN Method Based on Sampling Compress,KNN__S)。该方法将采样思想引入到K-NN分类过程当中,即对于每一个新来的未知类别的待测样本,不是计算其与所有带类别标签样本的距离,而是通过采集一定数量的有标记样本,计算这部分有标记样本中距离待测样本最近的近邻样本,来对待测样本进行分类。实验结果表明,本文提出的KNN__S方法能够加速K-NN分类的过程。