期刊文献+
共找到1,129篇文章
< 1 2 57 >
每页显示 20 50 100
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:15
1
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
在线阅读 下载PDF
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
2
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k NN)查询算法 不规则区域划分方法 MAP REDUCE 大数据
在线阅读 下载PDF
Nearest neighbor search algorithm based on multiple background grids for fluid simulation 被引量:2
3
作者 郑德群 武频 +1 位作者 尚伟烈 曹啸鹏 《Journal of Shanghai University(English Edition)》 CAS 2011年第5期405-408,共4页
The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth... The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth length is introduced. Through tested on lid driven cavity flow, it is clear that this method can provide high accuracy. Analysis and experiments have been made on its parallelism, and the results show that this method has better parallelism and with adding processors its accuracy become higher, thus it achieves that efficiency grows in pace with accuracy. 展开更多
关键词 multiple background grids smoothed particle hydrodynamics (SPH) nearest neighbor search algorithm parallel computing
在线阅读 下载PDF
Nearest neighbor search algorithm for GBD tree spatial data structure
4
作者 Yutaka Ohsawa Takanobu Kurihara Ayaka Ohki 《重庆邮电大学学报(自然科学版)》 2007年第3期253-259,共7页
This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteris... This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments. 展开更多
关键词 邻居搜索算法 GBD树 空间数据结构 动态数据环境 地理信息系统 计算机辅助设计
在线阅读 下载PDF
基于RSA模型和改进K-means算法的电商行业客户细分
5
作者 杨静 《计算机应用与软件》 北大核心 2025年第8期125-131,172,共8页
针对新兴的网络购物客户数量大、客户流动性强和消费数据多的特点,提出RSA模型结合改进的K-means聚类算法实现客户细分。采用熵值法计算RSA模型各指标的权重,综合各个属性计算客户价值。结合K近邻算法和密度峰值算法,提出一种基于K近邻... 针对新兴的网络购物客户数量大、客户流动性强和消费数据多的特点,提出RSA模型结合改进的K-means聚类算法实现客户细分。采用熵值法计算RSA模型各指标的权重,综合各个属性计算客户价值。结合K近邻算法和密度峰值算法,提出一种基于K近邻和密度峰值聚类的K-means初始聚类中心选取方法,优化传统K-means算法实现客户细分。通过选取的标准数据集和某零售公司在线交易的真实数据进行实验验证,证明了RSA模型和改进K-means算法具有更加优异的性能。 展开更多
关键词 RSA模型 客户细分 k-MEANS算法 密度峰值聚类 K近邻
在线阅读 下载PDF
Comparison of Two Quantum Nearest Neighbor Classifiers on IBM’s Quantum Simulator
6
作者 Wei Hu 《Natural Science》 2018年第3期87-98,共12页
Today computers are used to store data in memory and then process them. In our big data era, we are facing the challenge of storing and processing the data simply due to their fast ever growing size. Quantum computati... Today computers are used to store data in memory and then process them. In our big data era, we are facing the challenge of storing and processing the data simply due to their fast ever growing size. Quantum computation offers solutions to these two prominent issues quantum mechanically and beautifully. Through careful design to employ superposition, entanglement, and interference of quantum states, a quantum algorithm can allow a quantum computer to store datasets of exponentially large size as linear size and then process them in parallel. Quantum computing has found its way in the world of machine learning where new ideas and approaches are in great need as the classical computers have reached their capacity and the demand for processing big data grows much faster than the computing power the classical computers can provide today. Nearest neighbor algorithms are simple, robust, and versatile supervised machine learning algorithms, which store all training data points as their learned “model” and make the prediction of a new test data point by computing the distances between the query point and all the training data points. Quantum counterparts of these classical algorithms provide efficient and elegant ways to deal with the two major issues of storing data in memory and computing the distances. The purpose of our study is to select two similar quantum nearest neighbor algorithms and use a simple dataset to give insight into how they work, highlight their quantum nature, and compare their performances on IBM’s quantum simulator. 展开更多
关键词 QUANTUM COMPUTATION QUANTUM MACHINE Learning QUANTUM nearest neighbor algorithm
暂未订购
基于k-NN混合遗传算法的配电网重构方法研究
7
作者 李富 张智 +1 位作者 丁嘉伟 王坤 《电力科学与技术学报》 北大核心 2025年第5期36-45,共10页
在分布式电源广泛接入的情况下,为满足网络径向拓扑约束,考虑配电网拓扑限制等其他约束条件,提出基于K-NN混合遗传算法的配电网重构方法。首先,以最小网损、负荷平衡和最少断路器动作次数为目标函数,在潮流方程、负载平衡、电压上限、... 在分布式电源广泛接入的情况下,为满足网络径向拓扑约束,考虑配电网拓扑限制等其他约束条件,提出基于K-NN混合遗传算法的配电网重构方法。首先,以最小网损、负荷平衡和最少断路器动作次数为目标函数,在潮流方程、负载平衡、电压上限、功率上限等约束条件下,构建配电网重构的数学模型。然后,利用k-NN算法确保在交叉和变异中染色体始终满足配电网径向拓扑约束。最后,建立基于k-NN算法的混合遗传算法进行数学模型的求解,实现配电网拓扑重构。仿真算例表明,所提出的方法能完成重构方案的求解,具有一定的适用性。 展开更多
关键词 配电网重构 遗传算法 K最近邻算法 配电网拓扑
在线阅读 下载PDF
基于K-最近邻算法的新型输电系统故障识别方法
8
作者 王家齐 李颖慧 刘沐辰 《黑龙江电力》 2025年第2期102-108,共7页
随着风电机组的规模化并网,系统“双高”特性涌现,现有的电力系统故障识别方法难以满足现代电网安全稳定运行的需求。针对该问题提出了一种基于K-最近邻(KNN)算法和单机能量函数的电力系统故障识别方法。推导基于短路电流的单机能量函数... 随着风电机组的规模化并网,系统“双高”特性涌现,现有的电力系统故障识别方法难以满足现代电网安全稳定运行的需求。针对该问题提出了一种基于K-最近邻(KNN)算法和单机能量函数的电力系统故障识别方法。推导基于短路电流的单机能量函数,并分析其作为故障类型识别判据的可行性;考虑风力发电机输出能量的变化特性,采用分区边界电压值对故障区域进行初筛选,进而结合KNN算法提出了一种适用于含新能源机组的电力系统故障识别策略;在PSASP软件中利用含有风电场的十机系统上进行了试验验证。仿真结果表明,所提方法具有较强的适用性和稳定性,在不同工况下均能保持较高的故障类型识别精度。 展开更多
关键词 单机能量函数 电压跌落系数 K最近邻算法 故障识别 广域测量系统 PSASP
在线阅读 下载PDF
结合近邻思想和K-means的三支决策聚类方法
9
作者 唐欣 《计算机与数字工程》 2025年第2期314-319,共6页
针对K-means算法随机选取聚类中心且易受极端值影响等问题,提出近邻思想和K-means的三支决策聚类方法。首先,利用样本点之间的关系得到密度最高的对象作为初始聚类中心,根据剩余样本点与初始聚类中心之间的近邻密度选取合适的聚类对象,... 针对K-means算法随机选取聚类中心且易受极端值影响等问题,提出近邻思想和K-means的三支决策聚类方法。首先,利用样本点之间的关系得到密度最高的对象作为初始聚类中心,根据剩余样本点与初始聚类中心之间的近邻密度选取合适的聚类对象,同时更新聚类中心;接着从最远欧氏距离出发寻找n-1个聚类中心及其对应的聚类对象,得到二支K-means聚类结果。最后,结合三支决策和Q近邻思想,将上述结果进一步划分为核心域、边界域及琐碎域,得到三支K-means决策聚类结果。在UCI数据集和人工模拟数据集上分别进行试验,实验结果表明:相比于其他几种方法,该方法提高了聚类准确率,具有稳定性。 展开更多
关键词 k-MEANS算法 局部邻域密度 Q近邻 三支决策 三支聚类
在线阅读 下载PDF
基于PNCC声纹特征提取技术和POA-KNN算法的齿轮箱声纹识别故障诊断
10
作者 廖力达 赵阁阳 +1 位作者 魏诚 刘川江 《机电工程》 北大核心 2026年第1期24-33,共10页
风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因... 风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因此,提出了一种基于功率正则化倒谱系数(PNCC)声纹特征提取技术,以及行星优化算法与K近邻算法(POA-KNN)模型的风力机齿轮箱声纹识别故障诊断方法。首先,采用LMS噪声采集仪采集了6种不同状态下的风力机齿轮箱噪声数据;然后,使用了PNCC声纹特征提取的方法,提取了齿轮箱噪声信号的声纹图谱;在KNN的基础上加入行星优化算法(POA)优化了K值,提出了性能较高的POA-KNN分类模型;最后,根据6类不同状态下的齿轮数据集,采用对比试验和消融实验验证了模型性能。研究结果表明:POA-KNN模型对齿轮箱的PNCC声纹图分类准确率达到99.4%,比KNN基线模型提升了1.9%。POA-KNN分类模型能很好地对数据集中不同状态下的齿轮箱进行分类,更高效地针对风力机齿轮箱中存在的故障进行诊断。 展开更多
关键词 齿轮箱 功率正则化倒谱系数 声纹识别 声纹特征图谱 行星优化算法与K近邻算法 分类模型
在线阅读 下载PDF
机载激光点云数据滤波下尾矿坝位移变形监测
11
作者 赵国强 《有色金属(矿山部分)》 2026年第1期49-55,共7页
尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载... 尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载激光点云数据滤波的尾矿坝位移变形监测方法,通过K邻近搜索算法建立空间索引以划分多尺度噪声,并引入空间距离权重与几何相似性权重的双重约束机制,结合双边滤波算法有效抑制噪声干扰。同时,采用对象分割技术将监测区域划分为3D网格单元,实现尾矿坝水平变形与垂直沉降的高精度监测。结果表明,该方法在水平变形和垂直沉降监测中的平均绝对误差显著减小,位移速率波动率低,最大误差仅0.4%,为尾矿坝全生命周期安全提供了毫米级感知能力。相较于传统DS-InSAR技术和时序分解模型,本研究方法在复杂植被覆盖和地形起伏区域表现出更高的监测精度和稳定性,尤其适用于尾矿坝长期安全预警及动态管理场景。 展开更多
关键词 尾矿坝位移变形 双边滤波算法 K邻近搜索算法 法向量夹角 三维单元分割
在线阅读 下载PDF
基于K-means和近邻回归算法的Kinect植株深度图像修复 被引量:19
12
作者 沈跃 徐慧 +1 位作者 刘慧 李宁 《农业工程学报》 EI CAS CSCD 北大核心 2016年第19期188-194,共7页
针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行... 针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行阈值分割预处理提取植株目标区域,再利用K-means聚类算法去除背景噪声,使得植株目标区域轮廓更加清晰;然后基于配准的彩色图像和深度图像,对获取的深度图像中可疑像素点的深度数据采取近邻回归算法进行修复,再将修复后的深度图像与目标分割后的彩色图像进行植株区域的匹配,并进行二次近邻回归算法修正错误的深度数据,最后获取目标植株深度信息的检测图像。试验结果证明,采用RGB阈值分割和K-means聚类算法植株目标区域分割误差均值为12.33%,比单一RGB阈值分割和K-means聚类分割误差降低了12.12和41.48个百分点;同时结合聚类后的彩色图像对深度数据进行两次近邻回归算法修复深度数据,能够提高深度数据边缘的清晰度,单帧深度数据空洞点进行修复数据的准确度提高。该研究结果可为农业植株检测、植株三维重构、精准对靶喷雾等提供参考。 展开更多
关键词 图像处理 图像分割 算法 植株检测 深度数据 图像修复 k-MEANS聚类 近邻回归
在线阅读 下载PDF
基于K-最近邻算法的未知病毒检测 被引量:15
13
作者 张波云 殷建平 +1 位作者 张鼎兴 嵩敬波 《计算机工程与应用》 CSCD 北大核心 2005年第6期7-10,共4页
因为准确检测计算机病毒是不可判定的,故该文提出了一种基于实例学习的k-最近邻算法来实现对计算机病毒的近似检测。该法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,文章设计了一个病毒检测网络模型,此... 因为准确检测计算机病毒是不可判定的,故该文提出了一种基于实例学习的k-最近邻算法来实现对计算机病毒的近似检测。该法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,文章设计了一个病毒检测网络模型,此模型适用于实时在线系统中的病毒检测,既可以实现对已知病毒的查杀,又可以对可疑程序行为进行分析评判,最终实现对未知病毒的识别。 展开更多
关键词 计算机病毒 k-最近邻算法 病毒检测
在线阅读 下载PDF
基于对角化LDPC压缩感知和k-近邻算法的广域系统宽频振荡监测方法 被引量:20
14
作者 冯双 崔昊 +4 位作者 吴熙 冯俊杰 邹常跃 赵晓斌 汤奕 《电网技术》 EI CSCD 北大核心 2021年第8期3025-3033,共9页
在“双高”电力系统中,宽频振荡的发生概率大大增加。然而,传统基于广域测量系统(wide area measurement system,WAMS)的振荡监测方法一方面监测的振荡频带范围过窄,另一方面其准确性和快速性难以适应复杂的电网运行状态。因此提出一种... 在“双高”电力系统中,宽频振荡的发生概率大大增加。然而,传统基于广域测量系统(wide area measurement system,WAMS)的振荡监测方法一方面监测的振荡频带范围过窄,另一方面其准确性和快速性难以适应复杂的电网运行状态。因此提出一种基于对角化低密度奇偶校验码(low-density parity-check codes,LDPC)校验矩阵和k-近邻算法(k-nearest neighbor,KNN)的宽频振荡监测方法。首先,基于对角化LDPC校验矩阵对电力系统信号进行压缩采样,大大减少了宽频振荡的数据传输量,有利于在现有相量测量单元(phasor measurement unit,PMU)上传频率下实现几百Hz的宽频振荡数据的传输。在此基础上,主站直接基于压缩采样值作为输入特征,采用加权KNN算法进行振荡检测,避免了人为设置阈值带来的误判,提高了振荡检测的快速性和准确性。最后,根据振荡检测结果,采用正交匹配追踪(orthogonal matching pursuit,OMP)算法,在主站准确重构宽频振荡信号,便于广域系统的振荡全局性分析。仿真结果表明所提方法在噪声、数据缺失和数据有误等情况下,仍然能够实现宽频振荡信号的快速准确监测。 展开更多
关键词 宽频振荡监测 压缩感知技术 对角化LDPC k-近邻算法
原文传递
基于K-近邻算法的文本情感分析方法研究 被引量:10
15
作者 樊娜 安毅生 李慧贤 《计算机工程与设计》 CSCD 北大核心 2012年第3期1160-1164,共5页
为了识别网络文本的情感倾向性,通过分析文本结构以及情感表达的特点,提出了一种基于K-近邻的文本情感分析方法,将整个文本的情感划分为局部情感和全局情感。建立条件随机场模型,确定文本中的局部情感,通过K-近邻算法计算文本的全局情... 为了识别网络文本的情感倾向性,通过分析文本结构以及情感表达的特点,提出了一种基于K-近邻的文本情感分析方法,将整个文本的情感划分为局部情感和全局情感。建立条件随机场模型,确定文本中的局部情感,通过K-近邻算法计算文本的全局情感。实验结果表明,与传统机器学习方法相比,该方法能细粒度、多层次的分析文本的情感,同时能有效提高情感分析的准确率。 展开更多
关键词 情感分析 局部情感 全局情感 层次化模型 条件随机场模型 k-近邻算法
在线阅读 下载PDF
基于振动采用k-近邻法的机器人地形分类 被引量:6
16
作者 薛开 李强 +1 位作者 徐贺 王天龙 《振动.测试与诊断》 EI CSCD 北大核心 2013年第1期88-92,167-168,共5页
由于地形分类对于提高移动机器人的自治移动性能十分重要,尤其在行星表面探测时尤为突出。在四轮移动机器人左前轮轮臂上安装x,y,z向加速度计和z向传声器,使之在沙、碎石、草、土、沥青地面上分别以6种速度行驶,通过提取车轮与地面相互... 由于地形分类对于提高移动机器人的自治移动性能十分重要,尤其在行星表面探测时尤为突出。在四轮移动机器人左前轮轮臂上安装x,y,z向加速度计和z向传声器,使之在沙、碎石、草、土、沥青地面上分别以6种速度行驶,通过提取车轮与地面相互作用的振动信号来进行地形分类。该方法避免了视觉分类方法受光照变化影响大、易被地形表面的遮盖物蒙蔽的缺陷。对原始信号进行时域幅值分析,采用k-近邻法及投票决策法实现分类,并提出了票数相同情形下的新算法。实验验证了该算法的有效性。 展开更多
关键词 移动机器人 地形分类 振动 k-近邻法
在线阅读 下载PDF
一种自适应k-最近邻算法的研究 被引量:18
17
作者 余小鹏 周德翼 《计算机应用研究》 CSCD 北大核心 2006年第2期70-72,共3页
针对传统k-最近邻算法(k-NearestNeighbor,kNN)存在搜索慢的缺陷,提出了一种改进型的自适应k-最近邻算法。该方法在以测试样本点为中心的超球内进行搜索,对超球半径的生长进行采样,建立半径生长的BP神经网络模型,逼近半径变化函数,并用... 针对传统k-最近邻算法(k-NearestNeighbor,kNN)存在搜索慢的缺陷,提出了一种改进型的自适应k-最近邻算法。该方法在以测试样本点为中心的超球内进行搜索,对超球半径的生长进行采样,建立半径生长的BP神经网络模型,逼近半径变化函数,并用该函数指导超球体的生长。该方法有效地缩小了搜索范围,减少了超球体半径生长的试探次数,对处理稀疏数据集有明显的优越性。 展开更多
关键词 模式分类 k-最近邻算法 超球 BP网络算法
在线阅读 下载PDF
量子K-近邻算法 被引量:7
18
作者 陈汉武 高越 张军 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期647-651,共5页
为了提高经典K-近邻算法的效率,引入量子计算理论,将Grover算法中的Oracle算子以及相位估计算法嵌入经典K-近邻算法,提出一种量子K-近邻算法.该算法首先将样本点和待分类点的向量信息制备成量子叠加态,采用可逆的量子控制交换门并行计... 为了提高经典K-近邻算法的效率,引入量子计算理论,将Grover算法中的Oracle算子以及相位估计算法嵌入经典K-近邻算法,提出一种量子K-近邻算法.该算法首先将样本点和待分类点的向量信息制备成量子叠加态,采用可逆的量子控制交换门并行计算待分类点和样本点的相似度,然后利用相位估计算法将相似度信息存储到量子比特中,最后使用Grover算法一次性搜索出最相似的k个点.对嵌入的量子计算部分的理论分析结果表明,量子K-近邻算法可以明显降低经典计算复杂度,且提出的算法在已有算法计算复杂度O(RkM)的基础上,再次带来了k值的二次加速O(RkM),其中R为Oracle算子的执行次数,M为样本全局个数. 展开更多
关键词 机器学习 k-近邻算法 量子算法
在线阅读 下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:28
19
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 KNN算法 k-最近邻图 小样本 图划分 分类算法
在线阅读 下载PDF
基于哈希技术和MapReduce的大数据集K-近邻算法 被引量:7
20
作者 翟俊海 张明阳 +1 位作者 王婷婷 郝璞 《计算机科学》 CSCD 北大核心 2017年第7期210-214,共5页
K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数据环境中,K-近邻算法变得非常低效,甚至不可行。针对这一问题,提出了一种基于哈希技术和MapReduce的大数据... K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数据环境中,K-近邻算法变得非常低效,甚至不可行。针对这一问题,提出了一种基于哈希技术和MapReduce的大数据集K-近邻分类算法。为了验证算法的有效性,在4个大数据集上进行了实验,结果显示,在保持分类能力的前提下,所提算法可以大幅度地提高K-近邻算法的效率。 展开更多
关键词 k-近邻 哈希技术 分类算法 大数据集
在线阅读 下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部