期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于PNCC声纹特征提取技术和POA-KNN算法的齿轮箱声纹识别故障诊断
1
作者 廖力达 赵阁阳 +1 位作者 魏诚 刘川江 《机电工程》 北大核心 2026年第1期24-33,共10页
风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因... 风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因此,提出了一种基于功率正则化倒谱系数(PNCC)声纹特征提取技术,以及行星优化算法与K近邻算法(POA-KNN)模型的风力机齿轮箱声纹识别故障诊断方法。首先,采用LMS噪声采集仪采集了6种不同状态下的风力机齿轮箱噪声数据;然后,使用了PNCC声纹特征提取的方法,提取了齿轮箱噪声信号的声纹图谱;在KNN的基础上加入行星优化算法(POA)优化了K值,提出了性能较高的POA-KNN分类模型;最后,根据6类不同状态下的齿轮数据集,采用对比试验和消融实验验证了模型性能。研究结果表明:POA-KNN模型对齿轮箱的PNCC声纹图分类准确率达到99.4%,比KNN基线模型提升了1.9%。POA-KNN分类模型能很好地对数据集中不同状态下的齿轮箱进行分类,更高效地针对风力机齿轮箱中存在的故障进行诊断。 展开更多
关键词 齿轮箱 功率正则化倒谱系数 声纹识别 声纹特征图谱 行星优化算法与K近邻算法 分类模型
在线阅读 下载PDF
Enhancing Cancer Classification through a Hybrid Bio-Inspired Evolutionary Algorithm for Biomarker Gene Selection 被引量:1
2
作者 Hala AlShamlan Halah AlMazrua 《Computers, Materials & Continua》 SCIE EI 2024年第4期675-694,共20页
In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selec... In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selection.Themotivation for utilizingGWOandHHOstems fromtheir bio-inspired nature and their demonstrated success in optimization problems.We aimto leverage the strengths of these algorithms to enhance the effectiveness of feature selection in microarray-based cancer classification.We selected leave-one-out cross-validation(LOOCV)to evaluate the performance of both two widely used classifiers,k-nearest neighbors(KNN)and support vector machine(SVM),on high-dimensional cancer microarray data.The proposed method is extensively tested on six publicly available cancer microarray datasets,and a comprehensive comparison with recently published methods is conducted.Our hybrid algorithm demonstrates its effectiveness in improving classification performance,Surpassing alternative approaches in terms of precision.The outcomes confirm the capability of our method to substantially improve both the precision and efficiency of cancer classification,thereby advancing the development ofmore efficient treatment strategies.The proposed hybridmethod offers a promising solution to the gene selection problem in microarray-based cancer classification.It improves the accuracy and efficiency of cancer diagnosis and treatment,and its superior performance compared to other methods highlights its potential applicability in realworld cancer classification tasks.By harnessing the complementary search mechanisms of GWO and HHO,we leverage their bio-inspired behavior to identify informative genes relevant to cancer diagnosis and treatment. 展开更多
关键词 Bio-inspired algorithms BIOINFORMATICS cancer classification evolutionary algorithm feature selection gene expression grey wolf optimizer harris hawks optimization k-nearest neighbor support vector machine
在线阅读 下载PDF
基于GGO-KD-KNN算法的下肢步态识别研究 被引量:1
3
作者 李传江 丁新豪 +2 位作者 涂嘉俊 李昂 尹仕熠 《上海师范大学学报(自然科学版中英文)》 2025年第2期141-145,共5页
为了提高下肢步态识别的准确性和效率,针对K最近邻(KNN)算法参数调节困难的问题,提出了一种基于灰雁优化-K维树-K最近邻(GGO-KD-KNN)算法的下肢步态识别方法.首先,利用表面肌电信号(sEMG)采集下肢肌肉活动信息,并将信号划分为5个步态阶... 为了提高下肢步态识别的准确性和效率,针对K最近邻(KNN)算法参数调节困难的问题,提出了一种基于灰雁优化-K维树-K最近邻(GGO-KD-KNN)算法的下肢步态识别方法.首先,利用表面肌电信号(sEMG)采集下肢肌肉活动信息,并将信号划分为5个步态阶段.然后,进行sEMG去噪,并提取时域和频域特征.接着,用GGO算法基于灰雁群体行为进行启发式优化,优化KNN算法的K值和距离度量,并通过适应度迭代寻找最优解.实验结果表明,通过GGO算法优化的步态识别精度达到了98.23%,标准差为0.264,相较于其他常用算法,基于GGO-KD-KNN算法的步态识别方法展现出更高的分类准确率和稳定性,为下肢智能辅助装置的研究和开发提供了有力的理论支持. 展开更多
关键词 下肢步态识别 表面肌电信号(sEMG) 灰雁优化-K维树-K最近邻(GGO-KD-knn)算法 分类优化
在线阅读 下载PDF
An Optimization System for Intent Recognition Based on an Improved KNN Algorithm with Minimal Feature Set for Powered Knee Prosthesis
4
作者 Yao Zhang Xu Wang +6 位作者 Haohua Xiu Lei Ren Yang Han Yongxin Ma Wei Chen Guowu Wei Luquan Ren 《Journal of Bionic Engineering》 SCIE EI CSCD 2023年第6期2619-2632,共14页
In this article,a new optimization system that uses few features to recognize locomotion with high classification accuracy is proposed.The optimization system consists of three parts.First,the features of the mixed me... In this article,a new optimization system that uses few features to recognize locomotion with high classification accuracy is proposed.The optimization system consists of three parts.First,the features of the mixed mechanical signal data are extracted from each analysis window of 200 ms after each foot contact event.Then,the Binary version of the hybrid Gray Wolf Optimization and Particle Swarm Optimization(BGWOPSO)algorithm is used to select features.And,the selected features are optimized and assigned different weights by the Biogeography-Based Optimization(BBO)algorithm.Finally,an improved K-Nearest Neighbor(KNN)classifier is employed for intention recognition.This classifier has the advantages of high accuracy,few parameters as well as low memory burden.Based on data from eight patients with transfemoral amputations,the optimization system is evaluated.The numerical results indicate that the proposed model can recognize nine daily locomotion modes(i.e.,low-,mid-,and fast-speed level-ground walking,ramp ascent/decent,stair ascent/descent,and sit/stand)by only seven features,with an accuracy of 96.66%±0.68%.As for real-time prediction on a powered knee prosthesis,the shortest prediction time is only 9.8 ms.These promising results reveal the potential of intention recognition based on the proposed system for high-level control of the prosthetic knee. 展开更多
关键词 Intent recognition k-nearest neighbor algorithm Powered knee prosthesis Locomotion mode classification
在线阅读 下载PDF
改进型加权KNN算法的不平衡数据集分类 被引量:26
5
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 K最邻近算法 权重分配模型 遗传算法 K-MEANS算法
在线阅读 下载PDF
基于KNN的特征自适应加权自然图像分类研究 被引量:17
6
作者 侯玉婷 彭进业 +1 位作者 郝露微 王瑞 《计算机应用研究》 CSCD 北大核心 2014年第3期957-960,共4页
针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权... 针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权值向量解,利用该最优权值对自然图像纹理和颜色两个特征分别进行加权,最后用自适应加权K-近邻算法实现对自然图像的分类。实验结果表明,在用户给定分类精度需求和低时间复杂度的约束下,算法能快速、高精度地进行自然图像分类。提出的自适应加权K-近邻分类方法对于门类繁多的自然图像具有普遍适用性,可以有效地提高自然图像的分类性能。 展开更多
关键词 K-近邻算法 基因算法 自然图像分类 特征加权
在线阅读 下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:28
7
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
在线阅读 下载PDF
基于CEEMD和优化KNN的离心泵故障诊断方法 被引量:19
8
作者 杨波 黄倩 +1 位作者 付强 朱荣生 《机电工程》 CAS 北大核心 2022年第11期1502-1509,共8页
卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断... 卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断方法。首先,采集了卧式离心泵机械故障加速度信号,使用CEEMD对信号进行了一次分解,得到了本征模函数(IMF),采用相关系数法得到了IMF相关系数,确定了相关分量与不相关分量;其次,通过改进小波阈值去噪方法对不相关分量进行处理,提取了重构信号可分析的时频故障特征;最后,搭建了离心泵实验台,采用上述故障诊断方法对离心泵机械故障进行了分类诊断。研究结果表明:经CEEMD降噪后,信号评价指标信噪比(SNR)为2.2571,比原来的去噪方法提升了0.4381;优化后KNN分类对于卧式离心泵的机械故障诊断准确率可达96.7%,能够有效识别离心泵故障,达到智能诊断的目的。 展开更多
关键词 叶片式泵 故障信号分解 互补集合经验模态分解 改进小波阈值降噪 优化最邻近算法分类 本征模函数 相关分量/不相关分量
在线阅读 下载PDF
离散型增强烟花算法和kNN在特征选择中的研究 被引量:4
9
作者 黄欣 莫海淼 +1 位作者 赵志刚 曾敏 《计算机工程与应用》 CSCD 北大核心 2020年第16期112-117,共6页
特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩... 特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩罚因子处理之后约束条件融入到目标函数中,然后将搜索到的特征子集的数据放到kNN分类器进行训练和预测,最后使用十折交叉验证来检验分类的准确性。使用UCI数据进行仿真实验,仿真结果表明:与引导型烟花算法、烟花算法、蝙蝠算法、乌鸦算法、自适应粒子群算法相比,所提算法的总体性能优于其他五种算法。 展开更多
关键词 离散型增强烟花算法 特征选择 降维 分类 k近邻(knn)
在线阅读 下载PDF
用于WEB文档分类的并行KNN算法 被引量:1
10
作者 周朴雄 《计算机工程与应用》 CSCD 北大核心 2008年第25期155-156,共2页
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(lo... 针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与传统的串行算法相比,能显著地提高分类速度。 展开更多
关键词 文档分类 K最近邻 并行策略
在线阅读 下载PDF
一种基于Canopy和粗糙集的CRS-KNN文本分类算法 被引量:9
11
作者 姚彬修 倪建成 +2 位作者 于苹苹 曹博 李淋淋 《计算机工程与应用》 CSCD 北大核心 2017年第11期172-177,共6页
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集... 针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和F_1值都得到了一定的提高。 展开更多
关键词 Canopy聚类 粗糙集 K-最近邻(knn)算法 文本分类
在线阅读 下载PDF
面向申威架构的KNN并行算法实现与优化 被引量:8
12
作者 王其涵 庞建民 +3 位作者 岳峰 祝迪 沈莉 肖谦 《计算机工程》 CAS CSCD 北大核心 2023年第5期286-294,共9页
K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实... K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实现高效的KNN算法是海量数据分析整理的现实需求。根据SW26010pro处理器的结构特性,采用主从加速编程模型实现一种基础版本的KNN并行算法,其将计算核心传输到从核上,实现了线程级并行。分析影响基础并行算法性能的关键因素并提出优化算法SWKNN,不同于基础并行KNN算法的任务划分方式,SWKNN采用任务重划分策略,以避免冗余计算开销。通过数据流水优化、从核间通信优化、二次负载均衡优化等步骤减少不必要的通信开销,从而有效缓解访存压力并进一步提升算法性能。实验结果表明,与串行KNN算法相比,面向申威架构的基础并行KNN算法在SW26010pro处理器的单核组上可以获得最高48倍的加速效果,在同等数据规模下,SWKNN算法较基础并行KNN算法又可以获得最高399倍的加速效果。 展开更多
关键词 异构众核处理器 K近邻算法 并行计算 算法优化 分类性能
在线阅读 下载PDF
基于粗糙KNN算法的文本分类方法 被引量:5
13
作者 王渊 刘业政 姜元春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第12期1513-1517,共5页
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空... 在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。 展开更多
关键词 文本分类 粗糙集 knn算法 核心区域 混合区域
在线阅读 下载PDF
基于BP改进的KNN算法在北京密云土地覆盖分类中的应用 被引量:10
14
作者 王佃来 宿爱霞 刘文萍 《科学技术与工程》 北大核心 2020年第23期9464-9471,共8页
针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高... 针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高了北京市密云区土地覆盖分类精度。实验结果表明:相对于支持向量机(support vector machine,SVM)、随机森林、BP神经网络和KNN算法,改进算法分类精度最高,达到了95.20%,分类精度比未改进KNN算法提高了6.43%。改进算法的Kappa系数在对比算法中也是最高的,达到0.93。此外,实验结果也表明改进算法可应用于中分辨率遥感图像分类中。 展开更多
关键词 knn算法 土地覆盖分类 遥感图像 BP神经网络
在线阅读 下载PDF
基于BP神经网络决策的KNN改进算法 被引量:20
15
作者 路敦利 宁芊 臧军 《计算机应用》 CSCD 北大核心 2017年第A02期65-67,88,共4页
针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进... 针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进行改进优化。首先,通过对训练样本使用K值不同的K近邻算法进行初步分类,同一数据会得到多个不同的初步分类结果集;然后将初步分类结果集作为BP神经网络的输入,再对BP神经网络进行训练分类。在多个数据集上的实验表明,基于BP神经网络决策的K近邻改进算法降低了K值对算法精度的影响,同时极大地提高了分类的准确率。 展开更多
关键词 K近邻 BP神经网络 算法精度 分类算法 K值
在线阅读 下载PDF
结合属性值贡献度与平均相似度的KNN改进算法 被引量:1
16
作者 张玲珠 周忠眉 《计算机工程与应用》 CSCD 北大核心 2010年第18期130-131,共2页
与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集... 与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集上进行实验结果表明,改进后的KNN分类算法的准确率比传统的K-近邻分类算法的准确率更高。 展开更多
关键词 分类 K-近邻算法 相似度
在线阅读 下载PDF
A Memetic Algorithm With Competition for the Capacitated Green Vehicle Routing Problem 被引量:9
17
作者 Ling Wang Jiawen Lu 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2019年第2期516-526,共11页
In this paper, a memetic algorithm with competition(MAC) is proposed to solve the capacitated green vehicle routing problem(CGVRP). Firstly, the permutation array called traveling salesman problem(TSP) route is used t... In this paper, a memetic algorithm with competition(MAC) is proposed to solve the capacitated green vehicle routing problem(CGVRP). Firstly, the permutation array called traveling salesman problem(TSP) route is used to encode the solution, and an effective decoding method to construct the CGVRP route is presented accordingly. Secondly, the k-nearest neighbor(k NN) based initialization is presented to take use of the location information of the customers. Thirdly, according to the characteristics of the CGVRP, the search operators in the variable neighborhood search(VNS) framework and the simulated annealing(SA) strategy are executed on the TSP route for all solutions. Moreover, the customer adjustment operator and the alternative fuel station(AFS) adjustment operator on the CGVRP route are executed for the elite solutions after competition. In addition, the crossover operator is employed to share information among different solutions. The effect of parameter setting is investigated using the Taguchi method of design-ofexperiment to suggest suitable values. Via numerical tests, it demonstrates the effectiveness of both the competitive search and the decoding method. Moreover, extensive comparative results show that the proposed algorithm is more effective and efficient than the existing methods in solving the CGVRP. 展开更多
关键词 Capacitated green VEHICLE ROUTING problem(CGVRP) COMPETITION k-nearest neighbor(knn) local INTENSIFICATION memetic algorithm
在线阅读 下载PDF
基于改进KNN的不均衡信息文本分类算法 被引量:1
18
作者 马召贵 《信息与电脑》 2023年第12期85-87,共3页
针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,... 针对常规文本分类算法存在文本特征提取不全面的问题,提出基于改进K近邻(K-Nearest Neighbor,KNN)的不均衡信息文本分类算法。首先,通过文本分词与去停用词两个步骤,对不均衡信息文本进行预处理,避免无用数据对分类结果产生干扰。其次,利用互信息特征提取方法,提取不均衡信息文本特征,获取文本特征词与类别之间的相关程度。最后,利用改进KNN原理对待测不均衡信息文本数据进行邻近聚类,设计文本分类算法。实验结果表明,该算法的分类查准率始终在98%以上,优于对照组。 展开更多
关键词 K近邻(knn) 不均衡 信息文本 分类算法
在线阅读 下载PDF
A systematic approach in load disaggregation utilizing a multi-stage classification algorithm for consumer electrical appliances classification 被引量:5
19
作者 Chuan Choong YANG Chit Siang SOH Vooi Voon YAP 《Frontiers in Energy》 SCIE CSCD 2019年第2期386-398,共13页
The potential to save energy in existing consumer electrical appliances is very high. One of the ways to achieve energy saving and improve energy use awareness is to recognize the energy consumption of individual elec... The potential to save energy in existing consumer electrical appliances is very high. One of the ways to achieve energy saving and improve energy use awareness is to recognize the energy consumption of individual electrical appliances. To recognize the energy consumption of consumer electrical appliances, the load disaggregation methodology is utilized. Non-intrusive appliance load monitoring (NIALM) is a load disaggrega-tion methodology that disaggregates the sum of power consumption in a single point into the power consumption of individual electrical appliances. In this study, load disaggregation is performed through voltage and current waveform, known as the V-I trajectory. The classification algorithm performs cropping and image pyramid reduction of the V-I trajectory plot template images before utilizing the principal component analysis (PCA) and the k-nearest neighbor (k-NN) algorithm. The novelty of this paper is to establish a systematic approach of load disaggregation through V-I trajectory-based load signature images by utilizing a multi-stage classification algorithm methodol-ogy. The contribution of this paper is in utilizing the “k- value,” the number of closest data points to the nearest neighbor, in the k-NN algorithm to be effective in classification of electrical appliances. The results of the multi-stage classification algorithm implementation have been discussed and the idea on future work has also been proposed. 展开更多
关键词 LOAD DISAGGREGATION voltage-current (V-I) trajectory MULTI-STAGE classification algorithm principal component analysis (PCA) k-nearest neighbor (k-NN)
原文传递
Optimizing Clear Air Turbulence Forecasts Using the K-Nearest Neighbor Algorithm
20
作者 Aoqi GU Ye WANG 《Journal of Meteorological Research》 CSCD 2024年第6期1064-1077,共14页
The complexity and unpredictability of clear air turbulence(CAT)pose significant challenges to aviation safety.Accurate prediction of turbulence events is crucial for reducing flight accidents and economic losses.Howe... The complexity and unpredictability of clear air turbulence(CAT)pose significant challenges to aviation safety.Accurate prediction of turbulence events is crucial for reducing flight accidents and economic losses.However,traditional turbulence prediction methods,such as ensemble forecasting techniques,have certain limitations:they only consider turbulence data from the most recent period,making it difficult to capture the nonlinear relationships present in turbulence.This study proposes a turbulence forecasting model based on the K-nearest neighbor(KNN)algorithm,which uses a combination of eight CAT diagnostic features as the feature vector and introduces CAT diagnostic feature weights to improve prediction accuracy.The model calculates the results of seven years of CAT diagnostics from 125 to 500 hPa obtained from the ECMWF fifth-generation reanalysis dataset(ERA5)as feature vector inputs and combines them with the labels of Pilot Reports(PIREP)annotated data,where each sample contributes to the prediction result.By measuring the distance between the current CAT diagnostic variable and other variables,the model determines the climatically most similar neighbors and identifies the turbulence intensity category caused by the current variable.To evaluate the model’s performance in diagnosing high-altitude turbulence over Colorado,PIREP cases were randomly selected for analysis.The results show that the weighted KNN(W-KNN)model exhibits higher skill in turbulence prediction,and outperforms traditional prediction methods and other machine learning models(e.g.,Random Forest)in capturing moderate or greater(MOG)level turbulence.The performance of the model was confirmed by evaluating the receiver operating characteristic(ROC)curve,maximum True Skill Statistic(maxTSS=0.552),and reliability plot.A robust score(area under the curve:AUC=0.86)was obtained,and the model demonstrated sensitivity to seasonal and annual climate fluctuations. 展开更多
关键词 clear air turbulence k-nearest neighbor(knn)algorithm the ECMWF fifth-generation reanalysis dataset(ERA5) turbulence prediction
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部