期刊文献+
共找到2,367篇文章
< 1 2 119 >
每页显示 20 50 100
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:14
1
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
在线阅读 下载PDF
利用二阶k近邻构造微簇的过采样方法
2
作者 孟东霞 柳凌燕 魏晓光 《统计与决策》 北大核心 2026年第3期46-51,共6页
为了解决少数类样本在不平衡数据集中分类准确率较低的问题,文章提出一种利用少数类样本的二阶k近邻构造微簇,并在微簇内进行过采样的数据处理方法。二阶k近邻是样本近邻关系的扩展,能更准确地衡量样本在局部结构关系中的影响力。微簇... 为了解决少数类样本在不平衡数据集中分类准确率较低的问题,文章提出一种利用少数类样本的二阶k近邻构造微簇,并在微簇内进行过采样的数据处理方法。二阶k近邻是样本近邻关系的扩展,能更准确地衡量样本在局部结构关系中的影响力。微簇的划分反映了少数类样本的相似程度,微簇内生成的新样本降低了对少数类原始内在分布结构的影响。该方法先计算少数类样本在整个数据集中的k近邻,移除k近邻均属于多数类的噪声样本,在获得剩余样本的二阶k近邻后再计算样本的局部密度,依据局部密度和近邻关系构造少数类样本的微簇,并在微簇中生成新样本。通过对比实验比较了八种过采样方法在两组人工数据集上生成新样本的分布情况,并使用支持向量机对经过平衡处理的十组数据集进行了分类,结果表明,在所提方法构造的平衡数据集中,少数类样本的分类准确率较高,数据集的整体分类效果较好,验证了所提方法的有效性。 展开更多
关键词 二阶k近邻 不平衡数据 过采样
原文传递
基于变量筛选和OS-KELM的出口SO_(2)浓度预测
3
作者 金秀章 陈佳政 张瑾 《华北电力大学学报(自然科学版)》 北大核心 2026年第1期149-158,共10页
针对火力发电厂频繁调峰导致锅炉燃烧不稳定、出口SO_(2)浓度波动范围大难以准确、及时测量的问题,提出了一种基于变量筛选和在线核极限学习机的出口SO_(2)浓度预测模型。首先通过机理分析选择与出口SO_(2)浓度有关的影响变量;再利用基... 针对火力发电厂频繁调峰导致锅炉燃烧不稳定、出口SO_(2)浓度波动范围大难以准确、及时测量的问题,提出了一种基于变量筛选和在线核极限学习机的出口SO_(2)浓度预测模型。首先通过机理分析选择与出口SO_(2)浓度有关的影响变量;再利用基于FCBF改进的mRMR算法去除冗余变量,并对筛选后的变量使用K近邻互信息算法进行时延补偿;然后对补偿后的变量利用变分模态分解(VMD)进行分解,选择相关性最大的变量子集作为最终模型输入;最后利用天牛群算法(Beetle swarm optimization,BSO)优化在线核极限学习机(Online sequential-kernel based extreme learning machine,OS-KELM)参数建立出口SO_(2)浓度预测模型。利用电厂真实运行数据进行实验,结果表明,基于OS-KELM的预测模型其预测效果优于ELM、KELM、OS-ELM模型,具有较高的模型预测精度。 展开更多
关键词 变量筛选 VMD分解 时延补偿 K近邻互信息 天牛群算法 在线核极限学习机
在线阅读 下载PDF
基于PNCC声纹特征提取技术和POA-KNN算法的齿轮箱声纹识别故障诊断
4
作者 廖力达 赵阁阳 +1 位作者 魏诚 刘川江 《机电工程》 北大核心 2026年第1期24-33,共10页
风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因... 风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因此,提出了一种基于功率正则化倒谱系数(PNCC)声纹特征提取技术,以及行星优化算法与K近邻算法(POA-KNN)模型的风力机齿轮箱声纹识别故障诊断方法。首先,采用LMS噪声采集仪采集了6种不同状态下的风力机齿轮箱噪声数据;然后,使用了PNCC声纹特征提取的方法,提取了齿轮箱噪声信号的声纹图谱;在KNN的基础上加入行星优化算法(POA)优化了K值,提出了性能较高的POA-KNN分类模型;最后,根据6类不同状态下的齿轮数据集,采用对比试验和消融实验验证了模型性能。研究结果表明:POA-KNN模型对齿轮箱的PNCC声纹图分类准确率达到99.4%,比KNN基线模型提升了1.9%。POA-KNN分类模型能很好地对数据集中不同状态下的齿轮箱进行分类,更高效地针对风力机齿轮箱中存在的故障进行诊断。 展开更多
关键词 齿轮箱 功率正则化倒谱系数 声纹识别 声纹特征图谱 行星优化算法与K近邻算法 分类模型
在线阅读 下载PDF
基于负荷预测的公共建筑围护结构节能率特征研究
5
作者 刘馨 陈家琦 +3 位作者 吴修慧 王萌 冯国会 马腾 《建筑技术》 2026年第2期209-214,共6页
负荷预测能预先确定建筑能耗指标,为高效实施建筑节能优化策略提供清晰的指导方向。利用BP神经网络、决策树回归、KNN回归、XGBoost等预测模型对严寒地区一栋典型的绿色办公建筑进行负荷预测。以围护结构为研究对象,重新定义为建筑本体... 负荷预测能预先确定建筑能耗指标,为高效实施建筑节能优化策略提供清晰的指导方向。利用BP神经网络、决策树回归、KNN回归、XGBoost等预测模型对严寒地区一栋典型的绿色办公建筑进行负荷预测。以围护结构为研究对象,重新定义为建筑本体(围护结构)节能率,并与建筑本体节能率进行对比。KNN回归模型的负荷预测精度最高。建筑本体(围护结构)节能率为35.74%;外墙、外窗、屋顶贡献的节能率分别为25.89%、10.03%、9.09%。提出公共建筑围护结构节能率指标分析方法,量化外墙、外窗、屋顶节能贡献度占比,为办公建筑节能改造提供创新评估路径。 展开更多
关键词 负荷预测 KNN回归 建筑本体(围护结构)节能率 围护结构节能率指标
在线阅读 下载PDF
机载激光点云数据滤波下尾矿坝位移变形监测
6
作者 赵国强 《有色金属(矿山部分)》 2026年第1期49-55,共7页
尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载... 尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载激光点云数据滤波的尾矿坝位移变形监测方法,通过K邻近搜索算法建立空间索引以划分多尺度噪声,并引入空间距离权重与几何相似性权重的双重约束机制,结合双边滤波算法有效抑制噪声干扰。同时,采用对象分割技术将监测区域划分为3D网格单元,实现尾矿坝水平变形与垂直沉降的高精度监测。结果表明,该方法在水平变形和垂直沉降监测中的平均绝对误差显著减小,位移速率波动率低,最大误差仅0.4%,为尾矿坝全生命周期安全提供了毫米级感知能力。相较于传统DS-InSAR技术和时序分解模型,本研究方法在复杂植被覆盖和地形起伏区域表现出更高的监测精度和稳定性,尤其适用于尾矿坝长期安全预警及动态管理场景。 展开更多
关键词 尾矿坝位移变形 双边滤波算法 K邻近搜索算法 法向量夹角 三维单元分割
在线阅读 下载PDF
圆形网格抽样和逆近邻优化的密度峰值聚类算法
7
作者 赵嘉 何超凡 +2 位作者 肖人彬 曹浩 樊棠怀 《工程科学学报》 北大核心 2026年第1期161-176,共16页
密度峰值聚类(DPC)算法是一种简单高效的聚类算法,因其可直观和快速发现数据集中的类簇而得到广泛关注.但DPC算法需计算所有样本间的欧氏距离,算法的时间复杂度较高;局部密度定义未考虑类簇间密度差异影响,易误选类簇中心;使用链式分配... 密度峰值聚类(DPC)算法是一种简单高效的聚类算法,因其可直观和快速发现数据集中的类簇而得到广泛关注.但DPC算法需计算所有样本间的欧氏距离,算法的时间复杂度较高;局部密度定义未考虑类簇间密度差异影响,易误选类簇中心;使用链式分配策略,易产生错误连带效应.因此,本文提出一种圆形网格抽样和逆近邻优化的密度峰值聚类算法.该算法采用圆形网格抽样得到代表以减少需要计算的样本数,降低算法计算的时间开销,并引入近似K近邻策略加强代表和初始样本的联系,减少抽样导致的聚类精度丢失;利用逆近邻优化局部密度定义策略,根据样本所处环境调节其局部密度的大小,准确找到密度峰值;通过共享逆近邻计算相似性,由相似性矩阵分配代表,避免样本分配策略产生的错误连带效应.设置了复杂形态合成数据集、真实数据集和较大规模数据集进行分组实验.实验结果表明,本文算法在复杂形态、真实及较大规模数据集上聚类优势显著,精度与效率较DPC算法及其他基于DPC的改进算法均有较大提升. 展开更多
关键词 密度峰值聚类 圆形网格抽样 近似K近邻 逆近邻 共享逆近邻
在线阅读 下载PDF
基于KNN算法的问答气象服务技术研究与应用
8
作者 陈冲 张锋 +1 位作者 李建 陶慧青 《自动化技术与应用》 2026年第2期170-173,共4页
由浙江省气象部门推出的“智慧气象”App,依托权威气象数据源与精细化数值预报产品,构建了专业化的气象服务体系,自发布以来持续获得良好的用户口碑与行业认可。随着社会对气象服务的需求向精准化、个性化方向不断深化与细分,叠加气象... 由浙江省气象部门推出的“智慧气象”App,依托权威气象数据源与精细化数值预报产品,构建了专业化的气象服务体系,自发布以来持续获得良好的用户口碑与行业认可。随着社会对气象服务的需求向精准化、个性化方向不断深化与细分,叠加气象科学技术的快速发展,为有效回应用户在不同场景下多样化的气象信息获取诉求,本研究设计并实现了一种基于K近邻算法(K-nearest neighbors, KNN)的气象问答技术。该技术在保留原有App功能架构的基础上,创新性地整合了以KNN为核心的气象问句分类与相似匹配机制,实现了对用户自然语言问询的精准理解与自动化应答。该技术通过构建历史训练语料的特征向量空间,依据问句语义近邻实现高效分类与答案推送,显著提升了气象服务的交互性与智能化水平。实证研究及实际应用反馈表明,引入KNN问答模型后,系统在响应准确率、服务响应效率及用户综合满意度等方面均实现一定提升,为气象服务智慧化升级提供了有效技术支撑,具备良好的推广价值与应用前景。 展开更多
关键词 APP 气象服务 KNN 问答 分类 智能
在线阅读 下载PDF
Efficient Metric All-k-Nearest-Neighbor Search on Datasets Without Any Index 被引量:3
9
作者 Hai-Da Zhang Zhi-Hao Xing +1 位作者 Lu Chen Yun-Jun Gao 《Journal of Computer Science & Technology》 SCIE EI CSCD 2016年第6期1194-1211,共18页
An all-k-nearest-neighbor (AkNN) query finds k nearest neighbors for each query object. This problem arises naturally in many areas, such as GIS (geographic information system), multimedia retrieval, and recommend... An all-k-nearest-neighbor (AkNN) query finds k nearest neighbors for each query object. This problem arises naturally in many areas, such as GIS (geographic information system), multimedia retrieval, and recommender systems. To support various data types and flexible distance metrics involved in real applications, we study AkNN retrieval in metric spaces, namely, metric AkNN (MAkNN) search. Consider that the underlying indexes on the query set and the object set may not exist, which is natural in many scenarios. For example, the query set and the object set could be the results of other queries, and thus, the underlying indexes cannot be built in advance. To support MAkNN search on datasets without any underlying index, we propose an efficient disk-based algorithm, termed as Partition-Based MAkNN Algorithm (PMA), which follows a partition-search framework and employs a series of pruning rules for accelerating the search. In addition, we extend our techniques to tackle an interesting variant of MAkNN queries, i.e., metric self-AkNN (MSAkNN) search, where the query set is identical to the object set. Extensive experiments using both real and synthetic datasets demonstrate the effectiveness of our pruning rules and the efficiency of the proposed algorithms, compared with state-of-the-art MAkNN and MSAkNN algorithms. 展开更多
关键词 all-k-nearest-neighbor search query processing metric space
原文传递
基于邻域粗糙集和K近邻分类的核素识别方法研究
10
作者 陈宸 吴桓 +1 位作者 王国帆 姚正勇 《核技术》 北大核心 2026年第2期78-87,共10页
针对γ能谱数据的高维特性和噪声干扰导致传统核素识别方法普遍存在识别精度不足与计算效率较低的问题,提出一种融合邻域粗糙集与K近邻分类的核素识别方法,以满足便携式核素识别设备在资源受限环境下的实际应用需求。该方法首先采用主... 针对γ能谱数据的高维特性和噪声干扰导致传统核素识别方法普遍存在识别精度不足与计算效率较低的问题,提出一种融合邻域粗糙集与K近邻分类的核素识别方法,以满足便携式核素识别设备在资源受限环境下的实际应用需求。该方法首先采用主成分分析法(Principal Component Analysis,PCA)对原始1024维γ能谱数据进行降维,提取出累积贡献率≥99%的主成分,以消除冗余信息并抑制噪声干扰;随后引入邻域粗糙集的属性约简算法,通过定义样本邻域关系并计算属性依赖度,结合启发式前向贪心搜索策略对特征属性进行约简,最大限度保留关键判别信息并提升特征子集的分类鉴别能力;最后将约简后的低维特征输入K近邻分类器,依据距离加权投票机制计算各类核素的置信度,实现高效率、准确的核素识别。基于一套LaBr_(3)(Ce)探测系统与1024道多道分析器对识别算法进行实验测试,采集包括12种单一核素及2种混合核素在内的224组γ能谱样本,在STM32F407ZGT6单片机硬件平台上进行测试,在邻域半径δ=0.2时对包含特征峰重叠的混合核素在内的测试集的平均识别精度达到98.5%,单次核素识别运行时间控制在140 ms内,显著提升了核素识别的准确性与计算效率,为后续便携式核素识别仪的算法部署提供了可靠保障。 展开更多
关键词 Γ谱仪 邻域粗糙集 K近邻分类 核素识别
原文传递
基于IPFA算法和平均影响值的含水层矿井突水水源识别
11
作者 乔伟 《中国矿业》 北大核心 2026年第1期261-267,共7页
矿井不同含水层由于导水断层、裂隙网络相互导通,使得具有相似化学特征的水样混杂重叠,并且受到环境等无关冗余数据的干扰,容易造成水样特征类型的误判,降低了突水水源识别准确性。为此提出一种基于IPFA算法和平均影响值的含水层矿井突... 矿井不同含水层由于导水断层、裂隙网络相互导通,使得具有相似化学特征的水样混杂重叠,并且受到环境等无关冗余数据的干扰,容易造成水样特征类型的误判,降低了突水水源识别准确性。为此提出一种基于IPFA算法和平均影响值的含水层矿井突水水源识别方法。采用K-近邻法扩展获取含水层水源化学成分特征间的高维互信息熵,更全面地反映特征之间的关联性,从而筛选出与突水水源识别真正相关的特征,降低冗余特征干扰。使用IPFA算法对极限学习机(ELM)参数展开寻优,提高模型的泛化能力和识别精度,避免ELM陷入最优解,减少混杂重叠的水样相似化学特征类型误判;应用平均响应值(MIV)方法对各个类型特征的MIV值展开计算,筛选平均影响贡献率高的特征,深入理解各特征在水源识别中的作用机制。并构建基于IPFA-ELM-MIV的含水层矿井突水水源识别模型,通过模型完成水源识别。实验结果表明,所提方法通过筛选可以将样本特征的高维互信息熵提升到0.9以上,在9次识别过程中,所提方法出现误判的概率为0,准确识别了含水层矿井突水化学特征类型,提升了矿井不同含水层突水水源识别结果的准确性,并且在不同采样环境下的含水层矿井突水水源识别的R_(1)值高于0.95,具有更强的识别适应性,对于预防和治理矿井突水灾害具有重要意义。 展开更多
关键词 IPFA算法 K-近邻法 平均影响值 极限学习机 含水层矿井 突水水源识别
在线阅读 下载PDF
基于堆叠模型分类的空压机健康状态评估研究
12
作者 葛淩志 王磊 王晓冉 《机电工程》 北大核心 2026年第1期194-206,共13页
对工业空压机的健康状态进行准确的评估是保障生产系统可靠性、稳定性,降低系统运行成本的重要因素。针对传统健康评估方法在复杂工况下诊断精度和鲁棒性方面的局限性,提出了一种基于堆叠(Stacking)多模型集成的空压机健康状态评估模型... 对工业空压机的健康状态进行准确的评估是保障生产系统可靠性、稳定性,降低系统运行成本的重要因素。针对传统健康评估方法在复杂工况下诊断精度和鲁棒性方面的局限性,提出了一种基于堆叠(Stacking)多模型集成的空压机健康状态评估模型。首先,构建了异构基模型组,集成了K近邻分类器(KNN)、轻量梯度提升机(LGBM)、随机森林(RF)、极致梯度提升(XGB)四类算法,基于历史数据搭建了初始架构;然后,实施了联合参数优化,通过网格搜索与交叉验证协同调参,提升了基模型预测性能;最后,设计了基于径向基核函数的支持向量分类器(RBF-SVC),依托工程数据进行了实验验证。研究结果表明:基于堆叠多模型集成的空压机健康状态评估模型在处理可变操作条件时表现出较强的鲁棒性,特别是在面对噪声数据时,该模型在不同信噪比条件下显示出一致的诊断准确性,其准确率仍能保持在80%以上;横向对比分析表明,基于堆叠多模型集成的空压机健康状态评估模型在诊断精度上优于单一基模型及传统的健康诊断方法,在训练集和测试集上分别达到了98%和95%的准确率。该框架通过基模型互补性提升健康评估精度与鲁棒性,为空压机预测性维护提供技术支撑,具有重要工程价值。 展开更多
关键词 空气压缩机 基模型 模型集成 K近邻分类器 轻量梯度提升机 随机森林 极致梯度提升 基于径向基核函数的支持向量分类器
在线阅读 下载PDF
基于K近邻算法的黏性土无侧限抗压强度估算方法研究
13
作者 沈铃山 《山西建筑》 2026年第5期65-68,共4页
黏性土无侧限抗压强度是评价地基承载力和变形特性的重要指标,传统试验方法受限于效率与样本覆盖,难以快速满足工程现场预测需求。文中以K近邻算法为基础,构建黏性土无侧限抗压强度预测模型,围绕特征变量筛选、样本归一化、参数设定、... 黏性土无侧限抗压强度是评价地基承载力和变形特性的重要指标,传统试验方法受限于效率与样本覆盖,难以快速满足工程现场预测需求。文中以K近邻算法为基础,构建黏性土无侧限抗压强度预测模型,围绕特征变量筛选、样本归一化、参数设定、模型训练、误差评价与敏感性分析展开系统研究,采用交叉验证选取最优K值区间,构建稳健回归结构。与线性回归与支持向量回归模型对比,验证K近邻算法在非线性地质特征条件下的预测优势,明确其在工程数据驱动应用中的适应能力。结果表明,该方法具备良好的精度与解释性,适用于多场景强度估算任务,具备一定推广潜力与模型集成空间。 展开更多
关键词 K近邻算法 黏性土 无侧限抗压强度 回归预测 岩土工程
在线阅读 下载PDF
基于机器学习的30%TBP/煤油-硝酸体系中主要组分的分配比预测研究 被引量:2
14
作者 于婷 张音音 +6 位作者 张睿志 金文蕾 罗应婷 朱升峰 何辉 叶国安 龚禾林 《原子能科学技术》 北大核心 2025年第1期14-23,共10页
为最优化后处理过程的实验条件、优化工艺、降低实验成本和时间,并提高后处理流程数学模拟的准确性,本文基于随机森林、支持向量回归和K近邻这3种经典的机器学习算法建立了30%TBP/煤油-硝酸体系中主要组分铀、钚、硝酸的分配比数学模型... 为最优化后处理过程的实验条件、优化工艺、降低实验成本和时间,并提高后处理流程数学模拟的准确性,本文基于随机森林、支持向量回归和K近邻这3种经典的机器学习算法建立了30%TBP/煤油-硝酸体系中主要组分铀、钚、硝酸的分配比数学模型,并基于不同数据集进行了超参数优化和模型训练。通过对模型进行验证和测试,发现采用随机森林算法建立的分配比模型准确度最高,其对铀预测的平均绝对相对误差达7.73%,较传统方法提高了约7%。与传统建模方法相比,机器学习方法建立模型的准确度更高。 展开更多
关键词 分配比数学模型 随机森林 支持向量回归 K近邻
在线阅读 下载PDF
混合近邻和多簇合并的密度峰值聚类算法 被引量:2
15
作者 吕莉 赵妞 +2 位作者 肖人彬 王新峰 韩龙哲 《控制与决策》 北大核心 2025年第7期2194-2202,共9页
密度峰值聚类算法简单、高效,可识别任意维度和形状类簇,已在各领域得到广泛应用.然而,密度峰值聚类算法也存在一些问题,如:对截断距离参数敏感、难以发现低密度区域的类簇中心以及容易产生“多米诺效应”.为此,提出混合近邻和多簇合并... 密度峰值聚类算法简单、高效,可识别任意维度和形状类簇,已在各领域得到广泛应用.然而,密度峰值聚类算法也存在一些问题,如:对截断距离参数敏感、难以发现低密度区域的类簇中心以及容易产生“多米诺效应”.为此,提出混合近邻和多簇合并的密度峰值聚类算法.首先,综合考虑样本的全局分布与局部结构,引入自然近邻与k近邻重新定义局部密度,消除对截断距离参数的敏感,并提高低密度区域样本的局部密度以增加类簇中心的识别度;其次,将样本划分为多个微簇,并利用簇间关联度进行合并,减少距离类簇中心较远的样本的分配错误,从而有效缓解分配错误连带效应.使用人工数据与真实数据进行测试,结果表明,所提出算法的综合性能优于对比算法. 展开更多
关键词 聚类 自然近邻 K近邻 簇间关联度 密度峰值 局部密度
原文传递
基于K互近邻与核密度估计的DPC算法 被引量:2
16
作者 周玉 夏浩 +1 位作者 刘虹瑜 白磊 《北京航空航天大学学报》 北大核心 2025年第6期1978-1990,共13页
快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)... 快速搜索和发现密度峰值聚类(DPC)算法是一种基于密度的聚类算法。该算法不需要迭代和过多的设定参数,但由于计算局部密度时没有考虑数据的局部结构,导致无法识别簇密度小的聚类中心。针对此问题,提出基于K互近邻(KN)和核密度估计(KDE)的DPC(KKDPC)算法。通过K近邻和核密度估计方法得到数据点的K互近邻数量和局部核密度;将K互近邻数量与局部核密度进行加和获得新的局部密度;根据数据点的局部密度得到相对距离,并通过构建决策图选取聚类中心及分配非中心点。利用人工数据集和真实数据集进行实验,并与DPC、基于密度的噪声空间聚类应用(DBSCAN)、K-means、模糊C均值聚类算法(FCM)、基于K近邻的DPC(DPCKNN)、近邻优化DPC(DPC-NNO)、基于模糊加权共享邻居的DPC(DPC-FWSN)算法进行对比。通过计算调整互信息(AMI)、调整兰德指数(ARI)、归一化互信息(NMI)来验证KKDPC算法的性能。实验结果表明:KKDPC算法能更加准确地识别聚类中心,有效地提高聚类精度。 展开更多
关键词 聚类算法 密度峰值 K近邻 K互近邻 核密度估计
原文传递
基于改进WKNN的CSI被动室内指纹定位方法 被引量:1
17
作者 邵小强 马博 +3 位作者 韩泽辉 杨永德 原泽文 李鑫 《吉林大学学报(工学版)》 北大核心 2025年第7期2444-2454,共11页
针对幅值和相位构造包含干扰过多导致定位精度低的问题,提出了一种基于改进加权K最近邻算法的信道状态信息被动室内定位方法。离线阶段,采用隔离森林法,改进阈值的小波域去噪和线性变换法对采集到的信道状态信息进行预处理,将处理后的... 针对幅值和相位构造包含干扰过多导致定位精度低的问题,提出了一种基于改进加权K最近邻算法的信道状态信息被动室内定位方法。离线阶段,采用隔离森林法,改进阈值的小波域去噪和线性变换法对采集到的信道状态信息进行预处理,将处理后的幅相信息共同作为指纹数据,构造与参考点位置信息相关的稳定指纹数据库。在线阶段,提出改进的加权K近邻算法,对估计坐标进行重复匹配,该算法在一次匹配中得到位置坐标后,求该位置坐标在K个近邻点间的欧氏距离,并使用高斯变换对K个距离值进行权重计算,完成人员的定位。分别在教室和大厅进行实验模拟测试,实验结果表明:采用本文算法约81%的测试位置误差控制在1 m以内,可以有效提高定位精度。 展开更多
关键词 室内定位 信道状态信息 被动定位 改进阈值的小波域去噪 改进的加权K近邻算法 高斯变换
原文传递
DTWAWKNN驱动的蓝牙/WiFi指纹定位方法 被引量:1
18
作者 杨明 纪冬华 《导航定位学报》 北大核心 2025年第3期189-197,共9页
针对蓝牙/无线保真(WiFi)指纹定位效果差、算法复杂度高等问题,提出一种动态时间规整辅助加权K近邻(DTWAWKNN)驱动的蓝牙/WiFi指纹定位方法:离线阶段,通过动态时间规整(DTW)算法计算不等维度的蓝牙、WiFi和蓝牙/WiFi混合指纹之间的相似... 针对蓝牙/无线保真(WiFi)指纹定位效果差、算法复杂度高等问题,提出一种动态时间规整辅助加权K近邻(DTWAWKNN)驱动的蓝牙/WiFi指纹定位方法:离线阶段,通过动态时间规整(DTW)算法计算不等维度的蓝牙、WiFi和蓝牙/WiFi混合指纹之间的相似度,并基于加权K近邻(WKNN)实现匹配定位,然后以蓝牙、WiFi及蓝牙/WiFi混合指纹库与蓝牙、WiFi及蓝牙/WiFi混合指纹的匹配结果为定位特征,构建基于多类型指纹匹配定位结果的离线定位指纹库;在线阶段,基于DTWAWKNN实现蓝牙、WiFi和蓝牙/WiFi混合指纹之间的匹配定位,获取基于多类型指纹匹配定位结果的在线定位指纹,再基于WKNN算法实现离线定位指纹库和在线定位指纹的匹配定位。实验结果表明,提出方法的定位效果远优于WKNN、随机森林(RF)和支持向量机(SVM),定位精度可至少提高67.74%,定位稳定性最少提高54.51%,算法复杂度至少降低77.9%。 展开更多
关键词 蓝牙 无线保真(WiFi) 指纹定位 动态时间规整(DTW) 加权K近邻(WKNN)
在线阅读 下载PDF
基于图结构增强的番茄叶部病害识别方法 被引量:1
19
作者 刘博 王斌成 +2 位作者 陶旭 郭娜炜 马寅驰 《中国农机化学报》 北大核心 2025年第5期125-132,共8页
番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存... 番茄作为重要的蔬菜作物,其产量和质量常受到各类叶部病害的影响。针对此问题,计算机视觉技术已被广泛应用于病害的自动识别中。现有方法主要分为基于手工特征提取与深度学习两大类。基于手工特征的方法虽然简洁高效,但在鲁棒性方面存在限制;而基于深度学习的方法,尽管能有效提升识别准确性,但往往需要较大的数据标注量与较高的计算复杂性。为解决这些问题,提出一种基于图结构增强的番茄叶部病害识别框架(TDR—EGS)。TDR—EGS通过整合样本间的拓扑关系,实现图学习与单样本学习的交替训练,从而在不增加模型推理阶段复杂度的前提下有效提升分类性能。首先通过卷积神经网络提取单样本特征,然后利用这些特征构建k近邻图以挖掘样本间的结构信息。这种方法使得图学习和单样本学习能够在共享的网络结构和外部存储机制的支持下协同工作。在11种番茄病害上的试验结果表明,TDR—EGS能在不增加推理复杂度的前提下有效提升多种主流基准模型的性能,最高达到98.61%的识别精度。此外,即使在仅使用60%标签信息的条件下,TDR—EGS的性能仍可以接近或超过完全监督学习的基准模型,充分证明该框架的有效性和泛化能力,为农业病害识别应用提供一种高效且通用的解决方案。 展开更多
关键词 番茄叶部 病害识别 图学习 k近邻图 交替训练 深度学习
在线阅读 下载PDF
基于图卷积网络的室内Wi-Fi指纹定位算法 被引量:1
20
作者 康晓非 梁琪悦 李雨玫 《计算机工程与设计》 北大核心 2025年第8期2157-2162,共6页
针对传统室内定位算法未考虑指纹数据非欧几里德特征的问题,提出一种基于图卷积网络(graph convolutional neural network,GCN)双层特征提取的Wi-Fi指纹室内定位算法(DuGCNLoc)。该算法在接入点(access point,AP)层面通过设计邻接矩阵... 针对传统室内定位算法未考虑指纹数据非欧几里德特征的问题,提出一种基于图卷积网络(graph convolutional neural network,GCN)双层特征提取的Wi-Fi指纹室内定位算法(DuGCNLoc)。该算法在接入点(access point,AP)层面通过设计邻接矩阵建立图结构;在参考点(reference point,RP)层面,使用K近邻(K-nearest neighbor,KNN)选取邻近节点构建子图,并通过GCN分别对图结构特征提取,位置预测由全连接层(fully connected layer,FC)完成。实验结果表明,所提算法在自建数据集和公共数据集上的定位性能均优于传统算法,实现了平均定位误差为0.85 m的精度。 展开更多
关键词 室内定位 位置指纹 图结构 邻接矩阵 图卷积网络 最近邻算法 接收信号强度
在线阅读 下载PDF
上一页 1 2 119 下一页 到第
使用帮助 返回顶部