期刊文献+
共找到2,387篇文章
< 1 2 120 >
每页显示 20 50 100
一种基于特征加权的K Nearest Neighbor算法 被引量:6
1
作者 桑应宾 刘琼荪 《海南大学学报(自然科学版)》 CAS 2008年第4期352-355,共4页
传统的KNN算法一般采用欧式距离公式度量两样本间的距离.由于在实际样本数据集合中每一个属性对样本的贡献作用是不尽相同的,通常采用加权欧式距离公式.笔者提出一种计算权重的方法,即基于特征加权KNN算法.经实验证明,该算法与经典的赋... 传统的KNN算法一般采用欧式距离公式度量两样本间的距离.由于在实际样本数据集合中每一个属性对样本的贡献作用是不尽相同的,通常采用加权欧式距离公式.笔者提出一种计算权重的方法,即基于特征加权KNN算法.经实验证明,该算法与经典的赋权算法相比具有较好的分类效果. 展开更多
关键词 特征权重 k近邻 交叉验证
在线阅读 下载PDF
Empirical Mode Decomposition-k Nearest Neighbor Models for Wind Speed Forecasting
2
作者 Ye Ren P. N. Suganthan 《Journal of Power and Energy Engineering》 2014年第4期176-185,共10页
Hybrid model is a popular forecasting model in renewable energy related forecasting applications. Wind speed forecasting, as a common application, requires fast and accurate forecasting models. This paper introduces a... Hybrid model is a popular forecasting model in renewable energy related forecasting applications. Wind speed forecasting, as a common application, requires fast and accurate forecasting models. This paper introduces an Empirical Mode Decomposition (EMD) followed by a k Nearest Neighbor (kNN) hybrid model for wind speed forecasting. Two configurations of EMD-kNN are discussed in details: an EMD-kNN-P that applies kNN on each decomposed intrinsic mode function (IMF) and residue for separate modelling and forecasting followed by summation and an EMD-kNN-M that forms a feature vector set from all IMFs and residue followed by a single kNN modelling and forecasting. These two configurations are compared with the persistent model and the conventional kNN model on a wind speed time series dataset from Singapore. The results show that the two EMD-kNN hybrid models have good performance for longer term forecasting and EMD-kNN-M has better performance than EMD-kNN-P for shorter term forecasting. 展开更多
关键词 WIND SPEED Forecasting Empirical MODE DECOMPOSITION k nearest neighbor
在线阅读 下载PDF
基于K-Nearest Neighbor和神经网络的糖尿病分类研究 被引量:6
3
作者 陈真诚 杜莹 +3 位作者 邹春林 梁永波 吴植强 朱健铭 《中国医学物理学杂志》 CSCD 2018年第10期1220-1224,共5页
为实现糖尿病的早期筛查,提高对糖尿病分类的准确度,在研究有关糖尿病危险因素的基础上,增加糖化血红蛋白作为糖尿病早期筛查的特征之一。研究中选取与人类最为相似的食蟹猴作为研究对象,利用年龄、血压、腹围、BMI、糖化血红蛋白以及... 为实现糖尿病的早期筛查,提高对糖尿病分类的准确度,在研究有关糖尿病危险因素的基础上,增加糖化血红蛋白作为糖尿病早期筛查的特征之一。研究中选取与人类最为相似的食蟹猴作为研究对象,利用年龄、血压、腹围、BMI、糖化血红蛋白以及空腹血糖作为特征输入,将正常、糖尿病前期和糖尿病作为类别输出,利用K-Nearest Neighbor(KNN)和神经网络两种方法对其分类。发现在增加糖化血红蛋白作为分类特征之一时,KNN(K=3)和神经网络的分类准确率分别为81.8%和92.6%,明显高于没有这一特征时的准确率(68.1%和89.7%),KNN和神经网络都可以对食蟹猴数据进行分类和识别,起到早期筛查作用。 展开更多
关键词 糖尿病 糖化血红蛋白 空腹血糖 kNN 神经网络 食蟹猴
在线阅读 下载PDF
面向流形数据的共享近邻和二阶K近邻密度峰值聚类算法
4
作者 赵嘉 陈蔚昌 +3 位作者 肖人彬 潘正祥 崔志华 王晖 《控制理论与应用》 北大核心 2026年第2期388-396,共9页
密度峰值聚类算法能够快速高效处理数据集且无需迭代.但该算法在处理流形数据时,易错选类簇中心和错误分配样本.因此,本文提出面向流形数据的共享近邻和二阶K近邻密度峰值聚类(DPC–SKNN)算法.首先,该算法引入逆近邻和共享近邻重新定义... 密度峰值聚类算法能够快速高效处理数据集且无需迭代.但该算法在处理流形数据时,易错选类簇中心和错误分配样本.因此,本文提出面向流形数据的共享近邻和二阶K近邻密度峰值聚类(DPC–SKNN)算法.首先,该算法引入逆近邻和共享近邻重新定义局部密度,充分考虑样本的局部信息和全局信息,使算法易找到正确的流形类簇中心;其次,将样本的关联关系分为K近邻点、二阶K近邻点和非近邻点3种情况,设计K近邻的分配策略,增强同一类簇样本的相似性,提高样本分配的准确率.将本文算法与8种算法在流形和UCI数据集进行对比,实验结果表明,DPC-SKNN算法在上述数据集上均获得了不错的聚类结果. 展开更多
关键词 密度峰值聚类 逆近邻 共享近邻 二阶k近邻 流形数据
在线阅读 下载PDF
利用二阶k近邻构造微簇的过采样方法
5
作者 孟东霞 柳凌燕 魏晓光 《统计与决策》 北大核心 2026年第3期46-51,共6页
为了解决少数类样本在不平衡数据集中分类准确率较低的问题,文章提出一种利用少数类样本的二阶k近邻构造微簇,并在微簇内进行过采样的数据处理方法。二阶k近邻是样本近邻关系的扩展,能更准确地衡量样本在局部结构关系中的影响力。微簇... 为了解决少数类样本在不平衡数据集中分类准确率较低的问题,文章提出一种利用少数类样本的二阶k近邻构造微簇,并在微簇内进行过采样的数据处理方法。二阶k近邻是样本近邻关系的扩展,能更准确地衡量样本在局部结构关系中的影响力。微簇的划分反映了少数类样本的相似程度,微簇内生成的新样本降低了对少数类原始内在分布结构的影响。该方法先计算少数类样本在整个数据集中的k近邻,移除k近邻均属于多数类的噪声样本,在获得剩余样本的二阶k近邻后再计算样本的局部密度,依据局部密度和近邻关系构造少数类样本的微簇,并在微簇中生成新样本。通过对比实验比较了八种过采样方法在两组人工数据集上生成新样本的分布情况,并使用支持向量机对经过平衡处理的十组数据集进行了分类,结果表明,在所提方法构造的平衡数据集中,少数类样本的分类准确率较高,数据集的整体分类效果较好,验证了所提方法的有效性。 展开更多
关键词 二阶k近邻 不平衡数据 过采样
原文传递
基于变量筛选和OS-KELM的出口SO_(2)浓度预测
6
作者 金秀章 陈佳政 张瑾 《华北电力大学学报(自然科学版)》 北大核心 2026年第1期149-158,共10页
针对火力发电厂频繁调峰导致锅炉燃烧不稳定、出口SO_(2)浓度波动范围大难以准确、及时测量的问题,提出了一种基于变量筛选和在线核极限学习机的出口SO_(2)浓度预测模型。首先通过机理分析选择与出口SO_(2)浓度有关的影响变量;再利用基... 针对火力发电厂频繁调峰导致锅炉燃烧不稳定、出口SO_(2)浓度波动范围大难以准确、及时测量的问题,提出了一种基于变量筛选和在线核极限学习机的出口SO_(2)浓度预测模型。首先通过机理分析选择与出口SO_(2)浓度有关的影响变量;再利用基于FCBF改进的mRMR算法去除冗余变量,并对筛选后的变量使用K近邻互信息算法进行时延补偿;然后对补偿后的变量利用变分模态分解(VMD)进行分解,选择相关性最大的变量子集作为最终模型输入;最后利用天牛群算法(Beetle swarm optimization,BSO)优化在线核极限学习机(Online sequential-kernel based extreme learning machine,OS-KELM)参数建立出口SO_(2)浓度预测模型。利用电厂真实运行数据进行实验,结果表明,基于OS-KELM的预测模型其预测效果优于ELM、KELM、OS-ELM模型,具有较高的模型预测精度。 展开更多
关键词 变量筛选 VMD分解 时延补偿 k近邻互信息 天牛群算法 在线核极限学习机
在线阅读 下载PDF
基于特征多样捕捉的KNN-DLinear-GRU变压器油中气体预测模型
7
作者 熊海军 李娅菡 +2 位作者 孟奕吉 王钧平 兰塞迪 《电工电能新技术》 北大核心 2026年第1期84-95,共12页
针对电力变压器油中溶解气体浓度序列非线性和非平稳特性对预测精度的影响,本文提出了一种基于特征多样捕捉的多模型融合的预测方法。首先,通过粒子群优化(PSO)算法对变分模态分解(VMD)的关键参数进行自动优化,最大程度地去除序列中的... 针对电力变压器油中溶解气体浓度序列非线性和非平稳特性对预测精度的影响,本文提出了一种基于特征多样捕捉的多模型融合的预测方法。首先,通过粒子群优化(PSO)算法对变分模态分解(VMD)的关键参数进行自动优化,最大程度地去除序列中的噪声成分,并确保分解后信号的准确性。其次,KNN用于初步特征提取,DLinear模块负责趋势性信息的捕捉,而GRU则建模气体浓度的时间依赖关系,从而提高整体预测精度。实验结果表明,在预测变压器油中溶解气体H2时与GRU单独预测相比,该方法的决定系数提高了22.71%,均方根误差降低了4.972,显著优于单一模型。通过对其他气体成分(如C_(2)H_(2)、总烃)浓度进行预测,结果表明本模型在多种气体成分的预测中均表现出良好的泛化性能,证明了该方法在实际工程中能够有效提高系统的预测准确率。 展开更多
关键词 电力变压器 变分模态分解 油中溶解气体预测 最近邻算法 门控循环单元
在线阅读 下载PDF
基于PNCC声纹特征提取技术和POA-KNN算法的齿轮箱声纹识别故障诊断
8
作者 廖力达 赵阁阳 +1 位作者 魏诚 刘川江 《机电工程》 北大核心 2026年第1期24-33,共10页
风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因... 风力机齿轮箱是风力发电系统的核心组件之一,承担着将风能转化为电能的重要任务。由于运行环境的恶劣以及长期使用造成的磨损,齿轮箱常常会发生各种故障,从而导致齿轮箱运行过程中产生不同的噪声,严重影响风力机的正常运行和发电效率,因此,提出了一种基于功率正则化倒谱系数(PNCC)声纹特征提取技术,以及行星优化算法与K近邻算法(POA-KNN)模型的风力机齿轮箱声纹识别故障诊断方法。首先,采用LMS噪声采集仪采集了6种不同状态下的风力机齿轮箱噪声数据;然后,使用了PNCC声纹特征提取的方法,提取了齿轮箱噪声信号的声纹图谱;在KNN的基础上加入行星优化算法(POA)优化了K值,提出了性能较高的POA-KNN分类模型;最后,根据6类不同状态下的齿轮数据集,采用对比试验和消融实验验证了模型性能。研究结果表明:POA-KNN模型对齿轮箱的PNCC声纹图分类准确率达到99.4%,比KNN基线模型提升了1.9%。POA-KNN分类模型能很好地对数据集中不同状态下的齿轮箱进行分类,更高效地针对风力机齿轮箱中存在的故障进行诊断。 展开更多
关键词 齿轮箱 功率正则化倒谱系数 声纹识别 声纹特征图谱 行星优化算法与k近邻算法 分类模型
在线阅读 下载PDF
基于模糊粒化K近邻粗糙集模型的属性约简算法
9
作者 高兴媛 李晓明 《电子器件》 2026年第1期189-196,共8页
属性约简是粗糙集理论的核心应用之一。K近邻粗糙集作为传统邻域粗糙集的重要改进,有效解决了数据分布密度差异带来的近似适应性问题,但其在模糊关系下的数据环境中仍缺乏相关研究。针对这一不足,提出一种基于模糊粒化的K近邻粗糙集模... 属性约简是粗糙集理论的核心应用之一。K近邻粗糙集作为传统邻域粗糙集的重要改进,有效解决了数据分布密度差异带来的近似适应性问题,但其在模糊关系下的数据环境中仍缺乏相关研究。针对这一不足,提出一种基于模糊粒化的K近邻粗糙集模型及属性约简算法。首先创新性地将模糊相似关系的粒化方法引入K近邻粗糙集,构建了模糊粒化的K近邻相似关系;然后,以该相似关系作为二元关系,建立了新型K近邻粗糙集模型,并严格证明其数学性质;最后,提出模糊粒化K近邻依赖度指标,用于量化属性的重要度,进而设计了对应的属性约简算法。基于公开数据集的实验表明,所提算法在约简效果和效率上均具有显著优势。 展开更多
关键词 k近邻粗糙集 模糊相似关系 模糊粒化 依赖度 属性约简
在线阅读 下载PDF
基于重复匹配机制的WKNN-BP-MLP神经网络的室内定位算法设计
10
作者 夏颖 王岩 +2 位作者 王艳春 李宗岳 何胤北 《齐齐哈尔大学学报(自然科学版)》 2026年第2期1-6,23,共7页
随着物联网技术的飞速发展,基于位置服务的市场需求日益增长,Wi-Fi指纹定位方法成为研究热点。然而Wi-Fi信号存在于复杂室内环境中导致定位精度不足的问题。通过重复匹配机制优化传统加权K近邻算法并引入多层感知机神经网络和反向传播... 随着物联网技术的飞速发展,基于位置服务的市场需求日益增长,Wi-Fi指纹定位方法成为研究热点。然而Wi-Fi信号存在于复杂室内环境中导致定位精度不足的问题。通过重复匹配机制优化传统加权K近邻算法并引入多层感知机神经网络和反向传播神经网络,基于重复匹配机制的WKNN-BP-MLP神经网络算法,实现高精度室内定位。实验表明,所提定位算法显著提升定位精度,能够满足室内定位场景的技术要求。 展开更多
关键词 室内定位 改进加权k近邻算法 反向传播算法 重复匹配机制 多层感知机神经网络
在线阅读 下载PDF
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
11
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k NN)查询算法 不规则区域划分方法 MAP REDUCE 大数据
在线阅读 下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:15
12
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC k-nearest-neighbor Neural Networks Random Forest Support Vector Machines
在线阅读 下载PDF
Pruned fuzzy K-nearest neighbor classifier for beat classification 被引量:4
13
作者 Muhammad Arif Muhammad Usman Akram Fayyaz-ul-Afsar Amir Minhas 《Journal of Biomedical Science and Engineering》 2010年第4期380-389,共10页
Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats... Arrhythmia beat classification is an active area of research in ECG based clinical decision support systems. In this paper, Pruned Fuzzy K-nearest neighbor (PFKNN) classifier is proposed to classify six types of beats present in the MIT-BIH Arrhythmia database. We have tested our classifier on ~ 103100 beats for six beat types present in the database. Fuzzy KNN (FKNN) can be implemented very easily but large number of training examples used for classification can be very time consuming and requires large storage space. Hence, we have proposed a time efficient Arif-Fayyaz pruning algorithm especially suitable for FKNN which can maintain good classification accuracy with appropriate retained ratio of training data. By using Arif-Fayyaz pruning algorithm with Fuzzy KNN, we have achieved a beat classification accuracy of 97% and geometric mean of sensitivity of 94.5% with only 19% of the total training examples. The accuracy and sensitivity is comparable to FKNN when all the training data is used. Principal Component Analysis is used to further reduce the dimension of feature space from eleven to six without compromising the accuracy and sensitivity. PFKNN was found to robust against noise present in the ECG data. 展开更多
关键词 ARRHYTHMIA ECG k-nearest neighbor PRUNING FUZZY Classification
暂未订购
Support Vector Machine-Based Fault Diagnosis of Power Transformer Using k Nearest-Neighbor Imputed DGA Dataset 被引量:4
14
作者 Zahriah Binti Sahri Rubiyah Binti Yusof 《Journal of Computer and Communications》 2014年第9期22-31,共10页
Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting inc... Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting incipient faults in power transformers is one of the casualties. Thus, this paper proposes filling-in the missing values found in a DGA dataset using the k-nearest neighbor imputation method with two different distance metrics: Euclidean and Cityblock. Thereafter, using these imputed datasets as inputs, this study applies Support Vector Machine (SVM) to built models which are used to classify transformer faults. Experimental results are provided to show the effectiveness of the proposed approach. 展开更多
关键词 MISSING VALUES Dissolved Gas Analysis Support Vector Machine k-nearest neighborS
在线阅读 下载PDF
Mapping aboveground biomass by integrating geospatial and forest inventory data through a k-nearest neighbor strategy in North Central Mexico 被引量:2
15
作者 Carlos A AGUIRRE-SALADO Eduardo J TREVIO-GARZA +7 位作者 Oscar A AGUIRRE-CALDERóN Javier JIMNEZ-PREZ Marco A GONZLEZ-TAGLE José R VALDZ-LAZALDE Guillermo SNCHEZ-DíAZ Reija HAAPANEN Alejandro I AGUIRRE-SALADO Liliana MIRANDA-ARAGóN 《Journal of Arid Land》 SCIE CSCD 2014年第1期80-96,共17页
As climate change negotiations progress,monitoring biomass and carbon stocks is becoming an important part of the current forest research.Therefore,national governments are interested in developing forest-monitoring s... As climate change negotiations progress,monitoring biomass and carbon stocks is becoming an important part of the current forest research.Therefore,national governments are interested in developing forest-monitoring strategies using geospatial technology.Among statistical methods for mapping biomass,there is a nonparametric approach called k-nearest neighbor(kNN).We compared four variations of distance metrics of the kNN for the spatially-explicit estimation of aboveground biomass in a portion of the Mexican north border of the intertropical zone.Satellite derived,climatic,and topographic predictor variables were combined with the Mexican National Forest Inventory(NFI)data to accomplish the purpose.Performance of distance metrics applied into the kNN algorithm was evaluated using a cross validation leave-one-out technique.The results indicate that the Most Similar Neighbor(MSN)approach maximizes the correlation between predictor and response variables(r=0.9).Our results are in agreement with those reported in the literature.These findings confirm the predictive potential of the MSN approach for mapping forest variables at pixel level under the policy of Reducing Emission from Deforestation and Forest Degradation(REDD+). 展开更多
关键词 k-nearest neighbor Mahalanobis most similar neighbor MODIS BRDF-adjusted reflectance forest inventory the policy of Reducing Emission from Deforestation and Forest Degradation
在线阅读 下载PDF
向量数据库的K近邻图高效更新方法
16
作者 王嘉翼 徐士惠 李国良 《软件学报》 北大核心 2026年第3期1006-1020,共15页
在高维数据处理中,K近邻图作为一种关键的数据结构,广泛应用于聚类、图神经网络和推荐系统等领域.然而,随着预训练嵌入模型在非结构化数据建模与检索中的广泛使用,嵌入模型的微调逐渐成为提升嵌入向量的语义表示能力的核心步骤.嵌入微... 在高维数据处理中,K近邻图作为一种关键的数据结构,广泛应用于聚类、图神经网络和推荐系统等领域.然而,随着预训练嵌入模型在非结构化数据建模与检索中的广泛使用,嵌入模型的微调逐渐成为提升嵌入向量的语义表示能力的核心步骤.嵌入微调通常会导致全部数据的向量表示发生系统性变化,从而使原有K近邻图的邻接关系失效.现有研究主要关注于如何为静态数据构建K近邻图,缺乏对微调后的嵌入向量进行快速适应的研究.为此,提出一种面向嵌入模型微调场景的高效K近邻图更新方法FastAdjust.该方法基于嵌入模型微调为每条数据嵌入带来的影响较小的观察,通过局部更新策略对原始K近邻图进行增量调整,在确保最终K近邻图质量的同时,显著提升更新效率.具体而言,首先,FastAdjust利用基于乘积量化的聚类结构,为每条数据高效且准确地定位可能成为邻居的数据子集,缩小候选邻居搜索范围;其次,基于数据密度和嵌入变化幅度,FastAdjust结合二者与数据K近邻变化程度的相关性,为邻居关系变化程度不同的数据针对性地分配不同的更新资源,从而提升整体更新效率.真实数据集上的实验结果表明,FastAdjust在嵌入模型微调的场景下能够快速调整K近邻图,准确地适应数据嵌入的变化,同时大幅减少计算开销,具有良好的实用价值和扩展性. 展开更多
关键词 k近邻图 近似最近邻搜索 嵌入模型
在线阅读 下载PDF
基于KNN算法的问答气象服务技术研究与应用
17
作者 陈冲 张锋 +1 位作者 李建 陶慧青 《自动化技术与应用》 2026年第2期170-173,共4页
由浙江省气象部门推出的“智慧气象”App,依托权威气象数据源与精细化数值预报产品,构建了专业化的气象服务体系,自发布以来持续获得良好的用户口碑与行业认可。随着社会对气象服务的需求向精准化、个性化方向不断深化与细分,叠加气象... 由浙江省气象部门推出的“智慧气象”App,依托权威气象数据源与精细化数值预报产品,构建了专业化的气象服务体系,自发布以来持续获得良好的用户口碑与行业认可。随着社会对气象服务的需求向精准化、个性化方向不断深化与细分,叠加气象科学技术的快速发展,为有效回应用户在不同场景下多样化的气象信息获取诉求,本研究设计并实现了一种基于K近邻算法(K-nearest neighbors, KNN)的气象问答技术。该技术在保留原有App功能架构的基础上,创新性地整合了以KNN为核心的气象问句分类与相似匹配机制,实现了对用户自然语言问询的精准理解与自动化应答。该技术通过构建历史训练语料的特征向量空间,依据问句语义近邻实现高效分类与答案推送,显著提升了气象服务的交互性与智能化水平。实证研究及实际应用反馈表明,引入KNN问答模型后,系统在响应准确率、服务响应效率及用户综合满意度等方面均实现一定提升,为气象服务智慧化升级提供了有效技术支撑,具备良好的推广价值与应用前景。 展开更多
关键词 APP 气象服务 kNN 问答 分类 智能
在线阅读 下载PDF
A Short-Term Traffic Flow Forecasting Method Based on a Three-Layer K-Nearest Neighbor Non-Parametric Regression Algorithm 被引量:7
18
作者 Xiyu Pang Cheng Wang Guolin Huang 《Journal of Transportation Technologies》 2016年第4期200-206,共7页
Short-term traffic flow is one of the core technologies to realize traffic flow guidance. In this article, in view of the characteristics that the traffic flow changes repeatedly, a short-term traffic flow forecasting... Short-term traffic flow is one of the core technologies to realize traffic flow guidance. In this article, in view of the characteristics that the traffic flow changes repeatedly, a short-term traffic flow forecasting method based on a three-layer K-nearest neighbor non-parametric regression algorithm is proposed. Specifically, two screening layers based on shape similarity were introduced in K-nearest neighbor non-parametric regression method, and the forecasting results were output using the weighted averaging on the reciprocal values of the shape similarity distances and the most-similar-point distance adjustment method. According to the experimental results, the proposed algorithm has improved the predictive ability of the traditional K-nearest neighbor non-parametric regression method, and greatly enhanced the accuracy and real-time performance of short-term traffic flow forecasting. 展开更多
关键词 Three-Layer Traffic Flow Forecasting k-nearest neighbor Non-Parametric Regression
在线阅读 下载PDF
基于KNN-Transformer算法的密度测井曲线重构方法
19
作者 苏俊磊 董旭 +4 位作者 曾渝 史文祺 石雪莹 刘沛东 刘坤 《测井技术》 2026年第1期87-96,共10页
密度测井是计算储层物性参数、识别岩性及评价油气储量的关键技术。受井眼环境、仪器贴壁状况等因素影响,密度曲线常出现局部缺失、数据失真或噪声干扰等问题。为此,提出一种融合K近邻(K-Nearest Neighbors,KNN)算法与Transformer算法... 密度测井是计算储层物性参数、识别岩性及评价油气储量的关键技术。受井眼环境、仪器贴壁状况等因素影响,密度曲线常出现局部缺失、数据失真或噪声干扰等问题。为此,提出一种融合K近邻(K-Nearest Neighbors,KNN)算法与Transformer算法的密度测井曲线重构方法KNN-Transformer。该方法首先利用KNN在多元测井特征空间中检索与目标段时间序列沉积特征相似的样本,通过计算目标段与历史样本在声波时差、自然伽马、电阻率等多维特征上的欧氏距离,筛选出最相似的K个邻域样本,构建增强的地质先验输入集,增强输入数据的地质代表性,进而采用Transformer算法的多头自注意力机制,建立深度序列间任意位置的长程依赖关系,有效融合局部相似性约束与全局序列模式,实现局部特征与全局结构的协同表达。实验结果表明,KNN-Transformer算法密度测井曲线重构的结果平均绝对误差为0.0170,决定系数R^(2)达0.9533,其与支持向量回归、线性回归及长短期记忆(Long Short-Term Memory,LSTM)网络等典型算法相比,平均绝对误差降低30%~60%,对密度测井曲线总体趋势与局部细节均具有更高的重构精度,并在岩性界面及复杂层段表现出更好的稳定性与正确性。该方法有效修复了密度曲线的局部缺失,校正了数据失真并抑制了噪声干扰,显著提升了重构曲线的数值精度与地质合理性,为复杂储层条件下的测井数据高质量重建提供了可靠的技术途径。 展开更多
关键词 密度测井 k近邻 TRANSFORMER 曲线重构 深度学习 注意力机制 序列建模
在线阅读 下载PDF
基于AHP-EWM-KNN模型的煤矿顶板涌水危险性评价
20
作者 张慈增 张栋 《煤炭工程》 北大核心 2026年第3期198-205,共8页
为构建科学、严谨的煤层顶板涌水危险性评价体系,以嘎鲁图矿井2105工作面为背景,采用层次分析法-熵权法(AHP-EWM)优化涌水影响因素的综合权重,确定顶板涌水主控因素。以渗透系数、含水层厚度、孔隙水压力、温度及内聚力等指标为输入参数... 为构建科学、严谨的煤层顶板涌水危险性评价体系,以嘎鲁图矿井2105工作面为背景,采用层次分析法-熵权法(AHP-EWM)优化涌水影响因素的综合权重,确定顶板涌水主控因素。以渗透系数、含水层厚度、孔隙水压力、温度及内聚力等指标为输入参数,结合K近邻(KNN)机器学习算法,构建“数据输入-模型训练-现场验证-性能优化-预测应用”一体化的煤层顶板涌水危险性评价模型。结果表明:含水层厚度对嘎鲁图矿煤层顶板涌水的影响程度最大,渗透系数次之;通过对含水层厚度数据进行清洗与降噪处理,可显著提升模型预测精度,所构建的AHP-EWM-KNN融合模型精确率为0.9598,F_(1)-score为0.9569,验证了评价指标选取合理、预测方法可行。预测结果显示,2105工作面辅助运输巷距开切眼0~330 m及1620~2210 m区段为涌水高危险区域。该研究成果丰富了井下煤层顶板涌水危险性评价方法体系。 展开更多
关键词 顶板涌水 AHP-EWM 机器学习 模型预测 数据清洗 k近邻
在线阅读 下载PDF
上一页 1 2 120 下一页 到第
使用帮助 返回顶部