期刊文献+
共找到317篇文章
< 1 2 16 >
每页显示 20 50 100
Evaluation of the k-nearest neighbor method for forecasting the influent characteristics of wastewater treatment plant 被引量:6
1
作者 Minsoo KIM Yejin KIM +2 位作者 Hyosoo KIM Wenhua PIAO Changwon KIM 《Frontiers of Environmental Science & Engineering》 SCIE EI CAS CSCD 2016年第2期299-310,共12页
The k-nearest neighbor (k-NN) method was evaluated to predict the influent flow rate and four water qualities, namely chemical oxygen demand (COD), suspended solid (SS), total nitrogen (T-N) and total phosphor... The k-nearest neighbor (k-NN) method was evaluated to predict the influent flow rate and four water qualities, namely chemical oxygen demand (COD), suspended solid (SS), total nitrogen (T-N) and total phosphorus (T-P) at a wastewater treatment plant (WWTP). The search range and approach for determining the number of nearest neighbors (NNs) under dry and wet weather conditions were initially optimized based on the root mean square error (RMSE). The optimum search range for considering data size was one year. The square root-based (SR) approach was superior to the distance factor-based (DF) approach in determining the appropriate number of NNs. However, the results for both approaches varied slightly depending on the water quality and the weather conditions. The influent flow rate was accurately predicted within one standard deviation of measured values. Influent water qualities were well predicted with the mean absolute percentage error (MAPE) under both wet and dry weather conditions. For the seven-day prediction, the difference in predictive accuracy was less than 5% in dry weather conditions and slightly worse in wet weather conditions. Overall, the k-NN method was verified to be useful for predicting WWTP influent characteristics. 展开更多
关键词 influent wastewater prediction data-drivenmodel k-nearest neighbor method (k-NN)
原文传递
Identifying G-protein Coupled Receptors Using Weighted Levenshtein Distance and Nearest Neighbor Method 被引量:2
2
作者 Jian-Hua Xu 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2005年第4期252-257,共6页
G-protein coupled receptors (GPCRs) are a class of seven-helix transmembrane proteins that have been used in bioinformatics as the targets to facilitate drug discovery for human diseases. Although thousands of GPCR ... G-protein coupled receptors (GPCRs) are a class of seven-helix transmembrane proteins that have been used in bioinformatics as the targets to facilitate drug discovery for human diseases. Although thousands of GPCR sequences have been collected, the ligand specificity of many GPCRs is still unknown and only one crystal structure of the rhodopsin-like family has been solved. Therefore, identifying GPCR types only from sequence data has become an important research issue. In this study, a novel technique for identifying GPCR types based on the weighted Levenshtein distance between two receptor sequences and the nearest neighbor method (NNM) is introduced, which can deal with receptor sequences with different lengths directly. In our experiments for classifying four classes (acetylcholine, adrenoceptor, dopamine, and serotonin) of the rhodopsin-like family of GPCRs, the error rates from the leave-one-out procedure and the leave-half-out procedure were 0.62% and 1.24%, respectively. These results are prior to those of the covariant discriminant algorithm, the support vector machine method, and the NNM with Euclidean distance. 展开更多
关键词 GPCR weighted Levenshtein distance nearest neighbor method
在线阅读 下载PDF
Time-Series Forecasting Using Autoregression Enhanced k-Nearest Neighbors Method 被引量:1
3
作者 潘峰 赵海波 刘华山 《Journal of Shanghai Jiaotong university(Science)》 EI 2013年第4期434-442,共9页
This study proposes two metrics using the nearest neighbors method to improve the accuracy of time-series forecasting. These two metrics can be treated as a hybrid forecasting approach to combine linear and non-linear... This study proposes two metrics using the nearest neighbors method to improve the accuracy of time-series forecasting. These two metrics can be treated as a hybrid forecasting approach to combine linear and non-linear forecasting techniques. One metric redefines the distance in k-nearest neighbors based on the coefficients of autoregression (AR) in time series. Meanwhile, an improvement to Kulesh's adaptive metrics in the nearest neighbors is also presented. To evaluate the performance of the two proposed metrics, three types of time-series data, namely deterministic synthetic data, chaotic time-series data and real time-series data, are predicted. Experimental results show the superiority of the proposed AR-enhanced k-nearest neighbors methods to the traditional k-nearest neighbors metric and Kulesh's adaptive metrics. 展开更多
关键词 time series forecasting nearest neighbors method autoregression (AR) metrics
原文传递
基于不规则区域划分方法的k-Nearest Neighbor查询算法 被引量:1
4
作者 张清清 李长云 +3 位作者 李旭 周玲芳 胡淑新 邹豪杰 《计算机系统应用》 2015年第9期186-190,共5页
随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细... 随着越来越多的数据累积,对数据处理能力和分析能力的要求也越来越高.传统k-Nearest Neighbor(k NN)查询算法由于其容易导致计算负载整体不均衡的规则区域划分方法及其单个进程或单台计算机运行环境的较低数据处理能力.本文提出并详细介绍了一种基于不规则区域划分方法的改进型k NN查询算法,并利用对大规模数据集进行分布式并行计算的模型Map Reduce对该算法加以实现.实验结果与分析表明,Map Reduce框架下基于不规则区域划分方法的k NN查询算法可以获得较高的数据处理效率,并可以较好的支持大数据环境下数据的高效查询. 展开更多
关键词 k-nearest neighbor(k NN)查询算法 不规则区域划分方法 MAP REDUCE 大数据
在线阅读 下载PDF
EDGEWORTH EXPANSION FOR NEAREST NEIGHBOR- KERNEL ESTIMATE AND RANDOM WEIGHTING APPROXIMATION OF CONDITIONAL DENSITY
5
作者 Yu ZhaopingInstitute of Electronic Technique,Zhengzhou450 0 0 4 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 2000年第2期167-172,共6页
In this paper,Edgeworth expansion for the nearest neighbor\|kernel estimate and random weighting approximation of conditional density are given and the consistency and convergence rate are proved.
关键词 Random weighting method Edgeworth expansion nearest neighbor\|kernel estimate.
全文增补中
混合型弱标记不完备数据的三支聚类集成仿真
6
作者 李慧玲 孙皓 《计算机仿真》 2025年第3期313-316,326,共5页
即使数据存在弱标记和不完备的问题,数据中仍然可能隐藏着有价值的模式和结构。发现数据中的潜在群体或类别,从而挖掘出数据中的有用信息,提出了一种混合型弱标记不完备数据三支聚类集成方法。通过K最近邻填充法对数据的缺失属性展开填... 即使数据存在弱标记和不完备的问题,数据中仍然可能隐藏着有价值的模式和结构。发现数据中的潜在群体或类别,从而挖掘出数据中的有用信息,提出了一种混合型弱标记不完备数据三支聚类集成方法。通过K最近邻填充法对数据的缺失属性展开填充,获得混合型弱标记完备数据集;通过模糊C均值聚类得到数据隶属度,并利用三支聚类集成算法实现混合型弱标记不完备数据的聚类集成。实验结果表明,该方法填充后的数据完整度接近100%,且ARI值在0.85以上,说明所提方法具有较好的数据聚类集成效果,可以有效揭示不同数据类型之间的关系和相互作用。 展开更多
关键词 混合型弱标记不完备数据 三支聚类集成 最近邻填充法 模糊均值聚类 属性值填充
在线阅读 下载PDF
基于机器学习的女性压力性尿失禁发病风险预测模型建立及效能评价 被引量:3
7
作者 时欣然 庞震 +2 位作者 乔婷 李晶晶 王勤章 《现代泌尿外科杂志》 2025年第3期196-206,共11页
目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及... 目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及妇产科治疗的女性SUI患者及同期行健康查体女性的临床资料,将产后42 d女性纳入产后组(n=611),围绝经期与绝经后女性纳入非产后组(n=409)。设置随机种子数并以7∶3的比例分为训练集与验证集。收集所有研究对象的相关临床资料,使用单因素及Lasso回归筛选有意义的变量,将其纳入KNN、SVM、DT及RF算法中并构建模型,分别计算模型的敏感度、特异度、准确度、曲线下面积(AUC)等,筛选出最优的模型。结果产后组SUI患者为352例,占57.6%。根据单因素及Lasso回归,产后组筛选出有意义的变量为:年龄、身体质量指数(BMI)、快肌阶段最大值、孕次、膀胱颈移动度(BND)、尿道旋转角(URA)、会阴侧切、既往尿失禁史及便秘。在产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.881、0.878、0.750、0.905,RF模型的AUC、准确度、F1指数及Kappa值均最大。非产后组SUI患者为260例,占63.6%。根据单因素及Lasso回归,非产后组筛选出有意义的变量为:年龄、BMI、快肌阶段最大值及恢复时间、慢肌阶段平均值、后静息阶段变异性、阴道分娩、既往尿失禁史及便秘。在非产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.819、0.805、0.603、0.830,RF模型的AUC、准确度、Kappa值均最大。结论本研究基于机器学习成功建立4种产后42 d女性,围绝经期及绝经后女性SUI发病的预测模型,其中采用RF算法的模型预测效率最佳。 展开更多
关键词 压力性尿失禁 预测模型 机器学习 决策树 随机森林 支持向量机 K最近邻法
暂未订购
一种改进PSO-LSSVM模型的发动机后向RCS序列预测
8
作者 傅莉 关一 +1 位作者 孙旭 崔哲 《航空发动机》 北大核心 2025年第2期91-96,共6页
为解决现有预测模型对发动机后向雷达散射截面(RCS)序列预测精度低的问题,提出了改进的粒子群(PSO)优化算法,建立了PSO-LSSVM预测模型。在传统粒子群优化算法基础上应用最优拉丁超立方采样方法进行粒子群位置初始化,得益于最优拉丁超立... 为解决现有预测模型对发动机后向雷达散射截面(RCS)序列预测精度低的问题,提出了改进的粒子群(PSO)优化算法,建立了PSO-LSSVM预测模型。在传统粒子群优化算法基础上应用最优拉丁超立方采样方法进行粒子群位置初始化,得益于最优拉丁超立方采样技术的空间填充的特性,初始粒子可以较为均匀有规律地分布在整个设计区域,在粒子寻优过程中可以寻到更优的采样点;通过动态调整惯性权重以及学习因子,平衡全局和局部的搜索能力,避免了算法容易陷入局部最优的问题;设计改进的PSO算法对最小二乘向量机(LSSVM)的核宽参数σ和正规化参数γ进行寻优,提高了LSSVM模型计算效率,改善了适应误差的最小化和平滑程度,采用PSO-LSSVM模型与自回归积分滑动平均模型(ARIMA)以及LSSVM模型对发动机后机身RCS序列进行预测,并将预测结果通过模型评价指标(平均绝对误差、均方根误差和平均绝对百分比误差)进行对比分析,结果表明:PSO-LSSVM模型预测结果相比其他2种模型的预测精度提高30%以上。 展开更多
关键词 雷达散射截面 K最近邻法 核密度估计 统计特性 最优拉丁超立方采样方法 粒子群优化算法
在线阅读 下载PDF
自适应稀疏感知密度峰值聚类算法
9
作者 李欣娅 何星星 任芮彬 《计算机系统应用》 2025年第2期195-205,共11页
密度峰值聚类(density peaks clustering,DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类.然而,该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心,需要人为设定类簇数量,并且其分配策略中... 密度峰值聚类(density peaks clustering,DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类.然而,该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心,需要人为设定类簇数量,并且其分配策略中一个数据点分配错误会导致后续点的错误分配.为了解决上述问题,本文提出一种自适应稀疏感知密度峰值聚类算法.首先,引入模糊点概念以降低对子簇合并过程的影响;其次,利用减法聚类方法识别低密度区域的中心;然后,根据新的局部密度和反向最近邻数来识别噪声并更新子簇中心;最后,给出改进的全局交叠度,结合全局可分度指导子簇融合,并在这些度量下自动确定聚类结果.实验结果表明,在合成数据集和UCI数据集上,与DPC及其改进算法相比,本文提出的算法能够更好地识别稀疏簇、减少非中心分配带来的连锁反应,自动确定最优类簇数目并获得更加准确的聚类结果. 展开更多
关键词 聚类分析 密度峰值 减法聚类方法 反向近邻 子簇融合
在线阅读 下载PDF
基于核密度与AHP的房建工程危险区域综合评估
10
作者 刘学 《建筑技术》 2025年第17期2132-2137,共6页
构建了一种融合ArcGIS核密度分析与层次分析法(AHP)的综合性建筑工程风险评估方法,旨在显著提升施工区域的安全性。该方法通过建立空间模型,利用ArcGIS系统对机械设备、施工环境与人员风险等多种因素进行地理分布分析,并引入相邻点平均... 构建了一种融合ArcGIS核密度分析与层次分析法(AHP)的综合性建筑工程风险评估方法,旨在显著提升施工区域的安全性。该方法通过建立空间模型,利用ArcGIS系统对机械设备、施工环境与人员风险等多种因素进行地理分布分析,并引入相邻点平均距离的核密度分析策略,以优化高风险区域识别的精准度。结合AHP赋予各风险因素的权重,研究结果显示,该方法能够动态且高效地识别高危区域,并提供智能化的决策支持。研究创新体现在对相邻点平均距离经验法的应用,强化了方法对局部密度变化的敏锐度,使其能够满足动态施工环境中对风险精细化控制的要求。本方法为建筑安全管理提供了先进的空间评估手段和可靠的数据支持。 展开更多
关键词 ARCGIS 核密度分析 层次分析法 相邻点平均距离经验法 风险评估
在线阅读 下载PDF
基于自适应阈值滤波和S-Method的穿墙人体动作识别 被引量:2
11
作者 王凡 刘丽 +2 位作者 徐航 李静霞 王冰洁 《电子器件》 CAS 北大核心 2021年第5期1265-1273,共9页
穿墙人体动作识别在武装反恐、城市巷战、灾害救援、病人监护等领域具有重要的应用价值。传统的基于短时傅里叶变换(Short-Time Fourier Transform,STFT)的时频分析方法时频分辨率低,不利于后期的分类识别。本文提出了一种基于自适应阈... 穿墙人体动作识别在武装反恐、城市巷战、灾害救援、病人监护等领域具有重要的应用价值。传统的基于短时傅里叶变换(Short-Time Fourier Transform,STFT)的时频分析方法时频分辨率低,不利于后期的分类识别。本文提出了一种基于自适应阈值滤波和S-Method的时频特征增强方法,用于墙后人体动作识别。该方法首先利用自适应阈值滤波消除时频图中的噪声,然后采用S-Method方法聚焦能量,提高时频特征,最后利用K最近邻(KNN)分类器对人体动作进行识别。利用频率步进穿墙雷达获取的实验数据进行方法验证,结果表明:相比于传统的STFT方法,本文所提出的方法对走、跑、坐、跳、招手以及原地踏步等6种典型动作的平均识别准确率更高,可达96.11%。 展开更多
关键词 人体动作识别 穿墙雷达 时频分析 自适应阈值滤波 S-method K最近邻值
在线阅读 下载PDF
k-NN METHOD IN PARTIAL LINEAR MODEL UNDER RANDOM CENSORSHIP 被引量:1
12
作者 QIN GENGSHENG (Department of Mathematics,Sichuan University, Chengdu 610064). 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 1995年第3期275-286,共12页
Consider the regression model Y=Xβ+ g(T) + e. Here g is an unknown smoothing function on [0, 1], β is a l-dimensional parameter to be estimated, and e is an unobserved error. When data are randomly censored, the est... Consider the regression model Y=Xβ+ g(T) + e. Here g is an unknown smoothing function on [0, 1], β is a l-dimensional parameter to be estimated, and e is an unobserved error. When data are randomly censored, the estimators βn* and gn*forβ and g are obtained by using class K and the least square methods. It is shown that βn* is asymptotically normal and gn* achieves the convergent rate O(n-1/3). 展开更多
关键词 Partial linear model censored data class K method k-nearest neighbor weights
在线阅读 下载PDF
2012—2022年山西省3A级以上景区空间分布特征及影响因素研究 被引量:5
13
作者 师永强 宋雪剑 +3 位作者 魏亚娟 耿巍 张新生 李话语 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期288-298,共11页
山西省具有丰富的旅游资源,但11个地市级旅游资源赋存和旅游经济发展不协调.以2012—2022年山西省3A级以上景区为研究对象,运用核密度估计分析、标准差椭圆、平均最近邻指数、不平衡指数和缓冲区分析等空间分析方法和数理统计分析方法,... 山西省具有丰富的旅游资源,但11个地市级旅游资源赋存和旅游经济发展不协调.以2012—2022年山西省3A级以上景区为研究对象,运用核密度估计分析、标准差椭圆、平均最近邻指数、不平衡指数和缓冲区分析等空间分析方法和数理统计分析方法,重点研究山西省3A级以上旅游景区的空间分布特征及其影响因素,从而为山西省合理有效地开发、配置旅游资源提供数据支撑.结果表明:(1)通过标准差椭圆和平均最近邻指数分析得出,山西省3A级以上旅游景区总体分布呈南北延伸,空间结构类型为集聚型,3A级以上旅游景区逐渐向晋南、晋东南发展;(2)通过核密度分析发现,各地级市3A级以上景区分布不均衡,景区空间分布密度区域有明显差异,高密度区域分布在太原市周边;(3)交通条件、城市等级、水系、地形地貌、经济水平均是影响3A级以上旅游景区空间分布的重要因素. 展开更多
关键词 3A级以上旅游景区 空间分布 最近邻距离法 影响因素 山西省
在线阅读 下载PDF
Precipitation Retrieval from Himawari-8 Satellite Infrared Data Based on Dictionary Learning Method and Regular Term Constraint 被引量:2
14
作者 Wang Gen Ding Conghui Liu Huilan 《Meteorological and Environmental Research》 CAS 2019年第3期61-65,68,共6页
In this paper,the application of an algorithm for precipitation retrieval based on Himawari-8 (H8) satellite infrared data is studied.Based on GPM precipitation data and H8 Infrared spectrum channel brightness tempera... In this paper,the application of an algorithm for precipitation retrieval based on Himawari-8 (H8) satellite infrared data is studied.Based on GPM precipitation data and H8 Infrared spectrum channel brightness temperature data,corresponding "precipitation field dictionary" and "channel brightness temperature dictionary" are formed.The retrieval of precipitation field based on brightness temperature data is studied through the classification rule of k-nearest neighbor domain (KNN) and regularization constraint.Firstly,the corresponding "dictionary" is constructed according to the training sample database of the matched GPM precipitation data and H8 brightness temperature data.Secondly,according to the fact that precipitation characteristics in small organizations in different storm environments are often repeated,KNN is used to identify the spectral brightness temperature signal of "precipitation" and "non-precipitation" based on "the dictionary".Finally,the precipitation field retrieval is carried out in the precipitation signal "subspace" based on the regular term constraint method.In the process of retrieval,the contribution rate of brightness temperature retrieval of different channels was determined by Bayesian model averaging (BMA) model.The preliminary experimental results based on the "quantitative" evaluation indexes show that the precipitation of H8 retrieval has a good correlation with the GPM truth value,with a small error and similar structure. 展开更多
关键词 Himawari-8(H8) RETRIEVAL of PRECIPITATION k-nearest neighbor (KNN) REGULAR TERM constraints DICTIONARY method Bayesian model average (BMA)
在线阅读 下载PDF
基于加权实例推理的缓倾斜综采工作面液压支架选型研究 被引量:4
15
作者 吴悦 张志伟 +2 位作者 桑文龙 刘佳音 何龙龙 《煤炭技术》 CAS 2024年第1期207-210,共4页
为实现地质构造简单的缓倾斜综采工作面液压支架智能化选型,提出了一种基于加权实例推理的液压支架选型方法。首先,建立了液压支架选型实例库;其次,采用粗糙集理论和序关系分析法进行权重构造;另外,将液压支架的条件属性分为3种类型计... 为实现地质构造简单的缓倾斜综采工作面液压支架智能化选型,提出了一种基于加权实例推理的液压支架选型方法。首先,建立了液压支架选型实例库;其次,采用粗糙集理论和序关系分析法进行权重构造;另外,将液压支架的条件属性分为3种类型计算相似度;最后通过匹配实例选型。以某煤矿选型方案为例,并以50组液压支架的属性数据进行验证。结果表明,该方法的准确率为88%,能够为液压支架的智能化选型提供较好的参考依据。 展开更多
关键词 液压支架 实例推理 粗糙集 序关系分析法 最邻近算法
原文传递
孝感市院前急救医疗服务空间可及性研究 被引量:5
16
作者 舒成 柯卫泽 +8 位作者 杨海霞 张婷 舒敏 郑欢欢 李平 彭忠红 徐磊 郑立莹 王芬 《中国急救复苏与灾害医学杂志》 2024年第1期38-41,共4页
目的 探究孝感市院前急救医疗服务的可及性特征,为优化有限急救医疗资源配置提供依据。方法 以孝感市内2020年所有提供院前急救医疗服务的急救站为供方,孝感市内所有人口为需方。采用最短路径分析计算所有供方急救医疗服务设施点到达需... 目的 探究孝感市院前急救医疗服务的可及性特征,为优化有限急救医疗资源配置提供依据。方法 以孝感市内2020年所有提供院前急救医疗服务的急救站为供方,孝感市内所有人口为需方。采用最短路径分析计算所有供方急救医疗服务设施点到达需方的最短到达时间。结果 孝感市院前急救医疗服务平均最短到达时间为46.32 min,覆盖人口为80%的平均最短到达时间为66.08 min,98.53%人口可在2 h内获得院前急救医疗服务。在各辖区中,孝南区院前急救平均最短到达时间最短为6.48 min,大悟县最长为85.38 min。结论 孝感市的院前急救医疗服务的空间可及性较差,内部各辖区可及性存在较大差异。相较于其他各县(市),医疗资源丰富、人口密集的孝南区院前急救医疗服务可及性较好。对院前急救资源空间可及性较为薄弱的区域,实施合理布局增设院前急救医疗服务机构、增强交通网络等综合策略,可改善院前急救医疗服务可及性。 展开更多
关键词 空间可及性 院前急救医疗服务 最短路径法
暂未订购
基于最优近邻的局部保持投影方法 被引量:1
17
作者 赵俊涛 李陶深 卢志翔 《计算机工程》 CAS CSCD 北大核心 2024年第9期161-168,共8页
局部保持投影(LPP)方法是机器学习领域中一种经典的降维方法。然而LPP方法以及部分改进方法在构建数据的局部结构时简单地使用k最近邻(k-NN)分类算法寻找样本的近邻点,容易受到参数k、噪声和异常值的影响。为了解决上述问题,提出一种基... 局部保持投影(LPP)方法是机器学习领域中一种经典的降维方法。然而LPP方法以及部分改进方法在构建数据的局部结构时简单地使用k最近邻(k-NN)分类算法寻找样本的近邻点,容易受到参数k、噪声和异常值的影响。为了解决上述问题,提出一种基于最优近邻的LPP方法。该方法使用寻找最优近邻算法,在找到样本近邻点后,进一步选择与样本有一定数量的共同近邻点的近邻样本作为最优近邻,通过共同近邻点的限定来选择与样本最相似的近邻,增强近邻样本间的相关性,避免了传统LPP方法受参数k影响大等问题。在选择出足够的样本最优近邻后,构建数据局部结构,以便准确地反映数据的本质结构特征,使降维后的数据能最大程度保留样本的有效信息,提升后续机器学习模型的性能。公共图像数据集上的对比实验结果表明,该方法具有较好的数据降维效果,有效地提高了图像识别准确率。 展开更多
关键词 局部保持投影方法 最优近邻 近邻样本 降维 特征提取
在线阅读 下载PDF
数据驱动的出口管熔模铸件夹杂预测与工艺优化
18
作者 李天佑 王玉 +4 位作者 计效园 余朋 常玎凯 殷亚军 周建新 《特种铸造及有色合金》 CAS 北大核心 2024年第11期1441-1446,共6页
提出了基于BP神经网络与改进粒子群算法的夹杂预测与工艺优化方法。首先,基于华铸ERP系统进行数据挖掘及清洗;其次,建立结合粒子群算法与BP神经网络的缺陷预测模型(Particle Swarm Optimization-Back Propagation,PSO-BP),相比普通BP神... 提出了基于BP神经网络与改进粒子群算法的夹杂预测与工艺优化方法。首先,基于华铸ERP系统进行数据挖掘及清洗;其次,建立结合粒子群算法与BP神经网络的缺陷预测模型(Particle Swarm Optimization-Back Propagation,PSO-BP),相比普通BP神经网络,精度由92.1%提升至94.7%;最后,提出结合K近邻插补法与改进粒子群算法的工艺优化方法(K-Nearest Neighbors Imputation-Improved Particle Swarm Optimization,KNN-IPSO)。经模拟验证,相比生产前工艺在不同扰动下优化算法的缺陷率分别降低了52%和40%。 展开更多
关键词 熔模铸件 BP神经网络 改进粒子群算法 K近邻插补法
原文传递
改进的邻近加权合成过采样技术 被引量:1
19
作者 邢胜 王晓兰 +3 位作者 沈家星 朱美玲 曹永青 何玉林 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第6期748-755,共8页
针对邻近加权合成过采样技术(proximity weighted synthetic oversampling technique,ProWSyn)在合成样例时未删除噪声样例,且当平滑因子在[0,1]区间取值时,权重比例难以覆盖整个搜索空间的缺陷,提出一种改进的邻近加权合成过采样技术(i... 针对邻近加权合成过采样技术(proximity weighted synthetic oversampling technique,ProWSyn)在合成样例时未删除噪声样例,且当平滑因子在[0,1]区间取值时,权重比例难以覆盖整个搜索空间的缺陷,提出一种改进的邻近加权合成过采样技术(improved proximity weighted synthetic oversampling technique,IProWSyn).改变权重的计算策略,引入底数为(0,1]的普通指数函数,通过动态改变底数令权重覆盖更大范围的搜索空间,进而找到更优的权重.将IProWSyn、ASN-SMOTE和ProWSyn应用在非平衡数据集ada、ecoli1、glass1、haberman、Pima和yeast1上,再使用k近邻(k-nearest neighbors,kNN)分类器和神经网络分类器检验方法的有效性.实验结果表明,在多数数据集上IProWSyn的F1、几何平均值(geometric mean,G-mean)和曲线下面积(area under curve,AUC)指标性能都高于其他过采样方法.IProWSyn过采样技术在这些数据集的综合分类效果更好,有更好的泛化表现. 展开更多
关键词 人工智能 非平衡数据 邻近加权合成过采样技术 过采样方法 K近邻分类器 神经网络
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部