期刊文献+
共找到343篇文章
< 1 2 18 >
每页显示 20 50 100
Nearest neighbor vector analysis of SDSS DR5 galaxy distribution
1
作者 Yongfeng Wu Weike Xiao +2 位作者 Rongjun Mu David Batuski Andre Khalil 《Natural Science》 2013年第1期47-51,共5页
We present the nearest neighbor distance (NND) analysis of SDSS DR5 galaxies. We give NND results for observed, mock and random sample, and discuss the differences. We find the observed sample gives us a significantly... We present the nearest neighbor distance (NND) analysis of SDSS DR5 galaxies. We give NND results for observed, mock and random sample, and discuss the differences. We find the observed sample gives us a significantly stronger aggregation characteristic than the random samples. Moreover, we investigate the direction of NND and find the direction has close relation with the size of the NND for the observed sample. 展开更多
关键词 nearest neighbor Distance nearest neighbor vector ANISOTROPY SDSS DR5 GALAXY DISTRIBUTION
在线阅读 下载PDF
Face Recognition Based on Support Vector Machine and Nearest Neighbor Classifier 被引量:7
2
作者 Zhang Yankun & Liu Chongqing Institute of Image Processing and Pattern Recognition, Shanghai Jiao long University, Shanghai 200030 P.R.China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2003年第3期73-76,共4页
Support vector machine (SVM), as a novel approach in pattern recognition, has demonstrated a success in face detection and face recognition. In this paper, a face recognition approach based on the SVM classifier with ... Support vector machine (SVM), as a novel approach in pattern recognition, has demonstrated a success in face detection and face recognition. In this paper, a face recognition approach based on the SVM classifier with the nearest neighbor classifier (NNC) is proposed. The principal component analysis (PCA) is used to reduce the dimension and extract features. Then one-against-all stratedy is used to train the SVM classifiers. At the testing stage, we propose an al- 展开更多
关键词 Face recognition Support vector machine nearest neighbor classifier Principal component analysis.
在线阅读 下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:15
3
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC K-nearest-neighbor Neural Networks Random Forest Support vector Machines
在线阅读 下载PDF
Support Vector Machine-Based Fault Diagnosis of Power Transformer Using k Nearest-Neighbor Imputed DGA Dataset 被引量:4
4
作者 Zahriah Binti Sahri Rubiyah Binti Yusof 《Journal of Computer and Communications》 2014年第9期22-31,共10页
Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting inc... Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting incipient faults in power transformers is one of the casualties. Thus, this paper proposes filling-in the missing values found in a DGA dataset using the k-nearest neighbor imputation method with two different distance metrics: Euclidean and Cityblock. Thereafter, using these imputed datasets as inputs, this study applies Support Vector Machine (SVM) to built models which are used to classify transformer faults. Experimental results are provided to show the effectiveness of the proposed approach. 展开更多
关键词 MISSING VALUES Dissolved Gas Analysis Support vector Machine k-nearest neighborS
在线阅读 下载PDF
机载激光点云数据滤波下尾矿坝位移变形监测
5
作者 赵国强 《有色金属(矿山部分)》 2026年第1期49-55,共7页
尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载... 尾矿坝作为矿业生产的核心设施,其稳定性对矿山安全及周边环境具有重要影响。受表面植被覆盖和复杂地形影响,机载激光点云数据在采集过程中常面临密度不均及多尺度噪声干扰的问题,导致传统方法在形变估计时出现偏差。因此,提出基于机载激光点云数据滤波的尾矿坝位移变形监测方法,通过K邻近搜索算法建立空间索引以划分多尺度噪声,并引入空间距离权重与几何相似性权重的双重约束机制,结合双边滤波算法有效抑制噪声干扰。同时,采用对象分割技术将监测区域划分为3D网格单元,实现尾矿坝水平变形与垂直沉降的高精度监测。结果表明,该方法在水平变形和垂直沉降监测中的平均绝对误差显著减小,位移速率波动率低,最大误差仅0.4%,为尾矿坝全生命周期安全提供了毫米级感知能力。相较于传统DS-InSAR技术和时序分解模型,本研究方法在复杂植被覆盖和地形起伏区域表现出更高的监测精度和稳定性,尤其适用于尾矿坝长期安全预警及动态管理场景。 展开更多
关键词 尾矿坝位移变形 双边滤波算法 K邻近搜索算法 法向量夹角 三维单元分割
在线阅读 下载PDF
Improved scheme to accelerate support vector regression 被引量:1
6
作者 Zhao Yongping Sun Jianguo 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第5期1086-1090,共5页
The computational cost of support vector regression in the training phase is O (N^3), which is very expensive for a large scale problem. In addition, the solution of support vector regression is of parsimoniousness,... The computational cost of support vector regression in the training phase is O (N^3), which is very expensive for a large scale problem. In addition, the solution of support vector regression is of parsimoniousness, which has relation to a part of the whole training data set. Hence, it is reasonable to reduce the training data set. Aiming at the scheme based on k-nearest neighbors to reduce the training data set with the computational complexity O (kMN^2), an improved scheme is proposed to accelerate the reducing phase, which cuts down the computational complexity from O (kMN^2) to O (MN^2). Finally, experimental results on benchmark data sets validate the effectiveness of the improved scheme. 展开更多
关键词 support vector regression parsimoniousness k-nearest neighbors computational complexity.
在线阅读 下载PDF
AN EFFICIENT FAST ENCODING ALGORITHM FOR VECTOR QUANTIZATION 被引量:1
7
作者 徐润生 陆哲明 +1 位作者 许晓鸣 张卫东 《Journal of Shanghai Jiaotong university(Science)》 EI 2000年第2期23-27,32,共6页
A fast encoding algorithm was presented which made full use of two characteristics of a vector, its sum and variance. In this paper, a vector was separated into two subvectors, one is the first half of the coordinates... A fast encoding algorithm was presented which made full use of two characteristics of a vector, its sum and variance. In this paper, a vector was separated into two subvectors, one is the first half of the coordinates and the other contains the remaining coordinates. Three inequalities based on the characteristics of the sums and variances of a vector and its two subvectors were introduced to reject those codewords which are impossible to be the nearest codeword. The simulation results show that the proposed algorithm is faster than the improved equal average eaual variance nearest neighbor search (EENNS) algorithm. 展开更多
关键词 vector QUANTIZATION nearest neighbor SEARCH equal AVERAGE nearest neighbor SEARCH ALGORITHM equal AVERAGE equal variance nearest neighbor SEARCH ALGORITHM Document code:A
在线阅读 下载PDF
基于机器学习的30%TBP/煤油-硝酸体系中主要组分的分配比预测研究 被引量:2
8
作者 于婷 张音音 +6 位作者 张睿志 金文蕾 罗应婷 朱升峰 何辉 叶国安 龚禾林 《原子能科学技术》 北大核心 2025年第1期14-23,共10页
为最优化后处理过程的实验条件、优化工艺、降低实验成本和时间,并提高后处理流程数学模拟的准确性,本文基于随机森林、支持向量回归和K近邻这3种经典的机器学习算法建立了30%TBP/煤油-硝酸体系中主要组分铀、钚、硝酸的分配比数学模型... 为最优化后处理过程的实验条件、优化工艺、降低实验成本和时间,并提高后处理流程数学模拟的准确性,本文基于随机森林、支持向量回归和K近邻这3种经典的机器学习算法建立了30%TBP/煤油-硝酸体系中主要组分铀、钚、硝酸的分配比数学模型,并基于不同数据集进行了超参数优化和模型训练。通过对模型进行验证和测试,发现采用随机森林算法建立的分配比模型准确度最高,其对铀预测的平均绝对相对误差达7.73%,较传统方法提高了约7%。与传统建模方法相比,机器学习方法建立模型的准确度更高。 展开更多
关键词 分配比数学模型 随机森林 支持向量回归 K近邻
在线阅读 下载PDF
基于加速意图的发动机无力故障诊断方法
9
作者 徐洪胜 冯立 +1 位作者 高苏萌 王梦芸 《湖北汽车工业学院学报》 2025年第2期41-46,共6页
针对商用车发动机无力故障诊断高成本与低效率的问题,提出了一种诊断框架。分析商用车运行数据并结合现场试车的试验原理,构建反映加速意图的数据集,将加速意图分为轻度、中度和急加速3种类型;采用K近邻和支持向量机算法,对3种加速意图... 针对商用车发动机无力故障诊断高成本与低效率的问题,提出了一种诊断框架。分析商用车运行数据并结合现场试车的试验原理,构建反映加速意图的数据集,将加速意图分为轻度、中度和急加速3种类型;采用K近邻和支持向量机算法,对3种加速意图建立无力故障诊断模型。相较于未区分加速意图的方法,文中诊断模型的准确率分别提升了12.4%、18.6%和21.9%。 展开更多
关键词 发动机无力故障 故障诊断 加速意图 K近邻法 支持向量机
在线阅读 下载PDF
基于机器学习的冠心病风险预测模型构建与比较 被引量:3
10
作者 岳海涛 何婵婵 +3 位作者 成羽攸 张森诚 吴悠 马晶 《中国全科医学》 CAS 北大核心 2025年第4期499-509,共11页
背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目... 背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目的探索冠心病的影响因素,通过使用2种平衡数据的方法,基于5种算法建立冠心病风险相关的预测模型,比较这5种模型对冠心病风险的预测价值。方法基于2021年美国国家行为风险因素监测系统(BRFSS)横断面调查数据筛选出112606名研究对象的健康相关风险行为、慢性健康状况等24个变量信息,结局指标为自我报告是否患有冠心病并据此分为冠心病组和非冠心病组。通过进行单因素分析和逐步Logistic回归分析探索冠心病发生的影响因素并筛选出纳入预测模型的变量。随机抽取112606名受访者的10%(共计11261名),以8∶2的比例随机划分为训练与测试的数据集,采用随机过采样和合成少数过采样技术(SMOTE)两种过采样的方法处理不平衡数据,基于k最邻近算法(KNN)、Logistic回归、支持向量机(SVM)、决策树和XGBoost算法分别建立冠心病预测模型。结果两组年龄、性别、BMI、种族、婚姻状态、教育水平、收入水平、家里有几个孩子、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者、过去30 d内是否有体育锻炼、心理健康状况以及自我健康评价比较,差异有统计学意义(P<0.05)。逐步Logistic回归分析结果显示:年龄、性别、BMI、种族、教育水平、收入水平、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者以及自我健康评价为冠心病的影响因素(P<0.05)。风险模型构建的分析结果显示:k最邻近算法、Logistic回归、支持向量机、决策树和XGBoost采用SMOTE处理不平衡数据的总体分类精度分别为59.2%、67.4%、66.2%、69.2%和85.9%,召回率分别为75.2%、71.4%、70.5%、62.9%和34.8%,精确度分别为15.4%、18.2%、17.5%、17.6%和28.7%,F值分别为0.256、0.290、0.280、0.275和0.315,受试者工作特征曲线下面积分别为0.80、0.78、0.72、0.72和0.82;采用随机过采样处理不平衡数据的总体分类精度分别为62.5%、68.5%、69.0%、60.2%和70.1%,召回率分别为70.0%、69.5%、71.9%、69.0%和67.6%;精确度分别为15.8%、18.4%、19.1%、14.8%和19.0%,F值分别为0.258、0.291、0.302、0.244和0.297,受试者工作特征曲线下面积分别为0.80、0.77、0.72、0.72和0.83。结论本研究不仅确认了已知冠心病的影响因素,还发现了自我健康评价水平、收入水平和教育水平对冠心病具有潜在影响。在使用2种数据平衡方法后,5种算法的性能显著提高。其中XGBoost模型表现最佳,可作为未来优化冠心病预测模型的参考。此外,鉴于XGBoost模型的优异性能以及逐步Logistic回归的操作便捷和可解释性,推荐在冠心病风险预测模型中结合使用数据平衡后的XGBoost和逐步Logistic回归分析。 展开更多
关键词 冠心病 机器学习 风险预测模型 LOGISTIC回归 k最邻近算法 支持向量机 决策树 XGBoost
暂未订购
基于机器学习的女性压力性尿失禁发病风险预测模型建立及效能评价 被引量:3
11
作者 时欣然 庞震 +2 位作者 乔婷 李晶晶 王勤章 《现代泌尿外科杂志》 2025年第3期196-206,共11页
目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及... 目的运用K最近邻法(KNN)、支持向量机(SVM)、决策树(DT)及随机森林(RF)构建女性压力性尿失禁(SUI)发病的预测模型,并评估各模型效能,为SUI的早期诊断提供参考。方法回顾性分析2019年10月—2023年10月石河子大学第一附属医院泌尿外科及妇产科治疗的女性SUI患者及同期行健康查体女性的临床资料,将产后42 d女性纳入产后组(n=611),围绝经期与绝经后女性纳入非产后组(n=409)。设置随机种子数并以7∶3的比例分为训练集与验证集。收集所有研究对象的相关临床资料,使用单因素及Lasso回归筛选有意义的变量,将其纳入KNN、SVM、DT及RF算法中并构建模型,分别计算模型的敏感度、特异度、准确度、曲线下面积(AUC)等,筛选出最优的模型。结果产后组SUI患者为352例,占57.6%。根据单因素及Lasso回归,产后组筛选出有意义的变量为:年龄、身体质量指数(BMI)、快肌阶段最大值、孕次、膀胱颈移动度(BND)、尿道旋转角(URA)、会阴侧切、既往尿失禁史及便秘。在产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.881、0.878、0.750、0.905,RF模型的AUC、准确度、F1指数及Kappa值均最大。非产后组SUI患者为260例,占63.6%。根据单因素及Lasso回归,非产后组筛选出有意义的变量为:年龄、BMI、快肌阶段最大值及恢复时间、慢肌阶段平均值、后静息阶段变异性、阴道分娩、既往尿失禁史及便秘。在非产后组验证集中KNN、SVM、DT、RF模型的AUC分别为0.819、0.805、0.603、0.830,RF模型的AUC、准确度、Kappa值均最大。结论本研究基于机器学习成功建立4种产后42 d女性,围绝经期及绝经后女性SUI发病的预测模型,其中采用RF算法的模型预测效率最佳。 展开更多
关键词 压力性尿失禁 预测模型 机器学习 决策树 随机森林 支持向量机 K最近邻法
暂未订购
基于医疗大数据结合人工智能算法在呼吸机故障识别与预防性维护中的应用 被引量:4
12
作者 宫昕晨 温林 《中国医疗设备》 2025年第3期41-48,共8页
目的提出一种基于粒子群优化(Particle Swarm Optimization,PSO)算法和反向传播(Back Propagation,BP)神经网络模型的呼吸机故障识别与预防性维护策略,旨在提高呼吸机设备管理、维修水平,为呼吸机预防性维护提供参考。方法选取2017—202... 目的提出一种基于粒子群优化(Particle Swarm Optimization,PSO)算法和反向传播(Back Propagation,BP)神经网络模型的呼吸机故障识别与预防性维护策略,旨在提高呼吸机设备管理、维修水平,为呼吸机预防性维护提供参考。方法选取2017—2023年我院使用的呼吸机日常质量控制数据、临床使用数据、环境数据等多模态数据为研究对象,介绍PSO算法,建立粒子群优化-反向传播(PSO-BP)模型,同时引入K近邻(K-Nearest Neighbor Classification,KNN)模型、支持向量机(Support Vector Machine,SVM)模型以及极端梯度提升(eXtreme Gradient Boosting,XGBoost)模型作为对比模型,并选择准确度(Accuracy,ACC)、精准度(Precision,PRE)、召回率、F1得分以及曲线下面积(Area Under Curve,AUC)对模型进行评价。结果训练后的PSO-BP模型ACC、PRE、召回率、F1得分及AUC值分别为90.05%、91.00%、89.30%、0.90以及0.88;相对于KNN、SVM、XGBoost以及BP模型,PSO-BP模型识别ACC分别提高了6.64%、4.50%、3.32%、7.35%;召回率、F1得分及AUC值在一定程度上也得到了提高。模型最优阈值为0.6768,呼吸机安全区、稳定区、危险区以及高危区区间分别为[0,0.3384]、(0.3384,0.6768]、(0.6768,0.8384]、(0.8384,1.0000]。结论通过高通量医疗大数据建立的PSO-BP模型可有效识别呼吸机故障,并可使用定量数据为呼吸机预防性维护提供参考,具有一定的理论和实际应用意义。 展开更多
关键词 PSO-BP模型 故障识别 预防性维护 K近邻模型 支持向量机 极端梯度提升 高通量数据
在线阅读 下载PDF
特征提取和筛选下低速制动颤振的评价
13
作者 李天舒 靳畅 +1 位作者 李阳 姜天宇 《振动.测试与诊断》 北大核心 2025年第1期39-44,198,共7页
针对汽车低速制动时的蠕动颤振表现主要依靠人工主观评价,存在成本高、耗时长、易受人员主观性影响等问题,提出了一种基于机器学习模型的智能评价方法。首先,研究并提取了颤振信号的特征;其次,采用支持向量机(support vector machine,简... 针对汽车低速制动时的蠕动颤振表现主要依靠人工主观评价,存在成本高、耗时长、易受人员主观性影响等问题,提出了一种基于机器学习模型的智能评价方法。首先,研究并提取了颤振信号的特征;其次,采用支持向量机(support vector machine,简称SVM)和K近邻算法(K nearest neighbors,简称KNN)2种机器学习模型进行制动颤振的智能评价;然后,提出基于概率密度特征的特征排序与筛选算法,将特征从39维筛选至11维,以提高机器学习模型的准确率;最后,通过对比试验发现,经过特征筛选后的训练机器学习模型SVM和KNN的准确率分别从72.5%和68.75%提升到了86.25%和87.5%。试验结果表明,提出的特征提取和基于概率密度的特征筛选方法在对蠕动颤振评价上具有较高的有效性。 展开更多
关键词 制动颤振 特征提取 特征排序 特征筛选 支持向量机 K近邻
在线阅读 下载PDF
一种识别和检测人工智能生成文本的算法 被引量:3
14
作者 王雨欣 刘柯飞 +1 位作者 李雪莲 王红军 《电讯技术》 北大核心 2025年第3期378-384,共7页
针对目前人工智能(Artificial Intelligence,AI)生成文本的滥用导致的学术不端、侵犯版权、隐私保护和舆情监控等问题,提出了一种基于自然语言处理的AI生成文本的识别和检测算法。该算法首先采用Word2vec方法中的连续词袋模型将文本词... 针对目前人工智能(Artificial Intelligence,AI)生成文本的滥用导致的学术不端、侵犯版权、隐私保护和舆情监控等问题,提出了一种基于自然语言处理的AI生成文本的识别和检测算法。该算法首先采用Word2vec方法中的连续词袋模型将文本词转换成词向量,并将词向量累加获得文本向量。随后利用softmax函数获取文本向量的概率分布,通过统计可视化分析AI生成文本的基本规律,并采用余弦相似性来判断文本类型。其次采用支持向量机递归特征消除算法判断文本是否由AI生成,通过K-近邻算法对文本重生成次数进行判断,进一步细化了文本检测的粒度。通过仿真实验验证了算法的有效性,结果显示算法识别准确率达80%及以上。 展开更多
关键词 AI生成文本检测 文本向量 余弦相似性 支持向量机(SVM) K-近邻(KNN)算法
在线阅读 下载PDF
基于群智能优化的SVM-KNN人脸识别方法研究
15
作者 雷光政 乔建华 +1 位作者 马调花 张雄 《太原科技大学学报》 2025年第6期516-521,共6页
单纯的支持向量机(SVM)对于人脸图像识别率并不高,并且无法快速地处理特征向量维数过高时的人脸图片,因此提出了基于粒子群算法(PSO)改进的SVM-KNN算法,该方法首先提取人脸图片的特征系数,然后利用PSO优化SVM分类器参数,用径向基(RBF)... 单纯的支持向量机(SVM)对于人脸图像识别率并不高,并且无法快速地处理特征向量维数过高时的人脸图片,因此提出了基于粒子群算法(PSO)改进的SVM-KNN算法,该方法首先提取人脸图片的特征系数,然后利用PSO优化SVM分类器参数,用径向基(RBF)函数作为核函数,优化SVM惩罚参数C与核半径参数g,最后结合KNN算法进行分类识别。该方法在ORL人脸库中识别率达到99.40%,在Yale人脸库中识别率达到96.80%,且处理速度也优于常用的其它方法,表明该方法的有效性。 展开更多
关键词 主成分分析 支持向量机 K近邻算法 粒子群算法 人脸识别
在线阅读 下载PDF
基于因子分析的岩性识别智能模型对比
16
作者 何俊杰 李谦 +2 位作者 李同意 魏思维 姜杰 《钻探工程》 2025年第S1期105-111,共7页
岩性识别是钻探中十分重要的环节,传统岩性识别方法耗时较长且准确率较低,基于机器学习的智能岩性识别可以有效加快岩性识别的效率,准确率更高,泛化能力更强。本文以实现基于钻进参数的智能岩性识别预测为目标,使用逻辑回归、支持向量机... 岩性识别是钻探中十分重要的环节,传统岩性识别方法耗时较长且准确率较低,基于机器学习的智能岩性识别可以有效加快岩性识别的效率,准确率更高,泛化能力更强。本文以实现基于钻进参数的智能岩性识别预测为目标,使用逻辑回归、支持向量机、K近邻算法、随机森林、神经网络5种算法,先对原始数据进行预处理,然后对地层参数和其他参数进行因子分析、降维处理,建立了以钻进参数矩阵为输入,岩性分类识别和地层参数预测为输出的岩性智能识别模型,实现了钻遇地层的智能预测。实验表明,5种算法下岩性识别在测试集上的准确率和F1分数大部分达到70%以上,个别算法准确率较低但也在60%左右,5个模型地层参数预测的指标MAE和RMSE大部分都在1之下,识别预测准确。 展开更多
关键词 岩性识别 因子分析 机器学习 人工智能建模 逻辑回归 SVM支持向量机 K近邻算法 随机森林 神经网络
在线阅读 下载PDF
基于数据包络分析的互联网医院智慧分级诊疗服务系统
17
作者 邹双忆 《自动化技术与应用》 2025年第5期173-177,共5页
为了缓解医疗资源紧张的问题,研究设计面向互联网医院的分级诊疗服务系统。首先采用数据包络分析来对互联网医院的医疗资源配置情况进行分析,再设计面向诊疗服务系统的集成分类模型,该集成分类模型涉及三种基分类器。最后在区块链技术... 为了缓解医疗资源紧张的问题,研究设计面向互联网医院的分级诊疗服务系统。首先采用数据包络分析来对互联网医院的医疗资源配置情况进行分析,再设计面向诊疗服务系统的集成分类模型,该集成分类模型涉及三种基分类器。最后在区块链技术的支持下设计了医疗联盟体系和分级诊疗服务系统。结果显示,集成分类模型在训练集和测试集上的准确率最大值分别为70.89%和70.04%,所设计系统转诊模块的响应时间和中央处理器占用率的最大值分别为147 ms和16.7%,具有良好的性能,为缓解医疗资源紧张提供技术支持。 展开更多
关键词 数据包络分析 分级诊疗 KNN SVM CART决策树
在线阅读 下载PDF
基于特征工程和机器学习的高熵合金相结构预测
18
作者 熊夏轩 邓吨英 +1 位作者 文瀚庆 仝永刚 《机械工程材料》 北大核心 2025年第8期108-113,共6页
通过数据筛选去除不合理及冗余数据,获得788个高熵合金数据集,总结了13个预测相结构的特征参数并采用皮尔逊相关系数法去除冗余,采用去除特征法确定特征输入模型的顺序与数量,对比正则化、稳健标准化、极差归一化、标准差标准化4种特征... 通过数据筛选去除不合理及冗余数据,获得788个高熵合金数据集,总结了13个预测相结构的特征参数并采用皮尔逊相关系数法去除冗余,采用去除特征法确定特征输入模型的顺序与数量,对比正则化、稳健标准化、极差归一化、标准差标准化4种特征数据集标准化预处理方法,对比随机森林、支持向量机和最近邻回归3种算法,通过交叉验证,确定最佳预处理方法和算法,建立机器学习模型,并采用该模型预测高熵合金相结构。结果表明:综合考虑模型精度与效率,选取熔点标准差、价电子浓度标准差、原子半径差、混合熵、合金组成元素熔点平均值、价电子浓度、混合焓、电负性差、平均原子半径作为特征集,并以该顺序输入模型;最佳特征数据集预处理方法为标准差标准化,最佳算法为随机森林算法,构建的模型预测金属间化合物、无定形相、面心立方相、体心立方相的精度分别为95%,89%,88%,90%,预测面心立方+体心立方复合相、体心立方相+金属间化合物混合物的精度在76%左右,精度总体较高,验证了模型的泛化能力。 展开更多
关键词 机器学习 高熵合金 特征工程 相结构 随机森林 支持向量机 最近邻回归
在线阅读 下载PDF
结合遗传算法和集成学习的信用卡财务欺诈交易检测
19
作者 薛明香 《贵阳学院学报(自然科学版)》 2025年第1期81-86,91,共7页
随着数字化和信息化技术的发展,线上金融交易已被广泛应用。随之而来的欺诈交易也为金融机构和企业的财产安全带来了巨大威胁,迫切需要有效的检测方法,特别是检测信用卡欺诈对于识别和防止未经授权的交易至关重要。为此,提出了集合遗传... 随着数字化和信息化技术的发展,线上金融交易已被广泛应用。随之而来的欺诈交易也为金融机构和企业的财产安全带来了巨大威胁,迫切需要有效的检测方法,特别是检测信用卡欺诈对于识别和防止未经授权的交易至关重要。为此,提出了集合遗传算法和学习的欺诈交易检测方法。首先,通过欠采样和合成少数过采样(SMOTE)技术,解决信用卡数据集的数据不平衡问题。其次,所提方法智能地结合了多种算法,包括随机森林(RF)、K最近邻(KNN)和多层感知器(MLP)分类器,并通过遗传算法(GA)进行适当的加权优化,以增强欺诈识别能力。在公开信用卡交易数据集上的实验结果表明,所提集成模型在精度、召回率和F1得分等指标上均取得了比已有机器学习方法和单个分类器更好的性能,证明了集成学习方法在欺诈交易检测中的有效性。 展开更多
关键词 欺诈交易检测 遗传算法 集成学习 合成过采样 支持向量机 K最近邻 多层感知器
在线阅读 下载PDF
基于K最近邻算法的网络舆情信息自动摘要方法
20
作者 侯国辉 《计算机应用文摘》 2025年第12期174-176,共3页
针对现有摘要生成方法难以准确捕捉网络舆情关键信息的问题,文章提出一种基于K最近邻算法的网络舆情信息自动摘要方法,首先通过文本向量化将舆情信息转化为计算机可识别的文本向量,然后计算文本间的夹角余弦值以确定内容相似度。基于相... 针对现有摘要生成方法难以准确捕捉网络舆情关键信息的问题,文章提出一种基于K最近邻算法的网络舆情信息自动摘要方法,首先通过文本向量化将舆情信息转化为计算机可识别的文本向量,然后计算文本间的夹角余弦值以确定内容相似度。基于相似度计算结果,采用K最近邻算法选取K个最相似的已知类别文本,并根据其标签确定文本类别。最后,从各类别中提取最具代表性的关键信息,整合生成连贯的摘要文本。实验结果表明,该方法能有效处理海量网络舆情信息,显著提升了信息处理的效率和准确性。 展开更多
关键词 K最近邻算法 网络舆情 自动摘要 特征向量 样本分类
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部