期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
MAIPFE:An Efficient Multimodal Approach Integrating Pre-Emptive Analysis,Personalized Feature Selection,and Explainable AI
1
作者 Moshe Dayan Sirapangi S.Gopikrishnan 《Computers, Materials & Continua》 SCIE EI 2024年第5期2229-2251,共23页
Medical Internet of Things(IoT)devices are becoming more and more common in healthcare.This has created a huge need for advanced predictive health modeling strategies that can make good use of the growing amount of mu... Medical Internet of Things(IoT)devices are becoming more and more common in healthcare.This has created a huge need for advanced predictive health modeling strategies that can make good use of the growing amount of multimodal data to find potential health risks early and help individuals in a personalized way.Existing methods,while useful,have limitations in predictive accuracy,delay,personalization,and user interpretability,requiring a more comprehensive and efficient approach to harness modern medical IoT devices.MAIPFE is a multimodal approach integrating pre-emptive analysis,personalized feature selection,and explainable AI for real-time health monitoring and disease detection.By using AI for early disease detection,personalized health recommendations,and transparency,healthcare will be transformed.The Multimodal Approach Integrating Pre-emptive Analysis,Personalized Feature Selection,and Explainable AI(MAIPFE)framework,which combines Firefly Optimizer,Recurrent Neural Network(RNN),Fuzzy C Means(FCM),and Explainable AI,improves disease detection precision over existing methods.Comprehensive metrics show the model’s superiority in real-time health analysis.The proposed framework outperformed existing models by 8.3%in disease detection classification precision,8.5%in accuracy,5.5%in recall,2.9%in specificity,4.5%in AUC(Area Under the Curve),and 4.9%in delay reduction.Disease prediction precision increased by 4.5%,accuracy by 3.9%,recall by 2.5%,specificity by 3.5%,AUC by 1.9%,and delay levels decreased by 9.4%.MAIPFE can revolutionize healthcare with preemptive analysis,personalized health insights,and actionable recommendations.The research shows that this innovative approach improves patient outcomes and healthcare efficiency in the real world. 展开更多
关键词 predictive health modeling Medical Internet of Things explainable artificial intelligence personalized feature selection preemptive analysis
在线阅读 下载PDF
MultiDMet: Designing a Hybrid Multidimensional Metrics Framework to Predictive Modeling for Performance Evaluation and Feature Selection
2
作者 Tesfay Gidey Hailu Taye Abdulkadir Edris 《Intelligent Information Management》 2023年第6期391-425,共35页
In a competitive digital age where data volumes are increasing with time, the ability to extract meaningful knowledge from high-dimensional data using machine learning (ML) and data mining (DM) techniques and making d... In a competitive digital age where data volumes are increasing with time, the ability to extract meaningful knowledge from high-dimensional data using machine learning (ML) and data mining (DM) techniques and making decisions based on the extracted knowledge is becoming increasingly important in all business domains. Nevertheless, high-dimensional data remains a major challenge for classification algorithms due to its high computational cost and storage requirements. The 2016 Demographic and Health Survey of Ethiopia (EDHS 2016) used as the data source for this study which is publicly available contains several features that may not be relevant to the prediction task. In this paper, we developed a hybrid multidimensional metrics framework for predictive modeling for both model performance evaluation and feature selection to overcome the feature selection challenges and select the best model among the available models in DM and ML. The proposed hybrid metrics were used to measure the efficiency of the predictive models. Experimental results show that the decision tree algorithm is the most efficient model. The higher score of HMM (m, r) = 0.47 illustrates the overall significant model that encompasses almost all the user’s requirements, unlike the classical metrics that use a criterion to select the most appropriate model. On the other hand, the ANNs were found to be the most computationally intensive for our prediction task. Moreover, the type of data and the class size of the dataset (unbalanced data) have a significant impact on the efficiency of the model, especially on the computational cost, and the interpretability of the parameters of the model would be hampered. And the efficiency of the predictive model could be improved with other feature selection algorithms (especially hybrid metrics) considering the experts of the knowledge domain, as the understanding of the business domain has a significant impact. 展开更多
关键词 predictive modeling Hybrid Metrics feature selection model selection Algorithm analysis Machine Learning
在线阅读 下载PDF
Sensitivity analysis to reduce duplicated features in ANN training for district heat demand prediction 被引量:4
3
作者 Si Chen Yaxing Ren +2 位作者 Daniel Friedrich Zhibin Yu James Yu 《Energy and AI》 2020年第2期63-73,共11页
Artificial neural network(ANN)has become an important method to model the nonlinear relationships between weather conditions,building characteristics and its heat demand.Due to the large amount of training data re-qui... Artificial neural network(ANN)has become an important method to model the nonlinear relationships between weather conditions,building characteristics and its heat demand.Due to the large amount of training data re-quired for ANN training,data reduction and feature selection are important to simplify the training.However,in building heat demand prediction,many weather-related input variables contain duplicated features.This paper develops a sensitivity analysis approach to analyse the correlation between input variables and to detect the variables that have high importance but contain duplicated features.The proposed approach is validated in a case study that predicts the heat demand of a district heating network containing tens of buildings at a university campus.The results show that the proposed approach detected and removed several unnecessary input variables and helped the ANN model to reduce approximately 20%training time compared with the traditional methods while maintaining the prediction accuracy.It indicates that the approach can be applied for analysing large num-ber of input variables to help improving the training efficiency of ANN in district heat demand prediction and other applications. 展开更多
关键词 Building heat demand prediction Statistical modelling Artificial neural network Sensitivity analysis feature selection
在线阅读 下载PDF
面向超级计算系统的节点故障异常预测方法
4
作者 赵一宁 王小宁 +2 位作者 牛铁 赵毅 肖海力 《计算机科学》 北大核心 2025年第9期128-136,共9页
随着超级计算系统的规模不断扩大,其计算节点发生故障和异常的概率也随之上升,严重影响了计算系统的运行稳定性。传统的故障应对方法多采用事后响应和补救措施,只能一定程度地挽回损失,而对故障和异常进行事前预测则能够提供更多的反应... 随着超级计算系统的规模不断扩大,其计算节点发生故障和异常的概率也随之上升,严重影响了计算系统的运行稳定性。传统的故障应对方法多采用事后响应和补救措施,只能一定程度地挽回损失,而对故障和异常进行事前预测则能够提供更多的反应和处理时间,因此逐渐成为故障响应方法的研究热点之一。对此,提出了一种面向超级计算系统的节点故障异常预测方法,旨在提升系统运行稳定性,减少计算资源的浪费。该方法首先分析系统历史运行数据,并通过无监督结合少量人工辅助的方法标记异常,基于这些异常在原始运行数据中发现关联的前置运行特征,随后基于机器学习方法建立节点故障异常的预测模型。该预测方法通过在原数据集上交叉验证获得了78%的精度和约90%的召回率,同时也保证了充分的提前时间。验证中使用的数据集是来自真实的超级计算系统的原始运行数据,证明了该方法具有可应用性。 展开更多
关键词 数据分析 异常预测 运行特征 预测模型
在线阅读 下载PDF
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:1
5
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 SHAP算法 炼铁 预报模型
原文传递
基于不同相关性的钻速预测模型对比
6
作者 魏思维 李谦 +2 位作者 何俊杰 李同意 姜杰 《钻探工程》 2025年第S1期112-118,共7页
针对钻进过程中的钻速预测与优化问题,提出了一种基于相关性分析的建模算法。对来自10口油气井的21912组数据进行分析。首先对数据进行了预处理,包括去除无关参数、填补缺失值、处理离群值、数据平滑和归一化等步骤,确保了数据质量的可... 针对钻进过程中的钻速预测与优化问题,提出了一种基于相关性分析的建模算法。对来自10口油气井的21912组数据进行分析。首先对数据进行了预处理,包括去除无关参数、填补缺失值、处理离群值、数据平滑和归一化等步骤,确保了数据质量的可靠性。随后,基于4种相关性计算方法(Pearson/Spearman/Kendall/Chatterjee),分析了多个钻井参数与钻速之间的相关性,发现钻井液密度、固相含量、泵量等参数对钻速影响显著。在建模方法上,采用了多层感知机(MLP)和随机森林(RF)两种回归模型,结合不同数量的相关性参数进行训练和验证。对比不同相关性算法与特征数量对模型性能的影响,Pearson算法在多层感知机模型中表现最佳,而在随机森林模型中,所有算法的表现均较为稳定,R^(2)值高达0.96,同时,随机森林较多层感知机模型表现更为优秀。结果表明,相关性分析不仅能够有效提取影响钻速的关键参数,还能优化模型的建模过程。结合机器学习和特征选择技术,本研究为钻速预测与优化提供了一种智能化的新途径,并为实际钻井工程提供了理论支持。 展开更多
关键词 钻速预测 相关性分析 机器学习 特征选择 数据预处理
在线阅读 下载PDF
Analyzing Electricity Consumption via Data Mining 被引量:1
7
作者 LIU Jinshuo LAN Huiying +2 位作者 FU Yizhen WU Hui LI Peng 《Wuhan University Journal of Natural Sciences》 CAS 2012年第2期121-125,共5页
This paper proposes a model to analyze the massive data of electricity.Feature subset is determined by the correla-tion-based feature selection and the data-driven methods.The attribute season can be classified succes... This paper proposes a model to analyze the massive data of electricity.Feature subset is determined by the correla-tion-based feature selection and the data-driven methods.The attribute season can be classified successfully through five classi-fiers using the selected feature subset,and the best model can be determined further.The effects on analyzing electricity consump-tion of the other three attributes,including months,businesses,and meters,can be estimated using the chosen model.The data used for the project is provided by Beijing Power Supply Bureau.We use WEKA as the machine learning tool.The models we built are promising for electricity scheduling and power theft detection. 展开更多
关键词 feature selection multi-classification prediction model data analysis
原文传递
F-TabNet模型在工程评标优化中的应用研究 被引量:1
8
作者 汪嵩松 刘杰 《城市建筑》 2025年第2期196-200,共5页
为提高工程项目评标的准确性和合理性,本研究采用模糊综合评价方法(fuzzy comprehensive appraisal,FCA)处理评价指标体系中的模糊因素,并结合TabNet模型对评价方法进行了创新性的优化研究。该研究不仅涉及特征选择、模型训练与预测,还... 为提高工程项目评标的准确性和合理性,本研究采用模糊综合评价方法(fuzzy comprehensive appraisal,FCA)处理评价指标体系中的模糊因素,并结合TabNet模型对评价方法进行了创新性的优化研究。该研究不仅涉及特征选择、模型训练与预测,还提出了一个新颖的F-TabNet评价模型,该模型有效地利用TabNet网络的强大表达能力。研究成果验证了F-TabNet评价方法在工程项目评标中的应用价值,该方法不仅能够准确预测评标结果,而且具备较强的解释性,这对于推动项目评标决策的科学性和合理化具有重要意义。 展开更多
关键词 项目评标 F-TabNet模型 特征选择 决策准确性 数据分析与预测
在线阅读 下载PDF
基于机器学习的地基沉降预测方法研究综述
9
作者 肖时辉 李鹏 +3 位作者 李伟鹏 曲炎 樊天慧 谷任国 《建设科技》 2025年第12期84-86,共3页
准确预测地基沉降对于优化工程设计,确保工程的安全和稳定至关重要。本文系统地综述了几种常用的机器学习算法及其在地基沉降预测中的应用,对模型的输入特征、训练数据、预测性能等进行了分析和讨论,并指出了当前研究存在的问题和未来... 准确预测地基沉降对于优化工程设计,确保工程的安全和稳定至关重要。本文系统地综述了几种常用的机器学习算法及其在地基沉降预测中的应用,对模型的输入特征、训练数据、预测性能等进行了分析和讨论,并指出了当前研究存在的问题和未来的发展方向,旨在为相关领域的研究和工程实践提供有益的参考。 展开更多
关键词 地基沉降 机器学习 预测模型 数据挖掘 特征选择
在线阅读 下载PDF
基于多维特征选择的锅炉汽包水位预测优化模型研究 被引量:1
10
作者 陈述 《自动化应用》 2025年第8期35-37,41,共4页
研究了一种基于多维特征选择的锅炉汽包水位预测优化模型,通过引入相关性分析、遗传算法和LASSO 3种特征选择方法,有效筛选出关键特征,并在此基础上优化支持向量机、随机森林和深度神经网络等预测模型的性能。通过交叉验证和超参数调优... 研究了一种基于多维特征选择的锅炉汽包水位预测优化模型,通过引入相关性分析、遗传算法和LASSO 3种特征选择方法,有效筛选出关键特征,并在此基础上优化支持向量机、随机森林和深度神经网络等预测模型的性能。通过交叉验证和超参数调优,验证了优化模型在预测精度和计算效率上的显著提升。实验结果表明,多维特征选择技术显著降低了模型的MSE和MAE,缩短了训练时间和提升了泛化能力。 展开更多
关键词 多维特征选择 水位预测 优化模型 相关性分析 交叉验证 超参数调优
在线阅读 下载PDF
基于改进遗传算法的数据挖掘中高维特征选择方案
11
作者 谭洪梅 《技术与市场》 2025年第10期28-30,共3页
为提高数据挖掘中从高维特征空间选择最优特征子集的预测效果,设计了一种基于改进遗传算法的数据挖掘高维特征选择方案,将多模型融合分析方法加入到特征选择构建遗传算法,针对不同特征的预测结果选取多点位交叉算法展开深入分析和研究,... 为提高数据挖掘中从高维特征空间选择最优特征子集的预测效果,设计了一种基于改进遗传算法的数据挖掘高维特征选择方案,将多模型融合分析方法加入到特征选择构建遗传算法,针对不同特征的预测结果选取多点位交叉算法展开深入分析和研究,对不同遗传次数及UCI标准数据集进行测试。研究结果表明:目标值的特征、目标变量最大相关度均可通过此算法得到高效区分和有效筛选。预测算法运行时间随着特征维数减少而大幅下降,预测效率及准确率均可通过遗传算法得到显著提升。该研究有助于提升数据质量,响应信息化时代的需求。 展开更多
关键词 数据挖掘 特征选择 遗传算法 预测模型
在线阅读 下载PDF
基于机器学习建立高炉压差预测模型的研究
12
作者 张梦慧 刘然 +2 位作者 刘颂 吕庆 刘小杰 《世界有色金属》 2025年第1期31-33,共3页
压差变化作为高炉监控指标的一个关键参数,了解其变化趋势对操作者而言是至关重要的。本文通过对现场测量数据的分析,解决了原数据中存在的异常值、缺失值等问题。用Pearson特征的选择方法对标准化后的数据选取特征变量,通过将随机森林... 压差变化作为高炉监控指标的一个关键参数,了解其变化趋势对操作者而言是至关重要的。本文通过对现场测量数据的分析,解决了原数据中存在的异常值、缺失值等问题。用Pearson特征的选择方法对标准化后的数据选取特征变量,通过将随机森林模型,GBDT模型和Adaboost模型的预测结果进行对比。结果表明GBDT模型相对于随机森林和Adaboost模型而言具有较大优势,随机森林预测模型精度R2为0.78,Adaboost预测模型精度为0.76,GBDT预测模型精度R2达到了0.91。GBDT预测结果最精确,在模型训练所需时间上GBDT用时远远少于其他两个模型。综上所述GBDT模型总体表现出最高的预测准确性和最少的训练时间,具有更好的适用性。 展开更多
关键词 预测模型 GBDT 特征选择 数据处理 下部压差
在线阅读 下载PDF
Data-Driven Load Forecasting Using Machine Learning and Meteorological Data 被引量:1
13
作者 Aishah Alrashidi Ali Mustafa Qamar 《Computer Systems Science & Engineering》 SCIE EI 2023年第3期1973-1988,共16页
Electrical load forecasting is very crucial for electrical power systems’planning and operation.Both electrical buildings’load demand and meteorological datasets may contain hidden patterns that are required to be i... Electrical load forecasting is very crucial for electrical power systems’planning and operation.Both electrical buildings’load demand and meteorological datasets may contain hidden patterns that are required to be investigated and studied to show their potential impact on load forecasting.The meteorological data are analyzed in this study through different data mining techniques aiming to predict the electrical load demand of a factory located in Riyadh,Saudi Arabia.The factory load and meteorological data used in this study are recorded hourly between 2016 and 2017.These data are provided by King Abdullah City for Atomic and Renewable Energy and Saudi Electricity Company at a site located in Riyadh.After applying the data pre-processing techniques to prepare the data,different machine learning algorithms,namely Artificial Neural Network and Support Vector Regression(SVR),are applied and compared to predict the factory load.In addition,for the sake of selecting the optimal set of features,13 different combinations of features are investigated in this study.The outcomes of this study emphasize selecting the optimal set of features as more features may add complexity to the learning process.Finally,the SVR algorithm with six features provides the most accurate prediction values to predict the factory load. 展开更多
关键词 Electricity load forecasting meteorological data machine learning feature selection modeling real-world problems predictive analytics
在线阅读 下载PDF
基于比例风险模型的飞机部件剩余寿命预测 被引量:1
14
作者 何浪 鲁亮 +3 位作者 陆锦鹤 范圣娴 赵立新 张宇翔 《计算机工程与设计》 北大核心 2024年第4期1109-1116,共8页
为准确预测飞机部件的剩余寿命,在对某航空公司最近4年的163架波音B737 NG型号飞机的维修数据进行分析的基础上,提出基于比例风险模型的飞机部件剩余寿命预测方法。通过估计部件装拆间隔飞行时间对应的寿命分布,计算部件在当前时刻对应... 为准确预测飞机部件的剩余寿命,在对某航空公司最近4年的163架波音B737 NG型号飞机的维修数据进行分析的基础上,提出基于比例风险模型的飞机部件剩余寿命预测方法。通过估计部件装拆间隔飞行时间对应的寿命分布,计算部件在当前时刻对应的可靠度;对部件的维修数据进行分析,筛选出影响部件寿命的主要因素;据此预测部件的剩余寿命。通过实例分析,部件的累计飞行时间、飞机的机龄以及飞机的运行环境等均为影响部件寿命的重要因素。实验结果表明,基于比例风险模型的预测结果较其它预测模型在3个评价指标上均取得了最好效果。 展开更多
关键词 比例风险模型 可靠性分析 特征选择 比例风险假设检验 剩余寿命 飞机部件 维修预测
在线阅读 下载PDF
基于冗余分析的数据中心服务器能耗特征选择 被引量:1
15
作者 丰佳 张立志 +1 位作者 宋文 汤洪杰 《微型电脑应用》 2024年第2期115-117,共3页
应用精确的服务器能耗模型对能耗进行预测,可为资源调度方法提供重要依据。考虑到云数据中心服务器能耗特征维度高、冗余特征难以判断的题,分析特征与特征之间、特征与目标值之间皮尔逊相关性系数的联系,并给出服务器能耗冗余特征的判... 应用精确的服务器能耗模型对能耗进行预测,可为资源调度方法提供重要依据。考虑到云数据中心服务器能耗特征维度高、冗余特征难以判断的题,分析特征与特征之间、特征与目标值之间皮尔逊相关性系数的联系,并给出服务器能耗冗余特征的判断准则,在此基础上提出一种基于冗余分析的服务器能耗特征选择算法。实验结果表明了所提能耗特征选择算法在服务器能耗模型构建中的有效性。 展开更多
关键词 云数据中心 服务器 冗余分析 特征选择 能耗预测
在线阅读 下载PDF
基于时序数据降维的脓毒症死亡风险预测模型
16
作者 朱亚强 袁学光 +2 位作者 李丹丹 李元涛 黄小红 《计算机与数字工程》 2024年第8期2355-2360,共6页
现有脓毒症患者死亡风险预测模型大多需要患者的血常规结果等数据,输入特征较多且采集化验流程复杂。针对这个问题,提出了改进的包裹式(Wrapper)特征筛选方法以及基于LSTM和XGBoost的SD2V-XGBoost预测模型,能够仅使用较少的临床实时体... 现有脓毒症患者死亡风险预测模型大多需要患者的血常规结果等数据,输入特征较多且采集化验流程复杂。针对这个问题,提出了改进的包裹式(Wrapper)特征筛选方法以及基于LSTM和XGBoost的SD2V-XGBoost预测模型,能够仅使用较少的临床实时体征预测脓毒症患者的死亡风险。首先,利用改进的包裹式特征筛选方法筛选出和患者死亡风险相关性高的特征;其次,使用LSTM网络将患者的时间序列数据映射成向量;最后,将LSTM网络输出的向量和患者体征的统计特征作为XGBoost的输入,预测患者的死亡风险。使用公开的MIMIC-III数据集进行实验。在输入特征数量方面,和已有研究的模型对比,SD2V-XGBoost模型在保持预测精度的前提下将输入特征数量减少了71%;在预测精度方面,仅使用临床实时体征,SD2V-XGBoost的接受者操作特征曲线下面积为0.852 1,准确召回率曲线下面积为0.632 0,死亡样本召回率为72.15%,均优于LSTM、XGBoost和随机森林模型。 展开更多
关键词 长短时记忆网络 死亡风险预测 时序数据处理 特征筛选 XGBoost模型
在线阅读 下载PDF
基于智能技术的配电故障预测与对策优化分析
17
作者 朱泱 李枫 《集成电路应用》 2024年第10期228-229,共2页
阐述基于人工智能的故障预测模型,探讨人工智能在数据采集、特征工程、模型训练方面的应用。提出将故障预测结果应用于服务改进、实时监控、客户需求分析中的优质服务提升策略。
关键词 智能技术 故障预测 特征工程 模型训练 数据分析
在线阅读 下载PDF
基于数据的流程工业生产过程指标预测方法综述 被引量:34
18
作者 陈龙 刘全利 +2 位作者 王霖青 赵珺 王伟 《自动化学报》 EI CSCD 北大核心 2017年第6期944-954,共11页
生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述... 生产过程关键指标的预测对于流程工业生产调度,安全生产和节能环保有着重要作用.目前,已有多种基于工业生产数据提出的生产过程指标预测方法,主要涉及特征(变量)选择,预测模型构建及其模型参数优化这三方面.本文分别针对以上三方面论述了基于数据的工业生产过程指标预测国内外研究现状,分析了各种方法的优缺点.最后,指出了流程工业生产过程指标预测方法在工业大数据及知识自动化等方面的未来研究方向和前景. 展开更多
关键词 生产过程 特征选择 预测模型 参数优化 工业大数据
在线阅读 下载PDF
复杂储层测井评价数据挖掘方法研究 被引量:25
19
作者 李洪奇 郭海峰 +3 位作者 郭海敏 孟照旭 谭锋奇 张军 《石油学报》 EI CAS CSCD 北大核心 2009年第4期542-549,共8页
数据挖掘是应对石油勘探开发未来挑战的10项关键技术之一。提出了一种将预测性数据挖掘技术应用于复杂储层测井评价的方法。将遗传算法应用于特征子集选择和建模参数优化,利用重复交叉验证得到泛化误差的无偏估计,并从选定的多学习算法... 数据挖掘是应对石油勘探开发未来挑战的10项关键技术之一。提出了一种将预测性数据挖掘技术应用于复杂储层测井评价的方法。将遗传算法应用于特征子集选择和建模参数优化,利用重复交叉验证得到泛化误差的无偏估计,并从选定的多学习算法建模结果中优选出最终预测模型。以克拉玛依油田六中区克下组油藏水淹级别划分为例,在该方法框架内对比研究了8种特征子集方案和决策树、神经网络、支持向量机、贝叶斯网络、组合学习等5种分类方法12种预测模型。结果表明支持向量机预测准确率最高,达91.47%,选择其作为最终预测模型,而决策树模型容易理解,作为辅助参考模型。利用该数据挖掘方法解决油、气、水层识别和岩性划分等问题时,能够获得高性能的分类模型,从而将有效地提高解释精度和符合率。 展开更多
关键词 储层评价 数据挖掘 预测建模 参数优化 特征选择 支持向量机 水淹层 决策树
在线阅读 下载PDF
一种高效的随机块模型学习算法 被引量:8
20
作者 赵学华 杨博 陈贺昌 《软件学报》 EI CSCD 北大核心 2016年第9期2248-2264,共17页
由于随机块模型能够有效处理不具有先验知识的网络,对其研究成为了机器学习、网络数据挖掘和社会网络分析等领域的研究热点.如何设计出具有模型选择能力的快速随机块模型学习算法,是目前随机块模型研究面临的一个主要挑战.提出一种精细... 由于随机块模型能够有效处理不具有先验知识的网络,对其研究成为了机器学习、网络数据挖掘和社会网络分析等领域的研究热点.如何设计出具有模型选择能力的快速随机块模型学习算法,是目前随机块模型研究面临的一个主要挑战.提出一种精细随机块模型及其快速学习算法.该学习方法基于提出的模型与最小消息长度推导出一个新成本函数,利用期望最大化参数估计方法,实现了边评价模型边估计参数的并行学习策略,以此方式显著降低随机块模型学习的时间复杂性.分别采用人工网络与真实网络,从学习时间和学习精度两方面对提出的学习算法进行了验证,并与现有的代表性随机块模型学习方法进行了对比.实验结果表明:提出的算法能够在保持学习精度的情况下显著降低时间复杂性,在学习精度和时间之间取得很好的折衷;在无任何先验知识的情况下,可处理的网络规模从几百节点提高至几万节点.另外,通过网络链接预测的实验,其结果也表明了提出的模型及学习算法相比现有随机块模型和学习方法具有更好的泛化能力. 展开更多
关键词 网络数据挖掘 社会网络分析 随机块模型 模型选择 链接预测
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部