期刊文献+
共找到1,178篇文章
< 1 2 59 >
每页显示 20 50 100
Gene Expression Data Analysis Based on Mixed Effects Model
1
作者 Yuanbo Dai 《Journal of Computer and Communications》 2025年第2期223-235,共13页
DNA microarray technology is an extremely effective technique for studying gene expression patterns in cells, and the main challenge currently faced by this technology is how to analyze the large amount of gene expres... DNA microarray technology is an extremely effective technique for studying gene expression patterns in cells, and the main challenge currently faced by this technology is how to analyze the large amount of gene expression data generated. To address this, this paper employs a mixed-effects model to analyze gene expression data. In terms of data selection, 1176 genes from the white mouse gene expression dataset under two experimental conditions were chosen, setting up two conditions: pneumococcal infection and no infection, and constructing a mixed-effects model. After preprocessing the gene chip information, the data were imported into the model, preliminary results were calculated, and permutation tests were performed to biologically validate the preliminary results using GSEA. The final dataset consists of 20 groups of gene expression data from pneumococcal infection, which categorizes functionally related genes based on the similarity of their expression profiles, facilitating the study of genes with unknown functions. 展开更多
关键词 mixed Effects Model Gene Expression data Analysis Gene Analysis Gene Chip
暂未订购
Use of Linear Spectral Mixture Model to Estimate Rice Planted Area Based on MODIS Data 被引量:2
2
作者 WANG Lei Satoshi UCHID 《Rice science》 SCIE 2008年第2期131-136,共6页
MODIS (Moderate Resolution Imaging Spectroradiometer) is a key instrument aboard the Terra (EOS AM) and Aqua (EOS PM) satellites. Linear spectral mixture models are applied to MOIDS data for the sub-pixel classi... MODIS (Moderate Resolution Imaging Spectroradiometer) is a key instrument aboard the Terra (EOS AM) and Aqua (EOS PM) satellites. Linear spectral mixture models are applied to MOIDS data for the sub-pixel classification of land covers. Shaoxing county of Zhejiang Province in China was chosen to be the study site and early rice was selected as the study crop. The derived proportions of land covers from MODIS pixel using linear spectral mixture models were compared with unsupervised classification derived from TM data acquired on the same day, which implies that MODIS data could be used as satellite data source for rice cultivation area estimation, possibly rice growth monitoring and yield forecasting on the regional scale. 展开更多
关键词 RICE planted area Moderate Resolution Imaging Spectroradiometer Thematic Mapper data mixed pixel linear spectral mixture model
在线阅读 下载PDF
Outlier Detection of Mixed Data Based on Neighborhood Combinatorial Entropy
3
作者 Lina Wang Qixiang Zhang +2 位作者 Xiling Niu Yongjun Ren Jinyue Xia 《Computers, Materials & Continua》 SCIE EI 2021年第11期1765-1781,共17页
Outlier detection is a key research area in data mining technologies,as outlier detection can identify data inconsistent within a data set.Outlier detection aims to find an abnormal data size from a large data size an... Outlier detection is a key research area in data mining technologies,as outlier detection can identify data inconsistent within a data set.Outlier detection aims to find an abnormal data size from a large data size and has been applied in many fields including fraud detection,network intrusion detection,disaster prediction,medical diagnosis,public security,and image processing.While outlier detection has been widely applied in real systems,its effectiveness is challenged by higher dimensions and redundant data attributes,leading to detection errors and complicated calculations.The prevalence of mixed data is a current issue for outlier detection algorithms.An outlier detection method of mixed data based on neighborhood combinatorial entropy is studied to improve outlier detection performance by reducing data dimension using an attribute reduction algorithm.The significance of attributes is determined,and fewer influencing attributes are removed based on neighborhood combinatorial entropy.Outlier detection is conducted using the algorithm of local outlier factor.The proposed outlier detection method can be applied effectively in numerical and mixed multidimensional data using neighborhood combinatorial entropy.In the experimental part of this paper,we give a comparison on outlier detection before and after attribute reduction.In a comparative analysis,we give results of the enhanced outlier detection accuracy by removing the fewer influencing attributes in numerical and mixed multidimensional data. 展开更多
关键词 Neighborhood combinatorial entropy attribute reduction mixed data outlier detection
在线阅读 下载PDF
THE MIXED PROBLEM FOR A CLASS OF NONLINEAR SYMMETRIC HYPERBOLIC SYSTEMS WITH DISCONTINUOUS DATA 被引量:1
4
作者 邵志强 陈恕行 《Acta Mathematica Scientia》 SCIE CSCD 2005年第4期610-620,共11页
This paper studies the nonlinear mixed problem for a class of symmetric hyperbolic systems with the boundary condition satisfying the dissipative condition about discontinuous data in higher dimension spaces, establis... This paper studies the nonlinear mixed problem for a class of symmetric hyperbolic systems with the boundary condition satisfying the dissipative condition about discontinuous data in higher dimension spaces, establishes the local existence theorem by using the method of a prior estimates, and obtains the structure of singularities of the solutions of such problems. 展开更多
关键词 Nonlinear mixed problem discontinuous data symmetric hyperbolic systems
在线阅读 下载PDF
ROBUST ESTIMATION IN PARTIAL LINEAR MIXED MODEL FOR LONGITUDINAL DATA
5
作者 秦国友 朱仲义 《Acta Mathematica Scientia》 SCIE CSCD 2008年第2期333-347,共15页
In this article, robust generalized estimating equation for the analysis of partial linear mixed model for longitudinal data is used. The authors approximate the nonparametric function by a regression spline. Under so... In this article, robust generalized estimating equation for the analysis of partial linear mixed model for longitudinal data is used. The authors approximate the nonparametric function by a regression spline. Under some regular conditions, the asymptotic properties of the estimators are obtained. To avoid the computation of high-dimensional integral, a robust Monte Carlo Newton-Raphson algorithm is used. Some simulations are carried out to study the performance of the proposed robust estimators. In addition, the authors also study the robustness and the efficiency of the proposed estimators by simulation. Finally, two real longitudinal data sets are analyzed. 展开更多
关键词 Generalized estimating equation longitudinal data metropolis algorithm mixed effect partial linear model ROBUSTNESS
在线阅读 下载PDF
基于特征插值TSCTransMix-CapsNet的轴承故障分类模型
6
作者 任义 孙明丽 +1 位作者 栾方军 袁帅 《机电工程》 北大核心 2025年第4期607-617,共11页
针对轴承故障诊断分类模型不能很好地提取到振动序列多层次特征,以及故障样本量稀少的问题,提出了一种基于特征插值的时间序列分类Transformer融合胶囊网络(TSCTransMix-CapsNet)的故障诊断模型。首先,以重叠采样预处理后的一维振动信... 针对轴承故障诊断分类模型不能很好地提取到振动序列多层次特征,以及故障样本量稀少的问题,提出了一种基于特征插值的时间序列分类Transformer融合胶囊网络(TSCTransMix-CapsNet)的故障诊断模型。首先,以重叠采样预处理后的一维振动信号数据作为模型的输入,利用时间序列分类Transformer(TSCTransformer)捕捉了序列长距离关系,提取了振动信号的全局故障特征,同时应用混合数据增强方法(Mixup)对特征做了插值处理,进行了特征增强;然后,利用胶囊网络模型对全局故障特征作了进一步细化处理,提取了局部故障特征,从而形成了包含全局模式和局部细节的特征输出;最后,在多工况条件下选取CWRU和XJTU-SY数据集进行了轴承故障诊断的消融和对比实验,并将该模型与其他模型进行了比较。研究结果表明:该模型在CWRU数据集上的故障诊断准确率达到99.50%,在XJTU-SY数据集上的故障诊断准确率达到99.87%。相比于其他模型,该模型能更加有效地提高轴承故障诊断中的分类性能。 展开更多
关键词 故障诊断模型 时间序列分类Transformer 胶囊网络模型 特征插值 特征增强 混合数据增强方法
在线阅读 下载PDF
Actuarial Pricing of UAV Insurance for Thin Data Scenarios
7
作者 Wang Yang Li Dayu +1 位作者 Wang Dinglin Ren Feixiao 《Journal of Humanities and Nature》 2025年第2期106-123,共18页
Driven by both market demand and policies,the drone insurance industry is facing new development opportunities.This study focuses on exploring an innovative hybrid data integration method,which uses public datasets of... Driven by both market demand and policies,the drone insurance industry is facing new development opportunities.This study focuses on exploring an innovative hybrid data integration method,which uses public datasets of drones and small manned aircraft for hybrid data integration and severity scaling,and conducts simulation tests to ensure the reproducibility of the method.A two-part hybrid model approach is adopted to separate the frequency model from the severity model,and a hierarchical modeling method is used for each part to deal with the occurrence of extreme losses.Monte Carlo simulation is performed on the fused data to calculate the net premium.Innovatively,a no-claim discount system is introduced,and the impact of operators'behaviors on claim frequency is quantified,with comprehensive consideration given to the inclusion and quantification of risk factors.The application of Tweedie GLM in total loss modeling is constructed and analyzed,and the advantages and disadvantages of different modeling methods are compared,aiming to provide more comprehensive decision-making basis for insurance companies.This report is intended to construct and evaluate a robust actuarial rate-making model for the rapidly developing drone insurance market,and to develop more accurate,fair and market-competitive drone insurance products. 展开更多
关键词 mixed data Rate-Making Model Drone Insurance
在线阅读 下载PDF
DynamicMix:一种动态的像素级混合的图像数据增强方法
8
作者 曾武 朱恒亮 毛国君 《计算机应用与软件》 北大核心 2025年第12期236-245,共10页
近年来多个图像进行混合的数据增强方法取得不错的效果。然而,完全接受补丁图像像素区域的方法在一些情况下可能会生成一些质量较低的新样本,需要进一步改进。针对这些问题,提出一种动态的像素级混合算法DynamicMix。提出局部像素混合... 近年来多个图像进行混合的数据增强方法取得不错的效果。然而,完全接受补丁图像像素区域的方法在一些情况下可能会生成一些质量较低的新样本,需要进一步改进。针对这些问题,提出一种动态的像素级混合算法DynamicMix。提出局部像素混合的策略,选择合适的原图裁剪区域保留图像的部分像素值,从而实现局部像素级混合。为了降低裁剪面积大小对新生成样本的影响,又提出像素级动态混合方法,将裁剪区域图像块与混合比例进行关联,使得原图裁剪区域的像素保留比例随裁剪区域面积的大小而动态改变。通过该方法可以避免在裁剪面积较大的时候,原图特征显著区域丢失过多而导致标签值与对应内容差别过大。在4个数据集上的实验表明:提出的数据增强方法可以让训练出的模型拥有更好的分类性能和鲁棒性。将该方法应用于CIFAR-100和Mini-ImageNet数据集中,使用ResNet-34网络情况下比CutMix方法的Top-1准确率分别提升了1.00百分点和1.14百分点。 展开更多
关键词 数据增强 图像分类 深度学习 图像混合 动态混合
在线阅读 下载PDF
一般混合线性模型SAS的MIXED过程实现——混合线性模型及其SAS软件实现(一) 被引量:25
9
作者 张岩波 何大卫 +2 位作者 刘桂芬 王琳娜 郭明英 《中国卫生统计》 CSCD 北大核心 2001年第4期207-210,共4页
目的 系统结构数据在医学领域广泛存在 ,其统计分析方法各异 ,可统称之为混合模型。本文研讨其实现方法。方法 以多水平模型例证一般混合线性模型的SASMIXED实现过程。结果 以JSP数据为实例显示SAS的拟合结果与MLn相一致。结论 SASM... 目的 系统结构数据在医学领域广泛存在 ,其统计分析方法各异 ,可统称之为混合模型。本文研讨其实现方法。方法 以多水平模型例证一般混合线性模型的SASMIXED实现过程。结果 以JSP数据为实例显示SAS的拟合结果与MLn相一致。结论 SASMIXED可灵活地拟合包括多水平模型的各类混合模型。 展开更多
关键词 系统结构数据 混合线性模型 多水平模型 mixED过程 SAS软件
在线阅读 下载PDF
RP/SP融合数据的Mixed Logit和Nested Logit模型估计对比 被引量:14
10
作者 张天然 杨东援 +1 位作者 赵娅丽 叶亮 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第8期1073-1078,1084,共7页
分析了RP/SP(revealed preference/stated preference)融合数据对交通行为研究的重要性,通过实际调查的RP/SP融合数据,对比了用Mixed Logit和Nested Logit模型的估计结果.得出了以下结论:RP/SP融合数据中,有时同类型交通方式的关联性要... 分析了RP/SP(revealed preference/stated preference)融合数据对交通行为研究的重要性,通过实际调查的RP/SP融合数据,对比了用Mixed Logit和Nested Logit模型的估计结果.得出了以下结论:RP/SP融合数据中,有时同类型交通方式的关联性要比RP和SP数据之间的关联性强,应用不同的Nested Logit模型分层方法进行估计对比;Mixed Logit考虑了个体的异质性,假定参数为随机分布,同时体现了RP/SP数据的关联性和同类型交通方式的关联性,能够得到更好的参数估计结果;Mixed Logit模型能更现实地反映不同交通方式使用者对时间和费用敏感性的不同(时间价值的不同),体现小汽车使用者比公共交通使用者具有更高时间价值的现实情况. 展开更多
关键词 RP/SP融合数据 mixED Logit(RPL/RCL)模型 异质性 Nested LOGIT模型
在线阅读 下载PDF
重复测量数据的混合模型及其MIXED过程实现——混合线性模型及其SAS软件实现(二) 被引量:9
11
作者 张岩波 何大卫 +2 位作者 刘桂芬 张晋昕 郭静 《中国卫生统计》 CSCD 北大核心 2001年第5期272-275,共4页
目的 重复测量数据存在自相关及随机误差分布于不同层次 ,不宜使用常规分析方法 ,本文研讨使用混合线性模型及SAS软件实现的分析方法。方法 利用MIXED对多个处理组的重复测量数据进行混合模型分析。结果 通过固定效应与随机效应及对... 目的 重复测量数据存在自相关及随机误差分布于不同层次 ,不宜使用常规分析方法 ,本文研讨使用混合线性模型及SAS软件实现的分析方法。方法 利用MIXED对多个处理组的重复测量数据进行混合模型分析。结果 通过固定效应与随机效应及对协方差矩阵的估计 ,使重复测量数据得以合理的分析。结论 MIXED可以有效地、全面地分析重复测量数据。 展开更多
关键词 重复测量数据 混合线性模型 多水平模型 mixED过程 卫生统计
暂未订购
双反应变量重复测量资料分析及MIXED过程实现 被引量:6
12
作者 萨建 刘桂芬 《中国卫生统计》 CSCD 北大核心 2007年第6期580-583,共4页
目的探讨双反应变量重复测量资料的分析原理与方法及SAS软件PROCMIXED过程的应用。方法结合双反应变量重复测量数据的特点,采用SAS软件的MIXED过程对其进行分析,建立线性混合效应模型。结果该模型不仅考虑了每个变量多次重复测量结果之... 目的探讨双反应变量重复测量资料的分析原理与方法及SAS软件PROCMIXED过程的应用。方法结合双反应变量重复测量数据的特点,采用SAS软件的MIXED过程对其进行分析,建立线性混合效应模型。结果该模型不仅考虑了每个变量多次重复测量结果之间的相关性,也考虑了两个变量之间的相关性,同时还引入固定效应和随机效应,结合数据特征分析,结果更为可信。结论对双反应变量非独立重复测量资料,可以把数据之间的相关性分解为重复测量间相关性和变量间相关性两部分,采用MIXED过程不仅可对其相关性做出明晰深入的分析,且可保证数据分析结果解释更符合实际。 展开更多
关键词 双反应变量重复测量资料 mixED过程 线性混合效应模型 相关性
暂未订购
带时依协变量的重复测量资料的混合线性模型分析及其MIXED过程实现 被引量:2
13
作者 张莉娜 《中国卫生统计》 CSCD 北大核心 2012年第1期40-43,共4页
目的探讨混合线性模型在带有时依协变量的重复测量资料分析中的应用。方法以治疗轻、中度原发性高血压病临床试验资料为例,考虑到给药方案在各个时间点随病情而变化,利用SAS中的MIXED过程,选择合适的协方差结构来实现带有时依协变量的... 目的探讨混合线性模型在带有时依协变量的重复测量资料分析中的应用。方法以治疗轻、中度原发性高血压病临床试验资料为例,考虑到给药方案在各个时间点随病情而变化,利用SAS中的MIXED过程,选择合适的协方差结构来实现带有时依协变量的重复测量资料的统计分析。结果时依协变量(给药方案)对治疗轻、中度原发性高血压病有统计学意义(P<0.05);时间因素有统计学意义(P<0.05);给药方案与时间因素之间有交互效应(P<0.05)、给药方案与处理因素之间有交互效应(P<0.05)。结论采用混合线性模型对带有时依协变量的临床试验重复测量资料进行统计分析,可以更客观地进行药物疗效评价。 展开更多
关键词 时依协变量 重复测量资料 混合线性模型 协方差结构
暂未订购
基于SAS NLMIXED的广义线性混合效应模型在发病率数据Meta分析中的应用 被引量:5
14
作者 郑建清 黄碧芬 +1 位作者 吴敏 肖丽华 《中国循证儿科杂志》 CSCD 北大核心 2019年第2期129-133,共5页
目的:介绍利用SAS软件中的PROC NLMIXED过程步实现发病率数据的META分析方法。方法:基于广义线性混合效应模型(GLMM)的二项式-正态模型(BN)和泊松-正态模型(PNM)等,可方便地实现发病率数据的随机效应Meta分析,尤其当Meta分析纳入含0事... 目的:介绍利用SAS软件中的PROC NLMIXED过程步实现发病率数据的META分析方法。方法:基于广义线性混合效应模型(GLMM)的二项式-正态模型(BN)和泊松-正态模型(PNM)等,可方便地实现发病率数据的随机效应Meta分析,尤其当Meta分析纳入含0事件研究时。以Schutz等发表的血管内皮生长因子受体酪氨酸激酶抑制剂治疗的癌症患者发生致命不良事件风险的系统评价作为实例数据,利用SAS软件实现发病率数据的META分析,并提供编程代码。结果:对于含0事件研究,使用PNM模型进行Meta分析,无需进行连续校正法。删除0事件研究对于PNM模型影响较大。与标准正态模型相比,PNM和BNM模型给出的效应值更高,而P值则更小,具有更好的灵敏性。结论:基于广义线性混合效应模型,利用SAS的PROCNLMIXED实现发病率数据Meta分析是优选的方法。 展开更多
关键词 发病率数据 广义线性混合效应模型 正态-正态模型 二项式-正态模型 泊松-正态模型
在线阅读 下载PDF
混合高频数据下线性模型的经验似然
15
作者 赖喜祥 秦永松 《应用数学》 北大核心 2026年第1期278-291,共14页
高频数据在经济、统计及其他领域被广泛研究,而线性模型是统计学中最常见的回归模型之一.本文利用分组经验似然方法,构造了α-混合高频数据下线性模型回归系数的经验似然比统计量.在一定假设和条件下,证明了该统计量的渐近分布为卡方分... 高频数据在经济、统计及其他领域被广泛研究,而线性模型是统计学中最常见的回归模型之一.本文利用分组经验似然方法,构造了α-混合高频数据下线性模型回归系数的经验似然比统计量.在一定假设和条件下,证明了该统计量的渐近分布为卡方分布,根据此结果进一步给出了回归系数的经验似然置信域.通过模拟比较了经验似然和正态逼近方法的置信域,结果表明,基于经验似然方法构造的置信域的覆盖率优于正态逼近方法.此外,还将理论结果应用于实际数据分析. 展开更多
关键词 混合高频数据 Α-混合 线性模型 经验似然
在线阅读 下载PDF
基于新权重函数的MIX-GARCH-L模型及其应用 被引量:1
16
作者 杨炜明 刘涛 王琴 《统计与决策》 CSSCI 北大核心 2024年第8期22-27,共6页
文章引入一种新的权重函数,并构建新的波动率模型——MIX-GARCH-L模型,新模型能够充分利用高低频数据提炼出更有价值的信息。针对新模型参数估计问题,提出MIX-GARCH-L模型的参数估计方法来分析估计量的理论性质,证明了对应的中心极限定... 文章引入一种新的权重函数,并构建新的波动率模型——MIX-GARCH-L模型,新模型能够充分利用高低频数据提炼出更有价值的信息。针对新模型参数估计问题,提出MIX-GARCH-L模型的参数估计方法来分析估计量的理论性质,证明了对应的中心极限定理以及用Service-Boostrap方法模拟检验估计量的数据表现。所提模型具有以下优势:新权重函数能够更好地根据交易特征的变动来自动调整不同交易日的权重,从而使每个高频交易日所分配到的权重与未来波动率产生的冲击效果一致;能够利用同一交易过程中多种高频交易数据,信息利用更加充分,使得MIX-GARCH-L模型具有更好的预测精度和预测优势。实证结果显示:MIX-GARCH-L模型的MSPE值明显小于GARCH-RV模型和GARCH-M模型的MSPE值,说明MIX-GARCH-L模型不仅在模型预测上有更高的预测精度,而且在稳健性上的表现也更好。 展开更多
关键词 混频数据 新权重 波动率 参数估计 数值模拟
在线阅读 下载PDF
一种基于停止-转发MIX的统计型攻击
17
作者 徐红云 刘京 李孟杰 《小型微型计算机系统》 CSCD 北大核心 2010年第11期2217-2221,共5页
为了增强匿名系统的匿名性,更好地保护用户的通信隐私,基于停止-转发MIX提出一种新的统计型攻击算法.算法将攻击者的连续观察时间划分成t个周期,每个周期统计MIX节点输出信息包的接收者集合,称之为一个观察集合,获得t个观察集合后,采用... 为了增强匿名系统的匿名性,更好地保护用户的通信隐私,基于停止-转发MIX提出一种新的统计型攻击算法.算法将攻击者的连续观察时间划分成t个周期,每个周期统计MIX节点输出信息包的接收者集合,称之为一个观察集合,获得t个观察集合后,采用概率统计、集合运算等方法,确定目标发送者的接收者集合.指出采用填充包技术防御该攻击时,可以增加攻击所需的观察集合数,降低攻击的有效性. 展开更多
关键词 数据隐私 网络安全 匿名系统 停止-转发mix 统计型攻击
在线阅读 下载PDF
Application of a mixed DEA model to evaluate relative efficiency validity 被引量:2
18
作者 FU Yu-wei YIN Hang YANG Gui-bin 《Journal of Marine Science and Application》 2005年第3期64-70,共7页
Data envelopment analysis(DEA) model is widely used to evaluate the relative efficiency of producers. It is a kind of objective decision method with multiple indexes. However, the two basic models frequently used at p... Data envelopment analysis(DEA) model is widely used to evaluate the relative efficiency of producers. It is a kind of objective decision method with multiple indexes. However, the two basic models frequently used at present, the C2R model and the C2GS2 model have limitations when used alone,resulting in evaluations that are often unsatisfactory. In order to solve this problem, a mixed DEA model is built and is used to evaluate the validity of the business efficiency of listed companies. An explanation of how to use this mixed DEA model is offered and its feasibility is verified. 展开更多
关键词 decision making units (DMU) efficiency evaluating mixed data envelopment analysis (DEA) model relative efficiency
在线阅读 下载PDF
KERNEL ESTIMATION OF HIGHER DERIVATIVES OF DENSITY AND HAZARD RATE FUNCTION FOR TRUNCATED AND CENSORED DEPENDENT DATA 被引量:3
19
作者 陈清平 戴永隆 《Acta Mathematica Scientia》 SCIE CSCD 2003年第4期477-486,共10页
Based on left truncated and right censored dependent data, the estimators of higher derivatives of density function and hazard rate function are given by kernel smoothing method. When observed data exhibit α-mixing d... Based on left truncated and right censored dependent data, the estimators of higher derivatives of density function and hazard rate function are given by kernel smoothing method. When observed data exhibit α-mixing dependence, local properties including strong consistency and law of iterated logarithm are presented. Moreover, when the mode estimator is defined as the random variable that maximizes the kernel density estimator, the asymptotic normality of the mode estimator is established. 展开更多
关键词 Truncated and censored data Α-mixING strong consistency law of iterated logarithm MODE
在线阅读 下载PDF
改进决策树算法的混合属性大数据分类优化方法
20
作者 剧树春 李来杰 《电子设计工程》 2026年第1期45-49,共5页
为了简化混合属性大数据的分类过程,并依据各类属性数据的内在特征,确保分类结果的准确性,文中提出了改进决策树算法的混合属性大数据分类优化方法。通过主成分分析法挖掘混合属性大数据之间的内在规律,提取混合属性大数据关键特征;构... 为了简化混合属性大数据的分类过程,并依据各类属性数据的内在特征,确保分类结果的准确性,文中提出了改进决策树算法的混合属性大数据分类优化方法。通过主成分分析法挖掘混合属性大数据之间的内在规律,提取混合属性大数据关键特征;构建基于C4.5算法的改进决策树算法分类模型,输入提取的关键特征,计算该特征的信息熵和信息增益率,采用动态调整的方式进行模式学习,实现动态修正信息熵,以此优化节点的分裂效果,从而进一步提升分类精准度,输出混合属性大数据分类结果。通过实验验证,该方法具有极高的精确度,能够清晰区分不同类别的数据,且性能稳定,分类效率更高、可靠性更强,能够有效抵御噪声对分类性能的不利影响,证明了所提方法实现混合属性大数据分类稳定性和可靠性。 展开更多
关键词 改进决策树算法 混合属性大数据 分类优化 C4.5算法 信息熵 信息增益率
在线阅读 下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部