期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
Novel detection method for infrared small targets using weighted information entropy 被引量:13
1
作者 Xiujie Qu He Chen Guihua Peng 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第6期838-842,共5页
This paper presents a method for detecting the small infrared target under complex background.An algorithm,named local mutation weighted information entropy(LMWIE),is proposed to suppress background.Then,the grey valu... This paper presents a method for detecting the small infrared target under complex background.An algorithm,named local mutation weighted information entropy(LMWIE),is proposed to suppress background.Then,the grey value of targets is enhanced by calculating the local energy.Image segmentation based on the adaptive threshold is used to solve the problems that the grey value of noise is enhanced with the grey value improvement of targets.Experimental results show that compared with the adaptive Butterworth high-pass filter method,the proposed algorithm is more effective and faster for the infrared small target detection. 展开更多
关键词 infrared small target detection local mutation weight-ed information entropy(LMWIE) grey value of target adaptivethreshold.
在线阅读 下载PDF
Evaluating Shannon Entropy-Weighted Bivariate Models and Logistic Regression for Landslide Susceptibility Mapping in Jelapang,Perak,Malaysia
2
作者 Nurul A.Asram Eran S.S.Md Sadek 《Revue Internationale de Géomatique》 2025年第1期619-637,共19页
Landslides are a frequent geomorphological hazard in tropical regions,particularly where steep terrain and high precipitation coincide.This study evaluates landslide susceptibility in the Jelapang area of Perak,Malays... Landslides are a frequent geomorphological hazard in tropical regions,particularly where steep terrain and high precipitation coincide.This study evaluates landslide susceptibility in the Jelapang area of Perak,Malaysia,using Shannon Entropy-weighted bivariatemodels(i.e.,Frequency Ratio,Information Value,andWeight of Evidence),in comparison with Logistic Regression.Seven conditioning factors were selected based on their geomorphological relevance and tested for multicollinearity:slope gradient,slope aspect,curvature,vegetation cover,lineament density,terrain ruggedness index,and flow accumulation.Each model generated susceptibility maps,which were validated using Receiver Operating Characteristic curves and Area Under the Curve metrics.Logistic Regression yielded the highest predictive accuracy,reflecting its strength in capturing interactions among variables.Among the bivariate models,Frequency Ratio performed best,slightly outperforming the other two methods.Zones of high susceptibility were consistently located along steep slopes,high lineament density areas,and near built environments.The study demonstrates that incorporating Shannon Entropy improves the performance of conventional bivariate methods and provides a useful framework for spatial susceptibility modeling in data-constrained environments.The comparison with Logistic Regression highlights the advantages ofmultivariate modeling in capturing complex spatial relationships.Limitations of the study include the use of secondary spatial data and the exclusion of dynamic parameters such as rainfall intensity.Future research should incorporate temporal datasets and investigate machine learning techniques to enhance model generalizability and predictive capability. 展开更多
关键词 Bivariatemethods frequency ratio information value landslides susceptibilitymapping logistic regression shannon entropy weight of evidence
在线阅读 下载PDF
Information Worth of MinMaxEnt Models for Time Series
3
作者 Aladdin Shamilov Cigdem Giriftinoglu 《Applied Mathematics》 2015年第2期221-227,共7页
In this study, by starting from Maximum entropy (MaxEnt) distribution of time series, we introduce a measure that quantifies information worth of a set of autocovariances. The information worth of autocovariences is m... In this study, by starting from Maximum entropy (MaxEnt) distribution of time series, we introduce a measure that quantifies information worth of a set of autocovariances. The information worth of autocovariences is measured in terms of entropy difference of MaxEnt distributions subject to different autocovariance sets due to the fact that the information discrepancy between two distributions is measured in terms of their entropy difference in MaxEnt modeling. However, MinMaxEnt distributions (models) are obtained on the basis of MaxEnt distributions dependent on parameters according to autocovariances for time series. This distribution is the one which has minimum entropy and maximum information out of all MaxEnt distributions for family of time series constructed by considering one or several values as parameters. Furthermore, it is shown that as the number of autocovariances increases, the entropy of approximating distribution goes on decreasing. In addition, it is proved that information worth of each model defined on the basis of MinMaxEnt modeling about stationary time series is equal to sum of all possible information increments corresponding to each model with respect to preceding model starting with first model in the sequence of models. The fulfillment of obtained results is demonstrated on an example by using a program written in Matlab. 展开更多
关键词 Maximum entropy DISTRIBUTION Time Series Estimation of MISSING valueS MinMaxEnt DISTRIBUTION information WORTH
暂未订购
改进二叉树Entropy-SVM算法的芒果分类检测
4
作者 周靖 刘晋胜 《微处理机》 2010年第6期52-56,共5页
提出一种二叉树Entropy-SVM的改进算法,并将其引入芒果分类检测系统。针对传统SVM在多类分类方式及类区分性度量上的不足,首先对样本系统中任意二类问题,把相同的特征属性值信息熵作为样本类别归属的影响因子,然后把样本的平均属性值信... 提出一种二叉树Entropy-SVM的改进算法,并将其引入芒果分类检测系统。针对传统SVM在多类分类方式及类区分性度量上的不足,首先对样本系统中任意二类问题,把相同的特征属性值信息熵作为样本类别归属的影响因子,然后把样本的平均属性值信息熵定义为二类间的区分因子,由该定义计算二类间的区分度来得到样本系统中每一类的平均区分度。最后把平均区分度的高低作为二叉树SVM多类分类策略的依据,度值越高的类,越早分离。芒果分类检测试验表明,改进的二叉树Entropy-SVM分类检测的准确率明显高于传统SVM多类分类算法。 展开更多
关键词 属性值信息熵 区分度 二叉树SVM 芒果分类
在线阅读 下载PDF
Study on evaluation standard of uncertainty of design wave height calculation model 被引量:1
5
作者 Baiyu CHEN Yi KOU +2 位作者 Fang WU Liping WANG Guilin LIU 《Journal of Oceanology and Limnology》 SCIE CAS CSCD 2021年第4期1188-1197,共10页
The accurate calculation of marine environmental design parameters depends on the probability distribution model,and the calculation results of different distribution models are often different.It is very important to... The accurate calculation of marine environmental design parameters depends on the probability distribution model,and the calculation results of different distribution models are often different.It is very important to determine which distribution model is more stable and reasonable when extrapolating the recurrence level of the studied sea area.In this paper,we constructed an evaluation method of the overall uncertainty of the calculation results and a measurement of the uncertainty of the design parameters derivation model,by incorporating the influence of sample information on the model information entropy,such as sample size,degree of dispersion,and sampling error.Results show that the sample data size and the degree of dispersion are directly proportional to the information entropy.Within the same group of data,the maximum entropy distribution model has the lowest overall uncertainty,while the Gumbel distribution model has the largest overall uncertainty.In other words,the maximum entropy distribution model has good applicability in the accurate calculation of marine environmental design parameters. 展开更多
关键词 UNCERTAINTY information entropy extreme value distribution model
在线阅读 下载PDF
基于WP-TRP的滚动轴承故障诊断方法
6
作者 王娜 崔月磊 +1 位作者 罗亮 王子从 《东北大学学报(自然科学版)》 北大核心 2025年第3期20-27,共8页
针对故障诊断中传统时频域法提取特征时易受主观因素影响而导致冗余,且深度学习算法受训练数据影响导致计算复杂性较高的缺点,将时域和频域结合,提出一种基于小波包-无阈值递归图(WPTRP)的滚动轴承故障诊断方法.首先,提出递减信息熵准则... 针对故障诊断中传统时频域法提取特征时易受主观因素影响而导致冗余,且深度学习算法受训练数据影响导致计算复杂性较高的缺点,将时域和频域结合,提出一种基于小波包-无阈值递归图(WPTRP)的滚动轴承故障诊断方法.首先,提出递减信息熵准则,以克服小波包分解的主观性,获取更准确的时频域特征;在此基础上,引入无阈值递归图思想,充分提取数据初始时域特征,并利用奇异值分解进一步降低冗余特征,提高计算效率.然后,引入海洋捕食者算法来获得支持向量机最优参数,实现故障诊断的准确分类.最后,通过标准滚动轴承数据集仿真验证了所提方法的有效性. 展开更多
关键词 故障诊断 小波包分解 信息熵 无阈值递归图 奇异值分解 海洋捕食者算法
在线阅读 下载PDF
基于信息熵理论的中成药特征价格取值方法探析 被引量:1
7
作者 杨一玖 张海力 +8 位作者 刘斌 梁宁 李慧珍 宋填 曹文杰 胡紫腾 王燕平 韩晟 史楠楠 《中国卫生经济》 北大核心 2025年第2期13-17,共5页
目的:探讨基于信息熵理论的中成药特征价格选取方法,通过分析不同价格指标间的内涵差异性,结合信息熵度量对特征价格选择的科学性进行验证,以优化中成药定价模型并提升价格评估的准确性。方法:通过对中成药的最小制剂单位价格中位数、... 目的:探讨基于信息熵理论的中成药特征价格选取方法,通过分析不同价格指标间的内涵差异性,结合信息熵度量对特征价格选择的科学性进行验证,以优化中成药定价模型并提升价格评估的准确性。方法:通过对中成药的最小制剂单位价格中位数、平均日费用和平均疗程费用进行相关性分析和信息熵计算,比较不同价格指标的信息多样性和不确定性。结果:平均日费用在所有考察的价格指标中具有较高的信息多样性和不确定性。结论:建议将平均日费用作为中成药价格研究的特征价格因变量。该选择对于优化中成药定价模型和提高价格评估准确性具有重要的指导意义。 展开更多
关键词 信息熵 特征价格 中成药 价值定价
原文传递
基于信息熵的实物捐助物资筛选和分拣优化策略研究 被引量:1
8
作者 吴敏莲 樊彧 +2 位作者 王熹徽 刘林冬 李云博 《中国管理科学》 北大核心 2025年第6期105-115,共11页
实物捐助是社会力量参与灾害应急救援的重要途径之一,但低效和无效的实物捐助会大量占用应急管理部门的资源和人手,导致物资聚集效应,反而影响应急救援工作的开展。目前实物捐助管理的难点是如何筛选和分拣混合类型的物资,控制劣质和无... 实物捐助是社会力量参与灾害应急救援的重要途径之一,但低效和无效的实物捐助会大量占用应急管理部门的资源和人手,导致物资聚集效应,反而影响应急救援工作的开展。目前实物捐助管理的难点是如何筛选和分拣混合类型的物资,控制劣质和无效捐助造成的不利影响。本文提出了一种基于信息熵的实物捐助物资筛选和分拣优化策略,旨在解决应急管理部门在何种情况下应接受实物捐助,以及如何高效分配资源以优化实物捐助处理效果这两个应急管理中的关键问题。本研究通过比较混合信息,构建了一种分步式实物捐助的分拣系统模型,给出相应判定阈值用于判断拒绝、误差筛选和完全筛选等分拣策略,并分析了不同参量对各阈值的影响。最后,通过设计随机分流算法和资源约束下的优化算法,本研究对所提出的模型结合实际数据进行计算分析,验证了所提出控制标准的准确性与可行性。 展开更多
关键词 灾害应急 实物捐助 信息价值 物资分流 信息熵
原文传递
基于信息熵和决策树的信息化管控数据异常值检测方法 被引量:2
9
作者 罗清 葛宇昊 武峰波 《微型电脑应用》 2025年第1期209-211,216,共4页
通过计算管控数据特征的信息熵,对数据特征进行筛选,导致信息化管控数据异常值较多。因此,设计基于信息熵和决策树的信息化管控数据异常值检测方法。获取大量的信息化管控数据,进行标准化计算和降维处理,提取多个管控数据特征,并计算不... 通过计算管控数据特征的信息熵,对数据特征进行筛选,导致信息化管控数据异常值较多。因此,设计基于信息熵和决策树的信息化管控数据异常值检测方法。获取大量的信息化管控数据,进行标准化计算和降维处理,提取多个管控数据特征,并计算不同数据特征的信息熵值,对其进行特征选择,在决策树的作用下,计算特征阈值,对管控数据特征进行分类处理,通过计算管控数据之间的距离,对当前管控数据是否存在异常值进行判定。实验结果表明,所提方法在实际应用中的误检率较低,检测效果较好。 展开更多
关键词 信息熵 决策树 信息化 管控数据 数据异常 异常值检测
在线阅读 下载PDF
基于多维信息熵值与随机森林的计算机网络DDoS攻击检测 被引量:1
10
作者 左捷 《微型电脑应用》 2025年第4期249-252,共4页
精准确定并有效防御网络中的DDoS攻击是确保网络安全的基础。因此,提出基于多维信息熵值与随机森林的计算机网络DDoS攻击检测方法。利用DDoS攻击特性,结合条件熵和相异熵,形成多维信息熵作为检测向量。通过训练随机森林算法,构建检测模... 精准确定并有效防御网络中的DDoS攻击是确保网络安全的基础。因此,提出基于多维信息熵值与随机森林的计算机网络DDoS攻击检测方法。利用DDoS攻击特性,结合条件熵和相异熵,形成多维信息熵作为检测向量。通过训练随机森林算法,构建检测模型,并引入边缘函数和泛化误差优化提升检测精度。测试结果显示,所提方法能够计算网络流量的多维信息熵,有效检测各类DDoS攻击,能满足不同网络模式下的检测需求。 展开更多
关键词 多维信息熵值 随机森林 计算机网络 DDOS攻击检测
在线阅读 下载PDF
基于代数和几何组合相似度的区间值系统不确定性度量
11
作者 章宏远 谢晋 《石河子大学学报(自然科学版)》 北大核心 2025年第4期512-528,共17页
不确定性度量作为机器学习和粒计算领域重要的数据评估工具,可以量化数据属性之间的不确定性和依赖性。然而,现有的区间值信息系统不确定性度量方法没有考虑数据之间的几何结构,从而影响了不确定性度量结果的准确性。为了改善这一问题,... 不确定性度量作为机器学习和粒计算领域重要的数据评估工具,可以量化数据属性之间的不确定性和依赖性。然而,现有的区间值信息系统不确定性度量方法没有考虑数据之间的几何结构,从而影响了不确定性度量结果的准确性。为了改善这一问题,首先,针对区间值信息系统提出一种结合代数视角和几何视角的区间值组合相似度;然后,以新的相似度作为基础,构建出一种新的区间值粗糙集模型,并进一步提出区间值信息系统的信息粒化与信息结构理论;最后,定义了区间值信息系统的4种不确定性度量方法,分别为知识粒度、信息量、粗糙熵和信息熵,理论证明了这4种方法在不确定性度量方面的有效性。在人脸识别数据集上的数值实验结果表明,所提出的4种不确定性度量方法均具有较好的度量效果,同时与现有的不确定性度量方法相比,所提出的4种方法具有更高的度量性能。 展开更多
关键词 粗糙集 区间值信息系统 不确定性度量 知识粒度 信息量 粗糙熵 信息熵
在线阅读 下载PDF
深入敏感值评估的隐私度量分级模型
12
作者 谢思琪 田秀霞 《计算机工程与设计》 北大核心 2025年第3期756-761,共6页
为对数据的隐私等级进行细致化评定,探求同一类型敏感属性下不同敏感值之间的差异,提出一种深入敏感值评估的隐私度量分级模型。以信息熵为度量,通过考虑敏感值的泛化程度、语义敏感度、句法结构3方面的影响,对数据集中各个敏感因素进... 为对数据的隐私等级进行细致化评定,探求同一类型敏感属性下不同敏感值之间的差异,提出一种深入敏感值评估的隐私度量分级模型。以信息熵为度量,通过考虑敏感值的泛化程度、语义敏感度、句法结构3方面的影响,对数据集中各个敏感因素进行定权计算得到记录的隐私度量向量,输入到分类器中进行分级。实验结果表明,该模型在结构化数据集和短文本数据集中都能实现无需预定义权重的敏感数据分级,准确度分别为94.17%和87.84%。 展开更多
关键词 敏感值评估 数据分级 信息熵 敏感信息识别 敏感数据管理 信息安全 依存句法分析
在线阅读 下载PDF
基于信息熵的自适应多分类器交通数据插值模型
13
作者 张运凯 高金 +1 位作者 李青 王旭 《河北科技大学学报》 北大核心 2025年第3期248-256,共9页
为了解决单一交通数据缺失值插补模型不能全面地考虑交通数据多源异构、数据量复杂等问题,提出一种基于信息熵来确定自适应权重的多分类器插值模型。首先,选择表示“混乱度”的信息熵来衡量预测结果的优劣进而确定多分类器的权重;其次,... 为了解决单一交通数据缺失值插补模型不能全面地考虑交通数据多源异构、数据量复杂等问题,提出一种基于信息熵来确定自适应权重的多分类器插值模型。首先,选择表示“混乱度”的信息熵来衡量预测结果的优劣进而确定多分类器的权重;其次,设计动态的自适应权重设定方法来解决设备差异性引起的不同样本适应的分类器不同的问题;最后,在公共数据集与自采数据集上进行验证。结果表明:所提模型相较于其他插值模型在检测效果上取得了显著的提升,并且在公开数据集“州际公路交通流量数据集”上进行的实验也取得了较高精度,F1达到0.778,RMSE提升10%,具有较强的泛化性。在使用信息熵确定权重模型的基础上,使权重跟随数据流自适应变化,具有较快的检测速度和更高的准确度,为交通数据清洗中缺失值填补模型的建立提供了技术参考。 展开更多
关键词 数据处理 交通数据清洗 缺失值预测 信息熵 自适应权重
在线阅读 下载PDF
基于单值中智优势条件熵的增量式属性约简算法
14
作者 骆公志 王聪 《数据采集与处理》 北大核心 2025年第5期1207-1221,共15页
在大数据环境下,序决策信息系统中数据的持续增长导致对象间的优势关系动态变化,高效计算属性约简成为亟待解决的关键问题。为此,提出一种增量单值中智优势条件熵,并由此构建了新的增量式属性约简算法。首先,在单值中智序决策信息系统... 在大数据环境下,序决策信息系统中数据的持续增长导致对象间的优势关系动态变化,高效计算属性约简成为亟待解决的关键问题。为此,提出一种增量单值中智优势条件熵,并由此构建了新的增量式属性约简算法。首先,在单值中智序决策信息系统下给出单值中智优势条件熵;随后,针对4种不同类型的新增对象,深入研究了单值中智优势条件熵的增量更新机制,进而根据该更新机制设计了增量式属性约简算法;最后,选取6个具有优势关系的UCI数据集对增量算法与非增量算法的有效性和高效性进行了对比分析。实验结果表明,新给出的增量属性约简算法在保持相同分类精度的条件下,可以显著提升数据处理的计算效率。 展开更多
关键词 优势条件熵 单值中智粗糙集 增量学习 序决策信息系统 属性约简
在线阅读 下载PDF
未来不同气候情景下的汉源县滑坡易发性评估
15
作者 孙福路 朱红 +3 位作者 崔成玲 孟健 吴馨悦 韩丹 《自然灾害学报》 北大核心 2025年第2期66-78,共13页
汉源县滑坡地质灾害频发,对于未来不同气候情景下的滑坡地质灾害易发性情况的预测研究,可为未来气候变化下的防灾减灾工作提供参考依据。文中基于EC-Earth3模式下的3种未来不同气候情景(SSP1-2.6、SSP2-4.5、SSP5-8.5)数据,在Pearson相... 汉源县滑坡地质灾害频发,对于未来不同气候情景下的滑坡地质灾害易发性情况的预测研究,可为未来气候变化下的防灾减灾工作提供参考依据。文中基于EC-Earth3模式下的3种未来不同气候情景(SSP1-2.6、SSP2-4.5、SSP5-8.5)数据,在Pearson相关性分析与多重共线性分析的基础上,最终选取坡度、坡向、剖面曲率、地形湿度、土地利用、距断层距离、降雨量和径流量共8个影响因子作为滑坡易发性评估指标,采用信息量-熵指数模型与支持向量机模型开展不同气候情景下滑坡易发性评估。结果表明:在SSP1-2.6、SSP2-4.5以及SSP5-8.5情景下,信息量-熵指数模型的曲线下面积(area under curve,AUC)值均为0.928,在SSP1-2.6、SSP2-4.5以及SSP5-8.5情景下,支持向量机模型的AUC值分别为0.957、0.967、0.969。支持向量机模型在未来不同气候情景下的滑坡易发性预测精度方面具有更强的鲁棒性,在SSP1-2.6、SSP2-4.5以及SSP5-8.5情景下发生滑坡灾害的区域面积分别为23.02%、21.09%、26.39%,表明在高排放、高发展的情景下,滑坡灾害发生的可能性将会更大。 展开更多
关键词 不同气候情景 信息量-熵指数模型 支持向量机模型 滑坡易发性评估
原文传递
耗散结构评价方法在库岸稳定评价中的应用
16
作者 黄宇 《广西水利水电》 2025年第5期33-36,39,共5页
本文基于耗散结构理论,结合信息熵计算方法和层次分析法,提出了一种半定量的库岸稳定性评价方法。通过引入岸坡信息熵,构建了库岸系统的熵变值计算模型,并综合考虑各影响因素的相互作用及其权重,实现了对库岸稳定性的定量评价。以某水... 本文基于耗散结构理论,结合信息熵计算方法和层次分析法,提出了一种半定量的库岸稳定性评价方法。通过引入岸坡信息熵,构建了库岸系统的熵变值计算模型,并综合考虑各影响因素的相互作用及其权重,实现了对库岸稳定性的定量评价。以某水库近坝右岸9号单元库岸段为研究对象,验证了该方法的适用性。结果表明,该方法能够较好地反映库岸系统的稳定性状态,评价结果与定性评价方法具有较高的一致性。本研究为库岸稳定性评价提供了新的思路,具有一定的工程实践和理论研究意义,但其普适性仍需通过更多案例进一步验证。 展开更多
关键词 库岸稳定性评价 信息熵 耗散结构理论 层次分析法 熵变值
在线阅读 下载PDF
原煤与型煤破裂过程的声发射响应特征对比研究
17
作者 赵煜坤 董泽星 +1 位作者 王帅旗 曹阔 《煤》 2025年第3期102-108,共7页
文章对煤炭资源开采中煤体的破坏演化过程进行监测,对煤矿安全生产和避免经济损失具有重要意义。本研究旨在进一步提高煤炭资源开采过程中声波监测方法的有效性和准确性。为此,利用岩石力学测试系统和声发射测试系统对原煤与型煤进行单... 文章对煤炭资源开采中煤体的破坏演化过程进行监测,对煤矿安全生产和避免经济损失具有重要意义。本研究旨在进一步提高煤炭资源开采过程中声波监测方法的有效性和准确性。为此,利用岩石力学测试系统和声发射测试系统对原煤与型煤进行单轴加载下的声发射事件定位实验。根据b值和单链接聚类方法的基本理论,研究了b值、空间相关长度ξ和信息熵H等相关参数随应力的变化趋势,揭示了这3个参数变化的原因。分析结果表明,加载初期b值变化不明显,但空间相关长度ξ在加载初期呈上升趋势。与b值和空间相关长度ξ相比,在加载过程的大部分时间内,信息熵H对原煤与型煤的破坏状态不敏感。但值得注意的是,在原煤与型煤试样屈曲破坏前,这3个参数均呈现出明显的变化趋势。基于三维裂纹扩展理论和微裂纹密度判据,表明这些参数的变化是原煤与型煤试样在单轴载荷作用下由小尺度微破裂向大尺度微破裂、由局部损伤向整体损伤转变过程的宏观表征。本研究为利用声发射源定位技术评价高应力条件下原煤与型煤的破坏状态提供了一种新的方法,对保障煤炭资源开采过程中的生命财产安全具有重要的指导意义和参考价值。 展开更多
关键词 单链接聚类方法 声发射b值 空间相关长度 信息熵
在线阅读 下载PDF
决策树分类算法研究 被引量:53
18
作者 张琳 陈燕 +1 位作者 李桃迎 牟向伟 《计算机工程》 CAS CSCD 北大核心 2011年第13期66-67,70,共3页
ID3算法在选择分裂属性时偏向于选取属性取值较多的属性。针对该问题,引入属性重要性和属性取值数量2个参数对ID3算法的信息增益公式进行改进,从而提高取值数量少但较为关键的属性的重要性,使算法更好地反映实际决策情况,并根据凸函数... ID3算法在选择分裂属性时偏向于选取属性取值较多的属性。针对该问题,引入属性重要性和属性取值数量2个参数对ID3算法的信息增益公式进行改进,从而提高取值数量少但较为关键的属性的重要性,使算法更好地反映实际决策情况,并根据凸函数的性质简化信息熵的计算,提高决策树的构造效率。通过实例介绍改进算法的具体应用方法,证明其性能相比原算法有所提高。 展开更多
关键词 ID3算法 信息增益 属性重要性 属性取值数量 信息熵
在线阅读 下载PDF
利用决策树进行数据挖掘中的信息熵计算 被引量:30
19
作者 张维东 张凯 +1 位作者 董青 孙维华 《计算机工程》 CAS CSCD 北大核心 2001年第3期71-72,89,共3页
介绍了怎样通过信息量或熵的比较来构造一个决策树的数据挖掘算法,并且就一些特殊的地方进行了讨论分析,例如怎样处理高分枝属性、数值属性和缺失数据以及怎样剪枝.利用模型系统的一些源代码来具体地实现算法中的一些模块,并且描述... 介绍了怎样通过信息量或熵的比较来构造一个决策树的数据挖掘算法,并且就一些特殊的地方进行了讨论分析,例如怎样处理高分枝属性、数值属性和缺失数据以及怎样剪枝.利用模型系统的一些源代码来具体地实现算法中的一些模块,并且描述了国内外的有关数据挖掘的研究情况. 展开更多
关键词 数据挖掘 决策树 信息量 信息熵 人工智能 数据库
在线阅读 下载PDF
基于邻域量化容差关系粗糙集模型的特征选择算法 被引量:29
20
作者 姚晟 徐风 +2 位作者 赵鹏 汪杰 陈菊 《模式识别与人工智能》 EI CSCD 北大核心 2017年第5期416-428,共13页
数值型不完备信息系统的特征选择方法大多是以容差关系为基础,但是这种处理方式存在数据相似性刻画过于宽松的缺陷.文中提出邻域量化容差关系的粗糙集模型,在该模型的基础上定义邻域量化容差条件熵,分析相关性质,根据邻域量化容差条件... 数值型不完备信息系统的特征选择方法大多是以容差关系为基础,但是这种处理方式存在数据相似性刻画过于宽松的缺陷.文中提出邻域量化容差关系的粗糙集模型,在该模型的基础上定义邻域量化容差条件熵,分析相关性质,根据邻域量化容差条件熵的单调性构造相应的特征选择算法.实验表明,文中算法在特征选择结果、运行时间和分类精度方面具有优越性. 展开更多
关键词 特征选择 不完备信息系统 量化容差关系 邻域 条件熵
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部