摘要
目前,数据标准化处理通常采用的是线性变换方法,然而在处理非均匀分布的指标数据集合时,尤其是对局部集中分布数据的处理存在一定局限性,例如无法有效地将数据划分层级,缺乏辨识性等。利用Logistic曲线函数的特性构建S型曲线模型,可对指标数据进行非线性标准化处理。该方法能够在不改变数据序列及整体分布的前提下对各数据点的取值进行非线性放缩,在将数据稠密的区间进行扩大的同时将数据稀疏的区间进行压缩;同时,针对包含正负值的指标数据集合可以有效地将负值数据突显出来,并且是对特定领域指标数据非线性标准化的补充。
Data normalization process usually adopts the linear transformation method at present.However,in dealing with the non-uniform distribution of the index data set,especially the processing of the local centralized distribution data has some limitations,it can not effectively divide the data level.The author uses the characteristics of Logistic curve function to construct the Scurve model,which can deal with the non-linearity of the index data.The method can non-linearly reduce the value of each data point without changing the data sequence and the whole distribution,compress the data sparse interval while expanding the data density interval,and at the same time,in view of the index data collection of positive and negative value,can effectively highlight the negative data.This is a nonlinear normalization of index data for a particular field.
出处
《统计与信息论坛》
CSSCI
北大核心
2018年第2期17-21,共5页
Journal of Statistics and Information
基金
国家重点研发计划子课题<石化
化工行业非CO2核算方法学和企业高阶管理体系研究>(2016YFF0204401-04)
北京市社会科学基金项目<京津冀地区重点监控企业环境信息披露评价研究>(14JGB040)
国家青年科学基金项目<面向区域差异的发电资源开发与优化配置研究>(71403013)
关键词
区分度
S形曲线法
标准化
决策
discrimination
S curve method
standardization
decision-making