摘要
统计数据预处理是提升数据质量的重要阶段,包括数据审查、数据清理、数据转换和数据验证四大步骤。根据处理对象的特点及每一步骤的不同目标,统计数据预处理可采用的方法包括描述及探索性分析、缺失值处理、异常值处理、数据变换技术、信度与效度检验、宏观数据诊断等六大类。选用恰当的方法开展统计数据预处理,有利于保证数据分析结论真实、有效。
In order to improve the quality of data for analyzing, data must be prepared. Data preparation can be decomposed to four steps such as data examination, data cleaning, data transformation and data validation. The methods of data preparation include descriptive and exploratory analysis, missing data analysis, outlier processing, transformation techniques, reliability and validity analysis, and national economic data diagnosis. Data preparation can be operated by software and some possible problems must be noticed.
出处
《统计与信息论坛》
2007年第6期98-103,共6页
Journal of Statistics and Information
基金
2006年浙江省教育厅科研计划项目"统计数据质量诊断的方法与应用研究"(20061101)