期刊文献+

数据开采的数据质量问题 被引量:3

Research on Data Quality for Data Mining
在线阅读 下载PDF
导出
摘要 数据质量是影响数据开采效果的重要因素 ,这个问题并未受到人们的充分重视。本文针对数据质量在数据开采中的地位 ,给出了数据质量评价的几个主要尺度。并且结合统计学和机器学习的理论 ,分析了解决数据质量的方法 ,强调提高数据质量的出发点在于控制数据源的质量。 It is a widely accepted maxim that decision are no better than data on which they are based. Data quality is vital to data mining,which have been called researchers' attention. In relation to the importance of data quality for data mining,some data quality indicators are analyzed in detail and the improvement methods of data quality are analysed using statistics and machine learning theory etc. in this paper. To solve the problem of data quality,it is a start to control the quality of data sources where data are choosed to warehouse.
出处 《管理工程学报》 CSSCI 2002年第1期21-29,共9页 Journal of Industrial Engineering and Engineering Management
基金 江苏省自然科学基金资助项目 ( 76 0 5 730 0 72 )
关键词 数据开采 数据质量 数据仓库 统计学 机器学习 数据挖掘 评价指标 data mining data quality data warehouse
  • 相关文献

参考文献1

二级参考文献4

  • 1王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量:264
  • 2Wang J,J Comput Sci Technol,1998年,13卷,2期,189页
  • 3周育健,硕士学位论文,1996年
  • 4Hu X H,Comput Intell,1995年,11卷,2期,323页

共引文献238

同被引文献26

引证文献3

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部