期刊文献+

人工神经网络变量选取与隐藏单元数的确定 被引量:4

The Determination of the Number of the Hidden Cells and the Variable Selection of the Neural Network
在线阅读 下载PDF
导出
摘要 根据多隐藏层所有训练样本误差平方和最小设计优化问题,求解并绘出计算流程图。Trevor等人认为隐藏单元过多比过少好,交叉验证估计(隐藏单元)正则化参数没有必要。还有一种通常做法是常常利用分类树挑选变量作为输入变量进行人工神经网络建模。而从人工神经网络与多元统计、传统回归和其他数据挖掘工具的区别和联系出发,认为这些观点和做法值得商酌;用ZIP编码实例说明隐藏单元过多不一定比过少好,实际数据分析中所需隐藏单元数的确定可以用交叉验证结合经验判断来实现,利用分类树选择的变量对于人工神经网络没有太大的效果;通过分类树删节变量以降低计算量的效果不如通过压缩隐藏单元个数降低计算量来得好;非完全问题"从简单到一般"思想与完全问题中选择所有变量的思想不矛盾。在总结了Le Cun等人的局部联结以有效降低权数思想的基础上,提出通过随机选择人工变量建立人工神经网络分布式模型系统的设想。 This article gives the solution and the flow chart by way of a optimization model that minimize total sum of error. According to some masters such as Trevor, it's better to take hidden cells, there is no need to use CR to achieve it. And CART is frequently used before ANN to delete some variables. With the example of ZIP code, you will see in this article that too more hidden cells may be worse than less, CR may be useful, using CART to delete some variable do little help to ANN model, along with the viewpoint that there is no paradox between the idea that "from simple to general" in non - complete problem and the idea that choosing all variable in complete problem. In the end, this article proposed some thought to improve.
作者 谢远涛
出处 《统计与信息论坛》 2007年第6期9-15,共7页 Journal of Statistics and Information
关键词 人工神经网络 BP算法 统计学习 数据挖掘 分类树 ANN BP statistical learning data mining CART
  • 相关文献

参考文献10

  • 1HERTZ J, KROGH A, PALMER R. Introduction to the Theory of Neural Computation[M]. Addison Wesley, Redwood City, CA. 1991:1 - 5.
  • 2BISHOP C. Neural Networks for Pattern Recognition[M]. Oxford: Clarendon Press, 1995:1 -8.
  • 3MICHAEL J,BERRY A,等.数据挖掘-客户关系管理的科学与艺术[M].袁卫,等,译.北京:中国财政经济出版社,2003(8):85-90;26-45.
  • 4Vladimir N.V著.许建华,张学工译.统计学习理论[M].北京:电子工业出版社,2004.
  • 5TREVOR H, ROBERT T, JEROME F. The Eiements of Statistical Learning: Data Mining, Inference, and Prediction[M]. New York: Springer Press, 2001:347 - 366.
  • 6TREVOR H,ROBERT T,JEROME F.统计学习基础-数据挖掘、推理与预测[M].范明,柴玉梅,等,译.北京:电子工业出版社,2004(1):245-257;176-180;187-198.
  • 7约翰斯顿,迪拉尔多.计量经济学方法(第四版)[M].北京:中国经济出版社,2002.
  • 8WITTEN Ian H, FRANK Eibe. Data Mining:Practical Machine Learning Tools and Techniques[M]. Elsevier Inc, 2005: 11 - 17.
  • 9EVERITT Brain S, HOTHORN Torsten. A Handbook of Statistical Analyses Using R[M]. Chapman & Hall/CRC, 2006: 1 - 97.
  • 10LUIS Torgo. Data Mining with R: learning by Case Studies. LIACC- FEP[M]. University of Porto, 2003:4 - 100.

共引文献6

同被引文献38

引证文献4

二级引证文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部