深度学习应用技术研究被引量：60

Study on application technology of deep learning

下载PDF

导出

摘要针对深度学习应用技术进行了研究性综述。详细阐述了RBM(受限玻尔兹曼机)逐层预训练后再用BP(反向传播)微调的深度学习贪婪层训练方法,对比分析了BP算法中三种梯度下降的方式,建议在线学习系统采用随机梯度下降,静态离线学习系统采用随机小批量梯度下降;归纳总结了深度学习深层结构特征,并推荐了目前最受欢迎的五层深度网络结构设计方法。分析了前馈神经网络非线性激活函数的必要性及常用的激活函数优点,并推荐Re LU(rectified linear units)激活函数。最后简要概括了深度卷积神经网络、深度递归神经网络、长短期记忆网络等新型深度网络的特点及应用场景,归纳总结了当前深度学习可能的发展方向。 This paper reviewed the deep learning algorithms and their applications. It elaborated the greedy layer training al- gorithm which used the fine-grained back-propagation （BP） learning following the layer-wise pre-training on each restricted Bohzmann machine （RBM） layer. After comparing and analyzing the three ways of gradient descent in the BP algorithm, this paper suggested applying stochastic gradient descent in online learning and adopting stochastic mini-batch gradient descent in static offline learning. It summarized the characteristic of the network structure in deep learning and recommend the design of state-of-art five-layer network architecture. It also analyzed the necessity of the nonlinear activation function in feedforward neural networks and the advantages of the common activation functions, and recommended using ReLU activate function. Fi- nally, the paper provided a brief summary of features and application scenarios of emerging deep neural networks such as deep CNN （convolutional neural networks） , deep RNNs（ recurrent neural networks） and LSTM （long short-termmemory networks） , as well as the potential directions of future deep learning applications and research.

作者毛勇华桂小林李前贺兴时

机构地区西安工程大学理学院西安交通大学电子与信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2016年第11期3201-3205,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61472316 61172090) 国家科技重大专项基金资助项目(2012ZX03002001) 高等教育博士点研究基金资助项目(20120201110013) 陕西省自然科学基金资助项目(2014JM1006 2014KRM28-01) 中央高校基本科研业务费专项资金资助项目(XKJC2014008) 陕西省自然科学创新工程资助项目(2013SZS16-Z01/P01/K01)

关键词受限玻尔兹曼机深度神经网络梯度下降验证集监督学习贪婪层训练方法深度学习深度学习层次结构 RBM DNN gradient descent training set supervised learning greedy layer training deep learning deep learning network architecture

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献52

1Mitchell T. Machine learning[ M ]. [ S. 1. ] : McGraw Hill, 1997.
2Alpaydin E. Introduction to machine learning [ M ]. Cambridge: MIT Press, 2004.
3Samuel A L. Some studies in machine learning using game of chec- kers[ J]. IBM Journal of Research and Development,2000,44 (1/2) :206-226.
4Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks [J]. Science,2006,313(5786) :504-507.
5Hinton G E, Osindero S, Teh Y. A fast learning algorithm for deep belief nets[ J]. Neural Computation ,2006( 18 ) : 1527-1554.
6Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks[ C]//Advances in Neural Infor- mation Processing Systems. 2012 : 1090-1098.
7Farabet C, Couprie C, Najman L, et al. Learning hierarchical fea- tures for scene labeling[J]. IEEE Trans on Pattern Analysis and Machine Intelligence ,2013,35 ( 8 ) : 1915-1929.
8Tompson J, Jain A, LECUN Y, et al. Joint training of a convolutio- nal network and a graphical model for human pose estimation [ C ]// Advances in Neural Information Processing Systems. 2014: 1799- 1807.
9Mikolov T, Deoras A, Percy D, et al. Strategies for training large scale neural network language models [ C ]//Proc of IEEE Workshop on Automatic Speech Recognition and Understanding. [ S. 1. ] : IEEE Press ,2011 : 196- 201.
10Hinton G, Deng Li, Yu Dong, et al. Deep neural networks for acous- tic modeling in speech recognition [ J]. IEEE Signal Processing Magazine,2012,29( 11 ) :82-97.

同被引文献405

1王梦溪,王娜,张欣多,邱艳芬,陈慧.人工智能医学教学平台的构建[J].中国高等医学教育,2020(3):46-48. 被引量：37
2吴阳,刘凯,陈柏,李芳,姚佳烽.自适应粒子群优化算法优化径向基函数神经网络用于电阻抗成像图像重建[J].仪器仪表学报,2020(6):240-249. 被引量：48
3高培勇.构建新发展格局:在统筹发展和安全中前行[J].经济研究,2021,56(3):4-13. 被引量：165
4陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量：263
5李艳.新兴技术与国家安全:发展规律、治理逻辑与实践路径[J].国家安全研究,2022(4):67-83. 被引量：9
6吕国印.瞬变电磁法的现状与发展趋势[J].物探化探计算技术,2007,29(S1):111-115. 被引量：68
7刘涵,刘丁,杨延西.基于遗传算法模式匹配的机器人实时视觉伺服[J].机器人,2001,23(S1):732-736. 被引量：3
8周林,吕厚军.人工神经网络应用于电力系统短期负荷预测的研究[J].四川电力技术,2008,31(6):68-72. 被引量：5
9俞可平.治理和善治引论[J].马克思主义与现实,1999,51(5):37-41. 被引量：972
10江汛,王仲奕.330kV带均压环的棒形悬式复合绝缘子电场有限元分析[J].高压电器,2004,40(3):215-217. 被引量：63

引证文献60

1杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
2苑方.基于深度学习的典型神经网络对比分析[J].中国科技纵横,2018,0(19):9-10.
3李涉川,孙天夫,黄新,梁嘉宁.基于卷积神经网络的永磁同步电机转矩观测器[J].集成技术,2018,7(6):60-68. 被引量：3
4张湘博,李文敬,周杰,李松钊.基于深度学习的物流配送路径优化算法的研究[J].现代计算机（中旬刊）,2017(5):14-20. 被引量：11
5陈亮,王震,王刚.深度学习框架下LSTM网络在短期电力负荷预测中的应用[J].电力信息与通信技术,2017,15(5):8-11. 被引量：119
6于丽,亚森.艾则孜.基于HOG特征和MLP分类器的印刷体维吾尔文识别方法[J].微型电脑应用,2017,33(6):30-33. 被引量：2
7黄子良.深度学习应用前景分析[J].通信与信息技术,2017(3):54-56. 被引量：5
8李鹏,周希霖.基于深度CRBM模型的建筑能耗预测方法[J].湘潭大学自然科学学报,2017,39(2):45-48. 被引量：2
9王忠民,张琮,衡霞.CNN与决策树结合的新型人体行为识别方法研究[J].计算机应用研究,2017,34(12):3569-3572. 被引量：18
10周子扬.机器学习与深度学习的发展及应用[J].电子世界,2017,0(23):72-73. 被引量：7

二级引证文献506

1周哲儒.基于BP神经网络的钢材价格预测研究[J].现代交通与冶金材料,2023,3(S01):147-150.
2毕秀春,杨皓峰.基于t分布的贝叶斯深度学习模型及其应用[J].计算机系统应用,2022,31(11):330-338. 被引量：1
3李飞宏,肖迎群.基于EMD-TCN-ELM的短期电力负荷预测[J].计算机系统应用,2022,31(11):223-229. 被引量：9
4冷跻峰,徐晓钟.基于EEMD-MIPCA-LSTM的燃气短期负荷预测[J].计算机系统应用,2020,29(12):163-169. 被引量：6
5李林,刁磊,唐詹,柏召,周晗,郭旭超.基于BERT_Stacked LSTM的农业病虫害问句分类方法[J].农业机械学报,2021,52(S01):172-177. 被引量：7
6张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：17
7张海瑜,陈庆龙,张斯静,张子怡,杨帆,李鑫星.基于语义知识图谱的农业知识智能检索方法[J].农业机械学报,2021,52(S01):156-163. 被引量：21
8李屹,赵春兰,屈瑶,何婷,岑康.基于多维动态隶属度的模糊时间序列的天然气月负荷预测[J].模糊系统与数学,2023,37(2):134-143. 被引量：3
9李进,高静,陈俊杰,王永军.基于条件生成对抗网络的蒙古文字体风格迁移模型[J].中文信息学报,2020,34(4):55-59. 被引量：8
10沙尔旦尔·帕尔哈提,阿布都热合曼·卡的尔,阿力木江·亚森.多字体印刷体维-哈-柯文关键词图像识别[J].计算机科学,2022,49(S02):615-620. 被引量：1

1简单又实用[J].中国计算机用户,2002(18):21-21.
2李竞,李董东,杜玉改,成鹏.基于积分投影和LSTM的微表情识别研究[J].计算机时代,2017(4):13-16. 被引量：2
3记忆网络校园网解决方案[J].信息系统工程,2002(U04):67-67.
4王裕民,顾乃杰,张孝慈.多GPU环境下的卷积神经网络并行算法[J].小型微型计算机系统,2017,38(3):536-539. 被引量：5
5汤怡群,张泽功.模式记忆网络模型[J].计算机杂志,1993,21(1):17-21.
6刘艳,郝忠孝.基于Δ-tree的自底向上的深度递归KNN查询算法[J].计算机应用研究,2011,28(8):2889-2892. 被引量：2
7邹劲松,黄凯锋.遥感图像分类中的核稀疏字典学习[J].计算机工程与设计,2016,37(6):1584-1587. 被引量：1
8王越,程昌正.协同过滤算法在电影推荐中的应用[J].四川兵工学报,2014,35(5):86-88. 被引量：7
9宋利伟,曾智勇.基于多尺度深度卷积特征的图像检索[J].福建师范大学学报（自然科学版）,2016,32(5):17-23.
10张兰华,薛绍伟,唐一源.确定性小世界特性记忆网络的建模与算法[J].微电子学与计算机,2012,29(10):1-5.

计算机应用研究

2016年第11期

浏览历史

内容加载中请稍等...

深度学习应用技术研究被引量：60

参考文献52

同被引文献405

引证文献60

二级引证文献506

相关作者

相关机构

相关主题

浏览历史

深度学习应用技术研究 被引量：60

参考文献52

同被引文献405

引证文献60

二级引证文献506

相关作者

相关机构

相关主题

浏览历史

深度学习应用技术研究被引量：60