检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

高级检索
期刊导航

共找到36篇文章

< 1 2 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

	题名	作者	出处	发文年	被引量	操作
1	A geospatial service composition approach based on MCTS with temporal-difference learning	Zhuang Can Guo Mingqiang Xie Zhong	《High Technology Letters》 EI CAS	2021	0	在线阅读下载PDF 职称材料
2	基于随机森林模型识别浅层地下水TDS异常的方法研究	褚宴佳何宝南陈珍何江涛	《地学前缘》北大核心	2025	4	在线阅读下载PDF 职称材料
3	TD learning,PER和Epsilon:深度学习对高等教育教学的启示	张慧	《教育教学论坛》	2018	0	在线阅读下载PDF 职称材料
4	Self-Play and Using an Expert to Learn to Play Backgammon with Temporal Difference Learning	Marco A. Wiering	《Journal of Intelligent Learning Systems and Applications》	2010	0	暂未订购
5	基于TD-Mask R-CNN的机械装配体图像实例分割	唐若仪陈成军王金磊代成刚	《组合机床与自动化加工技术》北大核心	2024	3	在线阅读下载PDF 职称材料
6	On a novel tracking differentiator design based on iterative learning in a moving window	Xiangyang Li Rafal Madonski Zhiqiang Gao Senping Tian	《Control Theory and Technology》 EI CSCD	2023	0	原文传递
7	基于免疫算法的TD-SCDMA网络基站选址优化	张英杰毛赐平俎云霄孙先佑	《通信学报》 EI CSCD 北大核心	2014	24	在线阅读下载PDF 职称材料
8	一种二阶TD Error快速Q(λ)算法	傅启明刘全孙洪坤高龙李瑾王辉	《模式识别与人工智能》 EI CSCD 北大核心	2013	5	在线阅读下载PDF 职称材料
9	平均和折扣准则MDP基于TD(0)学习的统一NDP方法	唐昊周雷袁继彬	《控制理论与应用》 EI CAS CSCD 北大核心	2006	5	在线阅读下载PDF 职称材料
10	TD再励学习在卫星姿态控制中的应用	刘向东崔晓婷王华张宇河	《北京理工大学学报》 EI CAS CSCD 北大核心	2006	1	在线阅读下载PDF 职称材料
11	基于TD学习的网格资源预测方法	张树东曹元大廖乐键	《计算机工程》 EI CAS CSCD 北大核心	2005	1	在线阅读下载PDF 职称材料
12	增强型深度强化学习方法应用于化工过程控制	张佳鑫董立春	《化工进展》北大核心	2025	0	在线阅读下载PDF 职称材料
13	A Reinforcement Learning Based Approach to Partition Testing	Chang-Ai Sun Ming-Jun Xiao He-Peng Dai Huai Liu	《Journal of Computer Science & Technology》	2025	0	原文传递
14	The investigation of reinforcement learning-based end-to-end decision-making algorithms for autonomous driving on the road with consecutive sharp turns	Tongyang Li Jiageng Ruan Kaixuan Zhang	《Green Energy and Intelligent Transportation》	2025	0	原文传递
15	Evaluating Domain Randomization Techniques in DRL Agents:A Comparative Study of Normal,Randomized,and Non-Randomized Resets	Abubakar Elsafi	《Computer Modeling in Engineering & Sciences》	2025	0	在线阅读下载PDF 职称材料
16	基于TD-error自适应校正的深度Q学习主动采样方法	白辰甲刘鹏赵巍唐降龙	《计算机研究与发展》 EI CSCD 北大核心	2019	12	在线阅读下载PDF 职称材料
17	基于Q学习和TD误差的传感器节点任务调度算法	徐祥伟魏振春冯琳张岩	《合肥工业大学学报（自然科学版）》 CAS 北大核心	2017	1	在线阅读下载PDF 职称材料
18	TD-LTE网络中大气波导干扰的分析与预测	孙天宇周婷杨旸	《中兴通讯技术》	2018	10	在线阅读下载PDF 职称材料
19	基于强化学习TD算法的乒乓游戏击球策略优化	陈功周谊成王辉	《电脑知识与技术》	2011	0	在线阅读下载PDF 职称材料
20	强化学习原理、算法及应用	黄炳强曹广益王占全	《河北工业大学学报》 CAS	2006	19	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部