基于改进UCT算法的苏拉卡尔塔棋理论研究

Research on the theory of Surakarta chess based on improved UCT algorithm

下载PDF

导出

摘要 UCT(Upper Confidence Bound Apply to Tree)算法,即上限置信区间算法,是对蒙特卡洛算法利用UCB1算法进行改良的随机模拟算法。但对于苏拉卡尔塔棋,有大量的棋子数较多的棋局,单次模拟的随机性很难快速完成一次有效对局。甚至过多随机模拟会使单局的最终结果与真实情况大相径庭。对此利用限制单局模拟次数搭配估值函数来改进UCT的模拟函数,有效的提升了UCT算法的模拟速度和模拟准确性,提高了UCT算法的博弈能力。 UCT(Upper Confidence Bound Apply to Tree)algorithm is a stochastic simulation algorithm modified by Monte Carlo algorithm using UCB1 algorithm.However,in the case of Surakarta,there are a large number of chess games with a large number of pieces,and the randomness of a single simulation is difficult to quickly complete an effective game.Even too many random simulations can make the final result of a single round very different from the real situation.In this regard,the simulation function of UCT is improved by limiting the number of simulations in a single game and the estimation function,which effectively improves the simulation speed and accuracy of the UCT algorithm and improves the game ability of the UCT algorithm.

作者杨鑫朋王静文 YANG Xinpeng;WANG Jingwen(School of science,Shenyang University of Technology,Shenyang 110870,China)

机构地区沈阳工业大学理学院

出处《智能计算机与应用》 2025年第12期83-87,共5页 Intelligent Computer and Applications

关键词苏拉卡尔塔棋 UCT算法改进UCT算法 Surakarta UCT algorithm improvement UCT algorithm

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1张涛,江业峰,李博文.基于PVS算法的苏拉卡尔塔棋博弈系统设计与实现[J].信息与电脑,2023,35(19):46-48. 被引量：1
2车晓菲,徐勇,蒋宗华.苏拉卡尔塔棋系统的设计与实现[J].信息与电脑,2021,33(6):70-73. 被引量：3
3李东轩,胡伟,王静文.基于Alpha-Beta算法的苏拉卡尔塔棋博弈系统研究[J].智能计算机与应用,2022,12(2):123-125. 被引量：2
4张利群.实现苏拉卡尔塔棋网络博弈平台的吃子算法[J].计算机工程与应用,2016,52(7):62-66. 被引量：5
5王仁泉,丁濛,李淑琴,石露颖,戚译中,刘朔言.基于强化学习的苏拉卡尔塔博弈算法[J].智能计算机与应用,2020(4):6-8. 被引量：1
6徐志凡,王静文,李媛.基于UCT算法改进的Hex棋博弈系统研究[J].智能计算机与应用,2022,12(3):183-185. 被引量：2
7肖齐英,王正志.博弈树搜索与静态估值函数[J].计算机应用研究,1997,14(4):74-76. 被引量：6
8李淑琴,李静波,韩裕华,陶思拓.苏拉卡尔塔博弈系统中评估函数的研究[J].北京信息科技大学学报（自然科学版）,2012,27(6):42-45. 被引量：7
9张博,李淑琴,李臻.苏拉卡尔塔棋中残局的优化[J].智能计算机与应用,2017,7(1):83-85. 被引量：3
10靳淑娴,高铭,王修锴.开局库在点格棋计算机博弈系统中的应用[J].数字技术与应用,2022,40(1):61-63. 被引量：2

二级参考文献41

1李东轩,胡伟,王静文.基于Alpha-Beta算法的苏拉卡尔塔棋博弈系统研究[J].智能计算机与应用,2022,12(2):123-125. 被引量：2
2张宜放,孟坤.基于点格棋的UCT算法研究与分析[J].智能计算机与应用,2020(4):27-31. 被引量：3
3徐心和,王骄.中国象棋计算机博弈关键技术分析[J].小型微型计算机系统,2006,27(6):961-969. 被引量：62
4周玮,王水涛,孙旸.中国象棋计算机博弈中的一种数据结构方法[J].计算机工程与应用,2006,42(35):219-221. 被引量：2
5魏钦刚,王骄,徐心和,南晓斐.中国象棋计算机博弈开局库研究与设计[J].智能系统学报,2007,2(1):85-89. 被引量：6
6徐心和,徐长明.计算机博弈原理与方法学概述[C].中国人工智能进展:2009.北京:北京邮电出版社,2009.10.
7[3]THOMAS R.Lincke,Strategies for the automatic construction of opening books[A].Computer and Games:Second International Conference[C].Hamamutsu,Japan,2000.
8[4]KARAPETYAN A,RICHARD J.Lorentz,generating an opening book for amazons[A].4th Internatinal Conference on Computers and Game[C].Ramat-Gam,Israel,2004.
9[5]MICHAEL B.Toward opening book learning[M].USA,NEC research Institute,2001.
10刘知青,李文峰.现代计算机围棋基础[M].北京:北京邮电大学出版社,2011:63-80.

共引文献17

1李东轩,胡伟,王静文.基于Alpha-Beta算法的苏拉卡尔塔棋博弈系统研究[J].智能计算机与应用,2022,12(2):123-125. 被引量：2
2张越,芦东昕.面向目标的博弈搜索策略及其应用[J].计算机技术与发展,2007,17(3):102-105.
3张怀,许林英.空间有限条件下博弈搜索算法的优化[J].电子测量技术,2007,30(8):26-29. 被引量：1
4陈向勇,李春吉,李宁.机器博弈中韩国象棋与中国象棋的比较[J].重庆工学院学报（自然科学版）,2008,22(1):110-114.
5戴翔.博弈及其常用搜索算法初探[J].无线互联科技,2011,8(12):39-40. 被引量：1
6韩卫,任建敏,吴瑞芳.基于数据库技术的中国象棋软件开局库的设计与实现[J].科学技术与工程,2012,20(3):555-559. 被引量：3
7汪婷,喻金科.基于Xcode的智能五子棋的设计[J].计算机与现代化,2012(2):185-186. 被引量：2
8廖景亮,陈冬强.机器博弈中搜索算法的研究[J].福建电脑,2012,28(10):57-60.
9张博,李淑琴,李臻.苏拉卡尔塔棋中残局的优化[J].智能计算机与应用,2017,7(1):83-85. 被引量：3
10王亚杰,邱虹坤,吴燕燕,李飞,杨周凤.计算机博弈的研究与发展[J].智能系统学报,2016,11(6):788-798. 被引量：34

1钱航,张南,田猛.贝叶斯方法在地质学和地球化学中的应用[J].北京大学学报(自然科学版),2025,61(6):1201-1217.
2李磊,李鹏.参数不确定性下压水堆燃料棒非线性流致振动磨损研究[J].核技术,2025,48(12):129-137.
3籍风磊,杜小龙,闫晓明,迟学芬.基于MSFN可靠性的通信网络优化平台开发[J].吉林大学学报(信息科学版),2025,43(6):1201-1206.
4傅晨琦,王亦昌,廖玉龙,郑力维.基于禁忌搜索算法的索道运输路径规划仿真[J].计算机仿真,2025,42(11):53-57.
5雷铮,宋佳,罗涛,闫大威,张天宇.模糊神经网络下高比例新能源接入容量估计[J].电子设计工程,2025,33(22):123-126.
6苏锦涛,陈黎.统计能量中频扩展方法综述[J].汽车技术,2025(11):57-62.
7张海军,杨明驰.基于BIM技术的建筑暖通空调系统节能优化设计[J].产品设计,2023(21):0073-0075.
8李慧.基于B/S架构的数据共享网站系统的设计与实现[J].微型电脑应用,2025,41(9):248-254. 被引量：1
9喻静,裴洪军,汪丙国.江汉平原双层结构包气带渗透系数不确定性对氨氮运移的影响[J].地质科技通报,2025,44(6):249-258.
10王殿超,唐阳山.基于蒙特卡罗模拟法的多级库存系统优化[J].公路交通科技,2025,42(8):207-214.

智能计算机与应用

2025年第12期

浏览历史

内容加载中请稍等...

基于改进UCT算法的苏拉卡尔塔棋理论研究

参考文献11

二级参考文献41

共引文献17

相关作者

相关机构

相关主题

浏览历史