-
题名融合策略价值网络的高效棋类游戏算法
- 1
-
-
作者
周毅
田永谌
邱宇峰
高华
-
机构
武汉科技大学信息科学与工程学院
宝信软件(武汉)有限公司
-
出处
《计算机与现代化》
2025年第1期86-93,共8页
-
基金
国家自然科学基金资助项目(62372343)。
-
文摘
棋类游戏一直是深度强化学习的研究热点,因为棋盘和棋类游戏规则具备较高复杂度,寻求棋类游戏的最优解需要耗费大量时间。现阶段的棋类游戏算法采用的基于动作概率分布的动作选择方法导致自我对弈效率低下,且策略和价值需要独立的神经网络计算,样本利用率低、训练耗时长。本文就上述问题提出一种融合策略价值网络的高效棋类游戏算法,以耿贝尔最大值方法替代原本的动作选择方法,且采用ε-greedy算法和模拟退火算法平衡动作搜索中探索与利用的关系。实验结果表明:相较于各种经典棋类游戏算法,本文提出的算法在对战传统算法时胜率达到90%以上。在蒙特卡洛模拟次数较小的情况下,引入耿贝尔最大值采样训练得到的模型的埃洛等级分远高于传统动作选择方法。在训练达到3000埃洛等级分的前提下,本文提出的算法能节约50%的时间。
-
关键词
棋类游戏
蒙特卡洛树搜索
耿贝尔最大值方法
ε-greedy算法
模拟退火算法
-
Keywords
board games
Monte Carlo tree search
Gumbel-max method
ε-greedy algorithm
simulated annealing algorithm
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种Vague集上的直接聚类法
被引量:2
- 2
-
-
作者
余建坤
沈小虎
-
机构
云南财经大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第31期143-147,共5页
-
基金
云南省自然科学基金No.2009CD076~~
-
文摘
Vague集是Fuzzy集的扩展,在给出几种构造Vague集相似矩阵方法的基础上,将Fuzzy集上的编网法和最大树法引入到Vague集上,定义了Vague关系图,并给出了基于Vague集的直接聚类法:编网法和最大树法。最后使用文献[1]中的例子,分别采用Vague传递闭包法和Vague直接聚类法进行计算。实验结果表明,Vague直接聚类法计算简单,不会造成原始信息的失真,比Vague传递闭包法更加有效。
-
关键词
VAGUE集
直接聚类法
编网法
最大树法
-
Keywords
vague sets
direct clustering method
method of draw up web
max tree method
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种体现长距离依赖关系的语言模型
被引量:4
- 3
-
-
作者
李春生
-
机构
宁夏疾病预防控制中心
-
出处
《科技视界》
2014年第5期55-56,共2页
-
文摘
基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域,捕获的主要是词之间的局部依赖关系,但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系,显式地对词之间的长距离搭配关系进行建模。本文利用最大熵方法整合句子的局部依赖关系和长距离搭配关系,构建一种包含长距离依赖关系的语言模型。
-
关键词
语言模型
长距离依赖
依存句法树
最大熵方法
-
Keywords
Language model
Long distance dependency
Dependency syntax tree
max entropy method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于水下机器人的构筑物场景复原优化方法
- 4
-
-
作者
郭云翔
周军
-
机构
河海大学机电工程学院
-
出处
《锻压装备与制造技术》
2016年第6期118-123,共6页
-
基金
江苏省科技支撑项目(BE2012096)
-
文摘
为了克服水下构筑物场景复原过程中的累积误差,有效还原水下构筑物的表面结构信息,本文提出了一种基于水下机器人的构筑物场景复原优化方法。通过构建最大生成树,采用基本的图算法寻找基准坐标系以及完成坐标系的转换,并建立了误差方程,选取L-M迭代算法实现变换矩阵的最优化,采用对比实验实现了对该方法的可靠性检测。实验结果表明,采用该优化方法后可有效反映整个探测过程的图像信息,为后续的机器视觉处理建立了有效基础。
-
关键词
水下构筑物
累积误差
优化方法
最大生成树
变换矩阵
-
Keywords
Underwater building
Cumulative error
Optimized method
max. spanning tree
Transformation matrix
-
分类号
TP391.7
[自动化与计算机技术—计算机应用技术]
-