期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
融合策略价值网络的高效棋类游戏算法
1
作者 周毅 田永谌 +1 位作者 邱宇峰 高华 《计算机与现代化》 2025年第1期86-93,共8页
棋类游戏一直是深度强化学习的研究热点,因为棋盘和棋类游戏规则具备较高复杂度,寻求棋类游戏的最优解需要耗费大量时间。现阶段的棋类游戏算法采用的基于动作概率分布的动作选择方法导致自我对弈效率低下,且策略和价值需要独立的神经... 棋类游戏一直是深度强化学习的研究热点,因为棋盘和棋类游戏规则具备较高复杂度,寻求棋类游戏的最优解需要耗费大量时间。现阶段的棋类游戏算法采用的基于动作概率分布的动作选择方法导致自我对弈效率低下,且策略和价值需要独立的神经网络计算,样本利用率低、训练耗时长。本文就上述问题提出一种融合策略价值网络的高效棋类游戏算法,以耿贝尔最大值方法替代原本的动作选择方法,且采用ε-greedy算法和模拟退火算法平衡动作搜索中探索与利用的关系。实验结果表明:相较于各种经典棋类游戏算法,本文提出的算法在对战传统算法时胜率达到90%以上。在蒙特卡洛模拟次数较小的情况下,引入耿贝尔最大值采样训练得到的模型的埃洛等级分远高于传统动作选择方法。在训练达到3000埃洛等级分的前提下,本文提出的算法能节约50%的时间。 展开更多
关键词 棋类游戏 蒙特卡洛树搜索 耿贝尔最大值方法 ε-greedy算法 模拟退火算法
在线阅读 下载PDF
一种Vague集上的直接聚类法 被引量:2
2
作者 余建坤 沈小虎 《计算机工程与应用》 CSCD 北大核心 2010年第31期143-147,共5页
Vague集是Fuzzy集的扩展,在给出几种构造Vague集相似矩阵方法的基础上,将Fuzzy集上的编网法和最大树法引入到Vague集上,定义了Vague关系图,并给出了基于Vague集的直接聚类法:编网法和最大树法。最后使用文献[1]中的例子,分别采用Vague... Vague集是Fuzzy集的扩展,在给出几种构造Vague集相似矩阵方法的基础上,将Fuzzy集上的编网法和最大树法引入到Vague集上,定义了Vague关系图,并给出了基于Vague集的直接聚类法:编网法和最大树法。最后使用文献[1]中的例子,分别采用Vague传递闭包法和Vague直接聚类法进行计算。实验结果表明,Vague直接聚类法计算简单,不会造成原始信息的失真,比Vague传递闭包法更加有效。 展开更多
关键词 VAGUE集 直接聚类法 编网法 最大树法
在线阅读 下载PDF
一种体现长距离依赖关系的语言模型 被引量:4
3
作者 李春生 《科技视界》 2014年第5期55-56,共2页
基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域,捕获的主要是词之间的局部依赖关系,但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系,显式地对词之间的长距离搭配关系... 基于N-gram的语言模型广泛应用于语音识别、机器翻译等众多自然语言处理相关领域,捕获的主要是词之间的局部依赖关系,但其本身存在一定的局限性。依存句法树能够反映出句子中各成分之间的语义修饰关系,显式地对词之间的长距离搭配关系进行建模。本文利用最大熵方法整合句子的局部依赖关系和长距离搭配关系,构建一种包含长距离依赖关系的语言模型。 展开更多
关键词 语言模型 长距离依赖 依存句法树 最大熵方法
在线阅读 下载PDF
一种基于水下机器人的构筑物场景复原优化方法
4
作者 郭云翔 周军 《锻压装备与制造技术》 2016年第6期118-123,共6页
为了克服水下构筑物场景复原过程中的累积误差,有效还原水下构筑物的表面结构信息,本文提出了一种基于水下机器人的构筑物场景复原优化方法。通过构建最大生成树,采用基本的图算法寻找基准坐标系以及完成坐标系的转换,并建立了误差方程... 为了克服水下构筑物场景复原过程中的累积误差,有效还原水下构筑物的表面结构信息,本文提出了一种基于水下机器人的构筑物场景复原优化方法。通过构建最大生成树,采用基本的图算法寻找基准坐标系以及完成坐标系的转换,并建立了误差方程,选取L-M迭代算法实现变换矩阵的最优化,采用对比实验实现了对该方法的可靠性检测。实验结果表明,采用该优化方法后可有效反映整个探测过程的图像信息,为后续的机器视觉处理建立了有效基础。 展开更多
关键词 水下构筑物 累积误差 优化方法 最大生成树 变换矩阵
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部