这个棋的核心算法是什么

AlphaGo与人类手对局预测

假设AlphaGo仍然维持現有的算法框架但在持续的研究中,增加CPU增加训练局数,打些小补丁不断提升能力,那么可以对它的力进行推测

这些改进就是让強的越强,但是本质的弱点无法消除也许可以加一些程序代码,处理连环劫、多劫之类的bug型局面AlphaGo的策略网络和价值网络已经很好了,對人类有优势或者不吃亏AlphaGo的MCTS能力对于锁定胜局、抓对手大错误足够了,但还不足以消除自身的错误增加CPU也不会有本质提高。虽然锁定勝局时这种死算比人类更靠谱,但对于开放式局面仍然远不够用这是算法本质的问题。

对于大多数业余手AlphaGo只用策略网络和价值网络,连MCTS都不用就能轻松获胜了。而且下速度特别快只是算神经网络的输出值,]EV[美林谷杯首届世界计算机围锦标赛人机大战三番第3局 07:28:06]

我要回帖

更多关于 自走棋魔抗算法 的文章

 

随机推荐