AlphaGo是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
AlphaGo的棋让人想起了李昌镐九段全盛时期的招法,经常走一些看似缓手的自补,其实这正是李昌镐和AlphaGo的英雄所见略同啊,已走下神坛的李昌镐,看到AlphaGo想必会别有一番滋味在心头。
这个思路相当机智开始棋面简单可供学习的专家棋谱多,因此下棋就以学人下为主,后期搜索空间变少了,则已暴力穷举为主。