柯洁:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”
据悉,AlphaGo Zero可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会了围棋中的一些高级概念。值得一提的是,在经过40天训练后,AlphaGo Zero已经成功击败了AlphaGo Master(击败柯洁事的AlphaGo)!