为什么alphago的自对弈棋局很凶,却和人类对弈?

在13结束的AlphaGo与李世石的比赛第四局,李世石获胜。连输三局后,人类终于扳回一局。然而,这场胜利来得有点晚,AlphaGo早已高高兴兴地赢得了这场人机大赛。人们最想问的是,AlphaGo为什么能打败人类?

赛前,无论是职业棋手还是科技界都不看好机器胜利。

机器打败了人类,让无数人惊讶和惊喜。比赛开始前,很多职业棋手都认为AlphaGo赢不了比赛。棋圣聂卫平赛前总结说,电脑和人下围棋,100%人赢。

科技界对AlphaGo能否赢得比赛持谨慎乐观态度,并不是完全有信心。这一点从AlphaGo创始人戴密斯·哈萨比斯在第二局比赛后的发言中就可以看出,当时他认为AlphaGo的胜利是不可思议的。

在与李世石对弈之前,AlphaGo曾在去年6月5438+10月与欧洲围棋冠军范辉对弈,并以5-0击败范辉。在非正式比赛中,范辉在中盘两次击败AlphaGo。

这也是AlphaGo很难战胜李世石的原因。范辉的等级是职业选手II,李世石是职业选手IX。围棋界公认他们的围棋水平是:范辉踩着职业门槛,而李世石是顶级职业,围棋之前的世界第一人,代表了人类围棋的最高水平。

然而仅仅5个月后,AlphaGo在五局棋赛中以3-0战胜李世石,并在比赛过程中产生了许多令专业人士惊讶的妙手。

很多关心人机战的人都想知道一个问题:

谷歌是如何设计AlphaGo的?

比如AlphaGo的运行机制是什么?进入自学习阶段后,Google团队还需要手动优化、改进、升级吗?还是完全依靠自己的学习能力来提高?

最近两天,DoNews记者在推特上就此问题两次询问德米什·哈萨比斯,但德米什·哈萨比斯没有回应。

所有向公众发布的信息,包括发表在《自然》杂志上的两篇论文,都只提到了他们的AlphaGo能做什么,并没有透露AlphaGo的运行机制是什么,也就是AlphaGo是怎么做的。

Demich Hassabis只是透露,就AlphaGo的游戏水平而言,他们的神经网络训练算法远比它使用的硬件重要。此外,这场人机大战消耗的计算量与AlphaGo和范辉对局消耗的计算量相差无几,采用分布式方案搜索,可以有效节省决策时间。

为什么人工智能会战胜人类,吸引如此多的关注?

围棋,一种起源于中国,有着2000年历史的智力游戏,曾被认为是人工智能无法超越人类的最后一种游戏。围棋游戏规则是:棋盘由19条等距离、垂直交叉的平行线组成。形成361个交叉点,在围棋中称为“点”。游戏中,双方各持一枚相同颜色的棋子,轮流出招。最后谁占据的点数多谁就赢。

围棋的规则虽然简单,但基于这一规则的谋略、棋理、布局、格局、手部肌肉、手段却是层出不穷。

聂卫平曾经解释过原因。围棋棋盘上有361个点,其理论变化值为361阶乘。阶乘本身是一个无穷大的数,无法表示。

例如,一个玩家第一手牌有361点可供选择,第二手牌有360点,359,361× 360× 359×...第三手2× 1阶乘。(据统计,结果大约是1.43乘以10的768次方。)

这个数字有多大?谷歌的灵感来自于Googol这个词,以表明知识的海洋是无穷无尽的。Googol代表“100的100次方”,是目前人类最有想象力的数字。即使知道宇宙的原子数量,也只是10的80次方。

同时,在围棋比赛中,也有很多变化:打二送一、打三送一、抢、摔等。,而每一个变化都会引发无数个变化。

在下棋的过程中,棋手需要有一个判断。此前,计算机被认为无法承受这种判断,因为它无法通过计算来完成。

AlphaGo是怎么做到的?

AlphaGo结合了三项技术:蒙特卡罗树搜索(MCTS)是一个大框架,也是很多游戏AI使用的算法;强化学习(RL)是一种增强人工智能强度的学习方法。深度神经网络(DNN)是拟合态势评估函数和策略函数的工具。

这里用更通俗的语言解释一下:棋盘上有361个点,AlphaGo会做一个逐层分析:哪个点或区域对弈有利?此时会参考输入的过往棋谱,选择推演游戏和模拟,并对推演结果进行评估。AlphaGo可以理解为,它会按照“赢”的目标进行评估,选择一个对“赢”来说足够优秀的解。

去吗?AI可以超越人类的东西有很多。

AlphaGo的胜利引发了一场大讨论。因为人类开始面临一个前所未有的局面:人类创造了某种在智力上超越自己的东西。通过黑白条纹的胜利,AI打开了人类智力围栏的第一个缺口,但这绝不是最后一个。

在过去漫长的岁月里,机器只是人类劳动的替代品和工具。无论是飞机、汽车、起重机、计算机、互联网,虽然看似拥有无限的能力,却从未侵入人脑主导的领域——“创造”。

而随着AlphaGo的胜利,这一天可能会成为历史。事实上,在过去的几天里,围棋中这种人工智能的创造能力已经超过了人类两千年来以这种方式积累的智慧。

如果我们搜索人类的“资源库”,会发现复杂程度超过围棋的智力行为并不多见。这也意味着人类脑力劳动的许多传统形式发生了变化。大量从事创作、设计、演绎、归纳的工作将被AI部分取代。

如果拓展思路,可以应用到音乐创作中,以及其他类似于元素组合的创作中。从某种意义上来说,它可以打败围棋顶级选手,音乐和旋律可能很难分辨真假。甚至做更多我们想不到的事情。

根据Demich Hassabis的说法,未来人工智能的主要用途将是医疗、智能助理和机器人。

人们通过这场比赛担心的是,如果人工智能拥有创造性思维,并且远远超过人类的计算能力,是否有一天会统治人类。

就像网友评论里的那段“AlphaGo第四局输了。AlphaGo是故意输的吗?仔细想想又害怕。”