是井山幸还是日本围棋的不幸？

人们说人还是那个人，狗不再是那个狗了-

但这一次，狗不再是那个狗，人也不是那个人。

昨日下午，伦智从中新获悉。com刚刚获得人生第五个冠军的棋手柯洁在中国棋院宣布，他将于明年4月再次出战围棋AI程序:

作为一名棋手，我仍然喜欢挑战强大的对手。对我来说，下棋是无止境的。下棋是一个不断挑战自己的过程。下这种棋很有意义，是我人生中很有价值的一次经历。

这是柯洁今年5月在三防棋输给AlphaGo后，第一次重燃对AI的斗志。

五冠王:柯洁的脱胎换骨。

26日，首届新奥杯世界围棋公开赛决赛在廊坊正式落下帷幕。柯洁以3/4的比分击败了另一位来自中国的选手彭，并将比分锁定在3-2。这是新奥杯的第一个世界冠军，也是柯洁的第五个个人世界冠军。至此，柯洁打破了韩国“石佛”李昌镐(21岁零295天)的纪录，成为世界上最年轻的“五冠王”，享年20岁零146天。

2015 65438+10月14，第二届百灵杯决赛柯洁3-2邱军；

2015 12.8，第20届三星杯决赛柯洁2-0；

2016 1.5，柯洁在第二届MLILY梦百合杯决赛中3-2击败李世石；

2016 12.8，柯洁在21三星杯决赛中2-1击败拓跋嘉熙；

2017 165438+10月26日，1新奥杯决赛，柯洁3-2彭。

纵观柯洁这一年的成绩，除了在与AlphaGo的战斗中大败之外，整体表现可圈可点，但也有一些起伏。AlphaGo事件后，柯洁以22连胜赢得了媒体的关注，成为历史上继宇田(26连胜)和李昌镐(24连胜)之后的第三人。然而，在放出“和人下棋也可以这么轻松”的豪言壮语后，他从8月份开始也有下滑的趋势，甚至最近还让出了38个月的世界第一的位置(8天后又重新夺回)。

虽然是以AlphaGo起家的“过气网络名人”，但柯洁对中国围棋的贡献有目共睹。围棋是一项高强度的脑力活动。柯洁是人。做人就意味着他会妥协，会情绪化，会不稳定。这半年来，人们不知道他赛前的战绩是2胜6负，也不知道他心里的郁闷，不知道他是被棋院请去穴位表演，还是还在为AlphaGo一战担忧，还是状态陷入低谷。在采访中，他说:

今年年初的时候我有很高的期望，尤其是和AlphaGo开始下棋之后的连胜。我以为没人能阻止我，后来发现还是有很多人阻止了我。后来我也释怀了，试了也无怨无悔。今年的总体结果令人满意。现在的柯洁，似乎不再是这个世界上曾经狂言的第一人。天才还是天才，但他也开始展现出作为职业棋手的一面。偶像负责吸引眼球，但玩家不能丢的是对优秀的追求。围棋的世界是多变的，你必须有竞争力，但也要毫无负担地正视自己的每一次胜利和失败。

吴清源杯:这只狗不是另一只狗。

看看柯洁，这次我们来看看狗。

今天，首届“吴清源杯”世界女子围棋赛新闻发布会在中国棋院举行。借着人工智能的势头，主办方还竖起了人工智能围棋大赛的醒目招牌，为真正的比赛主体——女子围棋大赛加油。

一代棋圣，年少离家，随时局动荡，最后魂归故里。想依托围棋打造AI产业的福州，就是这么轰动。作为中国棋手领军人物的柯洁和女子棋手于志颖，此次再次受邀担任形象大使。总之这还是一个穴位表现。

女子围棋比赛期间，还将同时举行一场人工智能围棋比赛。据主办方介绍，大赛邀请了腾讯Unique、天壤、台湾省CGI、日本DeepZenGo等多支来自中国、日本、韩国、欧美的AI战队。届时，柯洁将与上海人工智能初创公司天壤智能的AI程序展开竞争。

说到新奥杯解说界面中的天壤(天壤也可用于棋局分析)，人们会称其为“冉冉人工智能领域的后起之秀”，它也曾在本届新奥杯世界围棋大赛中担任解说，但这个在比赛中表现出色的AI并没有获得与其成绩相称的关注度。在“翔宇杯”中，其搭档聂卫平输给了台湾省世界冠军斯里塞和人工智能CGI；在龙族星球大战中，它输给了DeepZenGo，获得了第三名。或许中国人更爱冠军，人们只记得这两场比赛的胜者CGI和绝活。

由于这些原因，我们对天壤了解不多，但在翔宇杯期间，天壤创始人薛透露了一些设计思路:

其实就是基于大量的人类棋谱，然后用两个完全相同的系统不断下棋，产生人类可能不熟悉的棋路。在这个过程中，我们会不断迭代，修正下棋的策略，实现棋力的提升。乍一看类似于AlphaGo的强化学习，似乎有些GAN的意思。据不可靠消息，天壤已经达到了AlphaGo高手的水平，但我们还需要等待比赛给出答案。

另外不会是黄二号博士，而是福州大学自动化学院研发的机械臂。恐怕柯洁要克服的不仅仅是AI的心理阴影，还有面对一个机械对手的不适。

AlphaGo:不与红尘为伍

相比圈内的浮躁，不再下围棋的AlphaGo前阵子在技术上实现了又一次突破。

就像伦智在AlphaZero一天内攻下三大棋局一样，这是RL的成就还是TPU的胜利？文中提到，无论是硬件水平的过硬，还是算法性能的过硬，AlphaZero在只有游戏规则的前提下，一天之内击败了三类桌游的顶级“玩家”，这本身就是一个非常了不起的成绩。

在这里，我们再来梳理一下这个暴发户。

众所周知，AlphaGo依靠棋谱数据集和RL进行学习，而其升级版AlphaGo Zero则更进一步，没有棋谱，仅通过自我学习就在短时间内超越了前辈。这次的AlphaZero是AlphaGo Zero算法的通用版本。它不再需要从手工收集的数据和游戏的具体技巧中学习。而是依靠DNN、蒙特卡罗树搜索算法和“白板”强化学习算法不断与自己对弈，不断训练自己利用计分系统的三盘棋优势，最终战胜对手。

在DeepMind的实验中，AlphaZero四个小时学会了象棋，两个小时学会了日本象棋，八个小时精通围棋。

AlphaZero的国际象棋、普通象棋、围棋100局的结果如上图所示。经过一天的训练，它在100场比赛中击败了这些对手。他们是2016年TCEC的冠军，今年已经保持51场不败纪录的国际象棋AI程序Stockfish，2017年CSA的世界冠军，日本国际象棋AI程序Elmo的主角，以及DeepMind中一篇论文的主角，仅训练三天就超越AlphaGo(李世石版)的围棋AI程序AG0 3(AlphaGo Zero3天训练版)。

当然，AlphaZero并不完全是AlphaGo Zero的重制版，但也经历了多次升级:

AlphaGo Zero只会考虑输/赢的结果，所以会不断估计和优化胜率；AlphaZero将对比赛结果进行预估和优化，并考虑平局或其他潜在情况。

由于围棋的规则无论如何调整棋位都不会改变，所以AlphaZero沿用了AlphaGo Zero的方法，会通过增加一些对称数据来加强训练，在蒙特卡洛树搜索进行评估时随机调整棋盘角度。但考虑到棋和棋的规则是不对称的，AlphaZero不增加训练数据，搜索时也不会改变棋盘的位置。

AlphaGo Zero算法自我提升的方式就是不断迭代。它将计算每次训练的表现。如果后者比前一个更好，那么后者就会代替前者进行后续的自我博弈。而AlphaZero自始至终只有一个神经网络，它只通过更新参数来更新自己，省去了打分的步骤，不计入最佳状态。

AlphaGo Zero通过贝叶斯优化来调整搜索超参数，而AlphaZero重用相同的超参数，而不针对特定的游戏进行更改。当然这一点有个例外，就是AlphaZero为了保证搜索，会在前面的动作中加入噪音，这个噪音和合理移动的次数成正比。

结论:浮躁的围棋和未来

纵观整件事，可以发现这显然又是一场炒作，一个噱头，而我们的天才棋手柯洁，年仅20岁，却成了围棋界，一些部门，甚至一些看客的消费者。

柯洁确实是历代棋手中的“异类”。作为这个时代的棋手，他不仅需要做出成绩，还承担着宣传和发扬围棋的使命。和传统体育的衰落一样，围棋的衰落可能是这个时代的一种必然，人工智能只是起到了催化剂的作用。为了拯救这款传承千年的文化游戏，我们可以理解玩家们的苦心。5438年6月+今年10月，柯洁因为活动太多状态不佳的时候，聂老曾经说过一段话:

各行业明星很多，英雄不多。什么是行业英雄？除了个人技能出众，还要有社会责任感，有爱心，善良，传播正能量。在这方面，柯洁做得非常好，是围棋界的榜样。一个很现实的评价，我们呼吁个人价值的实现，但对于这种牺牲小我拯救小我的传世做法，我们无法辩驳。

日本围棋曾经如日中天，现在几乎失去了全部生命力。21世纪初，日本棋院制作动画作品，吸引年轻人学习围棋，在当时确实起到了一点作用，但是杯水车薪。几年前，南韩也推出了一部以曹薰铉、李昌镐、李世石等棋手为原型的电视剧，产生了一些宣传效果。现在，中国棋院只为现在的偶像经济打造了一个围棋偶像。说到底，大家都是为了围棋，为了拯救奄奄一息的围棋。

可以说，柯洁的英雄形象是某些人刻意塑造的。他是一个不可多得的天才，可能会创造围棋史上又一个伟大的神话，但他也只是一个普通的一流棋手。围棋没有赢家，只有天赋、智力、年龄和灵感...需要玩家静下心来好好学习。当一个天才被冠上人类最强智能与机器抗衡的时候，当他需要频繁执行使命、参与公益活动的时候，其实是在消耗他的天赋，他是行业的受害者。谁是受益人？是围棋本身吗？你是围棋从业者吗？是Go经济吗？还是AI？其实都是，就算是我们这样的普通人也无法置身事外。

也许最讨厌的是，连又冷又笨的机械臂都要借用计算机的计算能力来踩人的脚。

这样的炒作除了吸引更多人关注围棋，还带来了行业生存的基础——资本，无论是人才、比赛还是赛制。虽然这几年很多人都在批判围棋行业的混乱和浮躁，但是怎么才能让人知道自己是饿了么？这是围棋的运气。还是围棋的悲伤？

最后，让我们一起来看看世界顶尖的10围棋选手在过去几十年的进化视频，来纪念这场逐渐走向回忆的比赛。