是井山幸还是日本围棋的不幸?
但这一次,狗不再是那个狗,人也不是那个人。
昨日下午,伦智从中新获悉。com刚刚获得人生第五个冠军的棋手柯洁在中国棋院宣布,他将于明年4月再次出战围棋AI程序:
作为一名棋手,我仍然喜欢挑战强大的对手。对我来说,下棋是无止境的。下棋是一个不断挑战自己的过程。下这种棋很有意义,是我人生中很有价值的一次经历。
这是柯洁今年5月在三防棋输给AlphaGo后,第一次重燃对AI的斗志。
五冠王:柯洁的脱胎换骨。
26日,首届新奥杯世界围棋公开赛决赛在廊坊正式落下帷幕。柯洁以3/4的比分击败了另一位来自中国的选手彭,并将比分锁定在3-2。这是新奥杯的第一个世界冠军,也是柯洁的第五个个人世界冠军。至此,柯洁打破了韩国“石佛”李昌镐(21岁零295天)的纪录,成为世界上最年轻的“五冠王”,享年20岁零146天。
2015 65438+10月14,第二届百灵杯决赛柯洁3-2邱军;
2015 12.8,第20届三星杯决赛柯洁2-0;
2016 1.5,柯洁在第二届MLILY梦百合杯决赛中3-2击败李世石;
2016 12.8,柯洁在21三星杯决赛中2-1击败拓跋嘉熙;
2017 165438+10月26日,1新奥杯决赛,柯洁3-2彭。
纵观柯洁这一年的成绩,除了在与AlphaGo的战斗中大败之外,整体表现可圈可点,但也有一些起伏。AlphaGo事件后,柯洁以22连胜赢得了媒体的关注,成为历史上继宇田(26连胜)和李昌镐(24连胜)之后的第三人。然而,在放出“和人下棋也可以这么轻松”的豪言壮语后,他从8月份开始也有下滑的趋势,甚至最近还让出了38个月的世界第一的位置(8天后又重新夺回)。
虽然是以AlphaGo起家的“过气网络名人”,但柯洁对中国围棋的贡献有目共睹。围棋是一项高强度的脑力活动。柯洁是人。做人就意味着他会妥协,会情绪化,会不稳定。这半年来,人们不知道他赛前的战绩是2胜6负,也不知道他心里的郁闷,不知道他是被棋院请去穴位表演,还是还在为AlphaGo一战担忧,还是状态陷入低谷。在采访中,他说:
今年年初的时候我有很高的期望,尤其是和AlphaGo开始下棋之后的连胜。我以为没人能阻止我,后来发现还是有很多人阻止了我。后来我也释怀了,试了也无怨无悔。今年的总体结果令人满意。现在的柯洁,似乎不再是这个世界上曾经狂言的第一人。天才还是天才,但他也开始展现出作为职业棋手的一面。偶像负责吸引眼球,但玩家不能丢的是对优秀的追求。围棋的世界是多变的,你必须有竞争力,但也要毫无负担地正视自己的每一次胜利和失败。
吴清源杯:这只狗不是另一只狗。
看看柯洁,这次我们来看看狗。
今天,首届“吴清源杯”世界女子围棋赛新闻发布会在中国棋院举行。借着人工智能的势头,主办方还竖起了人工智能围棋大赛的醒目招牌,为真正的比赛主体——女子围棋大赛加油。
一代棋圣,年少离家,随时局动荡,最后魂归故里。想依托围棋打造AI产业的福州,就是这么轰动。作为中国棋手领军人物的柯洁和女子棋手于志颖,此次再次受邀担任形象大使。总之这还是一个穴位表现。
女子围棋比赛期间,还将同时举行一场人工智能围棋比赛。据主办方介绍,大赛邀请了腾讯Unique、天壤、台湾省CGI、日本DeepZenGo等多支来自中国、日本、韩国、欧美的AI战队。届时,柯洁将与上海人工智能初创公司天壤智能的AI程序展开竞争。
说到新奥杯解说界面中的天壤(天壤也可用于棋局分析),人们会称其为“冉冉人工智能领域的后起之秀”,它也曾在本届新奥杯世界围棋大赛中担任解说,但这个在比赛中表现出色的AI并没有获得与其成绩相称的关注度。在“翔宇杯”中,其搭档聂卫平输给了台湾省世界冠军斯里塞和人工智能CGI;在龙族星球大战中,它输给了DeepZenGo,获得了第三名。或许中国人更爱冠军,人们只记得这两场比赛的胜者CGI和绝活。
由于这些原因,我们对天壤了解不多,但在翔宇杯期间,天壤创始人薛透露了一些设计思路:
其实就是基于大量的人类棋谱,然后用两个完全相同的系统不断下棋,产生人类可能不熟悉的棋路。在这个过程中,我们会不断迭代,修正下棋的策略,实现棋力的提升。乍一看类似于AlphaGo的强化学习,似乎有些GAN的意思。据不可靠消息,天壤已经达到了AlphaGo高手的水平,但我们还需要等待比赛给出答案。
另外不会是黄二号博士,而是福州大学自动化学院研发的机械臂。恐怕柯洁要克服的不仅仅是AI的心理阴影,还有面对一个机械对手的不适。
AlphaGo:不与红尘为伍
相比圈内的浮躁,不再下围棋的AlphaGo前阵子在技术上实现了又一次突破。
就像伦智在AlphaZero一天内攻下三大棋局一样,这是RL的成就还是TPU的胜利?文中提到,无论是硬件水平的过硬,还是算法性能的过硬,AlphaZero在只有游戏规则的前提下,一天之内击败了三类桌游的顶级“玩家”,这本身就是一个非常了不起的成绩。
在这里,我们再来梳理一下这个暴发户。
众所周知,AlphaGo依靠棋谱数据集和RL进行学习,而其升级版AlphaGo Zero则更进一步,没有棋谱,仅通过自我学习就在短时间内超越了前辈。这次的AlphaZero是AlphaGo Zero算法的通用版本。它不再需要从手工收集的数据和游戏的具体技巧中学习。而是依靠DNN、蒙特卡罗树搜索算法和“白板”强化学习算法不断与自己对弈,不断训练自己利用计分系统的三盘棋优势,最终战胜对手。
在DeepMind的实验中,AlphaZero四个小时学会了象棋,两个小时学会了日本象棋,八个小时精通围棋。
AlphaZero的国际象棋、普通象棋、围棋100局的结果如上图所示。经过一天的训练,它在100场比赛中击败了这些对手。他们是2016年TCEC的冠军,今年已经保持51场不败纪录的国际象棋AI程序Stockfish,2017年CSA的世界冠军,日本国际象棋AI程序Elmo的主角,以及DeepMind中一篇论文的主角,仅训练三天就超越AlphaGo(李世石版)的围棋AI程序AG0 3(AlphaGo Zero3天训练版)。
当然,AlphaZero并不完全是AlphaGo Zero的重制版,但也经历了多次升级:
AlphaGo Zero只会考虑输/赢的结果,所以会不断估计和优化胜率;AlphaZero将对比赛结果进行预估和优化,并考虑平局或其他潜在情况。
由于围棋的规则无论如何调整棋位都不会改变,所以AlphaZero沿用了AlphaGo Zero的方法,会通过增加一些对称数据来加强训练,在蒙特卡洛树搜索进行评估时随机调整棋盘角度。但考虑到棋和棋的规则是不对称的,AlphaZero不增加训练数据,搜索时也不会改变棋盘的位置。
AlphaGo Zero算法自我提升的方式就是不断迭代。它将计算每次训练的表现。如果后者比前一个更好,那么后者就会代替前者进行后续的自我博弈。而AlphaZero自始至终只有一个神经网络,它只通过更新参数来更新自己,省去了打分的步骤,不计入最佳状态。
AlphaGo Zero通过贝叶斯优化来调整搜索超参数,而AlphaZero重用相同的超参数,而不针对特定的游戏进行更改。当然这一点有个例外,就是AlphaZero为了保证搜索,会在前面的动作中加入噪音,这个噪音和合理移动的次数成正比。
结论:浮躁的围棋和未来
纵观整件事,可以发现这显然又是一场炒作,一个噱头,而我们的天才棋手柯洁,年仅20岁,却成了围棋界,一些部门,甚至一些看客的消费者。
柯洁确实是历代棋手中的“异类”。作为这个时代的棋手,他不仅需要做出成绩,还承担着宣传和发扬围棋的使命。和传统体育的衰落一样,围棋的衰落可能是这个时代的一种必然,人工智能只是起到了催化剂的作用。为了拯救这款传承千年的文化游戏,我们可以理解玩家们的苦心。5438年6月+今年10月,柯洁因为活动太多状态不佳的时候,聂老曾经说过一段话:
各行业明星很多,英雄不多。什么是行业英雄?除了个人技能出众,还要有社会责任感,有爱心,善良,传播正能量。在这方面,柯洁做得非常好,是围棋界的榜样。一个很现实的评价,我们呼吁个人价值的实现,但对于这种牺牲小我拯救小我的传世做法,我们无法辩驳。
日本围棋曾经如日中天,现在几乎失去了全部生命力。21世纪初,日本棋院制作动画作品,吸引年轻人学习围棋,在当时确实起到了一点作用,但是杯水车薪。几年前,南韩也推出了一部以曹薰铉、李昌镐、李世石等棋手为原型的电视剧,产生了一些宣传效果。现在,中国棋院只为现在的偶像经济打造了一个围棋偶像。说到底,大家都是为了围棋,为了拯救奄奄一息的围棋。
可以说,柯洁的英雄形象是某些人刻意塑造的。他是一个不可多得的天才,可能会创造围棋史上又一个伟大的神话,但他也只是一个普通的一流棋手。围棋没有赢家,只有天赋、智力、年龄和灵感...需要玩家静下心来好好学习。当一个天才被冠上人类最强智能与机器抗衡的时候,当他需要频繁执行使命、参与公益活动的时候,其实是在消耗他的天赋,他是行业的受害者。谁是受益人?是围棋本身吗?你是围棋从业者吗?是Go经济吗?还是AI?其实都是,就算是我们这样的普通人也无法置身事外。
也许最讨厌的是,连又冷又笨的机械臂都要借用计算机的计算能力来踩人的脚。
这样的炒作除了吸引更多人关注围棋,还带来了行业生存的基础——资本,无论是人才、比赛还是赛制。虽然这几年很多人都在批判围棋行业的混乱和浮躁,但是怎么才能让人知道自己是饿了么?这是围棋的运气。还是围棋的悲伤?
最后,让我们一起来看看世界顶尖的10围棋选手在过去几十年的进化视频,来纪念这场逐渐走向回忆的比赛。