欢迎光临

阿法狗 阿尔法狗和李世石对局视频

如何理解李世石对阵AlphaGo第四局的神之一手78手

这步棋很精彩,超出了电脑的想象,电脑在好几步之后才发现李世石这手的厉害,这一手直接导致阿法狗的 *** 。

这体现了人类智慧的绝妙之处

谈到比赛,李世石在比赛中段第78手时走出了一步谁都没有想到的棋,中国围棋冠军古力称之为神之一手,在这步棋之后,AlphaGo出现了明显失误,局面开始转向了李世石。

AlphaGo的开发者哈萨比斯(Demis Hassabis)证明了这一步棋对整个棋局的关键性。AlphaGo在第79手犯了错,但直到第87手左右时,它才意识到它错了。

生命围棋——古老围棋与生命游戏的结合

在狂拽酷炫的大神烧脑的阿法尔狗原理解析之后,我更多的从游戏设计和现象角度谈谈围棋和生命游戏以及生命围棋一些设计思路和开发体验。

线上Demo地址:gooflife

All of life is an act of letting go — Life of Pi

这是生命围棋的主题,出自李安的《life of Pi》,翻译过来:人生(或者生命)就是不断前进、放下的过程,与生命围棋意义十分搭配,我们古称围棋为弈,西方名称是Go。弈:古语就是指下围棋,也有博弈、对弈的意思,与英文名Go of Life形成对称,而Go有走,去,进行,达到等含义,很多游戏的开始按钮都是Go,每一次点击和移动的游戏操作动作我们也可以看成是go。比喻人生如棋,我们的每一次观察、言语、动作、行为和决策都可以看成是一次落子,an act of go。

围棋起源于中国,文化博大精深,论语、左传、孟子都有关于围棋的记载,琴棋书画棋所指的就是围棋,存在了几千年,而千古无同局,生命力依然非常旺盛。

我们可以几分钟了解明白围棋的规则,但也许要用一生来追寻围棋的技艺,古往今来也吸引了许多聪明人将智力和注意力投入其中,状态空间10^172远超过宇宙可观测的原子总数,可以说是最伟大的游戏。

这次人机大战,再次掀起全民(主要是中日韩地区)对于围棋的热潮和关注,而围棋一直都是完全信息博弈游戏的巅峰,人工智能的圣杯。而阿尔法狗4:1战胜李世石颇具历史意义,让我们有了参照物,知道人类围棋在天地之间是什么位置。

围棋规则主要可以归纳为下面三条:

基于这简单规则,围棋涌现出近乎无穷的下法和策略,从围棋术语我们就可以窥见一斑:

这次人机大战直播中,我们听到职业九段说各种围棋术语,但这些围棋术语也都是人为定义的,而阿尔法狗走棋的时候就没有这些概念,它只有概率和输赢,所以我们在直播中听到许多职业棋手们解说也看不懂阿尔法狗棋路,阿尔法狗也常常下出我们认为不合常理的棋路,同时职业在形势判断上出入也都比较大,说明了我们之前积累的围棋理论,比如一些总结出来的定式,包括势的概念及判断,其实是有局限性的。

人机大战第四局,李世石在78手下出神之一手,展现人类的思维直觉、计算力和创造力,AlphaGo在此之后看似乱了阵脚,连续下出低级昏招,使得李世石拿下世纪大战中极具历史意义的一盘。

围棋如此复杂的下法和变化背后,可以用对弈记录和量化的棋力准确的衡量一个人的水平,现在已经是非常成熟的段位体系。

我们将上市公司估值作一个类比,一个上市公司也是非常复杂的组织,但通过发行股票后,在市场里可以量化得到公司估值。

在这个排名背后我们看到AlphaGo现在一人之下万人之上,而当今围棋第一人就是天才少年——柯洁,他的职业是棋手,副业是段子手+网红,在AlphaGo击败李世石第一场后就放言:就算阿法狗战胜了李世石,但它赢不了我!。纵观五场直播过程,总体柯洁对于场上形势判断是最为敏锐和准确的。

John Conway在1970年设计和发明的二维元胞自动机,元胞自动机最早要追溯到祖师爷冯诺依曼,

想象一个二维平面网格,每个格子里能放下一个细胞,它有死和活两种状态;它的下一代是由它自身和它周围邻居8个细胞的死活状态决定。

演化规则如下:

基于这三条规则我们可以在屏幕上观察到许多纷繁复杂、形态各异的图案。

更有滑翔机,滑翔机枪,滑翔机枪播种机这样神奇的产物。

我们可以用这些滑翔机模拟计算过程,在生命游戏的虚拟世界中构造一台通用计算机!康威和他的学生们也证明了在这个二维世界中存在并包含了通用图灵机(Universal Turing Machine),也就是说在生命游戏上是完全可能再虚拟嵌套一个生命游戏,下面这个图案是由Paul Rendell具体实现,分别在2000年和2010年用数以万计的细胞实现了图灵机和通用图灵机。

康威他们还成功设计了一个自我复制结构,会通过产生自身的更多拷贝而在空平面上殖民,每个包含了一个通用图灵机。不过这么复杂的家伙要长多大?他们估计是在10^13像素这个数量级,大概要曼哈顿岛那么大一块地。

目睹这些震撼而复杂的动态后,康威放出豪言:只要给我足够大的模拟空间,等待足够长的时间,生命游戏中可能演化出任意你能想到的复杂事物,包括可以自我繁殖的细胞,以及能够撰写PhD论文的智慧生命!

强烈推荐 生命游戏 Web版(由Copy大神开发) ,可在上面看到非常许许多多震撼的Pattern,事实上基本导入了 conwaylife(Wiki) 里的Pattern,还带有视角伸缩和演化速率调节功能。

我们可以在图灵机之中定向植入一枚病*细胞,一粒老鼠屎坏了一锅粥——一个极其有序的图灵机迅速走向崩溃,直观地观察到这样设计出来的系统其实也非非常脆弱的。

我们可以得到这两个游戏世界的共性

围棋和生命游戏至今都吸引了许多人参与和沉浸其中,在游戏过程之中不断涌现出让人意想不到游戏可玩性和惊奇性,这两个游戏也揭示了沉浸和涌现的深刻联系。

因此我们考虑如何将二者结合,尝试开发出一种新的游戏,以下就是生命围棋的基本构思。

生命游戏与围棋在两个不同的层次上进行融合。具体地,在高层是围棋规则——宏观对弈;而在底层世界是按照生命游戏——微观演化。

两个层次的交互体现为:高层玩家的棋子实际上是一片固定尺寸的方格世界,按照多数原则分配黑色、白色方格。这些方格可以作为底层生命游戏的初始条件,并按照生命的规则进行演化。反过来,生命游戏的游戏结果会决定高层的围棋游戏行为。也就是说,在高层,玩家的地盘占领除了由围棋规则决定以外,还会受到底层生命游戏规则的影响。生命游戏使围棋子进行演化,并可能影响周围的棋盘世界。

高层每一个围棋棋子映射成底层M M生命游戏方格,每一次落子以一定的概率在M M格子内生成一定数量的活细胞,这个过程称作【细粒化】,反之方格转化为棋子过程称为【粗粒化】,因为底层生命游戏会生长、 *** 、死亡,方格会一个格点可能同时包含两种以上的方格,以多数原则决定该棋子归属,类似于地方民主投票——少数服从多数。

底层由于也会常常出现两种颜色以上,因此生命游戏规则需演变成竞争性的生命游戏:

在开发过程中,生命围棋尝试了多人实时*的游戏模式,简单来说有几个要点:

但这次尝试,在刚上线前几天日均有破万的点击数,我们从中可以看到玩家们一统江湖,王朝更迭的现象,但持续的可玩性还远远不够,新鲜度过去之后,演变成偷菜拼时间的游戏,用户迅速流失。

我们知道围棋的关键参数是19×19路棋盘,361个交叉点,据说当年围棋也是从9路、13路、15路、17路一直到19路演变过来,到了19路就停止了,得到19路关键系数。

而生命围棋规则里领军3个细胞创生,2或3个细胞继续存活无疑是生命围棋的关键参数,将这个换成其他数字都没有生命游戏如此多变好玩。

生命围棋里也有两个关键参数:

空间尺度:一个大方格对应多少小方格M

这是一个关键参数。当M较大的时候,底层的生命游戏规则将不会对围棋规则造成太实质的影响。当M较小的时候,整个游戏将变成生命游戏。

时间尺度:生命游戏演化速率T

假如不考虑计算机的运算速度,玩家下一步的时间如果为u,那么这段时间内,生命游戏演化的步数T就是一个关键变量。因为,如果T过大,则生命游戏的时间尺度就会过大,如果T小,那么生命游戏规则将来不得体现,围棋的时间尺度就会更大。总之,连续地调节T将会带来完全不同效果的游戏。

人脑的计算和反应能力,进行调节。

通过调整这个两个参数我们有可能体验感受完全不同的游戏。

生命围棋里的神之一手:

让我们展开想象,如果将M调到10 13次方,自复制细胞的量级;如果将M调到10 80次方——宇宙原子总和的数量级,,时钟滴答T=10^-34方接近普朗克尺度,那么神之一手这一落子,有没有可能从中涌现出智慧生命来,只是需要宇宙级计算能力的支持。

万事万物都有边界。细胞有细胞膜?人与人之间不能靠得太近,特别是在不熟的时候。地球是球状的,有限无界。宇宙有边界吗?如果有,那么边界外面是什么?滑翔机飞到了棋盘边缘,怎么办?不能凭空消失。

而围棋一旦边界相互连通,则所有的位置关系:天元、星位都不存在了,边角死活也将全部改写,金角银边草肚皮,所有的位置都是中腹,其实玩的已经不再是原来的围棋,影响了可玩性,但是值得探索。

生命围棋的边界目前是环状的,即上下互通,左右互通,如果是莫比乌斯环会怎么样?

边界其实深远的影响了局部与整体的关系,边界问题其实很深刻,通过边界可以探索空间的性质——自由度、连通性和相关性。

当然目前生命围棋的规则细节还没有确定和完善,还只是一个Demo,比如玩法和胜负条件都是开放的可变的,希望吸引更多同学,投入注意力,共同参与其中。

问题:

最后总结来一些比较水的思辨,围棋、生命游戏、生命围棋都是虚拟世界,棋和戏都是对我们的世界和人生的投影,而我们自身又是什么的投影呢?

我们的宇宙也许可以看成是一个规模超级巨大的元胞自动机,从游戏的视角来看我们的现实世界,我们自身也无时不刻不处在被基因、谜因、权力和经济规律所支配的游戏之中,通过能量、符号、语言、货币、情感等信息流,不断驱动着我们的进行计算和演化,最明显的现象和规律就是我们要吃喝拉撒睡,我们有马斯洛需求层次,我们个体要经历生老病死,组织有兴衰成败,而我们有没有可能从中脱离出来,迈向更高一个层次?就像当年单核细胞进化成多核细胞超级个体,单一个体又演化成群落,群落又诞生了人类的智能和文明,此刻我们已经正处在演化的轨道之上。

我们可能去尝试创造和实现一个更大的模仿游戏——Matrix?

附:出自xkcd的漫画

李世石和阿法狗的最后一场比赛啥时候比?

李世石

阿尔法围棋

的第五场比赛将于北京时间15日12点进行,这也是最后一场人机大战。前四局当中李世石以1-3落后。

唯一在比赛中战胜过阿尔法狗的人类棋手是谁

韩国职业棋手李世石(이세돌)。

2016年3月,AlphaGo挑战世界冠军韩国职业棋手李世石(이세돌)九段。AlphaGo使用谷歌位于美国的云计算服务器,并通过光缆网络连接到韩国。

比赛的地点为韩国首尔四季酒店;赛制为五番棋,分别于2016年3月9日、10日、12日、13日和15日进行;规则为中国围棋规则,黑棋贴3又3/4子;用时为每方2小时,3次1分钟读秒。

DeepMind团队在YouTube上全球直播并由美籍职业棋手迈克·雷蒙(Michael Redmond)九段担任英语解说,而中国很多简介网站也采用YouTube的直播信号进行直播,并加上自己的解说。DeepMind团队成员台湾业余6段围棋棋手黄士杰博士代表AlphaGo在棋盘上落子。

比赛获胜者将获得100万美元的奖金。如果AlphaGo获胜,奖金将捐赠给围棋组织和慈善机构,包括联合国儿童基金会。李世石有15万美元的出场费,且每赢一盘棋会再得2万美元的奖金。

2016年3月9日、10日和12日的三局对战均为AlphaGo获胜,而13日的对战则为李世石获胜,15日的最终局则又是AlphaGo获胜。因此对弈结果为AlphaGo 4:1战胜了李世石。这次比赛在网络上引发了人们对此次比赛和人工智能的广泛讨论。

算法

AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助估值网络(value network)与走棋网络(policy network)这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。

AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。后来它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。

围棋无法仅通过寻找更佳棋步来解决;游戏一盘平均约有150步,每一步平均约有200种可选的下法,这意味着有太多需要解决的可能性。

在首场人机大战中柯杰输了,看看他是怎么评价阿尔法狗的

李世石积攒的优势不足以挥霍,我也很害怕AlphaGo打遍职业无敌手,它确实很厉害。我们来看看他的评论,AlphaGo

的下棋风格和我很像近两天人机大战的主角是alphago和李世乭,照这样下去,李世石可能就拿不到奖金了、柯洁又发表。地方不利的地方会拼,越到后面计算就越精准。

2。

1。

4。但是它也有失误,说明人类还有机会,希望接下来几盘棋李世石能找回状态。柯洁还幽默地表示,生存空间大打 *** 。柯洁表示,就算阿法狗战胜了李世石,但它赢不了我。

今天是人机大战的第三场了、对于李世石不敌AlphaGo,柯洁表示了担心,他认为这个软件的未来会过于强大,导致国内棋手没有饭碗。好像第三场李世石也快要输了,但是中国棋手柯杰九段着实也是疯狂了一把、柯洁点评到,在面对选择时,哪边利益大就会选择哪边,它主次分得很清楚,还有什么言论我们接下来看看。

3、虽然李世石首战失利,但这也激发了柯洁的斗志,他明确表示,自己愿意接受AlphaGo的约战

赞(0)
版权声明:本文内容/及图片/由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭/侵权/违法违规的内容, 请发送邮件至 yangcongsoon@qq.com 举报,一经查实,本站将立刻删除。17攻略 » 阿法狗 阿尔法狗和李世石对局视频