网易首页 > 网易体育 > 综合体育 > 正文

AlphaGo吊打柯洁后为何仅赢1/4子?不是祁同伟相助

0
分享至

网易体育5月23日报道:

在今天结束的人机对弈第一盘比赛中,柯洁执黑半目负于AlphaGo,由于胜负差距非常微小,许多网友认为AlphaGo领先人类并不多。这里我们从AlphaGo的原理与棋局的进程两方面谈一下AlphaGo只赢了半目的背后究竟意味着什么。


要了解AlphaGo的原理,首先要知道一个叫做蒙特卡洛模拟的东西,蒙特卡洛模拟的是一种在不了解背后规律的情况下,依据大样本的独立事件测量找出近似的最优解,而围棋是一种非常合适的使用蒙特卡洛模拟为基础原理进行程序设计的游戏,蒙特卡洛模拟出来的仍然是概率,所以AlphaGo下围棋的过程可以简单描述为在任一局面下寻找当前胜率最高的一点的过程。


回到比赛中,这盘棋柯洁的败局在左上的战斗结束后就确定了。白棋54花一手后手断的时候,阿尔法狗已经积累了巨大优势。虽然柯洁后半盘拼命追赶最后只输了1/4子。但这1/4子却让柯洁震惊,赛后他甚至说再也不想和机器下棋了,可见AlphaGo在这盘棋给了柯洁多大的震撼和阴影,所以至少从柯洁的口中,他深知自己确实是被吊打了。

而人类围棋理论可不是什么全局胜率,而是实打实的目数,棋盘上的一切得失最后都要量化成具体的目数来衡量,“这个局部白棋亏了2目棋”,“那个局部黑棋一个妙手便宜了1又1/3目”,这种描述在人类对局的讲评中是经常可以看到的。但是目数便宜的多不代表胜率就高,因为追求赢得更多有时候意味着局面的复杂化,复杂化意味着风险。举个通俗的例子:90%赢10目和100%赢1目,AlphaGo一定会选择赢1目的变化,因为胜率更高。

而优势局面下,胜率高往往和行棋简单化,减少变化划等号。换句话说,AlphaGo的算法决定了它在优势局面下,会选择一些简单的、甚至稍微亏损但变化较少,不确定性较少的变化,以求更快达到胜利的重点。


第一局棋局全谱

这盘棋左上战斗下完就是白棋明显优势的棋,54断以后白棋开始了稳步收兵,迈向胜利终点的故事,下面我们举几个例子从棋的内容上看一下AlphaGo具体是如何做的:

第一个例子是面对黑棋55点入,白棋下得极其厚实,特别60粘,简直是不给黑棋任何变化的余地,只能扳粘做活。局部黑棋最大限度掏掉了白角,可以说非常满意,但白棋也消除了局部任何的不确定因素,局面大大简化。

第二个例子是右上作战,面对黑棋91刺,白棋没有直接粘上和黑棋战斗,而是柔软的托过,弃掉四路一子,取得边空。这样右上彻底定型,也没有了不确定性。全局唯一的不确定的地方就是上边了。而上边过于宽广,黑棋想全围住是不可能的,后来白棋轻松做活也印证了这一点。

第三个例子是官子阶段,左边下到143的时候白棋第144手完全可以在145位拐把5颗棋子(价值10多目)救回来,可是这样下目数虽然便宜,黑棋会取得先手在中央骚扰白棋,增加局面不确定性。白棋实战果断把这5个卖死,取得先手后在中间进一步定型彻底简化局面。


以上三个例子是非常直观的,局部有更强硬或者目数更便宜的选择的时候,AlphaGo果断选择简单无变化的手法,最大限度减少局面变数,更快将局势导向终局的下法。在第二、三局中,只要AlphaGo开局取得优势,这样类似的下法会屡见不鲜,虽然柯洁坚持到最后也许只是以半目的微小差距落败,但这半目就是不可逾越的天堑,想要“胜天半子”恐怕是极其困难的事情。


但蒙特卡洛算法也有两个致命的缺陷:首先是围棋的总变化数量过于庞大(远超宇宙全部的粒子数量),所以你模拟个1000次甚至10000次这个样本相对于整体而言占比过于微小。蒙特卡洛模拟准确度的核心在于庞大的样本数量,所以要想用这个方法下出高水平的围棋,必须增大每个选点的后续模拟次数,这样就带来了第二个问题:计算资源不足,虽然人类的超级计算机已经发展到相当的水平,但要实现模拟足够样本的围棋变化那还是远远不够的。

要克服上述两个致命缺陷,就要引入先进的算法做一件事情:剪枝。从字面意思也很好理解,就是剪掉不必要的计算分支。其实人类高手下棋的时候也是很擅长剪枝的,人类高手通过常年累月的计算,对每个局面可以形成出色的第一感,这样就大幅度缩小了选点数量,然后对每个选点进行计算的时候也不用一直算到整盘棋下完,往后计算若干步,这个选点是不是成立也就清楚了。AlphaGo就是通过深度学习技术训练出了价值网络和策略网络,实现了和人类高手一样的第一感和出色的剪枝技术,再结合蒙特卡洛模拟那就如虎添翼了。

相关推荐
热点推荐
“还是买特斯拉好,出了事全网能帮你维权”

“还是买特斯拉好,出了事全网能帮你维权”

亮见
2024-04-29 17:17:38
广东不敌辽篮!赛后听听沪媒,粤媒,辽媒和京媒怎么说

广东不敌辽篮!赛后听听沪媒,粤媒,辽媒和京媒怎么说

邹维体育
2024-05-01 22:51:34
金喜善因女儿丑被质疑整容,称长开就好了,结果12年后却被打脸!

金喜善因女儿丑被质疑整容,称长开就好了,结果12年后却被打脸!

简读视觉
2024-05-01 01:50:21
暮光女克里斯汀斯图尔特戛纳红毯脱鞋名场面,这姐好像不喜欢穿鞋

暮光女克里斯汀斯图尔特戛纳红毯脱鞋名场面,这姐好像不喜欢穿鞋

娱乐圈人物大赏
2024-04-16 06:18:36
两性:除了亲吻嘴巴,抚摸这四个部位,更能激起性欲

两性:除了亲吻嘴巴,抚摸这四个部位,更能激起性欲

妈星人
2024-04-30 06:06:06
A股:就在刚才,央行突发大利好,5000亿!市场要开始起飞了?

A股:就在刚才,央行突发大利好,5000亿!市场要开始起飞了?

彩云的夕阳
2024-05-02 04:40:03
深夜通报:5人遇难33人受伤!

深夜通报:5人遇难33人受伤!

家在栖霞
2024-05-01 18:51:29
无解的阳谋!菲律宾在仁爱礁发现3艘中国特殊船只,不是来拖船的

无解的阳谋!菲律宾在仁爱礁发现3艘中国特殊船只,不是来拖船的

青年的背包
2024-05-01 15:05:44
夸梅-布朗:别再说詹姆斯GOAT了 我被乔丹打过但我不能说谎

夸梅-布朗:别再说詹姆斯GOAT了 我被乔丹打过但我不能说谎

直播吧
2024-05-01 23:38:14
重庆轨道交通集团回应“蔡依林乘轻轨监控画面流出”

重庆轨道交通集团回应“蔡依林乘轻轨监控画面流出”

奔流新闻
2024-05-01 20:36:34
中国股市:炒股不需太勤快,永远只买美人肩的股票,简单却很赚钱

中国股市:炒股不需太勤快,永远只买美人肩的股票,简单却很赚钱

股经纵横谈
2024-04-30 22:08:27
一男子叫女技师上门服务,不料快结束时,女技师突然趴在男子身上

一男子叫女技师上门服务,不料快结束时,女技师突然趴在男子身上

回京历史梦
2024-04-30 10:53:47
沉迷于撸铁无法自拔,连“长城炮”是什么梗都不懂

沉迷于撸铁无法自拔,连“长城炮”是什么梗都不懂

平祥生活日志
2024-05-01 19:51:23
辽宁大胜广东高兴早了,CBA正式确认,杜锋收意外惊喜,球迷沸腾

辽宁大胜广东高兴早了,CBA正式确认,杜锋收意外惊喜,球迷沸腾

林子说事
2024-05-02 01:59:00
问界M7追尾起火,业内人士:事故车搭载福瑞泰克智驾方案,碰撞车速超过AEB范围

问界M7追尾起火,业内人士:事故车搭载福瑞泰克智驾方案,碰撞车速超过AEB范围

红星新闻
2024-04-30 21:29:31
深圳一女子开房黄体破裂后续:男友同事发声,评论区彻底失控!

深圳一女子开房黄体破裂后续:男友同事发声,评论区彻底失控!

古希腊掌管松饼的神
2024-04-29 15:39:11
网友五一日本偶遇王思聪,脚踏4万战靴与两名美女逛街,真潇洒

网友五一日本偶遇王思聪,脚踏4万战靴与两名美女逛街,真潇洒

七阿姨爱八卦
2024-05-01 17:25:47
水资源管理:农村不得私自打井,水是国家矿产,村民可购买自来水

水资源管理:农村不得私自打井,水是国家矿产,村民可购买自来水

音乐时光的娱乐
2024-05-01 13:05:29
8.2分全场最高!桑乔打爆巴黎打脸曼联 12次过人 欧冠历史第二人

8.2分全场最高!桑乔打爆巴黎打脸曼联 12次过人 欧冠历史第二人

狍子歪解体坛
2024-05-02 05:15:44
消息很突然,没有任何征兆!8万吨超级航母,欧亚第一巨舰首航

消息很突然,没有任何征兆!8万吨超级航母,欧亚第一巨舰首航

科罗廖夫
2024-05-01 11:45:05
2024-05-02 09:48:49

体育要闻

这场欧冠,多特的他诠释了什么叫"台柱子"

头条要闻

夫妻失联近一个月最后定位在泰国 男方曾称"回不来了"

头条要闻

夫妻失联近一个月最后定位在泰国 男方曾称"回不来了"

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

日元如此疯狂波动,背后谁在收割?

科技要闻

4月交付量理想超问界,小米首月交付超七千

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

本地
艺术
数码
公开课
军事航空

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

艺术要闻

造科幻之物于园林 “天工开悟——夏航雕塑展”于南池子美术馆呈现

数码要闻

最强Reno!OPPO Reno12系列处理器敲定

公开课

父亲年龄越大孩子越不聪明?

军事要闻

近距离看中国第三艘航母福建舰解缆起航

无障碍浏览 进入关怀版
×