设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕

[科技] 李喆:这两盘棋 没人会比李世石做得更...

[复制链接]
  • TA的每日心情
    慵懒
    5 天前
  • 签到天数: 1475 天

    [LV.10]大乘

    发表于 2016-3-12 12:08:18 | 显示全部楼层
    仁 发表于 2016-3-12 11:52
    没说具体多少机器?其实谷歌还可以同时和其他软件联网,对其他软件推出的棋步进行验算。 ...

    之前貌似哪说过,其实也就不到100个cpu/gpu
  • TA的每日心情

    2020-3-6 00:28
  • 签到天数: 564 天

    [LV.9]渡劫

    发表于 2016-3-12 12:37:54 | 显示全部楼层
    xlan1976 发表于 2016-3-12 10:45
    有人说过让AI帮助发展围棋的目的是为了人类能战胜AI吗?
    就好像吴清源对围棋的发展作了很大贡献,当时的 ...

    你打算说啥?
  • TA的每日心情
    慵懒
    2016-4-20 00:14
  • 签到天数: 15 天

    [LV.4]金丹

    发表于 2016-3-12 12:42:50 | 显示全部楼层
    本帖最后由 河蚌 于 2016-3-12 12:46 编辑
    煮酒正熟 发表于 2016-3-11 22:41
    自己和自己下只能提高proficiency,但是要拓宽视野,提高自己计算胜率的准确性,必须要和人类高手对弈才 ...


    觉得这点酒爷有些偏颇了。
    任何问题的解答,都依托于两个方面,一个是知识,另一个是推理。就本质上说,知识只是固化的被证明过了的推理过程。所以,阿尔法狗之间的对弈,只要每盘都是不重复,其实就是采用穷举推理的方式来积累知识。这种积累对于计算机来说,远比学习高手对弈来的直接,也就是比学习高手的招数更为有效。
    围棋的定式其实就是固化了推理过程的知识,也就是被无数棋手用很多盘棋证明了的下棋方法,如果让机器只是记住这种定式下法,这样的机器的智力是有限的,而如果让机器能够记住此定式过程中所有的变例(也就是亏的算法),并且对每一种变例做出应对,这时机器的智力才可以说很高明。机器每天进行无数次的对弈,然后记住所有的有效的无效的下法,其实就是按照这种思路来做出积累。
    不得不承认,一切智力游戏都是数学问题,如果机器无法解决,只是因为我们还没看透这个问题的数学本质。回头想一想,其实围棋是比象棋更为纯粹的数学问题,之所以大多数人认为它是人类的专利机器的禁区,还是因为我们没有找到能够覆盖那么大片数字空间的办法,而一旦找到了,那机器以其比人类高出无数层次的推理和探索能力,必然将人类甩的十分远。
    人类在思维上有其严重的局限,其推理的层次其搜索的范围,以心算方式普通人都只有个位数,最强者不过百。以前之所以认为机器不能,主要还是因为推理规则无法计算机程序化。现在看来,只要找到程序化的办法,任何数学问题,都会变成机器的天下。
  • TA的每日心情
    慵懒
    2016-4-20 00:14
  • 签到天数: 15 天

    [LV.4]金丹

    发表于 2016-3-12 12:50:24 | 显示全部楼层
    qyangroo 发表于 2016-3-12 10:33
    不明白人类为嘛这么激动。计算本来就是电脑擅长的事情。围棋的算法复杂度比其它棋类高一点,一旦算法上有突 ...

    因为以前很多人认为围棋会成为人类思维的永久自留地,会成为机器的禁区,但没想到,这么快,机器就闯进来。
    数学,真是一个令人着迷的东西。
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    发表于 2016-3-12 13:13:28 | 显示全部楼层
    本帖最后由 煮酒正熟 于 2016-3-12 00:15 编辑
    河蚌 发表于 2016-3-11 23:42
    觉得这点酒爷有些偏颇了。
    任何问题的解答,都依托于两个方面,一个是知识,另一个是推理。就本质上说, ...


    你说的也许是对的。我知道的是,阿法狗最开始被训练的目标是能够像人一样思考判断和下棋,所以在开始的阶段给他喂了多少万局人类高手的棋局。狗有了这些垫底儿,开始自行学习以后,它的思维特点与前面被动受训有什么不同,我就不知道了。但从前天和小李实战第37手那手棋,现在基本上大家都公认是彻底颠覆人类对围棋认知的一手,这就意味着,这种思考和判断,不是狗狗从人类那里学到的,极有可能是它自己在无休无止地自我对弈中,自己“悟”出来的。换言之,狗狗在一定程度上表现出了自己的创造性思维。(好像有不少老大坚决认为电脑现在完全没有创造力的 @晨枫 @老兵帅客 )昨天还有两三手,也是职业棋手和业余好手绝对不会那么下的,虽然效果欠佳,但至少说明狗狗有自己的思考和尝试。所以我觉得小李输掉第一局之后,柯洁显然有点儿着急,忙着为人类辩护的同时,还不忘攻击电脑“即使算得再精,也没有自己的风格”。我觉得柯洁说出这个话很扯。不知道他看完狗狗前天第37手之后是不是还继续坚持说狗狗没风格了。
  • TA的每日心情
    慵懒
    2016-4-20 00:14
  • 签到天数: 15 天

    [LV.4]金丹

    发表于 2016-3-12 13:36:50 | 显示全部楼层
    煮酒正熟 发表于 2016-3-12 13:13
    你说的也许是对的。我知道的是,阿法狗最开始被训练的目标是能够像人一样思考判断和下棋,所以在开始的阶 ...

    围棋,一直有“金角银边草肚皮”一说,其实这种说法就是基于人类的思维计算能力有限提出来的,而当年的“宇宙流”的提出,就是认为中腹才是围棋最广的天地,也被认为是围棋未来的方向,但武宫最终却越下越差,甚至成为一个笑话,这并不是说方向是错的,只是说明人类思维的局限造成人只能立足于边边角角之地踏实行走,却无法到中腹地带去飞。
    围棋的规则简单的3岁孩子花半个小时都能学懂,然后就是许多的棋形许多的定式,这些,就是人类在对弈中总结出的最适合人类记忆的下棋套路。其实很多复杂的定式,会有很多的变例,每种变例都又会有很多分支,记住这些变例就是在增长棋力。当年中国年轻棋手全面超越日本棋手,原因中说的最多的就是中国棋院几十位年轻棋手每天都在集体研究某种定式,摆出各种变例的情况然后集体分享,所以,在实战中能够下出很多意想不到的招法。
    真没想到AI来的如此之快,不到二十年时间,几乎所有领域都在突破,语音、视觉、动作,现在围棋如果实现突破,那离突破人类思维禁区就不远了。真希望能够活着看到人类创造出第一个真正的机器人。

    该用户从未签到

    发表于 2016-3-12 14:49:30 | 显示全部楼层
    煮酒正熟 发表于 2016-3-12 13:13
    你说的也许是对的。我知道的是,阿法狗最开始被训练的目标是能够像人一样思考判断和下棋,所以在开始的阶 ...

    我感觉狗的优势是计算能力。
    职业棋手一般最多算20多种变化,100多手棋。今天看了第三局直播,我感觉狗是否可能在限时里计算能力是人脑的N倍,然后选择最优。
    所以,看孔杰解说时,一个最大感觉是:人脑对某些过于复杂的形势会简化,或者先放一放来处理,因为人脑算不清,但是狗脑子却可以通过变态的计算看清形势。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2016-3-12 19:49:05 | 显示全部楼层
    本帖最后由 冰蚁 于 2016-3-12 06:53 编辑

    大家要记得,狗其实不算是专用围棋软件。选择围棋是为了验证算法:价值网络, 政策网络。这个是核心。
  • TA的每日心情

    2020-11-20 06:24
  • 签到天数: 1618 天

    [LV.Master]无

     楼主| 发表于 2016-3-12 19:54:09 | 显示全部楼层
    zilewang 发表于 2016-3-12 14:49
    我感觉狗的优势是计算能力。
    职业棋手一般最多算20多种变化,100多手棋。今天看了第三局直播,我感觉狗是 ...

    你错了,赵治勋说过,职业棋手每一手棋的计算是十几种,每种二十几手,因此大约要算三百手棋。

    他为啥这么说?是因为有艺术气质的师兄石田芳夫曾经回答记者问时说,一瞥千手。大家觉得不可能,问当时26岁的大三冠获得者,他很认真的给出了答案。

    狗能算多少手,恐怕多很多。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2016-3-12 20:00:24 | 显示全部楼层
    穿着裤衩裸奔 发表于 2016-3-11 21:37
    两回事。
    请刘翔的教练教我跨栏,我会不会提高成绩?肯定会。
    请刘翔的教练教我跨栏,我会不会跑过刘翔? ...

    发展围棋理论的人是职业高段棋手啊。又不是普通人。对普通人能长棋力已经可以。而且对普通人还用不到这么高级的狗。
  • TA的每日心情
    擦汗
    2023-2-28 12:05
  • 签到天数: 1972 天

    [LV.Master]无

    发表于 2016-3-12 20:44:56 | 显示全部楼层
    河蚌 发表于 2016-3-12 12:42
    觉得这点酒爷有些偏颇了。
    任何问题的解答,都依托于两个方面,一个是知识,另一个是推理。就本质上说, ...

    河蚌你的这种想法,跟人工智能领域里的“蚁群算法“的思路很一致。

    可以把围棋看成复杂的系统,而现代复杂系统理论的研究成果不断得到超出我们直觉和常识的结论。

    蚁群算法跟程序猿寻求最优解的遍历思维模式不一样,它通过简单规则导致群体行为的叠加,导致出现复杂系统状态突变(涌现)。 每只蚂蚁没有智能,实际上每只蚂蚁并不像我们想象的需要知道整个世界的信息,他们其实只关心很小范围内的眼前信息,而且根据这些局部信息利用几条简单的规则进行决策,这样,在蚁群这个集体里,复杂性的行为就会凸现出来。这就是复杂系统解释的规律。 只有每只蚂蚁遵循多样性、正反馈的简单规则不断试探局部最优路径,整个蚁群就显示出智能性,逼近全局最优解。

    还有其它人工智能方面的算法,神经元网络算法、退火算法、遗传基因算法,都是用多个节点、多个层级来模拟非线性的复杂系统,每个层次和节点遵循简单规则来运行,通过大量节点和层次的堆积模拟复杂非线性系统。并通过大量数据的训练、试错、反馈得到一些参数,向非线性系统的最优解逼近。

    由于复杂系统的决策超过人脑的计算力,人多数依赖知识和直觉来决策,这些人工智能算法尽量模拟复杂系统,电脑计算力远超人类,又有无穷精力不断穷举、试错、反馈,所以可以搞出超过人类知识和直觉的决策,看起来很智能的样子。

  • TA的每日心情
    擦汗
    2023-2-28 12:05
  • 签到天数: 1972 天

    [LV.Master]无

    发表于 2016-3-12 21:24:02 | 显示全部楼层
    冰蚁 发表于 2016-3-12 19:49
    大家要记得,狗其实不算是专用围棋软件。选择围棋是为了验证算法:价值网络, 政策网络。这个是核心。 ...

    Google在人工智能算法上确实有突破,上次有个新闻说google的神经元网络算法通过喂给无数猫的图片,最后自己学会能认出猫。它这个神经元网络是模仿人脑的,就是通过一个网络来学习视觉、听觉等各方面的能力,而不是视觉一个计算、听觉一个计算单元那样的电脑式机械计算。

    具体到阿法狗,我猜测阿法狗的价值网络和政策网络应该是人工智能算法模拟人脑的成果,而且其计算能力和能喂给的巨量算例也远超过人类。其搜索算法部分还是机械的电脑计算方式,计算力也远超人脑。阿法狗取胜的关键恐怕还是强大的机械计算能力部分占主导。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2016-3-12 21:51:46 | 显示全部楼层
    本帖最后由 冰蚁 于 2016-3-12 09:04 编辑
    qyangroo 发表于 2016-3-12 08:24
    Google在人工智能算法上确实有突破,上次有个新闻说google的神经元网络算法通过喂给无数猫的图片,最后自 ...


    搜索算法是传统蒙特卡罗搜索。但如果没有价值,政策网络进行筛选,后再蒙特卡罗搜索,这样的搜索量吃不消。所以狗下的棋就表现出大局观强,主次分明这样的特点。有了这个,再辅以蒙特卡罗的强大搜索能力,狗就给人深不可测的感觉和碾压李世石的结果。小李后两盘能彻底放下包袱了吧,好好拼拼,看看能出什么精彩对局。

    评分

    参与人数 1爱元 +4 收起 理由
    煮酒正熟 + 4

    查看全部评分

  • TA的每日心情
    擦汗
    2023-2-28 12:05
  • 签到天数: 1972 天

    [LV.Master]无

    发表于 2016-3-12 22:01:29 | 显示全部楼层
    冰蚁 发表于 2016-3-12 21:51
    搜索算法是传统蒙特卡罗搜索。但如果没有价值,政策网络进行筛选,后再蒙特卡罗搜索,这样的搜索量吃不消 ...

    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络模型的节点数和层级的计算量,也不是人脑计算能搞定的。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2016-3-12 22:08:52 | 显示全部楼层
    qyangroo 发表于 2016-3-12 09:01
    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络 ...


    你要这么定义,那肯定每步都要计算啊。
  • TA的每日心情
    擦汗
    2023-2-28 12:05
  • 签到天数: 1972 天

    [LV.Master]无

    发表于 2016-3-12 22:28:32 | 显示全部楼层
    冰蚁 发表于 2016-3-12 22:08
    你要这么定义,那肯定每步都要计算啊。

    我的意思是,一个人对阵一个多节点多层次的计算网络,就像一个人对一个兵团。阿法狗可以分布式计算,多进程多线程,人脑的计算方式,据一个科普片说,是多任务分时共享的单线程模式。
    从计算能力上说,一旦电脑开始模拟人脑的神经元网络工作方式,从计算能力上说肯定超过人类,在棋牌类这些规则固定的游戏上人类基本没有优势。
  • TA的每日心情
    慵懒
    5 天前
  • 签到天数: 1475 天

    [LV.10]大乘

    发表于 2016-3-12 22:28:54 | 显示全部楼层
    qyangroo 发表于 2016-3-12 21:24
    Google在人工智能算法上确实有突破,上次有个新闻说google的神经元网络算法通过喂给无数猫的图片,最后自 ...

    这个猫的我也看了报道,从这里来看,已经开始摸到人类思维抽象的边了。
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    发表于 2016-3-12 22:52:32 | 显示全部楼层
    qyangroo 发表于 2016-3-12 09:01
    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络 ...

    这是我的一个回贴:
    传统棋类AI的基础是蒙特卡洛树型搜索 (Monte Carlo Tree Search). 阿法狗自然也有这个。但这个是很低级的计算方法,不是高级算法。阿法狗算法里面的高级部分是价值网络和政策网络,这两个东西合在一起,就是要模仿人类棋手的“棋感"。价值网络和政策网络负责掌控宏观形势,基于对宏观形势的研判,指挥蒙特卡洛做有限的树型搜索。注意有限两个字。如果没有价值网络和政策网络的宏观指导,光靠蒙特卡洛树型搜索去下棋,以围棋10的170次方的近乎无限种的应对方式,阿法狗一步棋会下到地老天荒。

    价值网络和政策网络的技术基础,是很高端的所谓深度神经网络技术。这个俺不懂,就不乱说了。

    说到底,阿法狗之所以下起棋来比较像人,就是因为它有着相当复杂精妙的价值网络和政策网络。它在实战中的应对之所以屡屡技高一筹,得益于大数据时代的软硬件(比如cloud computing,你说它是硬件还是软件?)
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    发表于 2016-3-12 23:00:38 | 显示全部楼层
    本帖最后由 煮酒正熟 于 2016-3-12 10:07 编辑
    qyangroo 发表于 2016-3-12 09:01
    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络 ...


    阿法狗与90年代末爱必摸搞出来的那个会下国象的深蓝相比,Monte Carlo Tree Search 是它们的共性,所以这个不是吮马新鲜玩意儿。阿法狗比之深蓝真正优越之处是两个,一是大数据时代对海量数据的超高处理能力(这方面,软件比硬件贡献要大得多),二是研发人员基于神经网络技术为阿法狗搞出来的价值网络+政策网络。

    后面这两个,才是人工智能最终战胜人类顶级棋手的关键。

    但是在后两个因素之间,我得说,二在较大程度上依赖于一,因为没有大数据处理能力,神经网络技术就得不到充分发展,而以它为基础的价值网络和政策网络就不可能表现出我们现在看到的那种大局观。但是(对,但是,必须的),二里面又包含着两个部分,一是domain knowledge,也就是某一领域里面的专业知识。这个专业知识,确实是依靠一定时间里的喂棋谱,以及狗狗自己玩儿老顽童周伯通的双手互搏所积累下来的。二是machine learning,这个东西决定了狗狗可以从喂给它的棋谱以及自己双手互搏之中有效学到专业知识。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2016-3-12 23:11:08 | 显示全部楼层
    qyangroo 发表于 2016-3-12 09:28
    我的意思是,一个人对阵一个多节点多层次的计算网络,就像一个人对一个兵团。阿法狗可以分布式计算,多进 ...

    我看以后没什么固定规则的也没戏。拿围棋练手就是固定规则极少,而变化则是天文数字。怎么在这样的组合中选择相对正确的,这次得到了突破。所以这个算法的潜力真的很大。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-3-29 16:03 , Processed in 0.044841 second(s), 20 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表