设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕
打印 上一主题 下一主题

[科技] 李喆:这两盘棋 没人会比李世石做得更...

[复制链接]
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    楼主
    发表于 2016-3-11 22:41:28 | 显示全部楼层
    xlan1976 发表于 2016-3-11 08:22
    阿法狗据说不就是靠自己跟自己下棋学习吗,这么算来,这种棋已经下过好多次了 ...

    自己和自己下只能提高proficiency,但是要拓宽视野,提高自己计算胜率的准确性,必须要和人类高手对弈才能实现。

    这就好比你带小孩子去上奥数班,他会有两个收益,一是拓展思路,这个需要的是高人讲解启迪;二是对于已经掌握的知识,能够以最快的速度完成解答,而这一点,需要的是大量做题。

    狗狗和自己每天下那一百万盘,其实就是在做题。但你就是下一亿盘,也无法拓展思路。

    点评

    如果是下一亿盘不同下法的棋,并且还记住呢?  发表于 2016-3-12 12:44
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    沙发
    发表于 2016-3-12 02:42:37 | 显示全部楼层
    冰蚁 发表于 2016-3-11 11:22
    要相信9段棋手的实力嘛。

    九段棋手的脑子终究也是人脑子
    那狗可是狗脑子啊

    评分

    参与人数 1爱元 +8 收起 理由
    到处停留的叶子 + 8 高见!

    查看全部评分

  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    板凳
    发表于 2016-3-12 13:13:28 | 显示全部楼层
    本帖最后由 煮酒正熟 于 2016-3-12 00:15 编辑
    河蚌 发表于 2016-3-11 23:42
    觉得这点酒爷有些偏颇了。
    任何问题的解答,都依托于两个方面,一个是知识,另一个是推理。就本质上说, ...


    你说的也许是对的。我知道的是,阿法狗最开始被训练的目标是能够像人一样思考判断和下棋,所以在开始的阶段给他喂了多少万局人类高手的棋局。狗有了这些垫底儿,开始自行学习以后,它的思维特点与前面被动受训有什么不同,我就不知道了。但从前天和小李实战第37手那手棋,现在基本上大家都公认是彻底颠覆人类对围棋认知的一手,这就意味着,这种思考和判断,不是狗狗从人类那里学到的,极有可能是它自己在无休无止地自我对弈中,自己“悟”出来的。换言之,狗狗在一定程度上表现出了自己的创造性思维。(好像有不少老大坚决认为电脑现在完全没有创造力的 @晨枫 @老兵帅客 )昨天还有两三手,也是职业棋手和业余好手绝对不会那么下的,虽然效果欠佳,但至少说明狗狗有自己的思考和尝试。所以我觉得小李输掉第一局之后,柯洁显然有点儿着急,忙着为人类辩护的同时,还不忘攻击电脑“即使算得再精,也没有自己的风格”。我觉得柯洁说出这个话很扯。不知道他看完狗狗前天第37手之后是不是还继续坚持说狗狗没风格了。
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    地板
    发表于 2016-3-12 22:52:32 | 显示全部楼层
    qyangroo 发表于 2016-3-12 09:01
    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络 ...

    这是我的一个回贴:
    传统棋类AI的基础是蒙特卡洛树型搜索 (Monte Carlo Tree Search). 阿法狗自然也有这个。但这个是很低级的计算方法,不是高级算法。阿法狗算法里面的高级部分是价值网络和政策网络,这两个东西合在一起,就是要模仿人类棋手的“棋感"。价值网络和政策网络负责掌控宏观形势,基于对宏观形势的研判,指挥蒙特卡洛做有限的树型搜索。注意有限两个字。如果没有价值网络和政策网络的宏观指导,光靠蒙特卡洛树型搜索去下棋,以围棋10的170次方的近乎无限种的应对方式,阿法狗一步棋会下到地老天荒。

    价值网络和政策网络的技术基础,是很高端的所谓深度神经网络技术。这个俺不懂,就不乱说了。

    说到底,阿法狗之所以下起棋来比较像人,就是因为它有着相当复杂精妙的价值网络和政策网络。它在实战中的应对之所以屡屡技高一筹,得益于大数据时代的软硬件(比如cloud computing,你说它是硬件还是软件?)
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    5#
    发表于 2016-3-12 23:00:38 | 显示全部楼层
    本帖最后由 煮酒正熟 于 2016-3-12 10:07 编辑
    qyangroo 发表于 2016-3-12 09:01
    即使是筛选决策网络,也是依赖了巨量的离线计算(所谓的学习过程)和强大的在线计算能力。因为它那个网络 ...


    阿法狗与90年代末爱必摸搞出来的那个会下国象的深蓝相比,Monte Carlo Tree Search 是它们的共性,所以这个不是吮马新鲜玩意儿。阿法狗比之深蓝真正优越之处是两个,一是大数据时代对海量数据的超高处理能力(这方面,软件比硬件贡献要大得多),二是研发人员基于神经网络技术为阿法狗搞出来的价值网络+政策网络。

    后面这两个,才是人工智能最终战胜人类顶级棋手的关键。

    但是在后两个因素之间,我得说,二在较大程度上依赖于一,因为没有大数据处理能力,神经网络技术就得不到充分发展,而以它为基础的价值网络和政策网络就不可能表现出我们现在看到的那种大局观。但是(对,但是,必须的),二里面又包含着两个部分,一是domain knowledge,也就是某一领域里面的专业知识。这个专业知识,确实是依靠一定时间里的喂棋谱,以及狗狗自己玩儿老顽童周伯通的双手互搏所积累下来的。二是machine learning,这个东西决定了狗狗可以从喂给它的棋谱以及自己双手互搏之中有效学到专业知识。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-25 01:02 , Processed in 0.046549 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表