设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕

日本或者韩国也有这么厉害的人工智能围棋程序了?

[复制链接]
  • TA的每日心情

    2017-10-26 16:21
  • 签到天数: 68 天

    [LV.6]出窍

    发表于 2017-1-5 14:55:30 | 显示全部楼层
    冰蚁 发表于 2017-1-5 07:55
    我现在就是比较好奇如果设定的目标不是简单赢棋的话会怎么样。比如设定的目标是赢得越多越好,狗会下出什么 ...


    有意思的想法,一开始我以为只是变相的贴目,实际上是个开放的问题。

    如果是以赢棋为第一位,然后再考虑赢多少,那么只要在AI里加入对对手的评估,根据下棋过程中对手体现的水平估算自己能赢多少,然后按部就班就可以,因为AI最强的是执行力,所以我认为和master的表现差别不会太大。

    但是如果目标是能赢多少就赢多少就复杂了,因为AI的对手人类完全可能是个围棋白痴,理论上可以不停得吃子赢得目数直到棋盘上没有可以落子的地方,我觉得AI会先变成白痴

    点评

    油墨: 5.0 油菜: 5.0
    油墨: 5 油菜: 5
      发表于 2017-1-5 22:58
  • TA的每日心情

    2020-3-6 00:28
  • 签到天数: 564 天

    [LV.9]渡劫

    发表于 2017-1-5 20:18:14 | 显示全部楼层
    Dracula 发表于 2017-1-5 11:54
    据孟泰龄说,聂卫平下那步点角的败着(第50手)以前,形势已经不好了。聂卫平是自我感觉良好,他的形势判 ...

    以前欺负机器的时候就说机器没有棋感。
    人类的棋感其实是建立在无法精细计算的基础上,不靠谱。
    遇到电脑计算力一旦超过人类,人类的棋感就不起作用了。
    棋感肯定搞不清楚每一步盈亏多少目?
    机器只要比人精确,人就没戏了。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-1-5 22:08:31 | 显示全部楼层
    冰蚁 发表于 2017-1-5 00:55
    增加时间,计算机可以多算几层,人更没戏。

    Go不强在这里,强在局势的判断。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-1-5 22:57:03 | 显示全部楼层
    穿着裤衩裸奔 发表于 2017-1-5 20:18
    以前欺负机器的时候就说机器没有棋感。
    人类的棋感其实是建立在无法精细计算的基础上,不靠谱。
    遇到电脑 ...

    围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

    Go最大的惊喜是大局观强,死活计算反而不是强项。李世石唯一赢的那盘,死活错误是很低级的,最后一盘的开局误算损失也很大。需要补断,普通人的处理是处理好借用和余味,不会直接补,而Go是直接连成大长棍,笨了点但扎实到没有任何弱点。

    我今年两大预测,李世石会赢,希拉里当选,统统错了。诶。

    点评

    俺预测都对了。:D  发表于 2017-1-5 23:18
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2017-1-5 22:57:25 | 显示全部楼层
    本帖最后由 冰蚁 于 2017-1-5 10:19 编辑
    loy_20002000 发表于 2017-1-5 09:08
    Go不强在这里,强在局势的判断。


    没有否认go的神经网络的成功。但神经网络需要蒙特卡洛的搜索结果,比赛的时候是这样,训练的时候也是。一切都是计算。更充分的计算是神经网络能够成功的基础。
  • TA的每日心情
    慵懒
    2020-7-26 05:11
  • 签到天数: 1017 天

    [LV.10]大乘

    发表于 2017-1-5 23:14:00 | 显示全部楼层
    loy_20002000 发表于 2017-1-5 22:57
    围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

    Go最大的惊喜是大 ...

    我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象聂卫平那盘,聂卫平点角那步败招职业棋手第一感其实觉得还不错,没想到电脑马上就出杀招,给吃了。这个版本也一点不惧打劫。我看的好几盘都有打劫,下的都很好。AlphaGo和李世石下完,我看了一些职业棋手的总结觉得还是有弱点。Master这个版本就真的好像是无懈可击了。

  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2017-1-5 23:36:06 | 显示全部楼层
    Dracula 发表于 2017-1-5 10:14
    我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

    这个版本也是从零学起,只有几条简单的围棋规则起步,完全没有输入棋谱。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-1-5 23:57:46 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-6 00:33 编辑
    Dracula 发表于 2017-1-5 23:14
    我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...


    看过与李世石的五盘直播,Master还没看过。力量这么大呀,现在去看下。

    —————

    刚看过聂卫平的自战解说,不评论Master的实力,单说老聂。

    右上58粘那种棋是自灭一眼,换我上也肯定59。白棋净活后黑棋独眼龙,苦。杀是没戏,可以占一些便宜。不过以老聂的力量,就算净活也捞不到多少便宜,他一招败的工夫独步天下。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2017-1-6 00:41:11 | 显示全部楼层
    Dracula 发表于 2017-1-5 10:14
    我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

    这个版本也是从零学起,只有几条简单的围棋规则起步,完全没有输入棋谱。
  • TA的每日心情
    擦汗
    2017-2-2 05:24
  • 签到天数: 262 天

    [LV.8]合体

    发表于 2017-1-6 01:35:24 | 显示全部楼层
    冰蚁 发表于 2017-1-5 02:59
    阿尔法狗的算法还是要靠蒙特卡洛搜索啊。时间多,搜索的遍历结果更多(搜索窗口可以开得更大,搜索层数可 ...

    蒙特卡洛重复的次数,到了一定的数目以后,再增加次数也不会有什么变化了

    我的理解是,搜索是要依据神经网络的判断的,估值很低的棋着,就不会继续搜索下去。所以整体上来说,可以是一个很深的搜索,但是不会是太广的搜索,相对来说,时间复杂度不会太高

    目前30秒的快棋,master落子基本都在10秒以内,似乎都没必要把时间充分利用了
  • TA的每日心情

    2020-3-6 00:28
  • 签到天数: 564 天

    [LV.9]渡劫

    发表于 2017-1-6 10:52:43 | 显示全部楼层
    loy_20002000 发表于 2017-1-5 22:57
    围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

    Go最大的惊喜是大 ...

    大多数人的大局观都是靠死活计算以及打谱,棋局灌出来的,本质上也是个统计模型。计算机现在算法和计算能力上来后,可以做到更精细,直接用胜率表示就可以了。

    人类最多也就做到对棋局的判断精度精确到小数点后一位,比如三七开,二八开。计算机能做到1%就比人强10倍了。

    比如人类下一手棋,觉得有八成把握是好棋,计算机可以做到知道胜率是81%还是82%。假如每一步计算机的胜率比人类高5%,前面20手下完,胜率应该高了一倍不止,基本上人类就不用玩了。

    现在对局上的表现符合这个猜测,看起来每一步计算机都没什么特别高的,但下着下着就彻底落后了。




  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-1-6 20:55:31 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-6 21:00 编辑
    穿着裤衩裸奔 发表于 2017-1-6 10:52
    大多数人的大局观都是靠死活计算以及打谱,棋局灌出来的,本质上也是个统计模型。计算机现在算法和计算能 ...

    围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量化,少一子或多一子不会导致估值函数大起大落,而围棋盘面某个关键点是否有子是差别巨大的。简单累加优势一定是胜势是不一定成立的。

    根据《Nature》上DeepMind的那篇文章,Go=策略网络+快速走子网络+估值网络+MCTS(蒙特卡洛树搜索+信心上限算法Upper Confidence Bounds+深度卷积神经网络左右互搏)。这种框架下的AI是肯定有盲点的,人机李世石的4、5局出错就是盲点BUG,第四局的错误我没记错的话DeepMind方面公布是系统误认己方是优势。这个框架有两点很重要,一是局面s估值v(s),二是下一手a价值v(a)的判定,落子选择f(s,a)只要v(s)估计错误或a遗漏了要点就会很麻烦。为了避免a的遗漏或是a自损招法Go在局部也是引入了模式的。

    上次对李世石的测试出BUG,过不了多久应该有下一步的测试。期待柯洁或其他超一流的表现,这次不存在轻敌或准备不充分的问题,如果还是大败,人类就是彻底输了。

    点评

    涨姿势: 5.0
    涨姿势: 5
      发表于 2017-1-23 23:52
  • TA的每日心情

    2020-3-6 00:28
  • 签到天数: 564 天

    [LV.9]渡劫

    发表于 2017-1-6 22:31:47 | 显示全部楼层
    loy_20002000 发表于 2017-1-6 20:55
    围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

    高手!高手!
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2017-1-6 22:59:34 | 显示全部楼层
    loy_20002000 发表于 2017-1-6 07:55
    围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

    目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

    不晓得alphago 是如何解决上次的崩盘的问题的。也许是把搜索搞得更广更深?
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-1-7 00:09:20 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-7 00:22 编辑
    冰蚁 发表于 2017-1-6 22:59
    目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

    不晓得alphago 是如何解决上次的崩盘的问题的 ...

    围棋AI的框架大致是:深度卷积神经网络+蒙特卡洛树搜索。所有人都用类似的方法应该差距不大才对,但Go以外的系统对职业棋手都需要让子才能赢(大致一年前的信息)。Facebook的田博士问过Aja:“我们的平台用80个GPU累积数据,计算力能达到你们的1%吗”Aja含笑不语,他的猜测是到不了1%。DM的硬件计算力肯定世界第一。另外已经公开的算法和资料都很隐晦。其他系统停留在与职业初段抗争,Go(Master)完胜13位世界冠军(大概),这不是硬件能力可以简单解释的,他们或许在方法上取得了突破。

    Go出bug的概率较低,上次为什么出bug都是在猜,也许没人猜对,或我没看到官方说法。可能李世石的应招不在或极少出现在训练结构里,导致机器低估那一招的概率,机器判断对手最有利的几个点并且检验的时间比较长,低概率招法占用的资源较少。

    DeepMind训练AI玩Atari游戏听说成绩不错,只要是状态(向量空间、局面量化等)+动作的游戏都具有较高通用性。《Super Mario》、飞机类街机游戏、篮球投篮、斯诺克台球等等游戏都是满足的,这类游戏机器完胜人类。不清楚google与暴雪的合作是怎样的,我比较感兴趣的是他们如何处理人类的赌博行为,也就是投机选择。

    点评

    涨姿势: 5.0
    涨姿势: 5
      发表于 2017-1-23 23:53
  • TA的每日心情
    开心
    2021-2-17 23:40
  • 签到天数: 7 天

    [LV.3]辟谷

    发表于 2017-1-8 21:19:04 | 显示全部楼层
    冰蚁 发表于 2017-1-6 22:59
    目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

    不晓得alphago 是如何解决上次的崩盘的问题的 ...

    主要还是google没有向中国的职业棋手开放资源,其实人类棋手现在吃亏的地方是在明处,而阿法狗躲在AI的密云里面打冷枪。现在的局面我也是不看好人类棋手的,我是希望中国自己的AI完善以后,职业棋手借助AI训练一段时间或许可以和AI对上一阵。因为现在人类可以说完全不理解AI下出来的棋,以往千百年来积累的知识几乎都没有用了。

    还有你说这版阿法狗是从零开始重新训练的,这个有没有正式出处?我觉得google保密得很厉害的,连用了什么规模的硬件也不说的。
  • TA的每日心情
    擦汗
    2019-6-16 23:34
  • 签到天数: 1277 天

    [LV.10]大乘

    发表于 2017-1-8 21:56:23 | 显示全部楼层
    大脚丫 发表于 2017-1-8 08:19
    主要还是google没有向中国的职业棋手开放资源,其实人类棋手现在吃亏的地方是在明处,而阿法狗躲在AI的密 ...

    上次下完后,我记得黄博士在采访中就提到要从头开始训练,不依靠输入人类棋谱学习来获得升级版的狗。
  • TA的每日心情
    开心
    2021-2-17 23:40
  • 签到天数: 7 天

    [LV.3]辟谷

    发表于 2017-1-23 22:19:59 | 显示全部楼层
    大脚丫 发表于 2017-1-3 17:13
    以前的套路都是基于人类的局面计算能力的,现在AI超越了人类的计算深度,所以有新的观点不是奇怪的事情。 ...

    说这个肉臂点错怎么办,结果还真的有两盘棋点错了!无奈阿法狗天纵英才,错一步没事,照样把对手干趴下。

    这个事情是黄博士自己在facebook上面说的,主要还是怕研究棋局的棋手们被误导,具体感兴趣的朋友可以自己去看错的那两步。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2017-1-23 23:52
  • TA的每日心情
    开心
    2020-9-28 03:33
  • 签到天数: 17 天

    [LV.4]金丹

    发表于 2017-2-12 15:20:56 | 显示全部楼层
    loy_20002000 发表于 2017-1-4 21:19
    上次对李世石故意隐藏实力,让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快 ...

    计算机可以找小棋盘找到确定开局最佳点,然后逐步扩大棋盘, 从而迅速找到最佳开局的几个候选点。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    发表于 2017-2-12 15:36:56 | 显示全部楼层
    陈王奋起挥黄钺 发表于 2017-2-12 15:20
    计算机可以找小棋盘找到确定开局最佳点,然后逐步扩大棋盘, 从而迅速找到最佳开局的几个候选点。 ...

    我好好消化消化,有些想不明白。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-3-29 08:38 , Processed in 0.046784 second(s), 24 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表