日本或者韩国也有这么厉害的人工智能围棋程序了？

删除失败 · 发表于 2017-1-5 14:55:30

冰蚁发表于 2017-1-5 07:55
我现在就是比较好奇如果设定的目标不是简单赢棋的话会怎么样。比如设定的目标是赢得越多越好，狗会下出什么 ...

有意思的想法，一开始我以为只是变相的贴目，实际上是个开放的问题。

如果是以赢棋为第一位，然后再考虑赢多少，那么只要在AI里加入对对手的评估，根据下棋过程中对手体现的水平估算自己能赢多少，然后按部就班就可以，因为AI最强的是执行力，所以我认为和master的表现差别不会太大。

但是如果目标是能赢多少就赢多少就复杂了，因为AI的对手人类完全可能是个围棋白痴，理论上可以不停得吃子赢得目数直到棋盘上没有可以落子的地方，我觉得AI会先变成白痴

穿着裤衩裸奔 · 发表于 2017-1-5 20:18:14

Dracula 发表于 2017-1-5 11:54
据孟泰龄说，聂卫平下那步点角的败着（第50手）以前，形势已经不好了。聂卫平是自我感觉良好，他的形势判 ...

以前欺负机器的时候就说机器没有棋感。
人类的棋感其实是建立在无法精细计算的基础上，不靠谱。
遇到电脑计算力一旦超过人类，人类的棋感就不起作用了。
棋感肯定搞不清楚每一步盈亏多少目？
机器只要比人精确，人就没戏了。

loy_20002000 · 发表于 2017-1-5 22:08:31

冰蚁发表于 2017-1-5 00:55
增加时间，计算机可以多算几层，人更没戏。

Go不强在这里，强在局势的判断。

loy_20002000 · 发表于 2017-1-5 22:57:03

穿着裤衩裸奔发表于 2017-1-5 20:18
以前欺负机器的时候就说机器没有棋感。
人类的棋感其实是建立在无法精细计算的基础上，不靠谱。
遇到电脑 ...

围棋的博弈树复杂度是10的300次方，计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大局观强，死活计算反而不是强项。李世石唯一赢的那盘，死活错误是很低级的，最后一盘的开局误算损失也很大。需要补断，普通人的处理是处理好借用和余味，不会直接补，而Go是直接连成大长棍，笨了点但扎实到没有任何弱点。

我今年两大预测，李世石会赢，希拉里当选，统统错了。诶。

冰蚁 · 发表于 2017-1-5 22:57:25

本帖最后由冰蚁于 2017-1-5 10:19 编辑

loy_20002000 发表于 2017-1-5 09:08
Go不强在这里，强在局势的判断。

没有否认go的神经网络的成功。但神经网络需要蒙特卡洛的搜索结果，比赛的时候是这样，训练的时候也是。一切都是计算。更充分的计算是神经网络能够成功的基础。

Dracula · 发表于 2017-1-5 23:14:00

loy_20002000 发表于 2017-1-5 22:57
围棋的博弈树复杂度是10的300次方，计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大 ...

我看了几盘Master的棋，力量很大，计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象聂卫平那盘，聂卫平点角那步败招职业棋手第一感其实觉得还不错，没想到电脑马上就出杀招，给吃了。这个版本也一点不惧打劫。我看的好几盘都有打劫，下的都很好。AlphaGo和李世石下完，我看了一些职业棋手的总结觉得还是有弱点。Master这个版本就真的好像是无懈可击了。

冰蚁 · 发表于 2017-1-5 23:36:06

Dracula 发表于 2017-1-5 10:14
我看了几盘Master的棋，力量很大，计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

这个版本也是从零学起，只有几条简单的围棋规则起步，完全没有输入棋谱。

loy_20002000 · 发表于 2017-1-5 23:57:46

本帖最后由 loy_20002000 于 2017-1-6 00:33 编辑

Dracula 发表于 2017-1-5 23:14
我看了几盘Master的棋，力量很大，计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

看过与李世石的五盘直播，Master还没看过。力量这么大呀，现在去看下。

—————

刚看过聂卫平的自战解说，不评论Master的实力，单说老聂。

右上58粘那种棋是自灭一眼，换我上也肯定59。白棋净活后黑棋独眼龙，苦。杀是没戏，可以占一些便宜。不过以老聂的力量，就算净活也捞不到多少便宜，他一招败的工夫独步天下。

冰蚁 · 发表于 2017-1-6 00:41:11

Dracula 发表于 2017-1-5 10:14
我看了几盘Master的棋，力量很大，计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

这个版本也是从零学起，只有几条简单的围棋规则起步，完全没有输入棋谱。

武工队 · 发表于 2017-1-6 01:35:24

冰蚁发表于 2017-1-5 02:59
阿尔法狗的算法还是要靠蒙特卡洛搜索啊。时间多，搜索的遍历结果更多（搜索窗口可以开得更大，搜索层数可 ...

蒙特卡洛重复的次数，到了一定的数目以后，再增加次数也不会有什么变化了

我的理解是，搜索是要依据神经网络的判断的，估值很低的棋着，就不会继续搜索下去。所以整体上来说，可以是一个很深的搜索，但是不会是太广的搜索，相对来说，时间复杂度不会太高

目前30秒的快棋，master落子基本都在10秒以内，似乎都没必要把时间充分利用了

穿着裤衩裸奔 · 发表于 2017-1-6 10:52:43

loy_20002000 发表于 2017-1-5 22:57
围棋的博弈树复杂度是10的300次方，计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大 ...

大多数人的大局观都是靠死活计算以及打谱，棋局灌出来的，本质上也是个统计模型。计算机现在算法和计算能力上来后，可以做到更精细，直接用胜率表示就可以了。

人类最多也就做到对棋局的判断精度精确到小数点后一位，比如三七开，二八开。计算机能做到1%就比人强10倍了。

比如人类下一手棋，觉得有八成把握是好棋，计算机可以做到知道胜率是81%还是82%。假如每一步计算机的胜率比人类高5%，前面20手下完，胜率应该高了一倍不止，基本上人类就不用玩了。

现在对局上的表现符合这个猜测，看起来每一步计算机都没什么特别高的，但下着下着就彻底落后了。

loy_20002000 · 发表于 2017-1-6 20:55:31

本帖最后由 loy_20002000 于 2017-1-6 21:00 编辑

穿着裤衩裸奔发表于 2017-1-6 10:52
大多数人的大局观都是靠死活计算以及打谱，棋局灌出来的，本质上也是个统计模型。计算机现在算法和计算能 ...

围棋与其他棋类游戏最大的不同是估值函数不平滑，例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量化，少一子或多一子不会导致估值函数大起大落，而围棋盘面某个关键点是否有子是差别巨大的。简单累加优势一定是胜势是不一定成立的。

根据《Nature》上DeepMind的那篇文章，Go=策略网络+快速走子网络+估值网络+MCTS（蒙特卡洛树搜索+信心上限算法Upper Confidence Bounds+深度卷积神经网络左右互搏）。这种框架下的AI是肯定有盲点的，人机李世石的4、5局出错就是盲点BUG，第四局的错误我没记错的话DeepMind方面公布是系统误认己方是优势。这个框架有两点很重要，一是局面s估值v（s），二是下一手a价值v（a）的判定，落子选择f（s，a）只要v（s）估计错误或a遗漏了要点就会很麻烦。为了避免a的遗漏或是a自损招法Go在局部也是引入了模式的。

上次对李世石的测试出BUG，过不了多久应该有下一步的测试。期待柯洁或其他超一流的表现，这次不存在轻敌或准备不充分的问题，如果还是大败，人类就是彻底输了。

穿着裤衩裸奔 · 发表于 2017-1-6 22:31:47

loy_20002000 发表于 2017-1-6 20:55
围棋与其他棋类游戏最大的不同是估值函数不平滑，例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

高手！高手！

冰蚁 · 发表于 2017-1-6 22:59:34

loy_20002000 发表于 2017-1-6 07:55
围棋与其他棋类游戏最大的不同是估值函数不平滑，例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量 ...

目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的。也许是把搜索搞得更广更深？

loy_20002000 · 发表于 2017-1-7 00:09:20

本帖最后由 loy_20002000 于 2017-1-7 00:22 编辑

冰蚁发表于 2017-1-6 22:59
目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的 ...

围棋AI的框架大致是：深度卷积神经网络+蒙特卡洛树搜索。所有人都用类似的方法应该差距不大才对，但Go以外的系统对职业棋手都需要让子才能赢（大致一年前的信息）。Facebook的田博士问过Aja：“我们的平台用80个GPU累积数据，计算力能达到你们的1%吗”Aja含笑不语，他的猜测是到不了1%。DM的硬件计算力肯定世界第一。另外已经公开的算法和资料都很隐晦。其他系统停留在与职业初段抗争，Go（Master）完胜13位世界冠军（大概），这不是硬件能力可以简单解释的，他们或许在方法上取得了突破。

Go出bug的概率较低，上次为什么出bug都是在猜，也许没人猜对，或我没看到官方说法。可能李世石的应招不在或极少出现在训练结构里，导致机器低估那一招的概率，机器判断对手最有利的几个点并且检验的时间比较长，低概率招法占用的资源较少。

DeepMind训练AI玩Atari游戏听说成绩不错，只要是状态（向量空间、局面量化等）+动作的游戏都具有较高通用性。《Super Mario》、飞机类街机游戏、篮球投篮、斯诺克台球等等游戏都是满足的，这类游戏机器完胜人类。不清楚google与暴雪的合作是怎样的，我比较感兴趣的是他们如何处理人类的赌博行为，也就是投机选择。

大脚丫 · 发表于 2017-1-8 21:19:04

冰蚁发表于 2017-1-6 22:59
目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的 ...

主要还是google没有向中国的职业棋手开放资源，其实人类棋手现在吃亏的地方是在明处，而阿法狗躲在AI的密云里面打冷枪。现在的局面我也是不看好人类棋手的，我是希望中国自己的AI完善以后，职业棋手借助AI训练一段时间或许可以和AI对上一阵。因为现在人类可以说完全不理解AI下出来的棋，以往千百年来积累的知识几乎都没有用了。

还有你说这版阿法狗是从零开始重新训练的，这个有没有正式出处？我觉得google保密得很厉害的，连用了什么规模的硬件也不说的。

冰蚁 · 发表于 2017-1-8 21:56:23

大脚丫发表于 2017-1-8 08:19
主要还是google没有向中国的职业棋手开放资源，其实人类棋手现在吃亏的地方是在明处，而阿法狗躲在AI的密 ...

上次下完后，我记得黄博士在采访中就提到要从头开始训练，不依靠输入人类棋谱学习来获得升级版的狗。

大脚丫 · 发表于 2017-1-23 22:19:59

大脚丫发表于 2017-1-3 17:13
以前的套路都是基于人类的局面计算能力的，现在AI超越了人类的计算深度，所以有新的观点不是奇怪的事情。 ...

说这个肉臂点错怎么办，结果还真的有两盘棋点错了！无奈阿法狗天纵英才，错一步没事，照样把对手干趴下。

这个事情是黄博士自己在facebook上面说的，主要还是怕研究棋局的棋手们被误导，具体感兴趣的朋友可以自己去看错的那两步。

陈王奋起挥黄钺 · 发表于 2017-2-12 15:20:56

loy_20002000 发表于 2017-1-4 21:19
上次对李世石故意隐藏实力，让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快 ...

计算机可以找小棋盘找到确定开局最佳点，然后逐步扩大棋盘，从而迅速找到最佳开局的几个候选点。

loy_20002000 · 发表于 2017-2-12 15:36:56

陈王奋起挥黄钺发表于 2017-2-12 15:20
计算机可以找小棋盘找到确定开局最佳点，然后逐步扩大棋盘，从而迅速找到最佳开局的几个候选点。 ...

我好好消化消化，有些想不明白。

		自动登录	找回密码
密码			注册

日本或者韩国也有这么厉害的人工智能围棋程序了？

点评

点评

点评

点评

点评