真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

燕庐敕 · 发表于 2016-3-7 18:19:23

自从谷歌改名AlphaBeta之后，她的围棋人工智能程序也就改成了AlphaGo。Go这个音是唐朝时期“棋”这个字的发音的近似，现在考证类似“国”这个音发短促些。

可见语音的变化之大。

扯远了，今天，看见人工智能学家刘锋（计算机博士，互联网进化论作者，人工智能学家主编）质疑谷歌的文章，我这里全文引用，之后在回复里面对某些段落做点评。这样是为了首先保证文章的完整性和阅读的连续性。

“把大象关进冰箱要几步”涉及的科学漏洞

　　在讨论谷歌围棋AI及其比赛问题之前，我们先看那个著名的笑话“把大象关进冰箱要几步“，2000年中国春晚，赵本山、宋丹丹的小品《钟点工》，曾经用到了这个笑话：问“把大象放进冰箱总共分几步？”答：“三步，第一步把冰箱门打开；第二步把大象放进去，第三步把冰箱门带上”。

　　小品中的情景只是一个笑话，但从科研角度看，因为故意忽视最为关键的第二步，使得这个原本伟大的科学实验，变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现，根源也在这里。

　　谷歌围棋AI在Nature上究竟说了什么

　　谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理，这个原理描述相对专业，这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么，谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作，它们分别是：

　　第一步快速判断：用于快速的观察围棋的盘面，类似于人观察盘面获得的第一反应

　　第二步深度模仿：AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习，用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。

　　第三步自学成长：AlphaGo不断与“自己”对战，下了3000万盘棋局，总结出经验作为棋局中的评估依据。

　　第四步全局分析：利用第三步学习结果对整个盘面的赢面判断，实现从全局分析整个棋局。

　　判断欺诈的第一个原因，谷歌的把大象关冰箱问题

　　Nature论文阐述的AlphaGo基本原理，按照人工智能专家的评价：”其基本原理并没有新东西“，但核心价值是学习了近万盘人类历史高手的棋局，和自我对战下的3000万盘棋局总结的经验。

　　请注意，这个关键内容，也就是AlphaGo到底终结出什么围棋规律，或者其神经网络的权重值是什么，谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上，说出了如何打开围棋战胜人类的冰箱大门，和如何关上围棋战胜人类的冰箱大门，但唯独在第二步围棋如何战胜人类的方法塞进冰箱，同样做了隐藏。

　　我们知道，围棋之所以很难被人工智能攻破，战胜人类高手，就是其可能的组合数异常庞大。至于多么异常，2016年1月普林斯顿的研究人员给出了最新研究结果：对于一个19x19的围棋棋盘而言，一共有361个位置，而每个位置可以单独放置黑棋、白棋或者留空，理论上所有的可能组合是3^361种。但根据围棋规则，不是所有位置都可合法落子，例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢？

　　普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数：208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935

　　我们给它多分几行：

　　2081681993819799846

　　9947863334486277028

　　6522453884530548425

　　6394568209274196127

　　3801537852564845169

　　8519643907259916015

　　6281285460898883144

　　2712971531931755773

　　6620397247064840935

　　不用数了，一共171位数！这个数字比我们地球所有的沙粒数量还要多！比人类已知宇宙的所有星球数量还要多！对比一下，谷歌学习的近万盘人类棋局是5位数，谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化，我们把大头去掉，那也有70位数的棋局变化。

　　第一也就是说谷歌以幼儿园规模的知识量，就要获得诺贝尔奖级的知识规律，这违背了科学发展规律和常识。

　　第二，如果谷歌通过学习和自行对战学到了超出寻常的规律，或者其神经网络权重值达到新的高度状态。但谷歌不愿意公开这个最重要最关键的内容，其他研究者就无法真正了解谷歌围棋的真实水平。在这种情况下，匆忙举办获得巨大商业利益，没有第三方真正监督，无法洗脱作弊嫌疑的世界冠军比赛。受到科学欺诈指控也属必然。

　　判断欺诈的第二个原因，密室实验与棋手放水

　　从科学实验的严谨性说，谷歌在论文中阐述的实验方法，表现不及格甚至恶劣，我们知道在物理，化学，生物，计算机等领域，进行实验时，要求实验对象必须达到一定数量，并进行多次独立实验。才能相对确保结果的稳定性和可靠性。譬如一个受到污染的试管，无论我们重复多少次实验，其结果也一定是不可靠的。

　　谷歌在这篇论文中对其他围棋程序选取了众多测试对象，并进行了495次实验，但对人类测试者，却只选取了一位曾经获得欧洲围棋冠军的棋手，并签署严格的保密协议，原本可以很容易邀请更多选手，但却没有按照科学规范进行多次实验。先不谈谷歌和棋手之间有无利益交易，就这一点，谷歌在Nature发表的论文从实验角度是不合格的。

　　更重要的问题出在与谷歌对战的欧洲围棋冠军樊麾身上，在对战棋谱公布后的二个月里，大量职业围棋高手含蓄或公开指出樊麾水平发挥失常，或不求进取，或就是放水。

　　多次战胜李世石，当前世界最优秀的围棋选手柯洁评价道：“他可能也是好久不下棋了，实力表现非常糟糕”。前北京市高校围棋冠军王烁在财新发布的文章中评价道：“这五局棋下得反而是很平庸。樊麾抵抗不足，五盘棋没有什么激烈的战斗，开局、定式、占大场、小规模接触战，收官，对抗度很差。”

　　虽然欧洲围棋冠军樊麾多次辩解“我发挥失常，当时崩溃了“，但更多棋友评价欧洲围棋冠军樊麾，“发挥有技术变形”，“樊麾的表现只有业4水准，关键地方明显放水”，“很明显樊麾是谷歌公司的托，全是50年前的招法极其保守，不输才怪”，“对于谷歌，没有什么谎言是不能用1千万美金解决的”。

　　除此之外，谷歌也没有向Facebook那样把围棋程序放到互联网上，光明磊落的接受大众的考验，作为与谷歌AlphaGo原理相同facebook围棋程序DarkForest，目前水平相当于业余5段，与职业选手依然有巨大的差距。

　　同时谷歌的论文结论也存在不可重复问题，Facebook围棋项目负责人田渊栋在评价谷歌围棋AI最为关键的快速走子策略时讲到”对此AlphaGo只提供了局部特征的数目，而没有说明特征的具体细节。我最近也实验了他们的办法，达到了25.1%的准确率和4-5微秒的走子速度，然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力，因为只要走错关键的一步，局面判断就完全错误了“。

　　从上述情况看，谷歌在进行围棋实验的过程中，刻意违反科学实验规范，存在采用密室孤立实验，这些问题在3月9日与韩国选手李世石的比赛中没有消除。人们常说，互联网上，你不知道你的对面坐的是人还是条狗。同样对于谷歌围棋比赛，我们完全可以质疑，与李世石对弈的究竟是程序还是人？如何保证李世石没有被利益收买？

　　判断欺诈的第三个原因，过度追求市场影响与提高股价

　　谷歌选择欧洲围棋冠军和前围棋冠军李世石进行世界轰动的比赛，而且没有严格的第三方监督，排除作弊的可能，表明谷歌并不是追求科学的严谨和荣誉，而是在追求品牌和影响力最大化，从而获得巨大的经济利益。

　　事实也证明这一点，2016年1月28日曝出了谷歌人工智能围棋击败欧洲冠军的消息，随后是谷歌拿出100万美元作为奖金挑战李世石。当日谷歌股价大幅上涨，涨幅4.42%，换算成市值涨了200亿美元。从宣传效果是看，谷歌这次的“广告”做非常巧妙。2016年2月26日彭博社报道，谷歌旗下设计围棋AI的公司DeepMind正推进自身医疗技术发展，因为其在围棋领域的影响，已经获得不菲的订单。

　　谷歌的技术期货路径和消除欺诈指控的方法

　　西方谚语说”一个动物，如果它走起来像鸭子叫起来像鸭子它就是鸭子“，同样，对于谷歌围棋Ai及其比赛，如果它回避公开如何从3000万盘（8位数）棋局获得171位天文数字棋局的规律或神经网络权重值，回避不愿大范围邀请棋手参与实验，回避收买选手嫌疑，回避不在互联网上公开对战接受监督，那么谷歌的围棋比赛可以看作一场精心策划的科学骗局或有欺诈嫌疑。

　　商业中有一种做法叫产品期货，消费者购买商品后，要等到半年或一年后才能拿到，那时技术，原料成本大幅下降，商家因此获得利润。同样，谷歌的围棋程序应该获得一定进展，但远没有到达能够挑战职业选手或九段高手的地步，谷歌通过市场和技术手段，拔高其围棋水平。故意回避公开监督或公开大范围对战。等待未来水平继续提升后，可能会进行公开，这种做法也可以称作 ”技术期货路径。

　　谷歌可以消除欺诈指控的嫌疑，不是与李世石下棋，而是：

　　1。完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律，或公开其神经网络权重值参数，让其他实验者可以重复谷歌的实验结果，还原谷歌对战成绩。

　　2。将谷歌围棋AI程序AlphaGo放在互联网上，接受百人，千人的同时对战。并检测对战结果，消除作弊嫌疑。

　　这两条谷歌能做出任意一条，都可以看作是消除欺诈指控的强有力证据，但在未来一年或更长时间里，谷歌没有任何动作，那么谷歌将持续背负有科学欺诈嫌疑，利用科学炒作获得巨大经济利益的指控。

定风波 · 发表于 2016-3-7 21:22:07

我想谷歌觉对不会完全开源其人工智能系统，就像google的其它系统一样，核心不开源。

看客 · 发表于 2016-3-7 22:07:36

定风波发表于 2016-3-7 21:22
$ h4 I* R- U* @ w7 M: T我想谷歌觉对不会完全开源其人工智能系统，就像google的其它系统一样，核心不开源。 ...

这跟开源是两码事。
开源与否不是学术语境，刘锋指控的是学术欺诈，主要是针对谷歌在 Nature 的论文而言。其实如果没有那篇论文，单就挑战人类棋手而言，作为商业行为没什么可指责的。

冰蚁 · 发表于 2016-3-7 22:31:24

看客发表于 2016-3-7 09:07
# m1 s b- l: {) N这跟开源是两码事。) T) ~1 k0 w+ z9 ^+ Y7 ?8 o, F& @2 Q
开源与否不是学术语境，刘锋指控的是学术欺诈，主要是针对谷歌在 Nature 的论文而言 ...

这样写论文我觉得常见吧。比如半导体里讲某个领先节点技术，具体工艺肯定不谈的，大概说说就完了，因为是核心机密。然后发几张图，表明性能是怎么样的。至于其它厂家能不能达到这个性能，那是其它厂家的事情。这种没法说成是科学欺诈。

定风波 · 发表于 2016-3-7 22:36:50

看客发表于 2016-3-7 22:07! B; Z8 W E) _ w
这跟开源是两码事。
6 T5 j5 b |3 d$ J2 R% _8 V开源与否不是学术语境，刘锋指控的是学术欺诈，主要是针对谷歌在 Nature 的论文而言 ...

你觉得如下两条是商业公司干的吗？雷锋也不过如此吧。
1。完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律，或公开其神经网络权重值参数，让其他实验者可以重复谷歌的实验结果，还原谷歌对战成绩。

　　2。将谷歌围棋AI程序AlphaGo放在互联网上，接受百人，千人的同时对战。并检测对战结果，消除作弊嫌疑。'

冰蚁 · 发表于 2016-3-7 22:37:30

权值参数是核心中的核心机密，怎么可能公布。写这个的人是实验室呆多了，太不着调。

看客 · 发表于 2016-3-7 22:39:16

冰蚁发表于 2016-3-7 22:31: A& A+ N" T, o& p3 T" l) S2 \
这样写论文我觉得常见吧。比如半导体里讲某个领先节点技术，具体工艺肯定不谈的，大概说说就完了，因为是 ...

我是说刘锋是这么指控的。国内刊物的论文这很正常。但不同的刊物有不同要求也很正常。刘锋的指控意思是，谷歌在论文里把这种挑战是当做科学实验的，那就要守科学实验的规矩。

冰蚁 · 发表于 2016-3-7 22:46:54

本帖最后由冰蚁于 2016-3-7 10:06 编辑

看客发表于 2016-3-7 09:394 b. |$ k/ ~6 k5 a
我是说刘锋是这么指控的。国内刊物的论文这很正常。但不同的刊物有不同要求也很正常。刘锋的指控意思是， ...

我知道你是说刘锋，不是你的观点。国外其实也是这样。technology 和纯 science 并不是等同。google 这个属于 technology 上的进步，没有新概念。所以刘锋用纯科学实验的要求去要求这样的论文属于驴头不对马嘴了。technology 里的核心机密肯定是要保护的。

PS: 假如哈，打个比方，我们现在没有 Monte Carlo 的搜索技术。 google 这次发明了，用了。那么论文里就要写明 Monte Carlo 的算法，使用了什么具体参数，结果如何，效率等等的怎样。其它的组就会去重复这个实验，看看是否达到论文里所说的结论。这个就属于 science 范畴。

四处张望 · 发表于 2016-3-7 23:05:56

这作者秀逗了啊...

武工队 · 发表于 2016-3-8 02:31:31

生命科学领域提出类似的要求似乎还算正常

计算机科学领域不太可能吧，让人家把训练出的模型公布出来并分析原理？？

删除失败 · 发表于 2016-3-8 08:49:06

作者有点失去理智了。个人倒比较能理解。狗以战胜樊麾的水平挑战李世石是根本没希望的，关键在这几个月的水平提升上，正因为google没有任何技术细节的透漏，外界无从判断水平可能提升的高度。所以现在石狗大战中以IT人士为主的挺狗派优越感爆棚，让人感觉莫名其妙。他们唯一的依据大概只有alphago是google开发的了，很有点狐假虎威的感觉。

冰蚁 · 发表于 2016-3-8 09:37:03

本帖最后由冰蚁于 2016-3-7 20:39 编辑

删除失败发表于 2016-3-7 19:49
j( Y% _1 E/ D作者有点失去理智了。个人倒比较能理解。狗以战胜樊麾的水平挑战李世石是根本没希望的，关键在这几个月的水 ...

IT 人士兴奋很容易理解。如果AI 能接近世界顶级选手，即使一盘不赢，只要场面不难看，都是里程碑式的突破。最后全面超越人类选手也就指日可待。大家都要来抢这颗AI界的明珠。这不又来个中国和日本的新AI系统：

3月7日晚，由异构智能公司、极客帮创投与聂卫平围棋道场三方共同主办的“异构智能挑战未来”发布会在北京日坛会馆举行，异构智能创始人兼CEO吴韧博士、棋圣聂卫平、极客帮创投创始合伙人蒋涛、中国国家围棋队领队华学明以及总教练余斌出席了本次发布会，著名自媒体人王冠雄担任特邀主持人。会上，异构智能公司、极客帮创投与聂卫平围棋道场三方联合宣布启动人工智能项目“异构神机”，并向世界围棋第一人柯洁发起挑战。( a* I, D! G R* y1 v

/ w5 p" D* A" L4 g日本也在3月1日发布了“DEEP ZEN GO”项目，打出了超越AlphaGo的口号。围棋人机对决已成为全球人工智能科学领域的一场国际竞赛，“异构神机”与柯洁的加入，使得竞争更加激烈。异构智能也在发布会上表示，未来或邀请Google AlphaGO等其他人工智能以及其他世界顶尖围棋选手，共同创办一场围棋人机巅峰大战。

tanis · 发表于 2016-3-8 10:06:50

冰蚁发表于 2016-3-8 09:37% h; q4 M6 t0 a l- b
IT 人士兴奋很容易理解。如果AI 能接近世界顶级选手，即使一盘不赢，只要场面不难看，都是里程碑式的突破 ...

我不是很明白为啥那么多人类要那么在意。我觉得AI在棋类战胜人类就是时间问题啊~ 现在不行，五年后很可能就行了，五年不行，十年呗~ so what~

最近很多创新点的技术在理论上早就可行了，就是当时的计算性能无法达到。现在计算性能可以了，把老文章的老算法拿出来稍一捣鼓~ NB的startup就出来了~

冰蚁 · 发表于 2016-3-8 10:09:12

tanis 发表于 2016-3-7 21:060 x9 r& t0 b, a5 B# c- G
我不是很明白为啥那么多人类要那么在意。我觉得AI在棋类战胜人类就是时间问题啊~ 现在不行，五年后很可能 ...

对啊，alpha go 在技术真是没什么新鲜的东西。

删除失败 · 发表于 2016-3-8 14:20:11

本帖最后由删除失败于 2016-3-8 15:38 编辑

冰蚁发表于 2016-3-8 09:37
' h/ H4 X$ ^5 \9 F8 I/ H. M. QIT 人士兴奋很容易理解。如果AI 能接近世界顶级选手，即使一盘不赢，只要场面不难看，都是里程碑式的突破 ...

和异构神机的对局已经有了，不过是赵哲伦。
异构神机测试版详解
过程挺有意思，看来技术在扩散，从围棋爱好者的角度讲，有这样的围棋AI是件挺不错的事
异构神机还会在网络上公开对弈。

另外石狗大战还是用几个月前的版本，性能略高
人机大战发布会韩国召开
又有的口水了

道可道 · 发表于 2016-3-9 11:48:30

陛下，为什么要杀了那只下金蛋的鹅呢？

小木 · 发表于 2016-3-9 13:51:43

本穷不懂围棋，也不大明白机器学习算法什么的，但是这个作者对期货的描述基本是扯淡。

冰蚁 · 发表于 2016-3-9 15:42:09

哈哈哈哈。狗赢了。

四处张望 · 发表于 2016-3-9 15:49:34

冰蚁发表于 2016-3-9 15:42; z# m& V7 p; T# b
哈哈哈哈。狗赢了。

你看吧，很快就有阴谋论跳出来的啦

删除失败 · 发表于 2016-3-9 15:59:19

老实说，很泄气。
感觉小李下得有点问题，特别是开局，心理上有波动。但是输就是输了，没有借口。后面4局也相当不乐观。
狗后面确实厉害，有点李昌镐的感觉。

		自动登录	找回密码
密码			注册

[科技前沿] 真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

评分

相关帖子

点评

点评

点评

点评

点评

浏览过的版块