晨枫 发表于 2024-2-24 15:18:18

Sora这浪,中国跟不跟

人工智能是定义未来世界的关键技术之一,AlphaGo、ChatGPT和Sora或许可看作人工智能的三次浪潮,中国一次也没有赶上。这自然成为人们众多焦虑点中新增的一个,也成为美国将永远领先中国的新证据。

人工智能从理论到实践都在取得飞速发展,但一些基本问题并没有解决,比如:人工智能干什么用?人工智能与人类智能到底是什么关系?

人工智能干什么用似乎是一个不言自明的问题:什么都能干,从生产到生活,从聊天到思考,只有想不到的,没有干不了的。

这说起来不错,也是美国着力于研发自上而下的通用AI的理由,但实际上问题多多。人类有脑容量和学习时间的问题,再聪明的人也不可能样样精通。通用AI没有输入和算力瓶颈,还真是可以什么都学,但实际上学什么还是要看研发者“喂”什么数据。通用AI只能接触到“公共领域”的一般性知识和数据,专业领域的知识和数据研发者自己也不懂,“喂”什么都不知道,AI就无从训练了。

在这方面,中国AI走专业化路线,自下而上,物流、生产线管理和质检、自主驾驶等AI没有ChatGPT、Sora等那么高调,但也都在悄悄发力。更重要的是,接地气,能很快形成生产力或者产生经济效益的实用功能,进而反馈和资助进一步的AI研发。

相比之下,Chat GPT、Sora还只是“玩意儿”,奥尔特曼号称需要7万亿美元的投资才能成大事。在现阶段,有人戏称:人类幻想AI包下洗衣做饭打螺丝,人类好吟诗作画;结果洗衣做法打螺丝还是人类的活儿,AI倒吟诗作画上了。

其实,回顾历史,可以发现有意思的对比。

在维多利亚时代后期,英国依然是世界上科技和国力最领先的国家,德国和美国还在发力中。

富强的英国不仅有雄厚的科技技术和最高的教育水平,还有很多有钱有闲的人。这也是个科技属于时髦玩意儿的时代,富二代有很多人会捣鼓点炫但是无用的东西。

英国妇科医生Joseph Mortimer Granville在1880年代(具体年份不明,应该是前期)发明了振动棒,成为妥妥的妇女之友。他是在治疗女性歇斯底里症(现代医学不再认为这是一种病症,只是性生活失调)中,累到肌肉劳损。受到朋友发明的启示,最后发明了振动棒。朋友是个富二代,闲来无事,自己发明一个手持电风扇一类的玩意儿,用转动的羽毛扇风,在夏天给自己消暑,都没有想到过要产品化,只是在朋友圈里炫耀炫耀。Granville医生稍做改进,发明了振动棒,据说人老心不老的维多利亚女王也爱不释手。

振动棒倒不是吟诗作画,但与那个“火热的年代”的其他发明相比,和吟诗作画也差不多了:

-        亚历山大·贝尔发明电话(1876年,苏格兰人,但在美国、加拿大完成的发明)
-        尼古拉斯·奥托发明四冲程发动机(1876年,德国)
-        托马斯·爱迪生发明灯泡(1879年,美国)
-        卡尔·奔驰发明汽车(1885年,德国)
-        尼古拉·特斯拉发明电动机和变压器(1888年,塞尔维亚人,在美国完成的发明)
-        鲁道夫·迪塞尔发明柴油机(1892年,德国)

英国工业在关键领域依然领先,尤其在造船方面。19世纪末到二战前,造船工业就是高科技,地位至少与今日航空航天相当,再捎上计算机软硬件。与通常的认知不同,那个时代凝聚造船工业最高水平的不是战舰,而是邮轮。1912年下水首航的“泰坦尼克”号的吨位达到46000多吨,同时代的“铁公爵”号战列舰“只有”3万吨,两者的速度一样,都是21节。

英国科技也还领先,剑桥的卡文迪许实验室在科学界的地位依然不可撼动,但英国的去工业化已经悄悄开始了,科技成就的产品化常常“墙内开花墙外香”,以至于后人称此为英国病。相比之下,振动棒毕竟还是产品化了。


英国工业的余晖还在,尤其体现在邮轮的建造上,这是“泰坦尼克”号的姐妹船“奥林匹克”号


“奥林匹克”号(左)和“泰坦尼克”号唯一的合影,几天后后者首次出航就撞上冰山,沉没了


“毛里塔尼亚”号的螺旋桨这样复杂形状、整体打造的超重型金属制件是洋火、洋钉时代的中国彻底想象不能的科技和工业实力

在某种程度上,今日美国和维多利亚时代到一战前夜的英国有点相像,一方面依然是世界霸主,在高端工业和科技方面依然领先,实际上依靠惯性,领先还持续到二战时代。另一方面,去工业化已经很深,经济基础开始悬浮,造成科技成果也悬浮,或者墙内开花墙外香。

回到AI,AlphaGo、ChatGPT、Sora都基于深度学习,深度学习“只是”对给定数据建立条件反射的关系。换句话说,再通用的AI,依然只是对数据建立关联性,“A和B总是/很可能一起发生”;但不是因果性,“因为A发生,所以B发生”。

关联性和因果性的区分非常重要。

A和B一起发生,只说明两者是关联的,但不说明A导致B或者B导致A,有可能两者都是因为C才发生的。A导致B,或者B导致A,这才是因果性。

关联性是通过观察就可以得到的,并不需要多少智能。动物惧怕火,人类也怕火,这是条件反射,并不是智能。人类比动物强的地方,是还有经验,可以根据相似经历推断。比如说,古人每一次造桥的材料和环境都会有所不同,但桥造多了,有经验了,会根据相似情况综合推断出符合当前要求的造桥材质要求和施工方法。

通用AI厉害是因为能以比人类高得多的速度和大得多的数量“喂入”数据,建立海量因子之间的复杂关联性,而且能在现有数据之间“内插”,在邻近的数据点之间推测并无直接现有数据的中间值,或者有限外推。前者相当于条件反射,后者有点经验的意思了。

但这不是因果性。回到造桥,根据经验造桥可以大体保证不会塌下来,但不是根据力学原理,换一个全新材料,比如从石料换成钢铁,或者桥梁构型,比如从桁架桥换成拱桥,就要从头摸索了。

从数据分析因果性,这或许是人工智能与人类智能依然存在的最根本差别。有了力学工具,人们不仅会造桥,还可以举一反三,造大跨度建筑,同样的力学原理甚至用于空间站结构。关联性只能停留在现象的表面,因果性才揭示现象的本质,这才是智能。

换句话说,在人类也弄不明白因果性的地方,给人工智能“喂”再多的数据,依然得不出有用的结论。比如说,把世界股票市场上所有历史数据统统“喂进”ChatGPT(可能已经有人做过了),再问ChatGPT买什么股票能赚大钱,即使ChatGPT给出答案,估计也没人敢据此砸大钱;把历史上所有战争史数据“喂进”ChatGPT,问ChatGPT如何才能在乌克兰发动成功的大反攻,更是没有人会据此下达作战命令。

Sora比ChatGPT动用更多的算力,但在本质上还是把AI作画变成AI动画,增加了时间维,还是命题作文,并非原创创作。命题的质量直接决定作品的质量。

在本质上,人类对自己的智能的理解依然很肤浅,对于智能的刻画和表述依然很肤浅。一个简单的“睿智”,到底该怎样用数据或者语言来描述?嗯,说不清楚。那就连“喂数据”都难,喂什么?

AlphaGo、ChatGPT、Sora依然是了不起的成就,值得中国跟。但是否跟上,并不需要太过焦虑。就像德国和美国在专注发明汽车、内燃机、电灯、变压器的时候,不必为英国首先发明振动棒而焦虑一样。

倒是物流AI、自主驾驶AI、生产线管理和质检AI以及其他面向具体应用的AI,抓紧做起来。在做的过程中,对AI的一般原理和算法、概念形成更加深刻的理解,在这个基础上再总攻通用AI不迟。

鳕鱼邪恶 发表于 2024-2-25 02:34:55

以前见过一个报道,说的是某实验室用AI管理、设计、直到使用AI控制的设备,制造出没有人类参与的新物品。

这个才是AI的正确应用方式吧?

我拍脑袋想一想的话,比如以前人工探索出一个新材料需要10年;交给AI的话可能几个月。

这几天大火的Sora如果仅仅是用视频引擎“凑”出来的,那么也就是个圈钱的套路。网上有人说AI已经开始理解现实世界的物理定律了,恐怕有点夸张。

所以,中国又被美国甩下了,恐怕也是夸大其词。

任我行早说了,人工智能才是(中美)较力的主要方向。。任总这个外行都早就知道,那么我相信中国早已发力应该是靠谱的判断。

鳕鱼邪恶 发表于 2024-2-25 02:42:15

像Sora这种AI视频的项目,如果会占用很大算力的话,在中国恐怕根本不会批准。

在美国,则需要有这种酷炫效果的东西来炫耀,否则拉不来投资。。七万亿美元吖~

所以,我猜兔子并没有落后多远。。因为,按照前几年的报道,中国的超算能力与美国应该是并驾齐驱的。

晨枫 发表于 2024-2-25 03:58:18

鳕鱼邪恶 发表于 2024-2-24 12:42
像Sora这种AI视频的项目,如果会占用很大算力的话,在中国恐怕根本不会批准。

在美国,则需要有这种酷炫效 ...

IT占用世界电耗的10%,其中30%是终端,30%是数据中心,40¥是网络设备。

美国AI算力继续高速发展的话,会不会受到电网制约?

要是美国AI算力受到电网制约,中国受到芯片制约,那就好玩了。

鳕鱼邪恶 发表于 2024-2-25 06:44:40

晨枫 发表于 2024-2-25 03:58
IT占用世界电耗的10%,其中30%是终端,30%是数据中心,40¥是网络设备。

美国AI算力继续高速发展的话, ...

记得马斯克还是阿里,曾用大卡车拉着硬盘到处跑。。这样的话躲过电网的限制应该还是可以的吧?

pcb 发表于 2024-2-25 09:43:01

鳕鱼邪恶 发表于 2024-2-25 06:44
记得马斯克还是阿里,曾用大卡车拉着硬盘到处跑。。这样的话躲过电网的限制应该还是可以的吧? ...

Amazon 和 阿里 都干过。Musk不清楚。
不是电网,是互联网的传输速度限制
卡车拉硬盘对现有网络可以是数量级的碾压

散人 发表于 2024-2-25 12:25:06

晨大,作为半个业内人士,感觉国内和美国在AI层面还是有不少差距的。国内各种AI实验室以及各个公司都投资 AI很多年,但是实际怎么样大家估计都心知肚明。

ChatGPT, Sora都处于比较AGC早期的地步,不见得在AI model底层架构上和几年前比有多少创新。现在更多的是大力出奇迹。这方面说起来,国内在基础算力上差很多。国内GPU startup很多,能打的就是海思的Ascend 910b, 受制于制程生态等等差距,和英伟达也有2代以上差距,而国内英伟达2代之前的芯片都受到管制 无法买到

散人 发表于 2024-2-25 12:28:21

鳕鱼邪恶 发表于 2024-2-25 02:42
像Sora这种AI视频的项目,如果会占用很大算力的话,在中国恐怕根本不会批准。

在美国,则需要有这种酷炫效 ...

超算 High Performance computing 主要用于科学计算的。AI用的算力设施完全不同,主要是GPU, TPU, DSA架构

qiuwen777 发表于 2024-2-25 12:50:21

我也是一直有个疑问,就是ChatGPT自2023年年末出来后,到现在也已经有1年多的时间,大部分人,还是把他当做一个聊天工具或者知识搜素的工具,为什么没有明显的应用出来?
像谷歌,苹果,一直没有比较跟进,包括国内的华为小米,并没有民用的应用出来,比如像IPhone上面的siri,如果集成大模型,那提效应该很多,他们为什么做这个集成?简单归集于算力缺乏,我觉得应该也不是事,因为如果是有效,那必然可以收费啊。

testjhy 发表于 2024-2-25 16:42:53

散人 发表于 2024-2-25 12:25
晨大,作为半个业内人士,感觉国内和美国在AI层面还是有不少差距的。国内各种AI实验室以及各个公司都投资 A ...

还好,还好,昨天还收到济南国家超算中心的邮件,他们GPU集群比较空闲。AI三大要素,算法、算力和大数据。大厂们自己把三大件基本配齐了,而应用单位要么算法不得力,更为难的是收集不到大数据,一般的大数据远远够不上ChatGPT这么规模的,所以对算力的要求也不高。据我所知,各地方政府空闲的算力也不少,当然也有CPU型服务器与GPU服务器搭配不平衡的。

老友 发表于 2024-2-25 17:47:00

pcb 发表于 2024-2-25 09:43
Amazon 和 阿里 都干过。Musk不清楚。
不是电网,是互联网的传输速度限制
卡车拉硬盘对现有网络可以是数 ...

大多数互联网公司都干过:lol。国内因为基础运营商的互联互通问题(北联通南电信),为了确保全国各地域用户对服务和数据访问的一致性,通常需要在南北各地都建立idc。不同数据中心的原始数据复制拷贝完全都走线上的话,时间和金钱成本都太高。最快最便宜的方式就是卡车/飞机运硬盘。

鳕鱼邪恶 发表于 2024-2-26 02:31:51

散人 发表于 2024-2-25 12:28
超算 High Performance computing 主要用于科学计算的。AI用的算力设施完全不同,主要是GPU, TPU, DSA ...

这样的话在俺这个外行看来,兔子还是在扎扎实实地做科研,美国人在搞花里胡哨的取代好莱坞。{:187:}

数值分析 发表于 2024-2-26 03:57:23

老友 发表于 2024-2-25 17:47
大多数互联网公司都干过。国内因为基础运营商的互联互通问题(北联通南电信),为了确保全国各地域用 ...

当年(90年代)网络基础课用的是一本英语教材,里面第一章有一道习题就算一辆拉满磁带的卡车的带宽。习题最后一句是,永远不要低估一辆满载磁带的卡车的带宽。{:187:}

sleepyr 发表于 2024-2-26 11:27:52

qiuwen777 发表于 2024-2-25 12:50
我也是一直有个疑问,就是ChatGPT自2023年年末出来后,到现在也已经有1年多的时间,大部分人,还是把他当做 ...

chatGPT类似已经有很多行业应用的落地了,从简单的客服,到法律业务和生成代码。现阶段还需要人工对输出结果的审核。但是未来绝对是可以大规模替代人工的。Siri的包含GPT功能升级版目前传闻是要在IOS 18里加入。现在的AI确实有很多问题,但是确实是可以提高生产力。更可怕的是现在AI迭代的速度,现在很多的训练AI的数据都是AI生成的,比如特斯拉对自动驾驶AI的训练。感觉AI自我进化的大门已经慢慢打开了。

伯威 发表于 2024-2-26 12:40:06

数值分析 发表于 2024-2-26 03:57
当年(90年代)网络基础课用的是一本英语教材,里面第一章有一道习题就算一辆拉满磁带的卡车的带宽。习题 ...


Computer Networks (5th Edition) 5th Edition
by Andrew Tanenbaum (Author), David Wetherall (Author)
搜了下,现在已经第5版了。{:187:}

xiejin77 发表于 2024-3-22 16:45:34

本帖最后由 xiejin77 于 2024-3-23 16:25 编辑

Sora的话题,其实国内有不少类似的项目都在做。

但是是不是跟风,可能还不是一个现在可以回答的问题。

Sora本身,从原理层面的议论颇多,我也写了几篇理解性的文章,借晨大的宝地散一下,有兴趣的可以一起讨论。



https://mp.weixin.qq.com/s/yTHqJfBixkFBdblY4jD-xw

链接被封掉了。我再换一个试试。也可以关注俺的微信公众号上堵吟。

鳕鱼邪恶 发表于 2024-3-23 03:57:25

xiejin77 发表于 2024-3-22 16:45
Sora的话题,其实国内有不少类似的项目都在做。

但是是不是跟风,可能还不是一个现在可以回答的问题。


404{:189:}{:197:}

xiejin77 发表于 2024-3-23 16:36:11

鳕鱼邪恶 发表于 2024-3-23 03:57
404

不是封掉了,爱坛链接不过去。复制地址粘贴到地址栏里就行了。

老票 发表于 2024-3-23 18:35:39

xiejin77 发表于 2024-3-22 16:45
Sora的话题,其实国内有不少类似的项目都在做。

但是是不是跟风,可能还不是一个现在可以回答的问题。


如此雄文别掖着藏着啊,贴过来大家共赏啊~   {:237:}{:237:}

xiejin77 发表于 2024-3-26 09:27:39

老票 发表于 2024-3-23 18:35
如此雄文别掖着藏着啊,贴过来大家共赏啊~

票兄,真不是藏。我这边的网络上爱坛太困难了。我转几篇单独开楼吧
页: [1]
查看完整版本: Sora这浪,中国跟不跟