日志

真智能？伪智能？(上)

热度 34已有 454 次阅读2024-4-5 00:19 |个人分类:聊天

3月26日，工信部发布《工信部：加快推动以大模型为代表的人工智能赋能制造业发展》https://mp.weixin.qq.com/s/4QDi8djqSwlWRFWZQ-9YFg，标题吓人，内容很空，并没有如何推动大模型作用到制造业的一些战略思想。我目前经常接触到人工智能的工业应用，对大模型也比较了解，想了好几天也没想清楚工信部到底要做啥，干脆抛点砖给大家批判批判。

现在开展大模型研发工作的机构不少，大模型中理论方法也有不同，目前成功的当属以OpenAI的语言类大模型(LLM)，所以本文以LLM作为核心讨论。从原理上讲LLM成功在于以Transformer方法将人类自然语言(也可包括编程语言)编码，通过深度学习算法等方法形成巨型数据“库”(实际是神经网络的权重，或大模型的参数)，然后在注意力机制的控制下生成人类问题的解答。这是一个以概率为核心的生成过程，所以是一种先天缺少严格逻辑正确性的方法。

在制造业中应用大模型方法倒不是绝对不行，譬如在设计阶段，让大模型给你生成一些草图参考，应该还是能做到的，我有一个朋友他说他的一个合作伙伴开发了一个面向建筑CAD的大模型软件，可以帮助建筑设计师做CAD草图。又譬如说在生产过程中出现问题，操作人员通过大模型能够比较好的定位问题并找到解决方法。但在制造业主体过程中直接应用大模型方法，似乎并不可行。譬如说在生产过程中用大模型控制过程参数，譬如说用大模型直接指挥机器人进行操作，这都不是大模型擅长的事情。

我觉得工信部没有搞明白一件事：大模型不是为机器服务的，大模型是为人服务的。智能制造并不是强调人的智能与设备的高精度高效率融合在一起，实际上是让设备在高精度高效率上增加智慧和灵活性，这个不是目前大模型能够搞定的。

大模型神奇和局限的地方都是一个地方，它能够生成自然语言，通过海量语言的学习，它不但学会了说人话，而且具有单个人类无法习得的人类全部语言表达的内涵，或者说“知识”，只是这个知识与人类神经网络类似，是隐含在系统参数(权重)里的，如果概念上说人工智能是不是达到人类的智能水平是靠“图灵测试”来完成，则现在大模型毫无疑问可以通过“图灵测验”。更可怕的是，它是问不倒的，不象过去几十年中开发的智能问答系统，只能在很狭窄的领域里进行，而靠句法生成系统的回答总带有“机器”的洋泾滨味道。所以以大模型为核心的智能系统称为通用人工智能(AGI)，是很有道理的。用它来服务人类，用人类可理解的语言提供帮助，使人类智能水平更高，工作更好，生活更好。当然黑暗势力掌握它后，它也可走向反面，不过这儿就不讨论了。

但是，在工业生产过程中，机器并不能理解自然语言，要把大模型生成的语言直接喂给智能装备是不行的，这点恰恰走了回头路。扯远一点，早期人工智能研究的重点就是将人类自然语言中包含的知识转为计算机能够理解能够操作的符号(物理符号系统)，知识表达是智能系统的关键，与人类专家交流中得到的用自然语言表达的知识通过知识表达工具形成知识库才是计算机(智能装备)诊断问题解决问题的手段。用专业术语来说，就是要对自然语言进行形式化表达和获取，转化为知识系统推理机可进行推演的知识才能帮助计算机(智能装备)解决问题。

那我们设计自然语言理解系统将自然语言转化为形式语言不就行了吗？不行，通用的自然语言理解系统并不成功，一般而言，语言理解系统分成语法和语义，语法并不完备，而语义先天带有歧义。如果传统的自然语言理解系统总体成功，未必还有现在的AGI什么事。大模型讨巧地将自然语言表达的资料吃了下去，同时又以自然语言的形式将问题的答案吐了出来。它真的知道问题的内涵吗？以人为参考物，它并不是。它能够检验它输出的正确性吗?并不能。

真智能？伪智能？似乎也不太好回答。

膜拜

鸡蛋

鲜花

路过

雷人

开心

感动

难过

刚表态过的朋友 (31 人)

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (12 个评论)

回复老福 2024-4-5 02:03: 为T教授点赞，敢说工信部的报告“ 标题吓人，内容很空”，是我辈本色。

回复赫然 2024-4-5 05:02: 感觉人工智能这个筐里，中美装进去的完全不是同一个东西。。。

回复唐家山 2024-4-5 08:02: 这一篇极好，见识了T教授的洞察力。

回复晨枫 2024-4-5 09:21: 我在AlphaGo出来的时候，就一直是一个观点：人类对自己的智能是怎么回事够不清楚，不可能研制出堪比人类智能的东西，现有人工智能都只是条件反射式的因果模型，大模型只是把因和果的数量极大扩充了，而且具有在数据集里内插和有限外延的能力，但在本质上依然是条件反射模型，不存在内在的智能。

再大的模型依然受制于历史数据。历史数据里本质不包含的东西，也就是说内插也插不出来，外延更是没谱，那大模型也抓瞎。

现代工业生产已经高度规范化了，常见的问题都有现成的应对，不需要舍近求远搞大模型，何况大模型太复杂，响应的正确性难以确认。真碰到问题了，大多是不常见的，也就是说，历史数据里未必有。

没条件，怎么反射？

用大白话说，如果聪明人用谷歌都搜不出来的东西，大模型同样说不出所以然。

T教授关于自然语言和形式语言的观点，也深表赞同。但我们这实际上说的是一回事。LLM只是能理解自然语言，但要是人类连自然语言也说不明白的事，LLM何德何能？

所以我对LLM用于大量软件的自动化转换很看好，很多用老的程序语言写的软件，现在已经没法支持了。人工改写成新软件事不可承受之重。用LLM训练，可能是多快好省的办法。两头都是形式语言，更加便于上手。

回复五月 2024-4-5 09:47: 先给教授点赞，学习了。另外提一点外行不成熟的看法。如果把“工业”的范畴不限于制造业的加工环节，甚至仅限于车间环节，那么AI大模型可用武之地很广阔。例如，产品的早期研发，各种机器/生产线/管理方式的前期设计，制药行业的药物设计，产品设计的纠错和仿真模拟，等等。还有一些“小”模型AI应用，例如AI视觉识别，在加工机器人，检测机器人上应用已经方兴未艾。

回复大黑蚊子 2024-4-5 15:25: 之前人们搞AGI，是为了让机器人给人类打工，把扔给邪恶中国的制造业再抢回来
现在搞出来的这个AGI，似乎看上去更多的是在抢非理工类专业的饭碗，你让他编个曲唱个歌打打擦边球卖点儿小色情没问题，让他老老实实算质因数分解就抓瞎了。
有种回旋镖又打回来的既视感。

回复大黑蚊子 2024-4-5 15:29: 晨枫: 我在AlphaGo出来的时候，就一直是一个观点：人类对自己的智能是怎么回事够不清楚，不可能研制出堪比人类智能的东西，现有人工智能都只是条件反射式的因果模型， ...
我这段时间用下来，LLM在搜索、语音/视觉转化、文本阅读和语言翻译方面的能力是非常强悍的，或者说就是在“Transformer”这个大类下能够发挥极好的作用。
其他方面就不太行了，说好听的是稳定性不够，说不好听就是信口开河糊弄傻子。

回复晨枫 2024-4-5 15:43: 大黑蚊子: 我这段时间用下来，LLM在搜索、语音/视觉转化、文本阅读和语言翻译方面的能力是非常强悍的，或者说就是在“Transformer”这个大类下能够发挥极好的作用。
其他方 ...
这不难理解：LLM就是用日常场景自然语言训练的，其他方面就需要domain expertise，奥特曼的训练数据里就没有。

回复法乎其上 2024-4-5 19:05: 我比较认同张钹老师的说法，理论上现有的 AI 只是数学统计理论的应用，在这个基础上的 AI 是不可能产生智能的。这是从根本去理解现在 AI 的极限。
当然，基于统计学理论的 AI 确实得到了大发展，有其发挥的场所和空间，场景。至于哪些场所和空间适合，有已知的效果很好的，有未知的，需要各方去挖掘和拓展。文件的意义应该是鼓励后者，是在工业领域需要大家去挖掘拓展新的应用场景，来改善工业进程。
如果简单理解，那就是现在的 AI 适合做归纳，和对已知的推演的归纳。真正的人类的创新大体而言，基本不适合。
当然，AI 也可能给出某个新推演，这个推演可能本身就是新的，被人类忽略的正确的，或者某种推演启发了人的创新推演。但是，推演的最终验证还需要人类。
比如晨司机提到的工业中出现的新问题不可能由现在的 AI 来完成，从张老师的结论来看，非常容易理解。
国家现在有钱了，文件指明一个方向，拿出一些资金，企业社会才配置一些资金，各色人等一顿操作猛如虎，指不定打下来几个枣子。这应该是这个文件的原意。

回复 tingsanguo 2024-4-6 08:28: 大黑蚊子: 之前人们搞AGI，是为了让机器人给人类打工，把扔给邪恶中国的制造业再抢回来
现在搞出来的这个AGI，似乎看上去更多的是在抢非理工类专业的饭碗，你让他编个曲唱 ...
ChatGPT:
To express the number 999977 as a product of primes, we can perform prime factorization. Here's how it breaks down:
999977 = 997 * 1009

这个能不能说, ChatGPT 可以利用已知的知识, 验证自己的输出?

回复大黑蚊子 2024-4-9 10:38: tingsanguo: ChatGPT:
To express the number 999977 as a product of primes, we can perform prime factorization. Here's how it breaks down:
999977 = 997 * 1009

这个 ...
你这个是GPT4.0还是3.5啊
我一直没有试过那个传的神乎其神的Claude，丫ban账号都ban出花来了

回复 tingsanguo 2024-4-9 11:36: 大黑蚊子: 你这个是GPT4.0还是3.5啊
我一直没有试过那个传的神乎其神的Claude，丫ban账号都ban出花来了
GPT3.5, 免费版

testjhy的个人空间 http://www.aswetalk.net/bbs/?4473 [收藏] [复制] [分享] [RSS]

日志

真智能？伪智能？(上)

刚表态过的朋友 (31 人)

全部作者的其他最新日志

发表评论评论 (12 个评论)

testjhy

testjhy的个人空间 http://www.aswetalk.net/bbs/?4473 [收藏] [复制] [分享] [RSS]

日志

真智能？伪智能？(上)

刚表态过的朋友 (31 人)

全部作者的其他最新日志

发表评论 评论 (12 个评论)

testjhy

发表评论评论 (12 个评论)