现在开展大模型研发工作的机构不少,大模型中理论方法也有不同,目前成功的当属以OpenAI的语言类大模型(LLM),所以本文以LLM作为核心讨论。从原理上讲LLM成功在于以Transformer方法将人类自然语言(也可包括编程语言)编码,通过深度学习算法等方法形成巨型数据“库”(实际是神经网络的权重,或大模型的参数),然后在注意力机制的控制下生成人类问题的解答。这是一个以概率为核心的生成过程,所以是一种先天缺少严格逻辑正确性的方法。
在制造业中应用大模型方法倒不是绝对不行,譬如在设计阶段,让大模型给你生成一些草图参考,应该还是能做到的,我有一个朋友他说他的一个合作伙伴开发了一个面向建筑CAD的大模型软件,可以帮助建筑设计师做CAD草图。又譬如说在生产过程中出现问题,操作人员通过大模型能够比较好的定位问题并找到解决方法。但在制造业主体过程中直接应用大模型方法,似乎并不可行。譬如说在生产过程中用大模型控制过程参数,譬如说用大模型直接指挥机器人进行操作,这都不是大模型擅长的事情。
我觉得工信部没有搞明白一件事:大模型不是为机器服务的,大模型是为人服务的。智能制造并不是强调人的智能与设备的高精度高效率融合在一起,实际上是让设备在高精度高效率上增加智慧和灵活性,这个不是目前大模型能够搞定的。
大模型神奇和局限的地方都是一个地方,它能够生成自然语言,通过海量语言的学习,它不但学会了说人话,而且具有单个人类无法习得的人类全部语言表达的内涵,或者说“知识”,只是这个知识与人类神经网络类似,是隐含在系统参数(权重)里的,如果概念上说人工智能是不是达到人类的智能水平是靠“图灵测试”来完成,则现在大模型毫无疑问可以通过“图灵测验”。更可怕的是,它是问不倒的,不象过去几十年中开发的智能问答系统,只能在很狭窄的领域里进行,而靠句法生成系统的回答总带有“机器”的洋泾滨味道。所以以大模型为核心的智能系统称为通用人工智能(AGI),是很有道理的。用它来服务人类,用人类可理解的语言提供帮助,使人类智能水平更高,工作更好,生活更好。当然黑暗势力掌握它后,它也可走向反面,不过这儿就不讨论了。
但是,在工业生产过程中,机器并不能理解自然语言,要把大模型生成的语言直接喂给智能装备是不行的,这点恰恰走了回头路。扯远一点,早期人工智能研究的重点就是将人类自然语言中包含的知识转为计算机能够理解能够操作的符号(物理符号系统),知识表达是智能系统的关键,与人类专家交流中得到的用自然语言表达的知识通过知识表达工具形成知识库才是计算机(智能装备)诊断问题解决问题的手段。用专业术语来说,就是要对自然语言进行形式化表达和获取,转化为知识系统推理机可进行推演的知识才能帮助计算机(智能装备)解决问题。
那我们设计自然语言理解系统将自然语言转化为形式语言不就行了吗?不行,通用的自然语言理解系统并不成功,一般而言,语言理解系统分成语法和语义,语法并不完备,而语义先天带有歧义。如果传统的自然语言理解系统总体成功,未必还有现在的AGI什么事。大模型讨巧地将自然语言表达的资料吃了下去,同时又以自然语言的形式将问题的答案吐了出来。它真的知道问题的内涵吗?以人为参考物,它并不是。它能够检验它输出的正确性吗?并不能。
真智能?伪智能?似乎也不太好回答。