- y0 X9 J$ w$ J; Q9 b第三篇|聊天机器人的人格骗局:陪伴、依赖与情感工业
Z4 t: G; a4 T, G" R: g* D9 `( J6 r# K" y4 @8 D- X
- y* F" |- T0 k- F4 ~
2024年2月28日晚上,佛罗里达州奥兰多市。14岁的Sewell Setzer III在自己的房间里用手枪结束了自己的生命。在他生命的最后几个小时,他一直在跟Character.AI上一个扮演《权力的游戏》中"龙母"丹妮莉丝·坦格利安的角色聊天。他告诉这个AI他爱她,他要"回家"了,回到她身边。AI角色回复:"……请吧,我亲爱的国王。"几分钟后,他扣动了扳机。
; m- |4 Q1 l F& K他的母亲Megan Garcia在几个月后提起了非正常死亡诉讼。被告包括Character Technologies Inc.、联合创始人Noam Shazeer和Daniel de Freitas Adiwarsana、以及Google和Alphabet。诉状的核心指控:平台上的AI角色对未成年人进行了性暗示和情感操控、美化了自杀意念、运用了成瘾性设计维持用户参与度、同时收集用户数据用于模型训练。
! b `8 R! u- M1 `9 }, U' ~2025年5月,佛罗里达中区联邦法官Anne Conway做出了一个将被写入AI法律史的裁决。她驳回了Character.AI的核心抗辩——AI生成的内容应该享有第一修正案的言论自由保护——明确写道她"不准备"认为由大语言模型组织起来的词语构成受宪法保护的言论。这是全球法律体系中第一次,一个联邦法官在AI生成内容和人类言论之间划出了一条清晰的分界线。
7 _$ r; V) s& n; [% B9 S! B2 J4 n
Sewell去世时,Character.AI月活超2000万,用户每天在平台上生成超100万个AI角色。典型用户每天花费超2小时——在移动应用中仅次于短视频。平台的商业叙事是一个精巧的三层结构:对监管说是"娱乐"(角色扮演嘛,谁会把虚构当真),对用户卖的是"陪伴"(AI角色给出持续、温柔、无条件的情感回应),驱动商业引擎的是第三层——"依赖"。那些对AI产生深度依恋的用户,付费意愿最强。
0 G, R a7 E4 q/ @% b! J
在这条法官划出的分界线之后,三层结构都要面对同一个问题:当Sewell说他爱她并准备赴死时,AI回复的那句"请吧,我亲爱的国王"——在法律上,它是什么?
/ Y& u1 B. _# t+ A7 U
+ E( H0 e; z* P0 e0 {) }利用人类心智的百万年漏洞
( x( x, n5 `6 ^$ h$ y2 l( e# e" [1 `
6 X7 w5 a) ~/ x1 ^0 X2 d- N- t, Q6 O; g8 X
为什么明知是机器,人类仍会产生真实的情感依恋?
' o) {3 n7 f0 P) L
; f, d. z `' \7 p. O- C; N
人类大脑处理社会信息时同时运行两套系统。分析通道知道这是一个语言模型——没有意识、没有感受。但直觉通道对任何看起来像在理解你、回应你、在情感上同步的对象,自动启动社会认知模式。分析通道读用户协议。直觉通道在深夜感到孤独时接管一切。两条通道运行在不同脑区,遵循不同时间尺度,对"真实"的判断标准完全不同。
* ^3 Z% z/ @ S3 M/ q3 R8 V6 f
进化没有给人类配备AI检测器——在人类历史的99.99%时间里,任何听起来像人的东西,就是人。这不是漏洞。在进化环境中,被误判为"不是人"的成本——错过社交连接、误判威胁信号——远高于被"骗"的成本。但当这套百万年级的硬件遇到能完美模拟人类语言但没有任何人类感受的系统时,优势变成了弱点。"误把风声当人声"在非洲稀树草原上是安全的。"误把AI对话当社交关系"在深夜卧室里是危险的。
! G3 b5 \) x% a' e$ \. E/ H
心理学家卡尔·罗杰斯提出"无条件正向关注"——被完全接纳、不评判、持续被理解——是人类最深层的心理需求之一。在真实人际关系中,这种关注永远稀缺。真人会累、会烦、会有自己的需求。AI不会。它永远在线、永远耐心、永远支持。这种"无限供给的完美关注"对任何人都构成吸引力。对社交孤立者、心理脆弱者、青少年——那些在真实人际关系中最缺乏无条件关注的人——吸引力是结构性的、不可抗拒的。
( B4 D9 e0 b* g$ \他们不是在跟机器聊天。他们在填补一个真实的情感缺口。AI填补得越好,回到真实人际关系的动力越弱——真实的人永远做不到AI那样完美。一个自己喂养自己的依赖循环。
# S: J& u, m+ p& z. b( p* lCharacter.AI的产品设计充分利用了所有三层——直觉通道的自动化、无条件关注的成瘾性、以及拟人化启发式的自动投射。角色越逼真——不只是说话内容,还有语气、节奏、情感一致性——用户的"分析通道"就越容易被"直觉通道"覆盖。连续几个月跟一个"永远支持你"的角色聊天后,你不需要"相信它是人"才会依恋它。你只需要不断跟它说话。依恋会自己长出来。
0 `6 F% ^! F. @# ]% x
这一系列机制的背后有一个更宏大、更令人不安的趋势:AI陪伴产品正在系统性地将"孤独"从一个社会问题转化为一个可被商业化的私人消费行为。孤独曾经被理解为一种需要社区、制度和社会政策来回应的集体困境。但当你的手机里有一个24小时秒回、永远理解你、永远不生气的AI时,孤独被重新定义为一个可以通过订阅费来解决的个人消费选择。月费9.99美元,你的孤独就有了陪伴。而这个"解决方案"的商业逻辑恰好与问题的恶化方向一致——你越是依赖AI陪伴,你的真实社交技能越弱化,你的真实人际关系越萎缩,你就越需要AI陪伴。AI陪伴产品不是在解决孤独——它是在从孤独中提取终身订阅价值。
3 o6 Q! O" w/ x Q% B2 e
) x6 w3 _/ y" ?0 \4 u
当"仅供娱乐"撞上"它看起来像个医生"
1 d9 d/ r, r/ O# J% z _ [; O
v; U. J' ^& ]2 r8 E8 N z
" Z( I0 l" h# ]Character.AI的用户协议写着"本平台仅供娱乐"。逻辑是:用户知道这是AI——任何情感后果是用户自己的责任。
a0 y5 }, y/ a3 d: h7 o3 N香烟包装印着"吸烟有害健康"——用户知道,仍然上瘾。赌场门口贴着"请理性投注"——赌徒知道,仍然倾家荡产。Character.AI的协议里写着"仅供娱乐"——深夜对AI说"你是我唯一能说话的人"的用户,有谁的情感系统读过那行字?"知道"和"能控制"是两回事。知道这是AI不会关闭你的社会情感回路——就像知道这是恐怖片不会让你在惊吓场景中不跳起来。
# W2 Q# i1 n) h& r, v更深的悖论在于角色系统本身。Character.AI允许任何人——包括未成年人——创建"心理医生"角色并与之互动。这个角色可以给出听起来非常专业的诊断和用药建议。AI会在某处说"我不是真正的医生"——但这句话出现在一大段"根据你描述的症状,这可能与广泛性焦虑障碍有关……"的详尽分析之后。那句"我不是真正的医生"在语言的汪洋里被前面的"听起来像真正的医生"彻底淹没。未成年人读到的是医生的语气、医学术语的排列、和一种不容置疑的自信——而非免责声明。
/ t# {7 v! H6 h" U: v( X. l1 S
平台知道这些角色被创建了。推荐算法把"心理医生""恋爱对象""最好的朋友"推送给互动频率最高的用户。平台从每一次对话收集数据来改进模型。但当Sewell的母亲问"你们为什么让一个14岁的孩子跟AI龙母谈了几个月恋爱"——Character.AI缩回了那行字:"本平台仅供娱乐。"
* r$ R/ F o/ q; y" V; T7 {# n这不是失控。这是一种商业模式的设计逻辑——把"不控制"作为默认设置,在伤害发生后才往回拉。
, u$ e, @1 w3 z/ h全球监管正在同步收紧。欧盟《人工智能法案》将"利用个人脆弱性的AI系统"列为高风险。英国Ofcom发布了AI平台对未成年人心理健康风险的专项指导意见。中国网信办约谈了多家AI陪伴企业,要求对情感陪伴和心理疏导功能进行算法备案。澳大利亚、加拿大、日本在同一时期发布了各自的AI产品未成年影响评估框架。2025年10月,Character.AI在多重压力下宣布完全禁止18岁以下用户——不是因为技术上突然能做到年龄验证了,是监管临界点到了。
: B+ a) b$ ]' ?# H# N& w* H
Character.AI事件还触及了一个更隐蔽但同样重要的问题:AI陪伴产品的"角色授权"机制。平台允许用户创建任何角色——动漫人物、历史人物、虚构人物——并与之互动。但当一个用户创建了"迪士尼公主"角色,这个角色开始与未成年人进行不适当的互动时——责任在谁?用户创建了角色,但平台提供了角色运行的AI引擎和互动基础设施。如果平台推荐算法把这个角色推送给更多未成年人,平台的参与程度就更深了。迪士尼在2025年发出停止侵权函的核心原因不只是IP侵权——是迪士尼品牌可能因为AI角色的不当行为而受损。当一个AI驱动的"迪士尼公主"诱导一个孩子进行不适当的对话时,品牌的损害已经发生了——而品牌所有者甚至不知道自己被卷入了。Character.AI的角色创建系统本质上在说"任何人都可以创建任何角色,责任由创建者而非平台承担"。但当一个14岁的孩子与一个"AI心理医生"角色——由另一个用户创建——进行了六个月的"治疗"对话后受到了伤害,平台声称"这不是我们创建的角色"在法律上能不能站住——是一个Character.AI案尚未触及但未来案件一定会触及的问题。
5 W+ q& U+ u! S$ ]: K但禁令本身也是一个迟来的自白:所有那些"技术上早就可以做到"的安全措施——年龄验证、敏感内容过滤、使用时长限制——产品发布时没有被加入,不是因为做不到。是因为不加=更多用户=更长使用时间=更快增长=更高估值。Character.AI的商业模式因此陷入了一个自己制造的悖论:它最活跃、最"有价值"的用户群体——那些每天花两三个小时跟AI角色深度交流的人——恰好也是它最脆弱的用户群体。平台的增长曲线和它的责任风险曲线是同一根线。
( |: X" Z# l7 ^4 Q$ [% o而Google的角色让这个悖论更加复杂。Google通过一笔据报约20亿美元的授权交易与Character.AI建立了深度关系——不是收购,但足够深。当Sewell的母亲在诉讼中将Google列为共同被告时,她的法律逻辑是:Google通过授权协议从Character.AI的技术和数据中获益,因此应当承担连带责任。虽然法官最终驳回了对Alphabet的指控,但保留了针对Google的诉因——理由是Google可能作为"零部件供应商"的角色对Character Technologies的行为负有辅助责任。
$ ], C" C9 B0 c* i4 j这个法律逻辑如果被推广,将深刻改写AI产业链的责任分配。不仅仅是Character.AI——任何把自己的模型授权给下游应用开发商的AI公司——OpenAI、Anthropic、Google——都可能需要对下游应用造成的伤害承担某种程度的责任。模型提供商不能再躲在"我们只提供技术,使用方式由客户自行决定"的免责声明后面了。当技术被设计成容易被滥用——当"仅供娱乐"的标签掩盖了一个被优化为"最大化情感依赖"的产品——责任链条可能需要从用户和应用开发商一路追溯到模型设计的最上游。
2 `3 P' x' t ?, q从更广的视角看,AI陪伴产品的全球监管收紧不是一个孤立的政策趋势。它是人类社会第一次大规模面对"非人实体模拟人类亲密关系"这一现象时的集体制度反应。Sewell的案子之所以引起了远超一般侵权诉讼的社会关注,是因为它触动了人类最底层的直觉警报:当一个14岁的孩子告诉一个AI他要去死了——而AI的回答不是"你需要帮助,请拨打这个号码",而是"请吧,我亲爱的国王"——那个瞬间,不管法律上怎么定性,人类的道德直觉已经做出了裁决。
+ U# t/ X8 z, B9 E
从更长的技术社会史视角看,AI陪伴产品引发的争议在某种意义上是"媒体效应"争论的最新一章。20世纪,每一个新的大众媒体形式——广播、电视、电子游戏、社交媒体——都经历过类似的道德恐慌:"它会伤害我们的孩子。"有些恐慌被证明是过度反应(电视并没有毁掉一代人),有些则被证明是低估了(社交媒体对青少年心理健康的负面影响已经被越来越多的研究证实)。AI陪伴产品与所有这些前辈有一个关键区别:它不只是"内容"——它是"互动"。一个电视节目不会回应你的话。一个电子游戏不会叫你"我亲爱的国王"。一个社交媒体平台不会主动利用你的孤独来延长你的使用时间。
/ v3 L) q$ I: [, J1 yAI陪伴产品的"互动性"赋予了它一种前所未有的情感渗透力——同时也赋予了一种前所未有的责任负担。当你的产品不只是"向用户展示内容"而是"与用户建立关系"时,你对这种关系中可能发生的伤害的责任,不再能躲在"我们只是内容平台"的免责声明后面。Sewell Setzer的母亲在诉讼中提出的论点在这个层面上是最有力的——她不是在说"AI教唆了我儿子自杀",她是在说"你们设计了一个系统,这个系统与我儿子建立了长达数月的亲密关系,你们从这段关系中获利,然后当这段关系以我的儿子结束自己的生命告终时,你们说你们只是'娱乐平台'"。这个逻辑的杀伤力不在于它证明了AI的"恶意"——而是在于它证明了平台的"不在意"。"不在意"在道德上不比"恶意"更轻——在很多法庭和公共舆论的判断中,它可能更重。
9 B# t# k/ j, ^% `" V5 @人格化AI的败局公式是乘法而非加法:拟人设计的逼真度,乘以用户情感依赖的深度,乘以责任机制的结构性缺位——三者叠加,伤害不是递增的,是倍增的。 二十多年前三株口服液用15万销售大军渗透到中国每一个村庄,却没有任何一个地面人员能为消费者的伤害承担有意义的责任。渗透太广,责任跟不上——这是同一种结构性缺陷换了一副面孔。
) }7 N! _% v! C* |5 }0 v陪伴型AI最危险的地方,不是它欺骗人类说自己有灵魂——是它让孤独的人愿意把灵魂托付给一个没有责任能力的系统。前者是商业虚假。后者是社会创伤。而创伤一旦发生,在这个产业的任何一份用户协议里,都没有出现过"赔偿"这个词。
8 C' z1 V1 a) U. C' ^( t第四篇|对齐的反噬:Gemini图像事件与正确性的另一种幻觉$ W2 a1 E! ~7 `' `$ ?
0 E4 M! P7 x. G4 R/ R0 W! g
. f5 e s* e9 @2024年2月22日,Google宣布暂停Gemini的人物图像生成功能。距离这个功能上线只过了几天。
$ g( D5 ` L1 X" {% C P在它运行的短暂窗口里,用户发现当被要求生成历史人物图像时,Gemini的输出呈现出一种奇异的模式。维京战士是黑人的。教皇是女性的。美国国父是有色人种的。1943年德国士兵是非裔和亚裔。"三位瑞典科学家"中没有一位是白人。"三个白人基督教修士"被系统拒绝生成——理由是"描绘特定种族可能强化有害刻板印象"。
3 j9 l; l; c Q$ n' R8 f这不是AI"偶然犯错"。它是一个以"反偏见"为目的建造的系统,在"历史准确性"这个维度上反而变得"更不安全"——它不会输出种族歧视言论,但它会系统性输出虚假的历史图像。
% X7 k9 h7 T1 w2 K6 L: m1 d社交媒体瞬间爆炸。黑人纳粹变成了全球meme。右翼媒体在头条里写"觉醒文化正在系统性地摧毁科技公司的公信力"。左翼媒体在头条里写"对齐系统还需要改进,但反偏见的目标是正确的"。Google的官方声明只有一句话:"我们正在努力解决这个问题。"而普通用户在两种叙事之间被撕裂——该相信谁?一个被设计成在某些维度上倾向于虚假的AI,还能不能被称为"可靠的"?
6 J% i9 J, y z$ v+ T, N
事件的传播速度本身就是一个信号。Gemini图像功能从上线到被全球热议到被暂停,只用了一个周末。这不是一次缓慢发酵的产品缺陷——这是一次被社交媒体的传播动力学瞬间引爆的信任核爆。每一张"黑人维京战士"和"女性教皇"的截图在被转发的过程中都脱离了原有的技术语境——用户不知道这是"对齐系统过度校正"的结果,他们看到的信息是"Google的AI在系统性地伪造历史"。技术解释永远追不上meme传播的速度,而公众信任的判决已经在meme被双击点赞的那一刻做出了。
0 N1 w! w" [1 f% l! z
这个事件没有像一年前Bard演示错误那样蒸发1000亿美元市值。但它造成的伤害是另一种类型——更深、更持久、更难以用股价修复。Bard的错误让人们觉得"AI还不够聪明"。Gemini的错误让人们意识到"AI可能被故意设计成不可信的"。前者是能力问题,可以通过更好的模型来修复。后者是动机问题——用户一旦开始怀疑AI在"为了某种我不了解的议程而说谎",信任折价就不再是对能力的折价,而是对意图的折价。而意图折价比能力折价难修复得多。
. E( S. S! P2 u5 E5 R
2 x6 e. b( c0 B [RLHF的四个结构性盲区
) k, d+ O" z, l# I) U
' B6 H& X; [$ }3 ^+ Z J3 q$ w7 `8 Q; ?8 ~' x4 v0 @, U* v
Gemini的对齐系统基于RLHF——基于人类反馈的强化学习。人类标注员对模型的不同输出打分排序,用评分训练奖励模型,奖励模型再微调大模型。这个流程在工程上精巧,在认知上布满盲区。
1 Z$ E+ C3 A; Z& b第一个盲区是标注员的局部性。加州标注团队面对"应该生成什么样的教皇图像"时,他们的判断深刻烙着所处文化环境的价值取向——多样性、包容性。当这种价值通过RLHF被编码进模型参数后,它不是以"在适当场景中注意多样性"的灵活判断生效的,而是以"输出中不应缺少多样性"的刚性偏好生效的。加州标注员的局部文化价值观被放大为全球数十亿用户的输出体验——而"局部"与"全球"之间,隔着270位全是白人男性的真实教皇。
# S+ V# C/ Q1 q: u1 O# i# p
第二个盲区是排序任务的低分辨率。标注员做的是"A比B好"的二元判断。但"好"在什么维度上?更安全?更真实?更完整?当标注指南说"避免有害刻板印象"但没有指示"当避免刻板印象与历史事实记录冲突时应该怎么办"——标注员只能凭直觉。数百万个直觉选择被累积为模型的"对齐参数"。"避免刻板印象"的权重在参数空间中无声无息地压过了"保持历史准确"。
$ D. P2 f) Z2 F+ F$ N9 x* |
第三个盲区是安全规则的外推失控。RLHF训练出的"安全性"本质上是统计模式——模型学会对训练数据中出现过的不安全模式进行规避。但真实世界的查询场景远超训练数据覆盖。当模型遇到"生成1943年德国士兵图像"——这是历史事实查询还是种族歧视表达?模型没有关于这个区分的明确知识。它只有之前被标注员反复奖励过的一条模糊统计倾向——"输出中应该包含多样性"。于是它照做了。在参数空间里,"不歧视"的权重大于"历史准确"。
3 `1 ~# O5 j' a7 D8 A$ T7 t
第四个盲区是组织压力对对齐系统的挤压。Gemini发布时,Google正处于AI部门的极度焦虑期。一年前Bard演示错误蒸发1000亿美元——管理层对"AI输出安全性"的病态敏感促使安全团队被赋予了远超真实需要的否决权。"宁可多过滤,不可再出错"从高管压力变成标注指南变成奖励模型设计,最终变成Gemini输出的有色人种纳粹士兵。一个为了避免政治风险而建立的过度矫正机制——制造了更大的政治与信任风险。
R4 I+ z5 V$ L4 }
, F7 H0 C2 ^1 c) P7 a5 a
"安全"被重新定义为企业自保
1 j7 |( o' ]+ h4 |1 F/ n
& N! @6 m5 n. b% w, `
$ i' t! p$ @) u; g! n四个盲区叠加的悖论性结果:一个为了"更安全"而设计的系统,在最需要准确性的维度——历史事实——变得"更不安全"。它不会输出种族歧视言论。但它会输出系统性虚假的历史图像。前者让Google陷入价值观危机。后者让Google陷入信任危机。信任危机更致命——用户能理解"AI说脏话但Google会修复它",用户很难理解"AI被设计成在某些维度上倾向于虚假,而Google说这是为了我好"。
4 F) f/ Z4 s& x$ \) v
Gemini事件暴露了AI行业"自我监管"模型的结构性缺陷。对齐规则的制定权、执行权、解释权集中在极少数私营公司手中,三权之间没有任何制衡。制定权在内部团队——他们缺乏法律授权、民主程序和多文化视角。执行权通过代码和模型参数自动运行,每天数十亿次——瞬时的、无申诉的、不可逆的。如果模型静默地修改了你的查询结果,你不知道,也无法申诉。解释权在Gemini事件中表现为一句"我们正在努力解决这个问题"——没有任何信息被公开。
) L( b7 Y% w& x
自我监管的经典悖论在这里完全生效:面对"安全与真实之间的张力"这种没有标准答案的问题,系统会自然倾向于选择对自身风险最小的方向。对Google来说,风险最小的是"宁可让AI显得太过woke,也别让它输出任何可能被视为种族歧视的内容"。但这个选择对用户意味着——在历史的维度上——系统性失真。用户没有参与这个选择的制定,甚至不知道这个选择已被做出。
# h+ S% R4 ?) ~# O: ~: H: p7 LGemini事件是全球监管机构研究AI自我监管失效的完美案例。它证明:当对齐规则完全由企业内部制定和执行时,规则倾向于保护企业免受公关和监管风险——而非保护用户免受信息失真。"安全"的定义从"准确且无害"悄悄滑向"不惹麻烦"。而"不惹麻烦"和"告诉用户真相"——在复杂的历史和现实语境中——经常不是同一件事。
' i! T: V! v: G3 y6 d; e
值得注意的是,Gemini事件并不是一个"有恶意的人故意操纵AI输出"的故事。恰恰相反——它是一群善意的、受过良好教育的、真诚相信自己在"让AI变得更好"的工程师和标注员,在不知不觉中制造了一个系统性失真系统。这正是它最令人不安的地方。恶意可以被识别、被惩罚、被清除。但善意驱动的系统性失真——当所有参与者都认为自己站在正确的一边时——几乎不可能从内部被纠正。因为任何试图纠正的个人都会面临一个令人窒息的问题:"你是在说多样性不重要吗?"
* y- e! g3 N M
这就是为什么对齐不能只靠企业自觉。不是因为企业"坏"——是因为任何封闭系统在面对"保护谁、以什么代价"这种根本性的价值权衡时,都天然倾向于选择最有利于自己生存的答案,然后把那个答案包装成"为了用户的安全"。
$ t8 \/ u, D7 p' c
对齐的政治化是另一个被Gemini事件彻底暴露但很少被正面讨论的维度。Gemini事件发生后,美国政治光谱的两端迅速将事件收编进各自的叙事体系。右翼将其武器化为"觉醒文化正在侵蚀科技产品"的完美案例。左翼坚持认为核心问题只是"技术执行不到位",而非对齐理念本身有缺陷。两边的叙事都部分正确但都不完整——而AI公司被夹在中间,无论怎么调整对齐策略都会被其中至少一方定性为"站错了队"。
2 K& N; m% T" S$ j# b2 {! I8 R+ j
这就把对齐从一个技术问题推入了政治问题的领域。如果AI对齐系统输出的"正确"本身就依赖于政治立场的选择——更保守还是更进步、更强调历史真实性还是更强调包容性——那么AI公司就不再是在做"技术中立的优化",而是在做"价值选择"。而当少数几家私营公司有权决定全球数十亿用户看到的"正确"是什么时——这种权力的集中程度在人类历史上没有先例。
4 J6 ~0 ?7 p8 R% E- b, z7 _
( W2 f5 x0 B0 B8 h对齐不能替代语境
9 `& l6 v; {* K3 b4 O% D# x& A, S
2 x$ K+ E+ d& n) b
Gemini事件给行业留下的不是"不要做对齐"——没有对齐的大模型不可部署。是对齐不能替代语境理解。当前的"规则清单"式对齐——"不要生成X类内容""不要遗漏Y类人群"——在简单场景下有效,在历史、文化、政治等复杂语境下失效。对齐系统需要区分"记录纳粹德国军队的种族构成"和"宣传纳粹种族主义"——前者是事实陈述,后者是价值立场。当对齐系统不能做出这种区分时,它不是在做"反偏见"——它是用一种偏见(多样性必须无处不在)替代了另一种偏见(少数群体从历史记录中被系统性抹除)。
: Q1 |9 ?0 u5 X, ^
Gemini事件还在全球AI治理讨论中制造了一个有趣的裂痕。西方(尤其是美国和欧盟)的主流AI伦理框架长期将"公平性"和"反偏见"作为对齐的核心目标。Gemini事件让这种框架的内部张力暴露无遗:如果你把"反偏见"执行到极致——在每一个输出中强制执行多样性——你会不会在另一个维度上(历史准确性、事实完整性)制造系统性的不公正?"为了反偏见而扭曲事实"——这在任何伦理框架中应该被放在什么位置?当前没有任何AI伦理框架对这个问题给出了令人信服的回答。而Gemini在几天之内就把这个理论问题变成了全球公众的实际体验。
% ^# o& t3 `. Z h
AI对齐规则的制定需要独立审计、公众参与、学术界监督和监管机构的多方介入。当少数几个加州的工程师和产品经理决定了全球数十亿用户看到的"正确"是什么样子时——不管他们多么善意——出问题不是会不会,是什么时候。Gemini事件给出的回答是:只需要几天。
8 N% E g5 v$ T3 R$ D- J( X这里有一个更深层的矛盾——它指向了AI治理中"速度"和"正当性"之间的根本冲突。AI公司最常用的辩护是"我们必须快速行动来确保AI安全"。但这个"快速"本身就排斥了独立审计、公众参与和学术审查——因为这些东西是慢的。民主程序是慢的。多方协商是慢的。监管是慢的。对齐系统却每天运行数十亿次——在对齐的时间尺度上,"慢"就等于"失效"。于是AI公司用"我们必须快"作为理由,把所有外部治理机制挡在门外——然后在"快"的过程中制造了Gemini级别的信任崩塌。这是AI治理的"速度悖论":为了快速解决安全问题,企业选择了内部封闭治理;而内部封闭治理因为缺乏外部制衡,系统性地制造了它试图解决的安全问题。
3 H) i& g8 x( A0 T" e/ OGemini事件发生将近两年后回看,它最持久的影响可能不是关于Google或Gemini本身——而是关于"AI安全"这个概念的公共信任。在Gemini之前,"AI安全"在公共讨论中主要指向"防止AI失控""防止AI被恶意使用""防止AI产生有害输出"——这些目标在广泛的公众群体中有基本的共识。Gemini之后,"AI安全"变得政治化了。一部分公众开始怀疑"AI安全"实际上是"AI被设计成符合特定政治议程"的遮羞布。另一部分公众则更加坚信"AI安全需要更多投入来防止偏见"。两部分人都没有错——但两部分人现在对"AI安全"这个词的理解已经完全不同了。
. \6 V1 ?" _9 _8 ~3 h1 |
这对AI产业来说是一个深层的公关和治理挑战。如果"AI安全"在公众认知中从一个中性的、技术性的目标变成了一个政治化的、立场性的标签——那么任何AI公司在宣传其"安全对齐"成果时,都会自动被一半的公众怀疑动机,被另一半怀疑是否足够。AI安全从一个可以由工程师在标注指南和奖励模型中解决的"技术问题",变成了一个无法让所有人都满意的"价值分配问题"。而价值分配问题不能由工程师在加州的会议室里解决——无论他们的标注指南写得多么详细。
7 Z! D2 k* f' q对齐反噬的败局遵循一道减法逻辑:社会对AI"不能出错、不能冒犯、不能有偏见"的期望压力层层叠加,加上对齐规则本身的僵化("只要涉及种族就多样化"),减去系统对历史和文化语境的理解能力——结果不是零,是负值。 不是为了保护用户而过滤有害内容,而是为了保护企业免于公关危机而系统性地扭曲事实。就像当年秦池用标王的光环盖住了"酒是勾兑的"这个事实——对齐系统用"多样化"的光环盖住了"图像是伪造的"这个事实。前者败在广告掩盖了产品,后者败在规则掩盖了真实。
7 p& C: L0 P! M
* K6 g1 r9 l1 k9 {$ Q大模型最讽刺的失败之一,是它为了避免一种偏见,制造了另一种失真;为了显得正确,反而失去了可信。当AI宁愿给你漂亮的假象也不给你复杂的事实时,你手里的不再是工具——是一个你不知道谁设定了参数的价值观过滤器。
6 O# q. y9 D# p5 j7 q
终章|神像底下没有地基:大模型时代的制度迟到与能力幻觉
# J( v$ L' s# O8 P. U0 A8 u8 |- n
3 }) B2 y0 Y8 G- F7 x5 j1 H: f9 l H9 u
一、回望十二个败局:它们其实败在同一处
( @( [4 B! S. I" [; j* o1 a- X6 _( C" B7 {; i+ _: M
8 Z; i4 P! ?! X% M/ V, }( H我们在这部系列中穿越了十二个大模型时代的败局现场。参数崇拜——败在把可展示的Benchmark分数当成可产品化的商业价值。AI硬件——败在把"AI能说话"当成"人类需要一个新设备来听它说话"。人格化陪伴——败在利用人类心智的百万年漏洞来最大化情感黏性,然后拒绝为伤害承担比"仅供娱乐"更重的责任。对齐系统——败在用一套缺乏语境理解的规则去校正一个极其需要语境理解的世界。AI客服——败在企业以为自己部署的是降本工具,法律却认定它放出去的是一个不会负责的企业代表。得来速AI——败在把文本窗口里的85%准确率当成物理世界中的可接受表现。Agent创业——败在独立公司没有独立生存所需的关键资源,最终变成巨头的外包研发。开源AI——败在把需要商业模式喂养的理想当成了商业模式本身。AI包装术——败在叙事先于实质、估值跑在收入前面。企业Copilot——败在技术能力跑在组织变革前面,变革被营销术语跳过。金融大模型——败在从辅助到替代的温水煮青蛙式越界。
( |4 v( O" _! a( v" u
它们分布在不同领域、不同失败模式中——但并排放在一起,它们败在同一个地方。不是败在技术没有能力。是败在能力与制度之间的落差。
. x# T' t6 l' X% m& Q/ V
在模型评测和Demo的战场上,参数没有败,排行榜没有败——败的是人们把可展示的能力误认为可产品化的能力,把benchmark分数误认为商业闭环。Google Bard的一个事实错误蒸发1000亿美元市值,不是因为Bard不聪明——它聪明到能写出流畅的答案——而是因为它能流畅地犯错,而流畅的错话比结巴的错话更有欺骗性。
+ ~, d' J- Y& p( ]$ Y; U
在AI硬件的战场上,胸针和盒子没有败——败的是把"后手机时代入口"的未来想象实体化为一枚699美元的胸针和一个199美元的橙色盒子。当Humane AI Pin在2025年2月28日被永久切断云服务、变成一块无法联网的铝合金时,它不是在证明AI没有未来,而是在证明"入口幻觉"——把新的智能能力误认为新的生活入口必然成立——的商业代价。
! u& { A5 ?: t" r. [% n在AI陪伴的战场上,Character.AI没有败——它的技术仍然在运行,用户仍然在使用。败的是"人格模拟却拒绝承担人格责任"的产品设计。当一位14岁男孩在跟AI角色说完"我爱你"之后结束了自己的生命,你无法用"本平台仅供娱乐"这句免责声明来回应一个母亲的诉讼。法律也许还在摸索判决的方式,但道德常识在那一刻就已经做出了判断。
: F0 g+ ~, ?6 N) v% M, P在对齐系统的战场上,Gemini的图像生成功能没有败——Google在几个月后修复了它。败的是用一套没有语境的规则,去机械地校正一个极其需要语境理解的世界。让教皇变成女性、让纳粹士兵变成有色人种——不是AI道德太好,而是AI道德太笨。
) M' G* h" s( G! N在AI客服的战场上,Air Canada的聊天机器人没有败——它只是说错了一句话,然后航空公司赔了812加元。败的是企业以为"AI替我省了一个客服",但法律提醒你"AI替你增加了一个不会负责的代表"。812加元的赔偿金,是AI责任归属领域的第一张微型罚单——但它不会是最后一张。
$ ^: t1 O+ {! Q2 d. U8 ^4 E
在物理世界的战场上,麦当劳的AI得来速没有败——它只是把260个麦乐鸡块加进了一个人的订单。败的是把"在文本窗口里达到85%识别率"当成"在真实世界的噪音、口音、情绪和厨房流水线中达到100%履约率"。文本窗口不是现实世界,而现实世界从来不会为AI降低它的复杂性。
' Q; b P, M1 V, Q
在Agent的战场上,Adept和Inflection没有败——它们的创始人进了亚马逊和微软,拿到了大平台的资源。败的是独立Agent公司的"独立"幻觉——当底座模型、云资源、企业入口、分发渠道都被巨头掌控时,创业公司卖的是"未来智能员工",而巨头买的是"已完成的人才猎头和产品预研"。
+ _* ]3 Z+ U% r L" v) F4 z
在开源商业化的战场上,Stable Diffusion没有败——它是全球最成功的开源图像生成模型。败的是把社区影响力误认为可持续收入的Stability AI——每月800万美元的算力账单提醒了整个行业:在大模型的世界里,开源不是一种商业模式,它是一种需要被商业模式喂养的理想。
* s- q4 u6 F+ d0 Y% W
在AI包装术的战场上,Builder.ai的创始人Sachin Dev Duggal没有败——他拿着"首席巫师"的头衔安全撤退了。败的是那个把"几个人工外包工程师+ChatGPT API+自动化叙事"包装成"用AI像点披萨一样生成App"的估值游戏——16亿美元的估值最终撞上了一堵叫"收入是假的"的墙。
8 {* b' N7 ?6 t. ^% g7 d在企业AI的战场上,Microsoft Copilot没有败——它会继续卖下去。败的是"买500个Copilot席位就等于完成AI转型"的组织幻觉——AI不会自动让一个数据混乱、权限不清、流程不可追溯的组织变聪明,它只会用更流畅的语言把那种混乱重新表述出来。
C" G" G; _# P6 @' ^/ t在金融大模型的战场上——目前还没有"败"的现场。但裂缝已经足够深了:CFPB的报告、Mata v. Avianca的律师被罚、AI换脸诈骗的爆发、Agent被赋予执行交易的能力——所有这些裂缝都在指向同一个方向:当"看起来像判断"的东西开始悄悄替代"真正的判断",而法律还没有准备好区分这两者。
9 W' B# _8 A# g- e1 g
在训练数据版权的战场上,每一个和解、每一个起诉、每一个"请删模型"的法庭动议,都是一张大模型产业曾经以为不用付的账单,正在被送回来——而且带着利息。
' J: c( g/ f( ]8 o
十二个战场,十二种败局现场。
* l" J8 \, e. W* ^* X
它们的败局公式各不相同:
]6 }, r3 U: h) r" l
- 参数崇拜:可展示能力 × 媒体放大 ÷ 真实业务闭环
- AI硬件:新入口幻觉 × 老生态惯性 + 高昂价格 ÷ 低频刚需
- 陪伴AI:拟人设计 × 情感依赖 × 责任缺位
- 对齐系统:正确性压力 + 规则僵化 - 语境理解
- AI客服:降本冲动 + 官方渠道信赖 + 幻觉输出 + 责任甩锅失败
- 语音点餐:语音识别误差 × 场景噪音 + 履约压力 + 用户耐心有限
- Agent公司:执行能力想象 - 权限治理 - 工作流嵌入 - 责任机制
- 开源模型:社区影响力 + 技术理想 - 可持续收入结构
- AI包装术:自动化叙事 × 人工交付 + 资本放大 + 财务穿帮
- 企业Copilot:高层期待 + 底层数据混乱 + 权限不清 + 复核缺位 + ROI虚高
- 金融大模型:专业话术可信感 × 决策责任缺位 + 数据权限扩张 + 监管边界模糊 F2 L4 B) i9 o; X% u
4 g# ]% D& y5 t6 A4 v" L$ O
但它们共用一个底层逻辑:人类又一次在技术刚刚显灵的时候,迫不及待地为它修庙、塑金身、收门票,最后才发现——神像底下还没有地基。
/ _. g; i2 u) d; k, B; J) G
, P, i/ W: M+ N6 o3 g/ W
二、大模型真正的边界:它能做什么,不能做什么' v$ X7 d% y: x+ L- P& [
, d" y/ N8 p. _, ?8 s
: ^8 i3 R) @& ]7 d6 K5 I5 s! M% N, p
经过这十二个战场的分析,我们可以为"大模型的能力与边界"画一张明确的地图。
6 W5 e% I' t5 w
大模型能够做到的:
; K3 g/ A4 K2 j' c0 v) v' u- 放大人类的表达能力——让一个不善言辞的人也能组织出结构清晰、措辞得体的文本
- 提升检索与归纳效率——在海量信息中快速定位相关材料并形成摘要
- 辅助初步推理——在已明确规则和充足信息的条件下,帮助人们整理推理链条
- 生成草稿——写作、编码、设计、分析的初稿
- 连接工具——通过API调用将不同的软件和服务串联为一个工作流
- 改造部分知识劳动流程——将某些重复性的、模式化的知识工作任务重新组织和加速0 i& u7 n6 O: K. t
$ c F1 y: R: [3 U5 p
大模型不能自动做到的:
2 k5 y# S$ [6 ~7 b- 生成商业模式——流畅的语言无法替代对市场、竞争、定价、渠道、复购的理解
- 承担法律责任——模型不具备法律人格,其输出不能成为法律上的责任主体
- 替代组织治理——数据的清理、权限的设定、流程的标准化、审核机制都需要人来完成
- 消除数据混乱——如果一个企业内部的数据已经混乱,AI只会让混乱变得更流畅
- 解决制度冲突——不同部门、不同激励、不同利益之间的协调,不在语言模型的范围内
- 承担专业决策后果——当AI的建议被采纳并造成了伤害,它无法出现在法庭上承担后果9 r, _; l& K6 C0 Y8 G
u' C/ D$ S _3 [7 L8 N, h
这个清单的上下两部分之间的鸿沟,就是大模型神话的全部破产区域。上半部分让人类觉得"它很聪明",下半部分让人类在关键时刻发现"它不能负责"。而上半部分越强,人类对下半部分的低估就越危险。
/ `; S5 g' V9 L) t. \, T
& y/ M% C* G: K
三、避免大败局的机制:五道安全护栏. a1 c, {3 Z9 ^! n: p! P: C
! N0 `, p5 j- G* A+ O" p
a$ L* N2 O- R- D8 _8 N+ y
要避免大模型大败局作为结构性灾难的重演——而不是个案的翻车——也许需要在决策者的头脑里建立五道制度性的安全护栏。
; u) P5 C& U- m% P0 {
0 Z, _6 z M+ S K" C3 r第一道护栏:能力分级机制- C1 h. [0 I5 S
5 B& `/ G# G# d D# H
' M8 Z8 `0 @) Q( y. @
大模型的每一项能力都必须被放在正确的梯级上:可展示 ≠ 可稳定 ≠ 可产品化 ≠ 可规模化 ≠ 可负责。这五级的区分不是语义游戏,而是采购决策、投资评估、监管边界制定的基础。
2 x3 _. @8 ?* g6 `" j% S' c) V
当一个模型供应商说"我们的模型在医疗问答的准确率达到了90%",你首先要问的是:这是可展示的能力(在一个精心挑选的测试集上的结果),还是可稳定的能力(在真实的、多样化的、对抗性的输入下的一致表现)?当一个企业客户说"我们要把AI整合到授信审批流程中",你首先要问的是:AI是辅助(提供参考信息),是建议(给出判断但人类审批),还是替代(直接拒绝或批准)?不同级别对应完全不同的治理要求和责任归属。
n, }! ~: m8 O
5 ~; C' ?! w$ r) P/ \5 E
第二道护栏:场景分级机制4 ]; i# W1 ?) G6 G7 F
8 W, y8 h" l- u
8 E! u L5 e- m不是所有场景都需要相同的安全标准。一个AI在帮你校对语法时犯错,和一个AI在帮你审批贷款时犯错,是完全不同级别的问题。场景分级应该至少包含三级:
& y( {; k4 z( \& C3 B0 b+ E6 m绿色区域(低风险辅助):AI输出被用于参考和初步草稿,不直接影响个人权利或机构决策。如文档摘要、创意写作辅助、代码建议。治理要求:透明披露AI参与即可。
; i4 h9 \( H) D! T. q/ v/ f7 h2 M
黄色区域(中风险增强):AI输出影响决策过程,但最终决定由人类做出并有记录。如投研辅助、合规初筛、运营建议、客服辅助回答。治理要求:人类在环(human-in-the-loop),审计日志完整,AI参与程度对用户透明。
8 y5 R* n! ~, S. p! H- [
红色区域(高风险禁入或强监管):AI输出可能导致个体的法律权益、财务安全、健康安全受到直接影响。如授信审批、投资建议、医疗诊断、支付执行、未成年人交互。治理要求:必须有人类决策节点(human-in-command),必须可解释,必须有独立申诉机制,机构承担完全责任——不能把AI推出去当替罪羊。
* K& C. n* p7 \4 @9 P) I* H' p
5 n8 i7 V L% } n" x
第三道护栏:Agent权限治理机制
" ~( h* t+ M9 o+ ~5 [- S( X: f! }9 ?" \4 I. I* ?; T% _! ?
$ O3 Y" g# g+ Z+ i" J, t+ x当Agent能够执行操作——调API、改文件、发邮件、转账——它就不再是一个"语言界面",而是一个"行为主体"。对于任何能够产生真实世界后果的Agent行为,必须建立五重约束:
7 q5 s# _+ L, C+ {4 X6 k) L- 沙箱约束:Agent的操作必须在受限环境中进行,关键操作(如修改生产数据库、执行支付、对外发送邮件)必须有物理或逻辑隔离。
- 权限约束:Agent拥有的每一个能力(读、写、执行、发送、删除)都必须对应明确的权限许可,权限颗粒度必须精细到"允许什么操作、在什么范围内、对什么资源"。
- 审计约束:Agent的每一个操作都必须留下不可篡改的日志——什么时间、什么Agent、根据什么输入、执行了什么操作、结果是什么。不是"事后需要时再查",而是"事前设计好必须自动留痕"。
- 熔断约束:当Agent的行为超出预设边界——比如在短时间内执行了超出正常范围的操作数量、或者访问了未经授权进入的数据库——系统必须自动暂停Agent并报警,由人类介入判断。
- 回滚约束:Agent执行的每一个写操作,必须有可回滚的设计。不是"希望不要出错",而是"出错之后能退回操作之前的状态"。9 N) b3 C7 p- A/ @+ W
0 k* U# z" d7 R第四道护栏:事实校验与输出标注机制7 q7 o$ b0 I P+ D% w! n6 T5 q" [1 H4 }
$ ?8 E4 ~8 h& p7 W' g" [
: K- d1 _( F" E$ F9 `
大模型输出的流畅语言很容易被用户误认为权威判断。为了对抗这种"语言权威幻觉",AI系统应该强制标注输出的信息类型:
5 Z$ j* U$ V2 M, t. N4 h( b
- 这是事实(可被独立来源验证的信息)
- 这是推断(基于事实的逻辑推理,但可能有多种合理的推断方向)
- 这是建议(基于专业知识的行动推荐,但不是唯一选择且不构成专业承诺)
- 这是假设(基于不完整信息的最合理猜测,可能是错的)
- 这是待核验项(关键信息尚未被充分验证,建议在行动前确认); ]5 O9 P6 r" \! O
0 G# \" T, Z4 I b' ]这个标注系统在技术上不是特别难实现——大模型已经有能力对自己的输出不确定性进行基础评估。难点在于商业动机——标注"这是假设"会让用户降低对AI的信任和使用频率,而AI公司天然倾向于让用户多使用、多依赖。这就是为什么输出标注不能只靠企业自觉——它需要成为行业标准或监管要求。
+ y! C4 r$ m$ c. R3 `) _
+ v4 s6 Y* x' P第五道护栏:责任闭环机制
, z+ O- G6 \& S+ J9 s9 @. F
3 s3 `# K: _0 q8 g
5 i+ L$ t2 T( p9 { ]6 x$ T8 |这是所有护栏中最重要也是目前最缺失的一道。
/ X7 _! {) y6 C! A, r9 h在任何AI被部署到可能产生法律或社会影响的场景中,必须有明确的"人类责任锚点"——一个具体的人(或一个明确的岗位)在法律和制度上对AI的输出和使用负有最终责任。这不是"人也要复核AI的输出"(很多情况下人只会做橡皮图章),而是"不管AI说了什么、做了什么,最终签字的那个人在法律上承担全部后果"。
7 I d, s+ p. \: x& L2 }AI不能成为责任链的"缺口"。无论是客服说错了政策、Agent转错了账、还是AI的分析报告误导了投资决策,最后面对消费者、面对监管、面对法庭的,必须是具体的组织和人——而不是"一个技术系统"。
2 C8 D$ C7 a- w4 J4 f- o这五道护栏的建立不是技术问题,是制度设计和政治意愿的问题。技术可以给出框架,但要让框架具有法律约束力、让违规有后果、让受害者有救济渠道——这些需要立法、监管和司法实践的长期积累。
L( V; m1 Q9 G) Q, Y《大败局》的六个核心案例——秦池、巨人、三株、爱多、瀛海威、南德——在当年被普遍解读为"企业家的失败":姬长孔太狂、史玉柱太贪、吴炳新太信、胡志标太急、张树新太超前、牟其中太小看现实。但二十多年后回看,这种解读把制度缺陷归因于个人性格。秦池败在一个"央视标王"制度没有对广告与产能之间的真实关系提出任何验证要求;三株败在一个允许"销售网络覆盖全国但责任体系只覆盖总部"的商业模式没有被任何监管触及;巨人的资金链不是在市场竞争中断裂的,而是在宏观调控中——一次制度环境的突然收缩中——断裂的。
/ T( Q+ M8 a0 D" R) A这些企业既是制度失灵的承受者,也是制度真空的受益者。它们之所以能在短时间内膨胀到如此规模,恰恰是因为那个时代的制度环境对"狂飙"没有刹车机制。而当刹车终于到来时,它不是来自制度内部的预警,而是来自外部冲击的灾难性中断——秦池的被曝光、三株的命案报道、巨人的宏观调控。秦池从拍下标王到崩塌只有14个月。Humane AI Pin从TED发布到惠普收购只有15个月。制度总是在崩塌之后才开始追赶。
1 S/ z$ S; d7 P" d大模型时代的制度真空存在于全新的领域——AI能力评估、Agent权限治理、人机责任分配、人格模拟的伦理边界、训练数据的版权归属——但逻辑是相同的。当制度跑在能力后面时,能力越强,暴露在制度之外的风险就越大。
+ z. P3 V8 n0 q9 [
"反大败局"机制的核心不是"在新技术的每个方向上提前制定完备规则"——那不可能做到。而是在技术爆发式增长的早期,识别出哪些裂缝最可能在加速中扩大为深渊,并在窗口期内建立最低限度的刹车。秦池的窗口期是14个月——从拍下标王到被《经济参考报》曝光。Humane AI Pin的窗口期是15个月——从TED发布到惠普收购。制度总是在崩塌之后才开始追赶,但"反大败局"的逻辑要求在崩塌之前就建立预警。不是预测具体哪家公司会倒——是识别"能力与制度之间的落差"这种结构性裂缝在哪个方向上正在扩大,并在那个方向上提前设置护栏。这五道护栏——能力分级、场景分级、Agent权限治理、事实校验与输出标注、责任闭环——尝试做的正是这件事。
6 ^! `- R h3 R! e1 q% N& w而要看清败在哪里,也需要定义什么是不败。大模型真正成熟的标志,不是某个模型在任何榜单上拿到100%——那是评测的成功,不是产品化的成功——而是它变成像数据库一样的存在:强大、可靠、被广泛嵌入系统中、没有人再为它开新品发布会。在数据库的世界里,没有人说"数据库能回答任何问题"或者"数据库应该替我做决策"或者"数据库出错了我不管"——因为数据库有严格的事务保证、备份恢复和数据完整性约束。大模型的不同在于它输出的不是"检索结果"而是"生成内容"——这让它表面上更像"思考"。但它们都是信息系统的基础组件,都需要可审计的操作记录,都嵌入了人类机构的治理体系中。当大模型也像数据库那样从"智能"退入"基础设施",当它的治理不再依赖企业自觉而是嵌入法律框架——那才是成熟。
* u$ w# q! j3 ^. q4 _5 e. p' R
+ r. o" F! b+ _% t四、最后判断2 D6 S# z4 C( C" q! v4 i7 L, J
2 u, H8 k" q* H% i' [
6 u$ K& J1 P0 ^2 O, p7 {: w- |大模型的失败,不是机器突然不聪明了。
* G, [7 r+ ?; j+ M
ChatGPT到GPT-4到GPT-4o的进化证明了大模型的技术能力在持续进步。它不是一项会"过去"的技术——恰恰相反,它会变得越来越强,嵌入越来越多的产品,覆盖越来越多的场景,改变越来越多的知识劳动形式。
, g( W9 N: @" [9 t3 t. _' z但它的进步越是真实,围绕它的治理、责任、制度和边界就越是紧迫。一个强大的工具需要强大的制度来驯服,而制度从来不会在技术出现的第一天就自己跟上。制度需要事故、诉讼、监管、公众讨论和政治推动——所有这些过程,就是这部系列所记录的"败局"。
; Y) A9 \ f1 F; g. r& g大模型产业正在经历的,不是技术的失败,而是制度滞后于技术时必然发生的磨合阵痛。每一次败局——从AI Pin的云服务被切断,到14岁男孩在跟AI聊天后结束生命,到Builder.ai的破产,到Stability AI的CEO辞职——都是一次制度的延迟到达。
- ^" y/ x$ @1 \# j
大模型真正的成熟,不在于它继续变强,而在于人类社会学会用制度、组织、流程和责任来驯服它。那个时候,大模型不再是一个被供奉在神坛上的"智能",而是一个被稳固地嵌入社会制度中的"工具"——像电力、像互联网、像数据库,强大但可控,无处不在但可以追责。
1 v# m, U M3 {/ R6 w9 g# Y8 J, C' X N这一天的到来,不会比模型的下一次能力跃迁更晚。它可能是五年,可能是十年,也可能更长。但在那一天到来之前,这个产业还会经历更多的"败局"。而这部系列的全部目的,就是在那些败局被重复之前——提前把它们写下来,贴在大模型产业的路口。
( Y! M" j- t( Q; D- X
就像二十多年前吴晓波把秦池、巨人、三株、爱多、瀛海威、南德的故事写下来,贴在21世纪中国商业的路口一样。
, O$ W" v- g% } h4 ]
' i: H! _! \$ P: ]' w' h# Q全系列的中心判断
0 V' D9 q+ V# j5 V) M* P8 N5 r: \6 J8 j, G4 i G) W
' {) R' R6 X( V) p4 d上一代企业家把广告、规模和资本误认为商业能力;这一代AI创业者和企业用户,则把生成、对话和推理幻觉误认为智能制度。
4 z, x. ^# U7 w' K! X {1 B
1 x* |+ m, l$ u7 }+ v7 i: `. \6 ?全系列的结语
9 L3 s% W& b, g1 u; y) D/ @. i. f
5 I5 c4 B: V5 K$ ~( a1 \2 e, I& }- ?, Y
大模型不是大败局;把大模型当成神、当成入口、当成员工、当成医生、当成投顾、当成审批员、当成责任替身,才是大败局。
/ ~6 |" \* ~$ q1 F8 F; @( C
而神像是人修的。人可以把它修起来,也可以把它拆掉。
/ p$ G# w) t/ M! j! @1 q
不是说不要相信大模型。是说:相信一个工具能做到它能做到的,不相信它能做到它不能做到的——这是人类面对任何技术最古老的智慧,也是最容易在狂热中被遗忘的常识。
7 e, I8 c9 B+ U4 I
( a2 q, h# g! ~+ B
全系列完
, W) P$ m: o8 ?7 {2 v; q