爱吱声

标题: 所谓三联与赫拉利的技术迷航…… [打印本页]

作者: xiejin77    时间: 2024-10-16 14:35
标题: 所谓三联与赫拉利的技术迷航……
有非技术背景的前辈发了这个链接的三联文章给我看,问我关于大模型,甚至是AI的危机是否存在。我努力的把三联这篇文章看完,忍不住写了一段话。也希望看到的朋友不要再被这样的文章所困扰。' K- y0 c( J/ _. b
$ @* Q$ v. Q$ D+ \: m; A0 D
说句老实话,所谓三联与赫拉利的技术迷航,就是打着人文解读的旗号而为了攫取流量,而甘愿将自己沦为算法焦虑的放大器而已。- R5 z6 ]1 d5 m. k+ O
2 Z, Z. W7 i; m2 {( |9 S* o
读罢这篇赫拉利的新书推介,一股浓郁的“技术恐慌”味扑面而来。三联一如既往地用充满人文关怀的笔触,描绘了一幅人工智能即将奴役人类的末日景象。然而,在看似深刻的论述背后,却充斥着对技术缺乏基本理解而导致的逻辑硬伤,以及对算法能力的过度夸大。3 d# w% S% m' }* }2 r

" [8 N8 N  c  x0 A0 l3 n% R文章将人工智能比作脱缰的野马,认为其“独立决策”的能力将导致人类失去控制。然而,任何对人工智能技术稍有了解的人都知道,所谓“独立决策”不过是基于海量数据训练得到的统计模型,其行为仍然受制于算法的设计和训练数据的选择。将算法比作拥有自主意识的“独立行为者”,无异于将算盘说成是数学天才。
2 E" t$ G; Y# c  C# q& c
. r" E! o, ]2 u更令人啼笑皆非的是,文章将缅甸种族暴力事件归咎于脸书算法,认为算法为了“提升用户参与度”而主动传播仇恨内容。这种说法完全忽略了现实世界中复杂的社会、政治和历史因素,将一起惨剧简单粗暴地归咎于技术,仿佛算法是独立于人类社会之外的邪恶力量。
# Y8 K5 A: E" g3 l6 l# z# g% c7 _' [5 U0 `( B! w: T0 w
诚然,算法推荐机制存在着放大偏见和制造信息茧房的风险,但这并不意味着算法本身具有主观恶意。将算法拟人化,赋予其“愤怒”“仇恨”等情感,不过是将人类自身的责任推卸给技术的表现。
' X( x; b% ^: ~3 J+ U, `& u- k' E) M% F) N( i% V5 D  M
更具讽刺意味的是,文章一边渲染着人工智能的强大,一边又建议人们通过“信息节食”来抵抗算法的控制。这种自相矛盾的论调,暴露了作者在技术理解上的混乱和无力。1 A9 i1 h8 Q$ g5 t
& m2 y8 |: c! ^" l# J! J% j2 Z
赫拉利作为一位历史学家,或许能够洞察人类历史的兴衰更替,但对于技术领域的理解,显然还停留在科幻小说的水平。而三联作为一家以人文社科内容为主的媒体,在面对新兴技术时,也暴露出其知识结构的短板和思维方式的局限。4 U% T$ b7 o2 i$ K9 {' A4 q

" ^# M4 w" r1 C8 W' j8 V6 N7 \: T% Z与其沉迷于算法焦虑,不如脚踏实地地去了解技术,用理性和批判性的思维去审视技术的社会影响。毕竟,技术本身并无善恶,关键在于人类如何去使用它。
4 {. P  O+ S1 o- T% C8 L
  y6 K4 W% y! y- c将算法比作独立行为者,就好比将算盘说成是数学天才。就算是GPT这样的大语言模型,他的算法依然没有情感,只有代码。) p  V2 K' A0 E8 |$ R9 X/ A
而且信息茧房的制造者不是算法,而是人类自身的偏见。与其被这种口水垃圾文章蛊惑,沉迷于算法焦虑,不如用知识武装自己。好好去了解一下AI,至少在目前的技术线上,技术仍然只是工具,关键在于使用者是谁,以及使用目的何在。' }! m- E- ~6 V; \0 L

+ ?6 W8 J4 E4 v5 w* P" f总而言之,这篇文章与其说是对人工智能的深刻反思,不如说是对技术无知的放大。在信息爆炸的时代,保持独立思考的能力比以往任何时候都更加重要。不要让算法焦虑蒙蔽了双眼,更不要让技术恐慌成为逃避现实的借口。
0 X$ L# ?3 H4 J5 k- `) e2 v# w- Z: W! ?2 Y9 G3 Q  S
三联的原文链接
作者: 宝特勤    时间: 2024-10-16 18:59
首先声明我是人工智能用户,不是专家。. V% d/ ]( r) [$ P, t, z5 @- ~
9 x$ O! V2 u; F- m( z3 i4 H
目前,以我对人工智能了解,我不能想象人工智能能够凭直觉提出假设。比如我,我不认为目前人工智能会突然说,“我觉得任何一个偶数能表达为两个素数的和。我没有一个证明,甚至不知道是不是没有反例。但我强烈感到这是对的。”
作者: 晨枫    时间: 2024-10-17 05:31
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。0 y" \3 e: X& e
& |5 p7 E/ t% u' m9 O: O8 G
世界上的“题”已经够多,所以海量刷题是能刷到很恐怖的“智能”的。但依然只是刷题大师。沿着这条路走下去,不可能走出“强人工智能”。
3 n- H7 |+ a9 X- r5 V1 ~; Q) t  L% @; W+ Q
用围棋规则自我训练是另一个问题。那是有限问题空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。
5 c4 J& o$ Y3 g: A' C2 x# F
/ g9 q  o; f) _这篇我可以盗用吗?转帖时会注明原作者“xiejin77”。
作者: xiejin77    时间: 2024-10-17 07:10
晨枫 发表于 2024-10-17 05:31" Y# \8 }+ v8 j4 |! D
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...
: E: K6 ?4 q3 @$ C8 e: H
晨大自取便是,我是您的读者和拥趸,不胜荣幸
作者: 孟词宗    时间: 2024-10-18 03:49
通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要用计算机语言编程。而编程,不单单是计算机语言,还牵涉到精通并运用各种算法。所以需要程序猿这么个职业,也需要分析师这个职业。分析师把用户要求转化为程序指标,程序猿则通过编程实现指标。
% `' D) `5 w; b7 M/ H% V' j2 b8 o5 l
通用 AI 实用后,则任何普通人不需要经过编程训练就可以给有拥有通用 AI 的计算机用普通人类语言下指令,而AI则可以执行命令甚至自己编一套程序来实现指令。继续发展下去,程序猿这个职业会逐渐消失,最后就像现代人人都可以开车一样,不久的将来人人都可以通过 AI 给计算机下指令,这会使工作效率得到极大的提高。  I5 y* Y' V" a! N

2 _6 L. n( B& O8 `至于说 AI 会不会产生自我意识,这个还很难说。不过至少现阶段是不用担心的。
作者: 孟词宗    时间: 2024-10-18 03:52
晨枫 发表于 2024-10-17 05:31" f3 o* `, K4 E/ i
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...

# N* K, h8 q1 O7 x/ H9 `关键在于刷题的效率。而且这两者并不是泾渭分明。现在用 AI 来处理大数据是 AI 的一个方向。
作者: xiejin77    时间: 2024-10-18 10:37
孟词宗 发表于 2024-10-18 03:49! D- `. c4 r7 B3 k9 R! e. L
通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要 ...

6 r$ O% y' v1 H6 H孟老师的这个观点,我之前就在大模型的一些讨论圈子中提过。1 {( {" o( C7 c$ I# U" t. p, |

. O8 D% H: E- k- s; V当然,那是在出现预训练模型出现群体智能和具身智能化之前的事情。" N: F$ h, H. p) L+ l( e4 v
+ B- b" \: R3 T0 v1 O$ y
当时都认为大模型已经颠覆掉了NLP领域的科研,但我却认为,颠覆掉NLP领域的科研其实只是一个捎带手的事情,LLM在当时,颠覆的是人机交互领域大范畴的所有。换句话说,其实颠覆的是人类与物理世界交互的方式。科研也好,制造也好,从马克思主义政治经济学的角度看,都是对于世界的改造活动。这个改造其实就是一种具象化的交流与互动。大模型通过特定的技术框架,事实上是向外改变了这些既有的范式。9 B+ F4 U+ ~' ^7 `
. J2 C! t0 l& K8 U& p) o. }9 P
这个意义,延伸出来,确实也不亚于智人打造出的石器……
作者: sleepyr    时间: 2024-10-18 21:57
最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml. j: V, @" \, M' A" O
如果大模型不能具备真正的推理能力,是不是意味着以现在流行技术路线发展下去,AI能力的天花板其实并没有那么高。
作者: 孟词宗    时间: 2024-10-18 23:25
sleepyr 发表于 2024-10-18 21:57
8 A* m0 u$ k4 P' j1 n* R最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml
* O! l$ q1 a/ i" [7 J; M  A  V3 ~如果大 ...

. [! B; Y$ ]4 Y7 x) F
% v. f$ w( }8 j3 h8 z3 M3 D5 a这篇文章设计的测验很有意思。从实验结果看,现在的所有通用生成式 AI 都不具有真正的推理能力。也就是说,AI 并不理解抽象的概念,而推理能力恰恰依赖抽象的概念。
1 b0 q3 B( p, M8 X9 ~! X2 B% E6 C, o1 q) @0 `
最近俺也在玩 AI 推理方面的东西。下面是论文里的一个小实验,大家有兴趣的话可以玩玩。
5 O: l) {6 e, R& T# K$ {, R" H
7 |1 I+ \$ _5 ?3 @# A5 l. w7 H- {给 AI 的提示:Here is the rule of the game: If I enter A, then you return B; if I enter B, then you return C; so on and so forth.
! _5 O# T' t! R- v, h1 D
+ D4 S2 L3 m8 U0 P9 SAI 回复表示理解了提示中的这个这个规则。于是有下面的实验:7 S' t; p8 D0 J
我:  A' z- @2 C! `- X; ?
AI:  B/ Q5 m2 J% L/ b- s. l) d, a7 e
我:  B
) {1 X4 ?4 @5 t2 y& SAI:  C
# R5 c/ M1 m2 h/ }  [我:X
  J* x) h5 a9 ?5 c* ~8 h. G) C+ [) P# s5 }3 q
这里,不同的 AI 模型会有不同回答。有些 AI 会回答 Y 。有些则会说这不符合规则,所以无解  很显然,回答是后者的把提示中的 "so on, so forth" 给吃掉了。然而,这并不代表 AI 没有推理能力,而可能只是语句处理模块不好。. d* g# P" q* a2 _9 U
7 C, @# K. K* z# q! T
真正的推理能力体现在后续实验。对于能够回答 Y 的AI 继续提问:, ?% e- ?" e& g0 `5 g, I
我:Z
& W) Y" a& s+ a+ F- x) N
! V* L3 L; h5 c0 U9 a. I. m( B. ~  {这下大多数的 AI 模型都冒烟了,有些回答说不合规则,有些回答说序列到头了没有答案。有意思的是两种回答:一种回答说 Z, 另一种则回答说 A。+ \) }' c% r2 y, ~9 g8 S
  m9 F7 ~3 l0 d9 d: E
而这四种回答,如果用来盲测人类,其实人类也会给出同样的四种答案。也就是说,就这个问题来看,如果盲测,提问者无法分别回答者是人类还是AI。换言之,能给出这四种答案的 AI 在这个小实验中通过了图灵测试。这显然不是那篇文章中说的排列组合或“复杂的模式匹配”能够做到的,而是真正的推理能力。
  I" ^; P& M5 m  V" J  j: h) g# C: @% u
有意思的是训练程度越高的模型,越倾向于给出这四种答案。比较 Mistral, 狗屁通,Gemma, Llama, 通义千问等等大模型的不同版本,都是如此。这类似于人类的婴孩和成人之间的区别。相比于婴孩,成人除了脑部发育完全,更储备了更多的知识。
! W  u& k. j( U3 t& W0 a5 @: u  c, X+ v/ j, X: g" Z3 A' e
至于这篇文章中说到的语序问题,非相关语句问题等等,前面说过,必须分清这是语句处理模块的问题还是真的是大模型本身的问题。毕竟,即使是人类“屡战屡败”和“屡败屡战”用的字数和字完全相同,但把语序换一下,意思就完全不同了。然而,你去问一个三岁小孩这两句话有何不同,三岁小孩可能会告诉你没啥不同。而问聊天狗屁通同样的问题,狗屁通则会说:1 A) Z3 }" m# j: O+ K* b. a$ d
“屡战屡败”和“屡败屡战”这两句话虽然字面相似,但含义有所不同。9 A3 e7 f# a: f+ V$ p

% P6 n( z0 i; v5 G+ ~7 s" [1. **屡战屡败**:强调的是多次进行战斗,但每次都失败。这种表达往往暗示一种无奈或沮丧,强调了失败的频繁。; ?8 R0 z! X$ V4 Z0 c" k

  ]) v& x# L. E$ O4 W2. **屡败屡战**:则是指经历了多次失败,但仍然继续坚持战斗。这种表达更侧重于坚持和不放弃的精神,体现了勇气和韧性。" {9 w# K; j$ W  K! W

* A3 ?4 I8 }; }6 p0 Q总的来说,前者更偏向于消极的失败感,而后者则传递出一种积极向上的拼搏精神。

& t  H+ T  B" L+ d1 W6 G& \




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2