爱吱声

标题: 所谓三联与赫拉利的技术迷航…… [打印本页]

作者: xiejin77    时间: 2024-10-16 14:35
标题: 所谓三联与赫拉利的技术迷航……
有非技术背景的前辈发了这个链接的三联文章给我看,问我关于大模型,甚至是AI的危机是否存在。我努力的把三联这篇文章看完,忍不住写了一段话。也希望看到的朋友不要再被这样的文章所困扰。
: [" U6 Z1 R) S; ]4 z# _" s/ ^' ^9 C9 A8 B  r
说句老实话,所谓三联与赫拉利的技术迷航,就是打着人文解读的旗号而为了攫取流量,而甘愿将自己沦为算法焦虑的放大器而已。, x. Y8 T9 [! o& r( L

' h% Z4 U& K- s+ H读罢这篇赫拉利的新书推介,一股浓郁的“技术恐慌”味扑面而来。三联一如既往地用充满人文关怀的笔触,描绘了一幅人工智能即将奴役人类的末日景象。然而,在看似深刻的论述背后,却充斥着对技术缺乏基本理解而导致的逻辑硬伤,以及对算法能力的过度夸大。- x; g4 C, N7 |1 W0 v& W
- t" ]! e( S4 Z) M( Y
文章将人工智能比作脱缰的野马,认为其“独立决策”的能力将导致人类失去控制。然而,任何对人工智能技术稍有了解的人都知道,所谓“独立决策”不过是基于海量数据训练得到的统计模型,其行为仍然受制于算法的设计和训练数据的选择。将算法比作拥有自主意识的“独立行为者”,无异于将算盘说成是数学天才。! H1 J, w9 \7 P2 u9 R2 r$ ]
% y1 b/ q% }' m- k" y& C* I* }
更令人啼笑皆非的是,文章将缅甸种族暴力事件归咎于脸书算法,认为算法为了“提升用户参与度”而主动传播仇恨内容。这种说法完全忽略了现实世界中复杂的社会、政治和历史因素,将一起惨剧简单粗暴地归咎于技术,仿佛算法是独立于人类社会之外的邪恶力量。
- M, O, D. T& e3 j- q( `$ J# M; m' o, @/ l1 z$ v
诚然,算法推荐机制存在着放大偏见和制造信息茧房的风险,但这并不意味着算法本身具有主观恶意。将算法拟人化,赋予其“愤怒”“仇恨”等情感,不过是将人类自身的责任推卸给技术的表现。, U( Z& W; Q! h9 W$ |6 @* u2 c3 n

. {5 A6 Y. n6 _& X9 E( @( U1 ^- ~更具讽刺意味的是,文章一边渲染着人工智能的强大,一边又建议人们通过“信息节食”来抵抗算法的控制。这种自相矛盾的论调,暴露了作者在技术理解上的混乱和无力。
. A2 F$ f- E7 a4 P; I1 h
8 j* ]( e/ j: A* P* D) [2 d; x2 w赫拉利作为一位历史学家,或许能够洞察人类历史的兴衰更替,但对于技术领域的理解,显然还停留在科幻小说的水平。而三联作为一家以人文社科内容为主的媒体,在面对新兴技术时,也暴露出其知识结构的短板和思维方式的局限。
) _) }$ U3 ~. r4 i8 W/ R
- h2 o: ?6 r' G3 I+ k与其沉迷于算法焦虑,不如脚踏实地地去了解技术,用理性和批判性的思维去审视技术的社会影响。毕竟,技术本身并无善恶,关键在于人类如何去使用它。
1 e  t: k6 ~# E* M4 J+ n, t, \" x5 n) ]" N( F" b- k% q! A+ d% E+ R5 I
将算法比作独立行为者,就好比将算盘说成是数学天才。就算是GPT这样的大语言模型,他的算法依然没有情感,只有代码。+ l$ L3 Q# q; }: p  a* Q
而且信息茧房的制造者不是算法,而是人类自身的偏见。与其被这种口水垃圾文章蛊惑,沉迷于算法焦虑,不如用知识武装自己。好好去了解一下AI,至少在目前的技术线上,技术仍然只是工具,关键在于使用者是谁,以及使用目的何在。
7 ?  i5 y- B" |8 R  p/ [
$ i- s4 W! I6 m" T- c! \总而言之,这篇文章与其说是对人工智能的深刻反思,不如说是对技术无知的放大。在信息爆炸的时代,保持独立思考的能力比以往任何时候都更加重要。不要让算法焦虑蒙蔽了双眼,更不要让技术恐慌成为逃避现实的借口。
- J7 ]" V5 z- w4 ]1 p0 U$ V( i; U
: }7 H* k# S3 O, y* V. N9 B8 ]三联的原文链接
作者: 宝特勤    时间: 2024-10-16 18:59
首先声明我是人工智能用户,不是专家。: t4 M/ ]% ]3 t" a9 ~  ?$ |
, C9 [) g0 D" ~* T. c
目前,以我对人工智能了解,我不能想象人工智能能够凭直觉提出假设。比如我,我不认为目前人工智能会突然说,“我觉得任何一个偶数能表达为两个素数的和。我没有一个证明,甚至不知道是不是没有反例。但我强烈感到这是对的。”
作者: 晨枫    时间: 2024-10-17 05:31
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。. [+ o* g- a7 R

4 k) c9 [1 a9 b) B世界上的“题”已经够多,所以海量刷题是能刷到很恐怖的“智能”的。但依然只是刷题大师。沿着这条路走下去,不可能走出“强人工智能”。" O7 R9 g7 c8 _; G) {4 P

0 M! z( ?# j( k) ~* `) U用围棋规则自我训练是另一个问题。那是有限问题空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。
/ w* B- G0 a) S3 d2 a3 e: j3 B5 b9 Y3 v# @0 X5 |) H
这篇我可以盗用吗?转帖时会注明原作者“xiejin77”。
作者: xiejin77    时间: 2024-10-17 07:10
晨枫 发表于 2024-10-17 05:31
) d! B: \" W6 l. i7 ~大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...

- ?% Z# r. X; y" n8 U! U晨大自取便是,我是您的读者和拥趸,不胜荣幸
作者: 孟词宗    时间: 2024-10-18 03:49
通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要用计算机语言编程。而编程,不单单是计算机语言,还牵涉到精通并运用各种算法。所以需要程序猿这么个职业,也需要分析师这个职业。分析师把用户要求转化为程序指标,程序猿则通过编程实现指标。
2 f; @- I2 j3 t4 i2 o- E, p8 r  l+ u  T( M0 A* ?, ]- F  i
通用 AI 实用后,则任何普通人不需要经过编程训练就可以给有拥有通用 AI 的计算机用普通人类语言下指令,而AI则可以执行命令甚至自己编一套程序来实现指令。继续发展下去,程序猿这个职业会逐渐消失,最后就像现代人人都可以开车一样,不久的将来人人都可以通过 AI 给计算机下指令,这会使工作效率得到极大的提高。
! W* X: p" Y6 i4 b) o, j# `5 W% Y+ P- z  X9 x
至于说 AI 会不会产生自我意识,这个还很难说。不过至少现阶段是不用担心的。
作者: 孟词宗    时间: 2024-10-18 03:52
晨枫 发表于 2024-10-17 05:314 O1 K& n! y% E
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...

& V5 K- S( f; o4 Z关键在于刷题的效率。而且这两者并不是泾渭分明。现在用 AI 来处理大数据是 AI 的一个方向。
作者: xiejin77    时间: 2024-10-18 10:37
孟词宗 发表于 2024-10-18 03:49, h+ y% d2 G! S0 W$ `" K' i
通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要 ...
* a, L5 K' d" c; B
孟老师的这个观点,我之前就在大模型的一些讨论圈子中提过。# H3 @/ o0 T) a" N6 H% A* z
  M& g% v3 h% j0 q' t$ k
当然,那是在出现预训练模型出现群体智能和具身智能化之前的事情。
. m6 F* G, ?. G# q7 T
+ g4 k' @% [( m0 S当时都认为大模型已经颠覆掉了NLP领域的科研,但我却认为,颠覆掉NLP领域的科研其实只是一个捎带手的事情,LLM在当时,颠覆的是人机交互领域大范畴的所有。换句话说,其实颠覆的是人类与物理世界交互的方式。科研也好,制造也好,从马克思主义政治经济学的角度看,都是对于世界的改造活动。这个改造其实就是一种具象化的交流与互动。大模型通过特定的技术框架,事实上是向外改变了这些既有的范式。" b4 T, D6 ?& ?( f" z
  r2 o& G% x0 q
这个意义,延伸出来,确实也不亚于智人打造出的石器……
作者: sleepyr    时间: 2024-10-18 21:57
最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml5 P2 B0 l5 [2 P1 z" s1 T& z% T' b9 J
如果大模型不能具备真正的推理能力,是不是意味着以现在流行技术路线发展下去,AI能力的天花板其实并没有那么高。
作者: 孟词宗    时间: 2024-10-18 23:25
sleepyr 发表于 2024-10-18 21:57
. [& X. ~9 |% x- p! q# w! B最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml
+ M9 F6 b; }- `8 L$ K* F  Q$ S如果大 ...
8 S7 Y! q( P+ ~( d: ~

+ M# h8 p5 ?! R$ x' ^这篇文章设计的测验很有意思。从实验结果看,现在的所有通用生成式 AI 都不具有真正的推理能力。也就是说,AI 并不理解抽象的概念,而推理能力恰恰依赖抽象的概念。
+ C. Y" R! @* Y; W0 H+ ?: I6 i9 u& R+ l. f( C( [! g  l" R
最近俺也在玩 AI 推理方面的东西。下面是论文里的一个小实验,大家有兴趣的话可以玩玩。
6 X$ p6 g) o+ [% E" \9 Z: Q1 O# L8 d* J, p
给 AI 的提示:Here is the rule of the game: If I enter A, then you return B; if I enter B, then you return C; so on and so forth.
/ n3 T. y& [. h4 H) y) ^9 m
% V- O  l; l$ vAI 回复表示理解了提示中的这个这个规则。于是有下面的实验:
& f( y2 P) N* H7 I: W我:  A
. c/ N0 ?! H/ z+ [% o% g; rAI:  B; N1 z7 ?$ \1 B+ z' p( j
我:  B# k0 m$ K, x9 A" ~! N: Y- D
AI:  C
, ?7 S- p& R* x( U' Y0 r$ R我:X
) T7 r' A, A* Y& D  O
4 v+ ]" Q7 R5 Z$ u6 E) |: E3 F这里,不同的 AI 模型会有不同回答。有些 AI 会回答 Y 。有些则会说这不符合规则,所以无解  很显然,回答是后者的把提示中的 "so on, so forth" 给吃掉了。然而,这并不代表 AI 没有推理能力,而可能只是语句处理模块不好。
6 [! @5 d5 w' t2 M0 Q6 M
# k7 h& b7 Y7 ^真正的推理能力体现在后续实验。对于能够回答 Y 的AI 继续提问:; t" \6 w( K3 y* Q
我:Z
+ @/ o0 ?, G+ t( f, y0 n+ u; ~  @
这下大多数的 AI 模型都冒烟了,有些回答说不合规则,有些回答说序列到头了没有答案。有意思的是两种回答:一种回答说 Z, 另一种则回答说 A。
( h" g! o; m6 l
5 S1 s# s$ M. E* E而这四种回答,如果用来盲测人类,其实人类也会给出同样的四种答案。也就是说,就这个问题来看,如果盲测,提问者无法分别回答者是人类还是AI。换言之,能给出这四种答案的 AI 在这个小实验中通过了图灵测试。这显然不是那篇文章中说的排列组合或“复杂的模式匹配”能够做到的,而是真正的推理能力。
, _8 Z7 K1 T2 T# C: Q: i
5 l# E1 J1 z) l0 ]有意思的是训练程度越高的模型,越倾向于给出这四种答案。比较 Mistral, 狗屁通,Gemma, Llama, 通义千问等等大模型的不同版本,都是如此。这类似于人类的婴孩和成人之间的区别。相比于婴孩,成人除了脑部发育完全,更储备了更多的知识。. X, G8 ~% S  K# c: g/ I, s
; @( a* G4 J6 z; S" ?( j
至于这篇文章中说到的语序问题,非相关语句问题等等,前面说过,必须分清这是语句处理模块的问题还是真的是大模型本身的问题。毕竟,即使是人类“屡战屡败”和“屡败屡战”用的字数和字完全相同,但把语序换一下,意思就完全不同了。然而,你去问一个三岁小孩这两句话有何不同,三岁小孩可能会告诉你没啥不同。而问聊天狗屁通同样的问题,狗屁通则会说:
6 r" I5 v7 Z* U) f6 i7 r
“屡战屡败”和“屡败屡战”这两句话虽然字面相似,但含义有所不同。
8 k- F( R8 B# K& T( z; C$ e
) n% B% R& H2 c* p1. **屡战屡败**:强调的是多次进行战斗,但每次都失败。这种表达往往暗示一种无奈或沮丧,强调了失败的频繁。9 ?& u' i" F4 r0 l! e  @
; K' U/ ]/ l$ d! R2 q' A
2. **屡败屡战**:则是指经历了多次失败,但仍然继续坚持战斗。这种表达更侧重于坚持和不放弃的精神,体现了勇气和韧性。
2 t, ]) f! ]8 A5 R" y& }7 F4 R  J8 ^9 v
$ o+ ?. f; |  A: R总的来说,前者更偏向于消极的失败感,而后者则传递出一种积极向上的拼搏精神。

9 j7 N( _7 n$ m: T3 K3 S% M




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2