TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
8 p& X2 R Z5 S- d: u# b, q( A2 j2 M
: c- X8 X/ Y* D; N
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
9 H: k7 ~- V, [$ T) j4 C% u/ ]
1 x% m1 S$ d ?& u+ O故事是这样的。0 p+ v4 q7 G& R' X5 w/ }
q- r0 ], Q, a! K我今天看到这个新闻,看完之后愣了好几秒。7 i2 T; |7 }# \
$ Y" Z. y5 O: I$ q; H5 g. g
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。6 P! D8 A$ ~# ^' Z7 [5 @
2 f, g5 F' I& P& i* H A结果被一个AI模型给挖出来了。+ Y) b" I- k, c
( |( j/ k# ?" F% A0 k2 i4 z这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
' l6 O: R$ O6 t9 n: O& h; s, n4 L
( G$ f# d" W4 W$ Q/ f3 i然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
! @+ E& }( v& R8 H: x; [3 _$ `/ C6 o9 @1 ]9 E
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
9 y/ n) O+ K M5 C4 |7 e+ B1 j. ]- |& g3 G+ y0 u7 o0 g2 z% {8 E
然后呢?9 z% O$ s2 [3 d9 k# Z9 V" a
, `. s; k' f! U; v* w然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。0 O. o7 t& P" t8 L$ ^- x
4 y* F; \# T$ h* \$ E) {. ~这个项目,叫Glasswing。% \% ?+ I. X+ ?7 d. n( G
' t8 o- x" o) a
glasswing" d/ K% g1 g; l5 w3 N
& i, Q R6 r( r B9 M
" W0 [! w) h* W. n# P" N先说清楚Glasswing是什么。
1 f/ B$ o; b- u7 W: W1 W7 i6 t$ O+ L" Z. F
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。6 J: D) B6 ^& g' ]% T
2 @% y+ Y# ]6 h- U. g8 k) W有多强呢?
1 p+ v8 Z) R2 \4 N- F. B& M/ ?7 ~& E" }/ }5 X4 O0 _, ^
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。5 G( l3 D4 [: g
) ~" l% v% F6 _+ v. f! O( _) p5 HSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
0 p+ k9 p1 z; `- ~( Y) x* R8 Z
$ t; @' J9 w! x) e7 D0 U! E/ v差了13个百分点。; p# B7 V' p4 K. \* }+ Y j
4 W& K( Z9 W2 \3 x$ X7 v- v
你说这13个百分点意味着什么?3 e& E- Y9 _- y1 P# U6 ~
9 R; R/ U5 K* e, h3 e- }意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。1 @3 P* d' `8 R) _; X- }
% }! }; ?! K' y% F1 ?
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。 J: A" S0 E+ ~' w1 m0 _) ^
' u7 y# Y5 K2 P2 D" q或者说,这种级别的漏洞发现速度,会比以前快几个数量级。/ ~, j: w& q4 x9 O6 I9 i
4 I" B/ ]. e) Y) N, p7 t0 V说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
2 [7 V% R* h0 ?, N0 m0 h
& |; R$ B% A5 F( |3 {OpenBSD是个什么存在?
7 @- m8 u" ?$ S0 o) Z$ h& [7 S i1 D K) x' W0 e
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。/ e4 _, P; g9 ^# }* |) H! i0 g
3 M U7 Y4 A8 D2 \- U这样的项目,代码审计了多少年了?二十多年。
: R5 i6 g5 s1 u7 ~0 v p8 X) z( _' B* l! s9 e# Z8 D: Y
然后,一个漏洞,在里面躺了27年。
T7 k: A m! g0 I9 s# V& F! g: y* b6 A( A- `/ A
这说明什么?9 ]' e5 G8 c+ A" U8 C7 ~
. x0 E/ I6 L A% C" t$ r b
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。9 U- y, I- L0 v7 }
, k/ _1 U; J; [0 Q, _
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
/ w$ ]. ~; k3 Z$ d1 ?3 G+ ]
0 U3 |/ d, Z# sMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。9 ?+ s+ z U( L
0 W! V2 K# r# q E/ [4 u
这种漏洞可怕在哪?
: d" C9 Q P: T- G
8 I9 j; w- }' Y. y它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。, \# q4 b" n, e) S
5 E+ F' L; c: v5 N9 u6 {1 U
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
5 ^: T! J8 V8 P$ V9 Z* B9 i
* Q h" a# I8 s' J4 {+ @FFmpeg那个例子更让我震撼。! {* b8 u3 K! d) }5 D* H
; h6 t, C0 N: f/ [0 R5 b4 P
16年。
* k4 h- P' t# _# u: P
' S8 y. i+ b M. s kFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。& |: f, X5 p1 V$ l; w1 [7 S
, B% O& |, x8 k! o, [4 P16年都没有人发现。然后Mythos Preview扫了一下,找到了。. n! t- R) C' B" @, F( J: `/ N) f
: ?& U$ u1 {! A# Z0 h- k' H ^$ e5 k
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。6 o, p1 b+ u$ J( e
3 s8 {6 y0 h, c# _8 H: g7 g
这是主动防御,不是被动响应。
0 G( Z- U& c4 q/ m$ { y4 G* ~* A9 h8 I5 h, ]
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
/ B+ c/ k8 S5 D5 ], S
- @1 |; u$ O2 F/ p% d3 eAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
. Y9 _$ }& y8 t/ q9 @, X2 J
- t4 D7 h/ Y" R5 q' @( ?0 T5 v1 |7 x这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
3 F j2 D8 G4 @* L* Q h2 u0 B, o2 b% O: C
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。! g! Q& w2 V2 {0 r3 I
" m0 O/ N( |' }- T& qGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
8 q. l& C. a( h p$ T V! q$ z
5 j8 R5 O7 A0 h; a; `! ~# L这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
C+ Y8 W8 Q7 t( o
; n6 [! T8 c4 |2 A你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。) t% |; M) s6 H$ _* i
# p" d! X5 h/ ~! T价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。& E. |2 S! m% @
: x+ G( _1 H% E% B3 @
这个价格贵不贵?9 ]+ s6 }" n& L+ n
/ ]% H$ v, |. C3 s* _% D7 [: _- D4 q# X3 e对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。: K! b6 _6 m6 |/ A
( F. @' L/ x; G1 U6 J
Mythos Preview能发现那些工具发现不了的漏洞。8 @ a0 ? l O% G
+ Y* i& Y4 t( _/ C8 Y这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
' w t0 l5 C: T9 A5 a
1 T( V6 h. J3 \ C; l' d另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
7 S1 I$ t+ {7 U! Z& f
9 O9 w* L. d' J0 e. A这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。, x1 j5 x5 {$ }
5 y' |* U4 U! b' }
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。" K, N J: R/ R7 ?, D
- j: f$ m! H, K8 E) t! `. A还有一个细节,我觉得特别有意思。$ j; D% h( l: l5 {
4 f8 Q- d4 N4 E- `0 u7 P/ N1 I+ u漏洞发现之后,公开披露的时间是90天。) j7 f! T2 J5 T$ Q+ h; D
, m/ a7 e3 L* W, M$ E
90天是什么概念?& [9 ~( W% c' {4 V1 L+ m x- {7 c
, [! u' t' C N0 H+ `9 {# ~) a行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。. Z! t* K$ v- f* h
3 g( l) l! n: m$ q: j但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。/ v/ I! [! f9 m$ t5 @
* x6 R5 _+ @6 @; _7 X2 w# j
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。0 Z9 `, c# |5 S- k
: o. v& k, A% Z* \这意味着,漏洞披露的节奏,整个就变了。
% Q% \9 F( [ b8 V6 |# {1 @- n; s, x( c4 ^7 O, ~6 M3 ]( [/ O
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
4 U! n8 ?* x* I7 t
9 d+ q% O" s7 u3 }" r厂商的补丁开发速度,能不能跟上AI的发现速度?+ U i5 w$ z0 I* u4 o0 w2 I1 _
3 J }' w$ A6 ^' g这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
. p+ k/ c( u' c0 | D- D! B* z; f5 L
写到这儿,我突然想到了一个更大的问题。
9 i5 q% P% f! N. D0 y/ ^6 B. |% s, C2 K% i/ j- ?
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。5 @6 p7 ], X2 d/ g5 E: L
5 w1 V2 ]3 n' Z& V H
透明,意味着隐藏的东西变可见了。% D2 E, H( O6 M* U3 q* s
# v% i/ A, v: \- [4 W2 F! i4 }
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
$ w7 ]: a/ R9 O1 }- V2 b5 B3 Z; {1 D* a" h) q2 Z( t5 e
这个意象,放在漏洞挖掘上,太精准了。! G2 r" G% {1 K
/ U0 f. B* x2 u4 ~9 [/ e* o8 P, A" l代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。( {3 N ~; j, h/ @( J
# o+ J: `& Y b" J$ ~以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。# F4 ~7 @* i# R L! N
" I* e" T e8 P& d- `5 o) R, Q3 w但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。- P E7 n4 B7 n
/ `3 }& z% C, z% S) f代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
* M- s+ p- l- C. F# t- u4 R! B0 `" m
这是一件好事吗?
. b; B& u' W" w0 v6 ]& w5 R& d7 f: _$ Y. O+ k9 x5 M. b# R- \% O
我觉得,短期内,这是一件非常非常好的事。
9 B. X1 [5 w2 J& W* p8 J) |, i) ? h7 H% d; e& j
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
. e/ m' ~6 w7 l2 E+ T5 L' X( O# D; l1 m6 S& V
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。! N# D: s5 R7 P4 y/ P
" e' _4 f! P# }' L( o+ z( b
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。6 e( T% i7 X+ G# V, A) X
- z$ Y5 { b" s$ }7 v但长期呢?5 G9 x& g1 V+ V- R
6 _5 A( \: V2 ? ~2 p9 @, ^/ ?当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?8 y% p$ W2 ]! V$ `3 w
" Z% R& o4 ]+ c是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?4 `+ f) W2 p* m! M( d4 \8 i& Q
- P0 m* M3 l" ?我也不知道。3 o! R% E& r; |' R% Z+ y
7 Y9 ]& V0 a& p; p& j5 Y- {7 M但有一件事我特别想强调。
! i( R" e: q' ]1 b) l' U, f3 ^
0 h3 _6 t( I3 R# `这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。$ U, c2 [9 ]0 a; z1 y' I3 z
, }, K/ \4 u5 g5 V他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。2 S: F$ q# G y
t4 D; x3 J6 q8 B( r/ j J他们为什么还要加入这个联盟,用别人的AI?$ R+ Z. ?: S8 \" f c7 X
( N" m: m2 V9 x2 x1 u. T" H我大胆猜测一下:因为挖漏洞这件事,规模太大了。$ G7 D S4 A2 F% T8 \) ]
8 `. z' }* L( r2 R* A$ t) b
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
' S5 h1 T4 ~; Q# i; h0 E
; b+ i t' h- F; NMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。* f2 a* }& c; _6 D
- x. u0 Q( n& M2 b1 t k0 [1 ?这是规模效应。$ S7 i# R3 V* N- C/ z x6 z6 R
* H/ C$ W5 `' }
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。4 y3 t) m3 e5 c' q7 V" P: H, d
$ X, q6 v# [0 F& v6 d7 T! J: H9 _4 y3 Q这个规模,是人类团队根本无法覆盖的。
9 q- y( r; W' ^% J j
% a! B- I( ~8 {9 BGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。) @, q) Q+ ^; {8 c! L
! s0 ?, @( i+ O# r: t) g" z
什么意思?0 ?& ^. S: |3 ~1 K$ ]
2 y- O! d, o* a( f( @
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
8 v; s! s: ?/ X: m
- k7 `& X1 ^" h/ N. c类似现在的ISO认证,但针对的是代码安全。) Y" y' X3 g8 T* j* V
& U' n' R5 t# Q, d& ~- K- I! u
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。9 F: P3 ?. [8 Y$ }
! J8 W) t4 N; u3 T7 z
这不是不可能的。- o4 {* H8 P$ ?+ l" ]& Q
4 Y e! K, B! \当然,路还很长。现在还只是第一步。但方向是对的。# w0 g( U" z+ B( q& a, `% j& Q
- u, r! q9 D3 O: N: E/ D好了,写了这么多,让我最后说几句掏心窝的话。9 B% f: u& w5 ?9 _$ ]
$ ?& |' N" c2 l( u; z2 D
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。. M- J& Y- A( F0 c0 }6 ^
+ P7 \3 {# \) }8 n1 ?% k4 G5 p( I兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
g$ @2 `+ j8 Z
* h5 _$ C2 O% \8 ^' o6 R) {这次不一样。这次是AI在帮我们发现自己的脆弱点。* d0 C$ [0 m1 H; B4 ^( t2 b
6 z: N, d A V9 h' e
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
# q1 i% O f/ _% t+ G" e5 l9 e2 ~# L
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
* {; Q$ F" L1 C: z; [# F* ?6 `3 u- H/ @% o. t* K7 \
我怕的是什么呢?
3 f' h& g* N* J" I
^% J8 o* r5 G; P! l8 h我怕的是,这个工具,只有大公司用得起。
% ]& ^, w& A: o2 v" {: P' _4 G- n3 |! o5 s u, L
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?' z# B$ U0 J$ C+ n `4 S( S6 H' n
+ D9 u1 w1 _. H' G
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
* k5 ^! o* s/ d# u- g9 D( Q( x% l7 Q) ^3 ? s0 K/ N8 J9 Z
这些问题,现在还没有答案。( z3 q; T& w. I2 M& V8 K2 P
5 H: e! W2 x" V" l1 J h0 l6 ^
但有一点我特别想强调。
6 ~ o! X( }3 x* y: g, {; ]1 B# _
' `$ t) r2 g8 I8 \: N1 NGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。1 H) Q7 D# z& R6 g$ A1 P
9 p* I2 P, S! p! J d" W
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。6 Y/ R8 H8 M0 |: _5 I5 B9 V, _
/ b6 p! J6 L! yAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
# ~% _* P4 P" [2 ? K c+ [: e1 O! k# |
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。7 u1 c# k( y6 X# R
i/ u$ M' D+ f, J
这一天什么时候来?我不知道。可能5年,可能10年。1 w! [+ } u2 t. v7 w; v% u
: Y, L; S8 L0 Y但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
; l, |& G8 j- i |
评分
-
查看全部评分
|