TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview: }6 k2 Q' o2 ^2 c0 r; A, ?
' A1 l( h0 y; K& H
" I6 b6 g( G* p- Z p( P, A一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
& o6 w) G% m, y; g# p
+ n y% Z6 C* e, M故事是这样的。
; R$ ~& _+ {3 P \/ Z" u3 H
" L" N5 i$ A6 f; Q- r3 F3 i& u我今天看到这个新闻,看完之后愣了好几秒。! e: m+ U+ H9 ]
& D; F# a7 n# e t# Q一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。. ~) w# c+ n/ D
. [$ y3 [3 o4 q- d8 t7 o结果被一个AI模型给挖出来了。
# H4 E) @. c" [( V( N. g. X6 j$ u$ w: R4 g/ n4 I( j% h
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
+ o* I2 E2 Z1 M) D/ s+ E0 V I( y* C& A1 D. }
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。: I$ h4 F: T" s3 E+ \
. `8 ~2 k7 A% `! r/ Z7 [- ZFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。) `3 ~% ]1 q4 y* u, o
7 u/ u$ V/ a5 ^$ ^" C
然后呢?: D- T+ ]0 C* I7 t v1 j) c
, n" Z* u0 I9 M- ^" g0 f( Y+ v- J然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
x; i' Y$ D1 I& z6 F$ ]
# S1 `8 c) o& N' |# {2 {; M这个项目,叫Glasswing。
0 S' j7 N; h: u7 L0 t! z! G4 s5 \- e3 r( [9 {. J" M
glasswing
0 [" C8 O8 C! y, _. H8 {* b( F. h b3 m0 y+ p$ I* C8 C
$ J- S6 k" x7 X- W0 ]: E' b8 {- z$ l先说清楚Glasswing是什么。8 N9 c5 e1 K/ X+ B2 U
6 _7 ] T0 b9 Y6 k7 x1 ]简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
' x0 d0 B/ g# p' b/ M$ N: ^9 v' V- c7 Y5 ^5 N, V
有多强呢?
( [8 `, b0 g5 i9 i3 K8 G7 C. q0 z0 W+ `+ |( y+ ]. a* a8 {
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
, V% K1 H1 z! J8 J: Z
7 ` X' S( H' P pSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。0 [( D- S5 L- C3 v: L0 v5 \4 g0 p
# `$ \0 Y8 P' w& v1 p% c
差了13个百分点。& P# e7 L. s& m/ p1 t2 @) y1 Z
: `: N4 G f) Y你说这13个百分点意味着什么?: I3 q4 q2 w8 f% s
& S6 R6 ?% M& ]4 |! [意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
' j# A. }* W" R) A/ ~$ {4 u; O5 `, g1 ~( ]; a& S- u1 }
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
" d; [/ k4 o4 d: e2 V* I+ o' f; B1 @! P6 q7 s+ L
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
3 j4 H# S9 u1 J- C V) ?% i: {% p* b% Q0 c& \9 R; ?2 \
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
3 i, x' t# E, s3 D$ y
1 | o6 Q( o" j$ b ?4 l. O7 Y" v3 _OpenBSD是个什么存在?; T. L3 z( z8 I' n. B4 _7 P1 S
) ^6 S1 S# @ k% K2 C- h它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
# f. S9 z8 v$ u/ s; |
: H5 q" j4 ~/ Z D) D, q" n( M% N这样的项目,代码审计了多少年了?二十多年。
2 R" |1 b% H8 z- q& v" q$ L
. @. Y' `9 l- e然后,一个漏洞,在里面躺了27年。) Q4 U! s, c- s6 C
0 j$ y. s! Y5 P; m' ^
这说明什么?
& y/ K. n/ `8 Z. P& O
- }( E3 H8 I; U: X不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。5 f4 z3 ]) T X% u, w: O
( m, Q9 ~# |6 s; G% G但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
. d9 @, w. V6 ?2 p" w7 i2 e) @
6 L1 y3 B8 w: k5 Z# ~Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
4 y; r+ ^7 L/ h4 ?0 j" A
% [) a7 P/ w9 f, A这种漏洞可怕在哪?8 ^2 a+ {. t1 J* [4 k2 E) W8 p
$ o1 K9 a6 ]9 F9 N1 j3 `& z它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。; m/ r4 `# ~& g( Q! r3 U' K
, p, ^9 a; P4 ^0 I) _# c4 n t传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。3 {- o. b, r' y( C; N/ W1 k
. S1 C5 h" P- V" s
FFmpeg那个例子更让我震撼。( o+ a1 U$ A. `5 k8 D
. G+ [) h- K2 }5 t16年。
3 C6 N' ?, S6 i' r9 B7 L5 C
, }. \& b, F; k1 l) RFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
, d: l) E% R" X! @ W; @7 P; E' L5 `# l6 }0 g+ j4 g6 S, k
16年都没有人发现。然后Mythos Preview扫了一下,找到了。! c9 b2 G4 M' F* ?& Z4 e; B
. Q4 h. I7 ?, q( w0 |' ^( e4 R注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。) _1 T8 W6 y9 {% v. ?3 J) u4 I) [, p
! I0 a7 Q. E! i% p% i这是主动防御,不是被动响应。
9 ~: {( h3 M0 t2 m
( r, h5 g& e$ ~传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
; c: {3 l% q/ Q) }
- ^. l1 H$ i* y! C. hAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
6 m7 O- x# N; F# I+ i& Q! \! m! j0 E8 F8 l
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。& F$ v: |$ p# P# Q6 Q" E7 W/ [
% n) l8 l1 R" V$ b
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。" J, p K0 Y1 p, Q
- c* e* g- u; p1 W J. J' _
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
F" W3 J; A0 D5 f& ?2 v% j) {& n. h( x# }' N: p
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
# F' l) y6 h: \, \4 h/ x4 _* S# V+ k( I+ o
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。5 X( e2 L) v& R4 j4 @6 o% |
8 \. R3 s$ Z& t& A7 s' Q价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
5 {; |7 L8 ~2 r4 Q/ j. a. G s0 | a2 o( i2 j0 `2 I, a* \% u( g
这个价格贵不贵?
9 u% i; c- A$ _$ A6 U" `' {
# ~) K" k- B: h. n8 s对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
) o4 Z' ^! j$ `2 Z c' \, L. V
+ b3 r! @, D QMythos Preview能发现那些工具发现不了的漏洞。- q; @1 U T8 p/ a: s( x9 O& e
& O0 d# S3 J% Y- A9 t) `# S9 e
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
@/ e7 ]+ `5 W8 B' a! x1 J7 R( g1 q8 r2 y9 O" L( k
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
/ w2 I/ E$ o2 T- p7 y& Y3 t
0 S( J. ]! W: K# m2 t这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。- J0 H6 w3 ]+ w7 l* f9 J
/ V* @% f8 y- L6 NFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
X. g( B5 _* f
6 O, l3 H# S3 w* C# H还有一个细节,我觉得特别有意思。
' C8 p9 }8 M7 ^# A6 }7 J4 ] f: G! ~& b- U! _# x4 r
漏洞发现之后,公开披露的时间是90天。* p6 W# c. I( t D: v2 R: z0 f
/ U0 [' V- Q- O0 m! n( T% H
90天是什么概念?
" Q3 q; T4 g) q0 i- B5 i d
' K" j. w. R+ \8 N$ Z* ~行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
0 f; |( B0 E; @- s, q& H4 _, U6 w n
6 ~; w4 i; N, r% ` y4 N但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。9 l5 X( S; v9 _) _
# \0 v/ G' b0 _2 M# XMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
( n& q6 |% Y u* W6 l
0 r9 ~4 c: a4 T* j这意味着,漏洞披露的节奏,整个就变了。
9 a- A) d# Q) `" M% [/ I T
7 S$ ^+ N, s! m z) G$ a$ @. a7 K以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。3 L( I% m( n) C9 [
. h6 W. \6 Q+ h- V- J" n0 W/ N. I厂商的补丁开发速度,能不能跟上AI的发现速度?
) c/ T2 B$ o3 }6 Q* r. j# [' c& z! Q/ j8 N2 ~
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
1 p9 v. u' W% l! C6 x9 d
4 p5 l, e1 e* x: U; e; O( U写到这儿,我突然想到了一个更大的问题。
' P5 Q" P k5 X# g( ?
2 w2 B* m: m9 b: D5 J' y9 pGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。( N- \$ q* K4 S( J. ^1 s0 b
; ]) _4 I( Q1 ?2 x5 H" E# H, k透明,意味着隐藏的东西变可见了。0 p; ^; e+ F0 g4 y
: Z* @8 ^: `2 d( Y4 b
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
: q2 _" Y2 o( h$ W5 C
9 U! Y) S) d- a& U% E1 [) q6 \: E3 S这个意象,放在漏洞挖掘上,太精准了。: G8 Q, k, x4 U1 v- K
) V3 S* {! Z8 o/ A- M
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。7 v3 v( J) n! K# p# P# N6 h
0 H; b b! x* T4 w
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。* Q) z1 b6 d# g4 z4 |
, \( N% h: W( |- x6 x但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。; J" z8 M% u! E6 y2 W5 A. G
7 x: U4 i% s, L( M) F8 `2 N% a0 ]代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
8 ~4 ]% a9 Y; G5 q) A' S
* p& F- K3 o; Z# _* d, ~4 a2 B3 `这是一件好事吗?; n) n( S( c4 b+ u( s( p" x! B
7 v7 g& h1 }/ E. H" H
我觉得,短期内,这是一件非常非常好的事。
4 J; J+ V1 v. |% @4 u2 J# x
( z. i4 O/ R+ k3 u4 ?全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
2 L" b& U) b% L5 l0 k
( ?8 y- ?2 J% p. m. O- G$ _2 G这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。9 Q% {" \: Q8 _3 y
% Z7 L4 }/ r; n" G1 b9 K$ l7 |; \AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
9 y! [/ f9 e; l- D
/ d& _& x/ h t$ s; E但长期呢?
* ]5 | `7 l( M2 s4 N/ x. f5 @
; n8 \) d9 e7 Q5 G" ^+ _3 G当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
5 Z/ { ~- p6 v' |, [, E |5 q' q1 S
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?1 y+ V7 {# ?* I( @! y8 |6 }$ I$ o
4 x3 K+ d4 j7 M8 e
我也不知道。/ K& [9 P1 H" i4 H
; ~7 ]7 ?3 o2 C L6 j ~
但有一件事我特别想强调。9 x j, ^' C1 L; \# L
" Z6 B0 {3 I- v' E; m8 b
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
1 ^2 B- s1 l8 w; P. n. r( T% c! n3 n6 L
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
* U, ^6 u( S/ _. [& a
) N2 S4 P0 [# o: E他们为什么还要加入这个联盟,用别人的AI?
+ {5 i: g! q+ r8 j1 i3 f2 o! F9 X2 b) E! I: q9 e5 o
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
5 n2 v+ G7 _2 l% R" |. k5 u3 S5 h) a G s- C
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
0 v' T: w# h* ^; w$ b0 L
6 ^1 o( t: \9 A3 B; B5 e# W: QMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
* F' ?- b; A- T& X' _. J U" _8 P5 `1 O! C4 a
这是规模效应。
* \! k+ n3 q# g: X
7 T4 \, l, z6 Z. p就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
/ x. V9 Y: Q0 @8 J. V5 I$ g
% L; C# ?3 U/ H3 b这个规模,是人类团队根本无法覆盖的。6 s {) N5 @. A6 m5 N2 w
) v9 e( z& G/ C. [
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
$ M: I/ _; A$ e0 j- h. M6 K/ g$ k' j, P/ Y6 G
什么意思?7 \4 N5 M0 I! G! q0 O
% h# P* R/ s3 B. F4 \9 l
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。$ T7 x4 i* X1 q0 G# s
3 w- Y7 t( u% A6 U2 n
类似现在的ISO认证,但针对的是代码安全。' `$ I! T4 f) \& W# `: \% I
" @1 v6 s( Z6 E: Y
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
) Y' b0 d9 w1 G
8 q; O( }( o. F: ], Q这不是不可能的。
- S! U) e @2 I( c7 S" a5 M0 n% C @1 a
当然,路还很长。现在还只是第一步。但方向是对的。
3 r# @; D; F9 _$ ]6 N. h2 W( x8 i% M8 K1 Q9 q8 l
好了,写了这么多,让我最后说几句掏心窝的话。" _2 J" H$ r8 M# Y. I' s
7 y6 a1 M. P& |$ q% a* D
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。+ u: q @) \# \7 S; X+ v
9 H1 [0 O4 r, Z
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。3 A7 W! b A+ \, O. ?& Y; X
6 ^" } @+ p: G# ^0 k. I
这次不一样。这次是AI在帮我们发现自己的脆弱点。8 i: o: A! H+ t- m
# U0 I6 o) ?1 v- ^9 W8 p2 l( U
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
" m4 n- e* w/ x/ j! r: W( l0 ~: ~5 V# x+ y2 ~$ x- {0 Z& h: G: q+ ?
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
4 p+ A$ a2 K9 V5 A! R# a3 b& l1 {
我怕的是什么呢?& p( s0 X+ L M, t+ C/ u/ E
; n6 T) i& m4 T, U
我怕的是,这个工具,只有大公司用得起。
6 x& d2 N1 I+ P2 E6 S! Y$ m' G2 c+ `
. l) }% p3 S1 D8 hAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
- [* \+ k: ^- E8 C4 ]( f& k3 J
* h% n' I4 o0 fAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?6 g& C( i# n3 N4 u7 B
( }7 v0 D) {7 c' U9 d0 o
这些问题,现在还没有答案。5 C4 z, W; R& a$ l; I3 g+ w* B
9 d: v* i$ H' ?0 T- V) Z& Y但有一点我特别想强调。 S% Z! h3 b: ~& m9 \* ~
: U# ?5 P$ }! C a
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。( d2 o% O2 x# Z
+ Y$ ~1 `# H* ~; v2 G
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。9 S3 v* q4 C! }, w' Y
2 o ]+ h; b, |% {2 M" xAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
& x! a" ], C, U, {% o9 c6 A9 J
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
& \6 S) S. X L& T$ V; q
2 j- m7 Y' x* Z这一天什么时候来?我不知道。可能5年,可能10年。% J- ?$ j2 y1 |. q% |# C
7 U& F$ J R1 q; q
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。 ~0 |4 ~1 C: ?* G0 }1 |7 N& Y
|
评分
-
查看全部评分
|