TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
/ L6 ^$ L0 N! D0 m d
% S5 M3 {$ W5 D$ w' J* O3 Z0 t# R8 k4 @% ]8 A
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
& X* p* _9 O8 {; @
9 F8 z) I3 G# c) b: k7 y故事是这样的。
1 y; c# ~. A- J( n$ k" h3 u8 D8 T
/ ^, a8 A! M. q8 a我今天看到这个新闻,看完之后愣了好几秒。
7 u" b+ K+ a9 U* p3 |$ Q8 b
/ ^6 y0 J6 ^# D% Y! k$ f" r一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
E$ Y, r, l6 [ o/ b; B. E K! @9 S0 R0 \" z- g8 T4 i! n
结果被一个AI模型给挖出来了。* v# c- `+ k& A; M2 r
; T* [. i3 y8 ~5 R" x这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。, i" s/ |* [3 G/ r
8 U# ^( t4 D" [然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
7 C9 y% R8 i( Q( H! j6 M6 h9 e1 E3 H* F( i% E: F0 w
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。! D2 X) R- r3 J5 ~, Z0 ^
1 F( _; m. ?# N* O& l然后呢?
! f$ ^4 m. O2 @! {8 O, [
* N' E7 ]4 J, J然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
# y1 `; ~( L; Z! Y7 ~
# n2 p- x7 j: \! J* U- |这个项目,叫Glasswing。8 ?0 Z2 N7 A2 @: \/ Z( t% a
1 b% N0 Z# F5 d# V( o4 z
glasswing
" y' a( K% O6 ~2 Q
2 ?8 a2 A, v3 Z; [2 k9 Q, K5 O9 B6 y# z: b6 \/ K% |
先说清楚Glasswing是什么。
) D+ V, j, k9 n' K) X
& h0 u: V2 K7 Z3 k) P# M& U简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
# c0 v+ f; a, x, l a! W9 g- T: y9 }* J' I* {0 u
有多强呢?
( ?7 a( E- V- W/ c+ {9 T2 k: f' [
! {' C" v. [: m& F( d+ l4 [CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。- e* ?, N M: }7 s. S! d
; c! f2 f# Q4 v8 j2 {
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。$ ^6 D5 |, W% J ?* y
[: a: h( a8 s& t差了13个百分点。% O* ~& L) N1 C$ q- w* S7 j, N
6 Q" l$ c* v. }
你说这13个百分点意味着什么?
1 h" y6 Z: s: K4 k
# D& X% Y3 r5 e2 J$ O7 @意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。0 o! P! u# B& Z C
5 ?0 Q" j0 q; y. v3 D p) j意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
9 q+ t- `( M- E/ X$ l6 _& I c1 A0 [0 E1 U
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。) a3 K9 Z$ {* @* I2 q# ]
* N! R$ g2 O# S- l5 n* [
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。2 K" K2 @+ o( H
K5 b8 f! X; S0 s$ q; VOpenBSD是个什么存在?
! j7 P- c s$ W6 ` @3 @4 x& @5 z2 i2 ` [
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
' {& ?, ^+ A5 E" U1 z) m3 ^7 ~: ~$ L. j9 s8 P9 |
这样的项目,代码审计了多少年了?二十多年。& u' g; u2 O H Z7 F
+ z6 i8 O# u% ^- E( I' R然后,一个漏洞,在里面躺了27年。% D% f0 ?- N' G0 ] X$ M. @. }% m
0 d& S5 ]+ W0 t! |这说明什么?
. g X# h6 n( R4 a6 m$ e3 ^% B T
" F' N5 \, P, l' ]不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
7 Y5 }% @, r# I7 _. C# r. X7 s$ Q
4 a R) Q7 ?! e8 l; }但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
5 B! f" V2 P0 V) M- N/ t. A" t" c* l# g7 p7 N& \/ Q. ~
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。7 _- x/ A! B8 {/ L Z8 d
. W8 @6 m# E" M5 ^9 J这种漏洞可怕在哪?
7 Y& |4 I* [( W- ^) x+ P* J* E0 K: ]" }- U, q$ l
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。, w8 h6 |# o& t
; X* h; e" h# ?
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。4 H, E7 l, T7 l6 K. E7 ]
& q4 e. S3 |+ wFFmpeg那个例子更让我震撼。
1 U; A) I& V1 A( i; P" Q8 W; k. `8 P* E* S# d
16年。
+ i9 k6 p, |7 t: h3 m/ O G# x
, E6 O6 h& h% qFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
1 A/ q1 X3 `" c9 a. U4 v( P# C3 g
- t, x E: c7 q4 l0 P0 X' k( \16年都没有人发现。然后Mythos Preview扫了一下,找到了。
& b' h2 T) Z# |' Q2 B$ F5 U' T# L, e+ s0 v1 z N0 K+ ~6 M. V" b5 c
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。# I' Y6 ]6 o1 t$ j
. n& b' N# ~/ R' l# ?/ A, c1 M, |
这是主动防御,不是被动响应。
8 z! p; G8 Y, O3 ^( ^; I) }& {, t" H
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
) ] Z( m% n" j; Y1 f- N2 E6 X
5 ~# L( F. i, _1 n" JAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
& o+ w* Q: i" w% U9 y9 H* o/ [" @
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
# R0 e1 U* e! }& h& X+ s# J7 j0 [1 m
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。6 n) D1 Q' ]# `
, i$ @$ y6 l1 @: v TGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
: E2 s7 ?. I; v+ S$ W% T) m
& K: I- z9 r" ]* W6 X这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
0 h5 B; P% O1 T7 K$ d. u; w, E$ s% l: ]0 A0 i- c4 \
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
) o6 }7 c0 C) C& N1 k* d8 G# u8 h$ q0 s& F5 t; v9 P7 y3 [% q
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
$ _% {" Q: o0 k
; L0 [5 e3 S) W, o0 ?- b这个价格贵不贵?+ ^, K1 K# [$ d' x0 T
! e; o1 l% o: @9 k对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。8 H/ o, }, r; h; o& O) k
% X: ?5 v0 n4 k/ f1 T. v) @+ U
Mythos Preview能发现那些工具发现不了的漏洞。9 t: ^( ?4 x) F# L) R G
7 j- b1 [9 J0 H$ m这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。* q1 n: ?: |5 O5 D' r: ^% r; P* x- u
4 P8 F% g. m) Y4 L
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。1 W, F7 h0 X( P' i
, R6 z3 e. W& d/ Q: e. o
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
& H5 V' _4 o! s' i/ K6 t4 M8 f+ H, y" q7 x- u
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。9 j- Y- J0 H( e; j B$ G
' p% ]3 g# ?: m: G3 \7 c还有一个细节,我觉得特别有意思。9 Y! ^7 L( c3 I' I3 k
, I+ J/ `' b7 g
漏洞发现之后,公开披露的时间是90天。( J6 e1 `& Z" ^! j' ?1 c( Y
) w+ t- t0 B, H$ i90天是什么概念?
. Q: j1 v X, g
0 g6 n! ~$ V3 |5 d行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。1 x- V# G: {1 q9 n0 |; b7 H( a
/ q2 s8 g' C: T但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。. u! N0 R2 X! c* W, L2 h& m9 a
& K0 F8 P$ x# `9 s8 A2 t7 @7 LMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。$ n5 a# X4 w+ ?0 R# z' r
! B/ H9 U* [- }7 R9 m' k' q这意味着,漏洞披露的节奏,整个就变了。
( c* Q7 {5 H- h* W4 F" a# A& a! x# T& x8 m1 H y
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。$ B- a3 e6 y2 V' i+ Z8 M b# _
0 { \+ L2 w9 g! ^8 y8 w
厂商的补丁开发速度,能不能跟上AI的发现速度?- t4 E6 a( x. k/ z3 S8 X0 B8 M
z& a. X7 K$ a2 K
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。4 Z8 ^$ s, B: g8 C6 o5 c( T
* h4 E2 w8 ^/ J0 ^/ X( K* Q% E写到这儿,我突然想到了一个更大的问题。
+ V) ^% J8 c9 M9 P+ v. n# A$ k; t8 ?1 g7 J3 _
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。9 h x/ y5 d& y( |0 i
0 {% k Y1 ]4 o* A
透明,意味着隐藏的东西变可见了。2 l8 N( X( J% d- J. V% |- G
+ A+ t I2 C% T: }9 u4 x, b
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。) I! `0 ^7 H R) ]- v0 F
6 A6 k, {/ I3 p9 |5 {2 I1 ^这个意象,放在漏洞挖掘上,太精准了。+ i2 N1 \: I8 ?
+ d. |& Z0 Y8 g' u/ p( f3 L1 P
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
1 j1 G- d9 q* Z. g
" ]$ t2 ^3 U& x* {以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
! D+ ^: Y" M! Q4 j$ X: F
' J6 l2 d$ N! F; Y9 p但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。$ b; I6 X/ O H9 I0 f/ R0 s
# x( E& G, o% E8 C3 ~
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。' z1 u$ }+ Y# q$ K* C
9 O5 k' a; ?' C5 \1 F6 Q
这是一件好事吗?
5 X- @" {$ s; x1 |+ ~1 R: E, x1 q5 o" `
我觉得,短期内,这是一件非常非常好的事。% `" h7 n# P' I5 B v
( ~0 b K* o3 a2 E! l
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
# o3 J% @1 W4 z. o1 s' a2 x) \( R# Y1 A w" B, R |
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
' c4 C6 Y3 |# g8 U: t
% s3 E! W2 W$ z4 LAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
+ r! X7 S6 ~2 ?8 {$ r$ B+ |2 p8 y& e) t4 l a) N6 F8 {$ p9 s
但长期呢?
9 a1 l8 O& w( u1 L/ T0 l. u a, B. `
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
; F- a2 D& p% O& x) y2 Q `) C3 }. W, S/ ~+ [9 G
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
" ]' j! u5 d3 B; h) O7 J: d7 W2 |! f1 x: _+ d l: L
我也不知道。
: }, \( b8 ]# |0 h3 \4 k c+ G. h3 F6 ~9 j! o: u- m' i4 e
但有一件事我特别想强调。& d3 y( D/ p# c) b. `
% G N7 g6 P# B! {: J# Q
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
" Y& ]1 S# Z( c. ^0 n9 J( a
" p+ R2 g X `9 b' L他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
. `# T; L4 E7 L/ l& M( Z* r2 p8 k; Q3 z Z& |( V {" y6 _
他们为什么还要加入这个联盟,用别人的AI?
% `7 r8 n4 I& J! e, ]5 ^) f: {% y: C8 `9 e- N
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
9 B9 `! p3 E' o' H% o7 [ S& @# e4 D" P% b
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。9 g, W1 U9 C5 |- @. A0 S( \4 u
) F- e, A! b2 \6 R
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。0 l* A& _ T: S+ n* m) u
' o* H7 s! H0 B$ ~这是规模效应。
0 O4 L+ `) m8 N0 w
, o- y+ `3 J1 z% l4 v9 `就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。" f) n% O+ Y; ^$ ^7 _
* u$ f% s2 h2 \
这个规模,是人类团队根本无法覆盖的。+ b' H4 x( M+ |# Y1 n% p
# a8 @5 i4 ~) @" R, h3 s' g; ?
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
6 q4 C/ }- `: P; \9 {- w/ } {
6 r/ ^3 x( L: z7 R9 Y9 Q/ L$ w什么意思?
( N( {, t9 n4 G2 L
3 p% P% o! N# y. N4 U; G9 ]现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。. p3 ` z1 v1 u
( e7 [* v' [; `( r, d4 `) N类似现在的ISO认证,但针对的是代码安全。% c/ F7 o' h9 s" \! q3 m
# j; w( |: L' Q; C; a想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
9 Z1 d6 Q- s% [8 N1 z2 m/ e( v0 k6 j( P+ G% z( H- K
这不是不可能的。1 ?# \4 z/ f7 h. g- s
% F/ p; T8 m0 s. T- t- p+ R当然,路还很长。现在还只是第一步。但方向是对的。
- q% {/ F7 |& Y( N3 U' J, f8 W
! ]) q; F1 w1 t好了,写了这么多,让我最后说几句掏心窝的话。
- v7 T3 Z7 s& o* u8 _5 a6 e+ b* q- k. K+ s1 B
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
J6 L: |0 Z$ U+ R+ h) O& j2 K& }6 Q5 l$ O+ v7 f4 ~3 d1 a/ u
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。& ?8 m, {8 O: E( N, Q( `
6 ?" x; s2 O$ m- e5 o6 z) L* s; Q' I
这次不一样。这次是AI在帮我们发现自己的脆弱点。. `1 h9 @2 d5 G/ \1 }
! }, T4 a8 O6 E, F这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。! D; I( s8 M1 E. Z
" X; W9 e, i) [! D) t& r2 {
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
& x, L6 `1 A3 K. E) D. S/ j6 a t y+ R) M" E0 a
我怕的是什么呢?/ i) ^) G& w R' i" ]6 c q
1 @4 z) U" \; E c" C
我怕的是,这个工具,只有大公司用得起。# a) r$ r: j. i8 H
# z/ V" |5 A6 j XAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
; K/ w' v* G* A% J) y
( f& P% Y/ s* L2 T' m- s5 C2 bAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?( \# h" M; r& t; g0 b( r5 H
: B) @( J4 Z% ?; g, @# \9 N
这些问题,现在还没有答案。
; X% ]2 h, g9 n
% @4 N$ g8 u8 [, g但有一点我特别想强调。
- J2 X. A$ l, Y8 I) F1 ?1 P. U9 \% ?3 g' _
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。7 m" V: W$ B4 x8 s7 r
. z, G: w6 v! d- r5 x4 f% M4 V以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
( E+ n' l0 {% W
: @+ a; |( o; D/ a4 ?AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。& Z- ]6 W4 x: }# N+ f0 C* R
+ W( r. P; ~2 E: b% r) m$ x0 E当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
: Z% F- I" \# H- C7 M7 D. P/ o
7 _$ S+ x( v: r$ |2 g# A这一天什么时候来?我不知道。可能5年,可能10年。& m9 v+ o8 z- u' b1 F
) e) Y9 B$ `' O, Z2 G. M但Glasswing,让我第一次觉得,这件事不是痴人说梦了。6 {5 \6 U7 y, _7 `- N& c' s" J
|
评分
-
查看全部评分
|