TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
& ?1 J. f# ~# U5 n0 {
' H# k+ W$ |, t2 ^3 \4 i/ b: v5 f7 r
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
6 s- P7 y! t. g, U( m* _- |6 S; N2 G& y* s0 _/ r& d
故事是这样的。
* j1 w8 X& G1 t+ s) z# q% H5 [* S% K* c) A8 ?' Y6 a: o
我今天看到这个新闻,看完之后愣了好几秒。& Z0 ~8 P" l. x
1 Q) t$ o5 @: b: v& L/ v0 O5 ?
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
# j- o! K1 l. a8 T8 m% E% M0 t. w8 x" w/ J' W0 y b5 s. T
结果被一个AI模型给挖出来了。( h# J7 J8 v: I6 l+ t) R8 ^
; p$ [8 P6 E1 i* p$ w这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
% S1 b% i- A. R5 a' @; ^* x7 W: y/ J: E0 E
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
7 U, q4 r2 v/ ~" w: |3 o+ n+ U1 k
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。$ L$ n7 _, @: @; K* I, k6 |3 r1 r
8 N, N/ L. X- i然后呢?
) |+ u5 U7 ]1 c- J1 w/ f/ o/ H/ u
3 E( z! u6 P4 S; F% [- }0 w8 d7 Z6 L然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
7 A1 [2 A A4 I v% N' K: d: b! Q
) B( ]$ a4 F( S6 v这个项目,叫Glasswing。
{. h* R! I! u4 g$ W, b7 Q: R* v# f2 z, Y q1 Z
glasswing
* d# J) g1 R8 U# s" C2 d
! O O2 A7 D5 k0 V3 I
# V* E$ w' N7 b, t- h7 K- v先说清楚Glasswing是什么。
' x- {: V# `# M& n/ @/ d C/ V
# S* O" } O9 l" X: ]/ o简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。, q* X) b3 L1 b0 s; X1 H
6 q; [4 t& c& M1 c4 l! ?
有多强呢?3 W% G9 z& m- x
2 Y% ~8 q9 ~4 J; U+ |+ N) }2 [4 v
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。/ x4 C/ F) F5 K' q+ H, ?
: O! A. r( a1 s+ P) r' }/ m
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
" k$ {& ^5 o% Q. |( B# n" s) e m
' i6 S6 m# C. I4 G差了13个百分点。( M2 u6 r" k$ G% k V$ n: {( I7 L5 W4 s
0 A* F$ ]! Q. L( M& j) f4 @
你说这13个百分点意味着什么?
6 ?9 H1 K1 y5 Y+ m% f8 K% p6 l* T
: V7 \/ T( W) e意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
6 z% }( D6 W( f& |$ t" z4 [, {; i3 H3 J' X) I) L- p
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。: B) N+ D! x7 C1 M2 \1 \
+ P' k J/ c6 x- V8 ~5 `% o& _' X或者说,这种级别的漏洞发现速度,会比以前快几个数量级。( l+ k H$ R2 O$ `) Y: j2 p D
1 `. X* e+ E3 i4 S/ ]; T$ f/ i说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。% L9 \+ D3 ~3 u7 y" R
/ ^# z' r. V8 U1 x" IOpenBSD是个什么存在?+ k1 O) b3 I8 j! _& w$ C
" l* J6 q y. P7 f% J o/ g) h它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。* X5 U9 Y9 @: n+ o9 O- J
! Y B3 g! ?. \7 E) p这样的项目,代码审计了多少年了?二十多年。
; ` J5 S! z% [3 x) ?2 e3 l! S C$ x& A0 i3 Z4 V' W" `6 f# j
然后,一个漏洞,在里面躺了27年。; g2 O% o+ L" ~+ i$ ]
+ e: i t" K: T4 Y" d; z, w% B这说明什么?
: F5 I# T$ |7 E& k# g# Y% L b
) K# L4 c3 q4 R$ q* j' S1 K不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。! ?+ A, K4 z) _! Z8 J5 e+ ]
: P& L% G H/ p# S- C. K# f: `但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。7 J" y/ c, K( y1 _
& U# X. `% l! ~$ n9 N! Y
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
8 g8 V) e X9 Y9 e/ O% w- [7 @$ ?/ ~- q" ^4 F
这种漏洞可怕在哪?5 u6 [, | A: t$ c7 [7 y3 B
8 `( V2 v4 o- O* R它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。! I- k$ j* N8 o/ s- T& Q
- ?" [' A2 [ }/ v
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。9 V* Q( A6 y; V' Q: t% ~$ \' p7 W
' `' i. J6 M6 ]0 O) a8 m- o- W
FFmpeg那个例子更让我震撼。
0 n8 [8 g8 g6 x
2 y, \, a- v3 R16年。$ B$ L8 ?( A c7 J
4 W4 |- @" G% w4 K4 E. P' P2 gFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。7 y1 Z; c7 m( L! r0 v; A" A
" W0 i6 ], b8 R0 @16年都没有人发现。然后Mythos Preview扫了一下,找到了。) Y; F! l* ^! j( x. U A/ ?
: Y+ V4 k- N, `5 I( f
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。% P1 k5 h2 b% x! i0 R
3 Y0 p& S. ^5 }, K& ]8 g9 Z3 A2 J) N
这是主动防御,不是被动响应。/ R& c6 K: M1 J: W8 x' K# W
2 N3 _& \, m7 ^9 a' ~传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
; d: i; k. U- ]5 r- j
1 Q6 G, S4 W" c$ j- T a; fAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。, O9 c$ c" b7 t" v" t: s! P
, m6 i' v* K; Q这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。* e# v1 b# m/ c1 w ]# g
; ~0 {9 H% S+ B$ p7 x3 N F" C$ t现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
$ u" h1 b0 i }" q& u9 [! J/ L9 h8 |
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
% D, q+ J6 R8 C
! {6 W" b) }% P+ a: l这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
' R; a0 T; B5 ]* r
% J2 z8 l* ~0 K/ K" @2 q3 f你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
) o8 B( F0 M* p2 q# G
2 o* g- r; b9 Q! i( G价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。' x* ^& `& B; S; Q
4 q2 J) H1 W* t: F
这个价格贵不贵?+ x: S8 g2 q2 p
) f" Y0 Z; B5 x% {
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。' w3 ~! g. ?, N" m* ?" S6 ~" e2 ?
0 O9 r3 M3 G* r) _9 o
Mythos Preview能发现那些工具发现不了的漏洞。7 n4 ?9 y0 X* G# Y
+ L) t" e. b: s" _& _$ p' y- A3 X
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。4 p& t9 R7 r8 A' |
& Q# G# H7 e. K
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。 ?% \& R# Q7 K }
/ B* |) i7 C a. z
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
( ?$ l1 R3 H) w* E
6 o/ H3 y* _" q1 gFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
& s5 r+ n# l" l; s! w3 b3 U- S& }6 f+ s" A4 l& k
还有一个细节,我觉得特别有意思。6 H; p& A( Y' y7 t5 @
* M: |# S9 s: n& }* O漏洞发现之后,公开披露的时间是90天。) _* D- P$ |' c* F; T5 A( s* k( [2 {
. U" {8 k# l+ \0 R( n Y( r: T: v& P90天是什么概念?" s( ?; j5 ^* @: A5 d g
& t: U) H8 H" g# P) R6 R' _/ A行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
" j- K1 Y! N$ r( }. ~ V7 f8 N
但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
8 {9 p9 X" }% }. e+ f6 I, o n. G; Y# ~% H: t
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
# e& I5 x/ b6 y; v# x& J( {" v; \- f3 d. S# B
这意味着,漏洞披露的节奏,整个就变了。6 P- Q+ \/ s4 c2 }9 I
, m* G6 ]( K; U
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
8 t. {% P5 p# A, C7 Y
+ \* j& |6 d$ A5 I+ D厂商的补丁开发速度,能不能跟上AI的发现速度?
. X S0 r: G, t# n- R5 K& |
' `, t" X# h1 k: w* v这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。- C8 K t. |! F! ^ i- w
, r6 I+ W, {7 Q ^' C p
写到这儿,我突然想到了一个更大的问题。) b1 X5 B3 y2 I, g/ O
A9 a& M/ Q" F n( ?Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
) l% ?' r6 E2 j" F+ i. e
p# D7 u$ b; h透明,意味着隐藏的东西变可见了。
! M- e& t* w4 E4 E3 U5 x5 h3 X' r7 Q+ f2 X) e7 Z8 r
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。( ]0 d, `! k `+ ?4 J& E* o
& `' j5 c: U- M. O3 {5 E# t这个意象,放在漏洞挖掘上,太精准了。
% ], r& K3 h+ T5 \1 t) Q' J8 M
4 M+ E, s; x" ?9 p9 g/ n7 K: c* I代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
. j2 |" c: T/ J5 Q5 i1 ~: [: ^0 N7 {0 C# o/ W
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。) a! x$ }3 j3 i4 l! {
1 g& k, c5 m1 x2 ?
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
6 o' \% O/ J9 ]0 o: z. G4 F% V8 U" f% F" v7 i) i
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
/ M" [6 I7 O8 x2 q# {. e- m5 Y
, \& z7 G( M" w这是一件好事吗?4 i9 k8 P6 ]! F5 p* y
4 `9 X% h* a: r" Y/ \
我觉得,短期内,这是一件非常非常好的事。0 Y& k$ _9 g' v Z+ ~, C
- E" ?) R7 E% Q, \4 p, T5 _全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?: ~. \4 O5 e. o( [) F' L; f, } W( Q0 F
, Q" X: L& t5 R) Y: ]
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
' z! w( f D+ i7 S N! x
- x2 Y* }8 L# S" j; x% U/ b/ mAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
7 O" s& M. u* d- C% ?6 L4 e$ ^% ^+ H4 O- G* ^- t6 T; a
但长期呢?
" J6 U- W3 K. U0 x8 O6 E
% Q! q2 p2 d; B/ O+ |当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?! i4 O! |( U4 D$ Y, u# n
% M6 o& t: H! f9 N
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?1 k( T9 S8 P# `3 m
7 b# G) F& R- _5 X9 a+ ]4 y# A
我也不知道。7 F2 _3 u6 a/ w2 v& C; ~3 q2 r; M
G- i$ o- k, A# ]
但有一件事我特别想强调。
5 g' ]. j8 Z$ \" _/ G
6 z' o6 s8 [4 v/ Z+ E! o+ n- j这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。# P: z% g _# a) a; z! H" y2 s+ I
- W1 Q; s+ |: _2 t3 Z9 Y1 l; i) r v他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
, V6 p2 E; {. L( [3 U0 A3 i$ E' m1 A' p8 t. i
他们为什么还要加入这个联盟,用别人的AI?- M# y$ Q: G0 S
/ D) K; F( C. C7 [我大胆猜测一下:因为挖漏洞这件事,规模太大了。
3 b0 Q! g3 P0 ?1 H( Y4 l0 z3 W c6 h7 @) C. s& v
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。" } W( t5 M7 J5 G# I3 H/ N
# v { z6 X* Q9 k- z
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。% G( G7 L+ C' P7 O( f* f; A
0 N ^2 F6 l9 x! K, |7 s- f, z
这是规模效应。
: i- p0 M( C- b. y* j; z1 z/ C \- h8 X, U L! ~
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。/ [ T2 u* ^- \0 O; |( ]: _6 A
. D# b2 g- S+ d1 d. d" K这个规模,是人类团队根本无法覆盖的。, L; L ~ B7 s
/ s* R; T. K6 P& dGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
+ x) D3 y# o; j
' M6 m6 K% S" S% J. v什么意思?
; N0 t- Y7 d* G4 Y5 h
9 V% N9 @* f K现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
! W9 A9 F& ^- j, {# @5 e. g3 N/ u& a) m& F, d5 o8 T( u
类似现在的ISO认证,但针对的是代码安全。
. l, k2 t/ l+ x
* C2 E8 v# L. W6 @+ N+ ~3 F0 L想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
' w- m& [5 n" Q) k
: c$ j" E' c& d: N7 n! z这不是不可能的。: j9 \; c5 K4 G# l6 {; u) A. J: r
( F$ P% J8 |9 k5 O) }当然,路还很长。现在还只是第一步。但方向是对的。
( P/ y1 z0 ^ K# ~% h! s7 u' _
- U' c! k8 ?, D' L, o1 K |好了,写了这么多,让我最后说几句掏心窝的话。
/ E d. |" q1 I. W* }" ?
- x4 r5 v0 i- D5 T# o; n w% H% _$ |# e我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
; v- y) ]' {2 {# W% M% m
8 Q0 [4 S, ]; `6 ?兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。" n! U- F& m7 t; ]! i- l% C
, C3 \* G6 ` t+ o- y这次不一样。这次是AI在帮我们发现自己的脆弱点。
6 H" ]/ Z! v+ c' Z; f0 W; F1 }: M; Q2 R G/ q- T
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
) W1 I8 n# z. v3 G
' V/ f% }4 w( X# c/ Q0 G; @这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
* _9 d" W6 p7 h8 ]7 k8 b) `% \; e X5 C5 b8 a1 H# z4 [
我怕的是什么呢?
( c% L$ c! N. V9 e6 o" [5 x* t; |0 ?/ U$ B
我怕的是,这个工具,只有大公司用得起。0 ?# ]# G7 j1 D- C( U, t! C! \
, G; s3 ~+ j- t) {AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
6 i1 }7 I8 w0 E3 Z) Q% M( g
+ V' Y5 `7 k) a2 CAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?5 c5 r3 F5 M/ B7 \4 j: T# [
2 Z) Q |& N8 Z8 @这些问题,现在还没有答案。
' e# L T/ [2 e& i& I7 Y5 X) J/ r# Q
但有一点我特别想强调。
k# ^7 H y; x+ F: }+ \3 M) n9 Q0 \* |1 f/ o1 B; g @
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
$ M* H. l9 I5 M S- Q! O- [3 _# l& L& B* u2 i% t6 L
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
0 V. H8 |3 w5 |) E4 g J- L4 Y" k) u& T4 J% U' ]
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。6 |" c6 S" ]9 i/ |8 R; s% \/ G4 ~
' _. ~( V+ P% z! {9 @; m
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。& ~8 `. H) |- |( M' A& h
; t/ D' E9 _1 \这一天什么时候来?我不知道。可能5年,可能10年。: ]# G A* T1 @' e4 v5 J4 H4 z
; D1 Q$ h" c$ q6 v
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。% Z* g: g5 `5 Q* h6 [& a) C f
|
评分
-
查看全部评分
|