爱吱声
标题:
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
[打印本页]
作者:
xiejin77
时间:
2026-4-9 07:45
标题:
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
% ~- Y* u8 G; x" R
* e! V/ g% Q y. |% f& \- h
- k/ p1 j$ m O7 Y" z
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
3 k4 {- [$ f Y: I
5 |/ @! B$ S: x! L' B2 Q
故事是这样的。
2 C, g+ L, z. Z2 E; z) l
& a, B* j" w4 x9 R0 W6 z
我今天看到这个新闻,看完之后愣了好几秒。
1 P4 z' E9 B& D: k
3 B [& A! J6 w' v
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
7 }2 g8 R0 J7 ^
! {3 @5 c0 Y0 E- r6 W) H
结果被一个AI模型给挖出来了。
" b1 q7 K; l4 k0 k4 v- w
' W* _! p! z2 B! d1 o, u
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
4 d, S$ e! ]+ g% H
2 k3 s9 I2 u0 b, O. H
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
2 D! u- H" ?8 q( _
/ i) v8 W9 N b- c5 N
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
8 M" ~+ }( s$ i. G" a% S
. y$ ]' x' E; U
然后呢?
# A. T8 y6 E3 m/ N9 U
2 K: u7 v# l: d1 Y; W
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
7 F6 S$ L# m$ f9 w# y
5 p% R* [! j$ S; g, ?/ O' c
这个项目,叫Glasswing。
, b% w+ S7 D9 M: H( a1 ~
: Y: o/ O2 n/ J% ~
glasswing
% _( A- R& _1 H Y2 Z
9 O o/ ~# i) \: m" j2 g' t) W
8 r+ x+ T ~+ D5 r' e) ^
先说清楚Glasswing是什么。
8 \9 p, C8 L9 H1 b
! w0 }4 I$ A( q4 u
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
+ s" B4 `9 x8 t) }9 I2 x
! [$ N- @: ]5 I
有多强呢?
( G M0 t; P9 I
0 o; y- H4 t5 S7 ]+ M
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
& V0 ?: |$ M! X% R5 O
0 d+ H/ B: u; K8 I6 Z* j! H$ [) A
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
# a* F3 w1 F- J% M; S, G% j! z
) L& P K/ L" r+ \, k
差了13个百分点。
; H( H9 z9 ^& }) ]$ j) v
2 t6 Y. \. {7 t/ d
你说这13个百分点意味着什么?
$ w7 ~; @8 t! p
7 Z7 F; s9 H9 w2 m, v
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
" G% P3 t/ c* O& M$ j, `" n5 K, n
8 a, u4 X7 E0 s$ {6 [ u
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
0 z" j; f1 F" t
) _3 ^+ K1 D* D) {
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
% v U; |- X, ?
& K E0 Z9 T/ {
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
3 M7 U! N( ~5 X# K2 b3 r2 C
5 I( I, x. j1 o: N k
OpenBSD是个什么存在?
8 A! \3 j4 U- p0 B* h D" p
" G% z8 [, _4 [; r& ^) k. n
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
/ v% Q4 w2 m7 J. V+ e
$ L: ^7 s F% m
这样的项目,代码审计了多少年了?二十多年。
4 D8 o: L A" A9 s/ D. X/ N
; S/ t/ S0 y& c- }0 @" k9 v' W3 f
然后,一个漏洞,在里面躺了27年。
4 C$ ~) w1 Q; v
) ~! W* G$ }' ?
这说明什么?
" r& M6 r0 O1 Z- Q' ~ s; I% F3 P
# ^3 C+ [3 _6 k, ?+ e8 B* k
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
# U9 J) d6 N, p
% C) C, M4 N9 r; ], K: F6 ~! O0 F
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
( ?; j1 m' L* Q _' j
x$ D/ m1 I. L/ \
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
1 Z W5 y7 O u" H
2 E b: } _ w. Q0 {* u3 N+ \) ?& U, A
这种漏洞可怕在哪?
7 t$ _* j/ Q0 r, V
' K) c" C0 p2 [/ \
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
: w0 f& n8 `# F
9 f' X- c+ X4 y
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
; V! E9 b; f6 m% b* H
" u9 E$ a) v' q l/ r- Q
FFmpeg那个例子更让我震撼。
) J8 f* h9 s/ n( y" ]9 B3 a( J
+ K6 }, L% C1 n @: e* T
16年。
6 I: M* {. ]. {
4 u$ b) a, E# I
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
3 o1 e' M4 J( M5 O a5 |8 @
# ^* h1 ^5 G$ {4 L7 C6 X
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
, S4 S2 q% \4 c: e3 o* P) B$ x
2 S: j" S* a" s# q1 Q, q
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
9 F3 O3 I5 e4 ~
# O, l8 s# \1 ?" B
这是主动防御,不是被动响应。
. Z7 b4 @* X% i* p' X1 C) i; b: d5 Y
- r/ D3 G/ X8 P# ~ `4 n
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
4 L1 _3 o9 [1 I4 ^4 `+ [+ ?! s; L
/ R1 n! \4 ]/ B% q; h4 S' V/ D7 h
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
" V2 l3 S- O+ {( l/ X" n( H
; T6 X8 C, j: O3 v" o
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
8 Q1 x' _5 }% W/ Q7 |( m6 I
/ A# o4 }- m$ f) |/ B/ b
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
/ ^3 H# w4 d& O: q7 J: y }
9 H7 k$ y+ j" r
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
+ \( i2 p: ]# R3 t' c
i6 o( v* { [, K
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
2 F) ^8 O5 `+ w: V! H2 ]
' Z3 e/ O2 r* N+ q4 I& q: y! E9 G [
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
3 E; |6 q; _( C$ Z
' O+ ~8 \+ j1 t0 B+ m. ]& p; }
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
* D' }8 ? _( W) P; f0 t# ]
: f& @2 _' n0 f+ V
这个价格贵不贵?
0 f i; j% ~. z, x& \
& H; t! a( U7 B; ?' v, w) I5 F
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
4 E# R! [. {, Z
, s1 B" F% {. b7 u% i; O# {
Mythos Preview能发现那些工具发现不了的漏洞。
. {3 `; p! j% g& J
' D) s- e. r* ^) X
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
- b1 X, v- c' n4 F2 W; C6 l
2 L/ A' M" w' v' C. A
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
" r4 o K* \# s' [% c, J8 \# O
' ^7 u$ ^1 Y% q8 b; Q
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
+ T: t' r) ^( F
8 g3 j0 v1 f$ n" @# l9 `' o! r
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
# S8 b# z+ |) X. j/ V3 \- D
2 Z8 t s0 U( U5 K
还有一个细节,我觉得特别有意思。
8 {1 C' k6 S% V2 A
6 g: Z; U9 }% K* r9 ~0 J9 U
漏洞发现之后,公开披露的时间是90天。
: x# g4 ]: T& w4 ~& z' v
/ s p6 n# r+ B* `! F" {' E1 B! s
90天是什么概念?
! F: B/ f. m) {% t1 H
7 U! j# s5 x' b( S
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
( _- q/ h+ p5 q- ~6 a W( c% O
3 Y8 {* q& B! J
但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
3 u9 v6 L& A6 {: a8 Q% I
; a3 v6 O9 u. T% j6 C( h
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
0 j" t5 d5 n( ~ A# [9 e- h; B
4 @5 ]# l2 ~6 G* G
这意味着,漏洞披露的节奏,整个就变了。
) J$ O; N4 [$ i2 @$ ?3 Y
7 Z/ W9 I* T6 a A3 e
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
0 ? ~$ k5 i. {- P* w5 C, c
2 R: W8 ]2 j8 B3 n( h5 k
厂商的补丁开发速度,能不能跟上AI的发现速度?
, K: h3 x9 B; n: z% B
, o1 E/ i; I* B6 } Q! M. s
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
5 M" Z7 _4 j" }: g Q' T$ R
1 h. v7 j o* e+ n& Q
写到这儿,我突然想到了一个更大的问题。
x) q4 n' B" d; K5 Q y
6 q- c: }! s# L6 g8 Y- o9 @
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
6 Z3 R, h' U$ k5 F/ ~* U% m2 {# v
4 A! A4 |( i5 S/ e/ N1 E
透明,意味着隐藏的东西变可见了。
: ^. M6 s& \- E' R, }3 ^& c
8 ~4 K* ]1 T5 ]7 |6 j
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
( h% Y6 {! L8 }2 ?, j* D' K9 n: R
( f) ~0 j" J/ X% _1 d' ?/ r5 P9 [3 F
这个意象,放在漏洞挖掘上,太精准了。
+ K5 i; i3 y: }
5 P- [% m2 H2 v' Z' d C8 k
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
7 l' c1 g$ o, T- ^. z8 [* T
9 ]+ b. X6 K5 a( O* I( x
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
$ ]2 O D) b/ }4 t
0 C2 m9 s3 _' O& b/ d
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
* S. B- d7 G$ r4 a- n, ^
& E- w& F) R$ f* _5 f2 }' `
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
! k' }- P( E% z; A0 |( |
t( ^$ e& h% \( _& ^
这是一件好事吗?
) w1 I2 d: |1 c
# h B5 m- b3 |0 h' Y% _$ _
我觉得,短期内,这是一件非常非常好的事。
3 h y9 a4 B% {7 ], W
" c* m4 K m8 \ A1 Y# J8 |0 A
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
2 t9 K) X# N/ C$ k2 M( `* t
& _7 G& ]; s! r: T% g+ j
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
/ X7 B& U8 F/ a1 R" M+ P
, I! {# r1 g) F% D8 @
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
0 b- j+ w. e7 i) Y7 G: t
; w# v x2 J$ W% }7 b
但长期呢?
8 s5 N6 u2 e9 N* f
1 o" z6 ~! \- v& N8 j1 t& \
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
- F4 [' O# g* b# }% h5 H
6 m5 c$ s$ m2 A
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
h* J% k1 e2 ?, \0 b) M+ s& p4 M
& z9 \1 k: i7 _/ v, ^! D" p1 b
我也不知道。
1 E: i4 Z0 B. y4 W O
$ {; w7 V4 S+ G9 _
但有一件事我特别想强调。
, N' h7 z! y7 }9 ]1 R
* _6 _; y& T$ V5 T3 N
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
' f( c8 W: i% C: b6 M; J
& L: L( y! z X0 \/ \
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
6 _2 ~, E7 S7 e9 i/ h" Q
! R. y+ ]: b4 J+ G* Y* [ ]: e6 R: \
他们为什么还要加入这个联盟,用别人的AI?
+ Z. a+ {9 j4 i/ v$ S) ^( v
0 M A$ O; \1 J& K2 t* V" G" M
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
- H$ Q" v" T$ B4 j* g$ Y+ L
0 Z7 B" `1 h4 N" ~# x1 f$ F8 ~, V
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
d8 Z, G& D r {7 S
& _% ~7 `* K, g
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
7 t2 J3 O, ^; D1 A4 P
+ {% v# H2 x7 W5 p
这是规模效应。
* s% Y: i5 I4 h5 L1 m! ^+ V
. s+ a- S7 S p+ r6 v' f
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
$ C* N' [9 R6 M' i. h
6 {' J. B# J* \' }
这个规模,是人类团队根本无法覆盖的。
4 k- h. P1 d& F3 g6 S: B2 v
2 e! q9 d9 m) }8 s( ?- h6 q
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
& o8 U# Y/ K2 g. r4 O& Y6 R
+ y1 U- L* g+ i
什么意思?
- P) `% d& p* `: a
2 o# v9 G" {1 z: b
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
T4 f! @0 ]7 Q5 g
/ A& j" n! c/ K C6 H
类似现在的ISO认证,但针对的是代码安全。
# }3 u5 Q+ z0 q6 W- k" u
3 v9 u: `7 p1 ?. p( T4 F1 V
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
y# Y/ n" R: j# s0 U
( ]0 ~( t% b- q% b7 `
这不是不可能的。
9 S R9 L* d- j; N5 ` T# Y
' W9 S! I1 U N$ z: H
当然,路还很长。现在还只是第一步。但方向是对的。
, M* G: g' {- z3 Q. f6 I- V
( ]6 q, U2 \# B
好了,写了这么多,让我最后说几句掏心窝的话。
5 B6 Q1 I5 p; x, a9 G
5 g5 P6 [8 F. x# v& t; G( n
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
' ^% B9 v7 A$ v! X9 B0 q n
! m; y1 p4 o$ P$ Q
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
) x0 ~6 S6 _; g
- a6 V. J8 x0 s$ e" N) O. B5 D6 D
这次不一样。这次是AI在帮我们发现自己的脆弱点。
4 A8 N$ i4 q" h* f
/ m, m4 j4 a; g$ d+ `6 |% H
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
/ O4 k4 I9 G, ]0 w5 e. V8 A& W, [
4 g1 F$ F& ^8 g# E2 d5 `" p5 p
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
6 T1 u1 i$ a4 n& m) L/ ]+ Y7 d/ L
) r# m0 R( L) q6 z& a0 k
我怕的是什么呢?
3 @2 ^( A( D) z) J. H3 [6 [' O
/ `+ Q; H# N8 J' n( e. N2 T
我怕的是,这个工具,只有大公司用得起。
% @2 M/ Q( [& S& u& e) F
/ j4 j% }. N; }# L' y4 Z' u, K2 }
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
4 o4 n$ ]" @/ e9 G. h
; y7 H- P" x/ s# [* R7 S
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
" I# A5 d2 ~$ _: Y
# C* E# n8 X6 W5 r# S
这些问题,现在还没有答案。
! P- H4 m) @6 b/ q
9 X( x: F9 H# _
但有一点我特别想强调。
8 e* V+ f1 q8 w: O
1 H# ^$ ?+ z* Z+ V9 ?
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
3 s$ y$ }" T' a& z3 b1 {
1 k* r4 X$ _! z8 i- {9 J$ C+ S
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
8 Q7 g% _8 F1 L- X" E
" {/ V, D3 a; F! Z6 Y( r7 g* f6 D
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
( ? d* G$ n+ j# h
5 y0 m8 l: a+ ?% L1 m8 R' N
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
$ ]( ^' }( R" \" v' [- S
" g; ~: i' ~+ a
这一天什么时候来?我不知道。可能5年,可能10年。
; f6 g1 L/ R( W( Z
3 |7 K6 ]! {# q+ K3 I5 m v+ y+ x
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
9 | S, F Z- A5 d) K
作者:
aniu
时间:
2026-4-9 09:53
联想到了Snowden曝光的棱镜PRISM
作者:
xiejin77
时间:
2026-4-9 09:56
aniu 发表于 2026-4-9 09:53
) ?. |* F' _2 ~5 K6 H& L' U& \
联想到了Snowden曝光的棱镜PRISM
/ q! ^" K8 b6 ^
大模型大大降低了此类工具的门槛,之前国内的安全夺旗竞赛,几个夺冠的团队好像都用了AI,最狠的一个用了五个codex自动渗透攻击;反复迭代。
欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/)
Powered by Discuz! X3.2