TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沙发

楼主 |
发表于 2026-2-26 21:43:21
|
只看该作者
后来想了想,我让龙虾爬了一个分析全球AI数据中心建设和运营成本的报告,内容如下:9 G" w% q6 j1 b3 B. v" [
( L2 }: i; ?: ~ ~$ Y一、总体分析框架与核心结论6 y" I) T0 ]6 H! _0 `! R
1.1 分析框架概览& D0 {% }- u0 [8 w# I8 a
拆分维度
) z% X" Y$ V, i4 {% }% V
9 h3 z( x9 J( P/ I# P' @( V阶段:
, |$ g, Z) v/ F' ^建设期(CAPEX):土地/建筑、供电与配电、制冷、IT 硬件(GPU/TPU/加速卡)、网络与其他基础设施! T. z% ?" Z1 K% t+ W$ ?
运营期(OPEX):电力、水、运维人员、场地/托管、维护与更新、网络带宽等 P7 Z* T1 D; R3 ]9 L! n1 g# a. F( t& j
区域:
b, I f8 E" s; t2 \1 v中国、美国、欧洲、中东(以海湾地区/UAE 为代表): [5 H. I7 B9 I/ [# f4 l
技术方案:, E* H2 b. Z9 J" H
NVIDIA(H100 / H200 / B200 / GB200 NVL72 等)6 Q! }: }2 d& b! u! l, }
Google TPU(v5e/v5p/Trillium 等)
& C3 e# C) t9 I X: J& o/ Y中国芯片:华为昇腾 910B / 910C 系列、阿里平头哥真武 810E(PPU)# k2 |1 H0 q) t; m* \5 m2 f3 \
算例基准
' W. u4 B. ]! |/ _
. ^+ P$ t1 P- v+ @ D, g( D% @: G6 M! _以400 MW 级 AI 数据中心为统一标尺(与 ChinaTalk BOTEC 分析保持一致)[1]:
7 b! `7 ^" q8 v b$ t3 `; q其中 IT 有效功率约 360 MW:GPU/AI 加速约 312 MW,CPU/存储约 48 MW
' H a( p6 V" R! qPUE 假设约 1.11(高效液冷场景)[1][29]
3 l: x8 h0 k: d( w时间窗口:3–5 年运营期(与行业 TCO 分析和硬件折旧相匹配)[28]
2 f& ]& E7 W) g4 ]3 G关键指标
) }. ?9 R8 L/ K4 |- O' f
& x. r# C/ D# l/ F$/MW 建设成本(含/不含 IT 硬件)
; S( X2 o5 g- X* z r. J7 I" _$/kWh 电力成本、L/kWh 水耗+ L- B9 w! L9 o7 q1 g/ H; j8 S* k9 S
$/token 或 $/百万 token 的综合成本7 x8 d' z: P9 F8 O8 A. m
Token-per-watt / Joule-per-token 作为能效基准[17][18][26]. X) l) N4 s8 b4 w- D$ D2 f! i0 V
项目 IRR/回收期、吨位级 TCO 对比(自建 vs. 云租)
2 e/ n& R. K1 e n! j1.2 高层结论(供决策快速参考)
- ^% l0 C3 `9 b1 {# j! v F建设成本:AI 数据中心相对传统云数据中心成本翻倍' R" p( B8 ~# p6 P+ o! P: y8 Z
* X& E8 j# y: z4 m传统云数据中心壳体+机电平均约 $10.7M/MW (2025),预计 2026 升至约 $11.3M/MW[2][41]。
( \) b: b9 j. SAI 优化数据中心(高功率密度 + 液冷)壳体+机电可高达 $20M/MW 甚至更高[41]。, O$ T. a b) v
按 Accenture/Soben 研究,传统云 DC 为 $8–10M/MW,而 GW 级 AI 数据中心可达 $17M/MW(仅壳体+机电,不含 GPU)[3]。
! ]3 ^ o) S+ T; c/ s1 q4 f区域 CAPEX:中东≈中国 < 美国≈欧洲 < 高端 AI 园区5 y, b6 L3 U- n4 N
9 F* Y7 R$ h) H* i+ e1 V! I" P" j" D
中国:$5.5–6.5M/MW,400 MW 约 $2.4B[1][13]4 x0 E" x! y6 ^$ m3 }
美国:$8–12M/MW,400 MW 约 $4.0B[1]* ], r2 A2 S$ i: C
欧洲:接近全球平均 $10.7–11.3M/MW[2][41]! v8 s- j8 n8 H! b' I
中东(UAE Stargate 5 GW):总投资超 $30B,约 ≥$6M/MW[20]9 l6 T' i2 u: C, }. \# q p
结论:中国与中东的壳体+机电 CAPEX 明显低于美国/欧洲,同等规模下节省约 30–40% 构筑成本。" n9 R! }' C, S# T5 O; i
OPEX:电价与人工决定区域优势
& W$ V" \# C( k. T1 n- T/ H& \8 y1 r
电价(2025–2026 工商业大致区间):
0 n: F1 F: l8 r9 T中国:约 0.8–1.1 元/kWh ≈ $0.08–0.11/kWh,部分算力基地可通过长协拿到 ≈3 美分/kWh[12][73]
2 p/ Z6 i. C" H3 b9 ^美国:工业用电约 $0.085–0.09/kWh[44]
2 K* ^& L5 `/ \欧洲:非居民平均 €0.19/kWh ≈ $0.20+/kWh[45]
+ C$ U$ \7 P9 \& @: I中东/UAE:工业用户 $0.07–0.13/kWh[47]4 E; ~8 {2 W2 E0 d& i7 R
人工:
# G8 Y/ n! v# N" X# l3 d中国数据中心运维:约 $22k/人/年
l3 I% T, o& c7 J" }美国数据中心运维:约 $120k/人/年[1]
0 B+ U" P& x5 ^) X8 f' v' v \结论:电价上中国西部/北部与中东有显著优势,人工成本上中国远低于美欧。
; n \+ S1 M* x" n5 l能耗与每 token 能源成本:能效差异远大于电价差异, O0 P2 y0 e3 d: h
8 N! s2 A& h- m3 t
IEA:2022 全球 DC+AI+加密耗电 460TWh,2026 可能至 620–1050TWh[86][90];AI 专用服务器约 90TWh 量级[30][90]。9 s: ^ e6 ] _4 d
大规模 LLM 推理能耗估算:H100 集群训练 GPT-3 175B 约 2.46–3.63 J/token(训练)[10][16];经推理优化后,Inference 端典型可做到 0.4–1.0 J/token 级别[17][26]。: i9 J, ^ p( `1 H6 a/ p* f) H6 \
将 token 能耗约化为统一口径:5 L& H1 b" m1 t- y
粗略取 1 J/token = 2.78×10⁻⁴ Wh/token。若电价为:
* X5 n( F2 _1 g9 h- `中国 0.3 元/kWh ≈ $0.042/kWh:电费 ≈ 1.17×10⁻⁸ $/token ≈ $0.0117/百万 token
. M$ f: X9 F# ~. [! I9 S美国 $0.30/kWh(题设):电费 ≈ 8.34×10⁻⁸ $/token ≈ $0.0834/百万 token
% c( _: b. b4 n5 b( H$ Z0 b对比:OpenAI GPT‑4.1 / GPT‑5.2 系列对外 API 输出侧价格 $8–168/百万 token[62],电费占比 远低于 1%,真正决定成本差异的是硬件 TCO 和利用率,而非电价本身。& S) j+ v o' y6 I2 l
不同芯片方案的核心差异
3 w2 y% a: }5 e5 b/ l( F3 c( t) y; ]+ Q7 y
NVIDIA Blackwell/B200 & GB200 NVL72:
: p) v2 x5 P5 r# C* W# U3 G+ l单 B200 GPU 峰值 ~4.5 PFLOPS FP4/FP8,功耗 600–1000W[68][69]。! Z/ F6 i& y J1 Q/ Y% c5 ]
GB200 NVL72 整机架售价约 $3.0–3.35M,72 GPU[34][69],GPU 约占整个 AI 数据中心总 CAPEX 的 39% 左右[36]。/ ~2 R5 P5 V- W0 T
Google TPU v5e/v5p/Trillium:2 \6 v, `% n1 b6 r) W( t$ A, K
TPU v5e 8 芯推理:约 2,175 tokens/s(Llama2‑70B,INT8)[67];功耗显著低于 H100,同负载下能耗可降约 5 倍[67][52]。' |5 o: T3 I6 p7 j; d
Google 内部披露 TPU v5 能效约为 H200 的 1.46×,Trillium/TPU v7 更高(约 2× 甚至以上)[52][65]。
( S( E* k) w* u3 a5 s2 S- n3 p华为昇腾 910B:
" Y( @7 s3 c* A+ ~- [% KFP16 算力 320–376 TFLOPS,INT8 640 TOPS,TDP ≈ 310W[80][81][82];能效接近甚至超过 A100,在长序列推理上 token-per-watt 可超 H200[71]。; C! E- y/ H% }& n C
单芯片成本约 5 万元人民币 ≈ $7k[60],显著低于受限版本 H20/H100。
/ ]7 L! e1 v' [6 r阿里平头哥真武 810E(Zhenwu PPU):
. q7 S2 `$ F9 a* a! l, g# V, W( ?96GB HBM2e、700 GB/s 互联带宽[59][111],功耗约 400W 级别[102],整体性能对标 NVIDIA H20/A800,并已形成万卡集群部署[59][111]。0 |, f/ G! M' Y g' j7 E) y: H. I7 R
结论:
8 L; x$ Y+ z; o& v5 N v5 }能效(tokens/J 或 tokens/W)排序大致为:Google TPU v7/Trillium > NVIDIA B200/GB200 > TPU v5e/H200 ≈ 华为 910B ≈ 阿里真武 > H100/A100。' |5 x, b4 g! l( K
单芯片/整机价格排序:华为/平头哥 < TPU 自用成本(Google 内部) < NVIDIA 公版(H100/B200/GB200)。; n. ], Q2 [& L' ~
对中国市场,在算力性能足够的前提下,昇腾 + 真武 方案的 CapEx/每 token 成本有 30–60% 的价格优势。5 f$ E" P6 R7 L2 @- A7 F) @
自建 vs 云租的 TCO 与 token 成本3 V- D+ B. Y4 O* T$ Q. M+ J: T
# [% c A4 @, J: I/ ~" z9 F
LenovoPress 对 8×H100/H200/B200/B300 本地 vs AWS/Azure/GCP 的 5 年 TCO 对比[28]:% q; e2 j2 `! V; C% g9 Z
8×B300(Config D)自建 5 年 TCO ≈ $1.01M;! n9 J0 ]% m- l
等价 AWS p6‑b300.48xlarge(24/7)5 年 ≈ $6.24M,节省 83.8%。
6 w% R- E- ?3 Q. L7 o/ b8×H100(Config A)自建对 Azure On‑Demand,回本点约 2,720 小时(~3.7 个月),对 1/3/5 年保留分别约 4,423/6,800/7,591 小时(~6/9.3/10.4 月)[28]。
: u. N5 C/ z, M3 zToken 成本对比示例(LenovoPress 场景)[28]:
" y1 @' F8 y3 p; b9 R( fLlama‑70B 推理,8×H100 本地:约 $0.11/百万 token' K5 Z; `" |( Q& S7 m; G0 F8 B
vs Azure H100 On‑Demand:$0.89/百万 token → 自建 ~8× 便宜。
; `* X) x2 R$ r+ X( v( W同样 70B 模型,自建 vs GPT‑5 mini API(约 $2/百万 token):自建便宜约 18×。
6 n# y- i8 d9 p4 b) yLlama‑405B,8×B300 自建:$4.74/百万 token,AWS B300 On‑Demand:$29.09/百万 token → 节省 ~84%。0 A! f9 Q# b3 \/ T9 m# u% L, Q% {
结论:
1 u5 p. K7 T- z- Z! w9 _! k, W* Q( ]高利用率、长周期推理负载下,自建 AI 数据中心的每百万 token 成本可比公有云或高端闭源 API 低 1–2 个数量级。6 V% N& K. B- ]) c4 q1 Z. J, @
Token 电费占比极低,自建 vs 云租的差异几乎全部来自 硬件折旧 + 云溢价 + 运维与利用率。6 O/ r0 \1 @3 E0 N
二、建设期成本分布:区域对比
0 w* w' |: a6 H: Y8 T以下重点讨论 壳体+机电(不含 GPU) 与 全栈(含 GPU) 两层。! e5 b1 [/ y* |
6 I( B1 S& K1 T0 A+ S+ G+ a' u
2.1 全球/通用结构(以 1 MW 为单位)
+ o. R! `, [1 B! a综合 JLL、ConstructElements 等[2][41][40]:6 ]" f. N) O V6 G
3 B5 F, b" H6 \5 T壳体+机电(Shell & Core)8 @) o5 a' T/ w3 b
. r' I3 {, R4 Z; R9 l F
全球传统 DC 平均(2025):$10.7M/MW,2026 约 $11.3M/MW[2][41]
* K# [4 u; V8 z) [& a5 T8 Q其中按成本构成[40]:
/ ^- t- {( n a0 _ q; ~9 @电力系统(变电、配电、UPS、母线等):40–50%
) T/ C# ?) V# v3 e' T9 K机械与冷却(冷机、冷却塔、管路、CRAC/液冷):15–20%1 ^) d+ B. f& Q+ ~1 X$ w. n2 ^' N( A
建筑与土地、结构:约 15–20%
4 v/ O' `' g1 `其他(消防、安防、楼宇管理等):约 10–15%
c) J( I/ Z( }7 z6 NIT 内装与 AI 基础设施(不含芯片)
* |! o: P3 [9 b2 m& E2 ^% X! S* q/ {8 {8 w
高密 AI 集群内部装修(高密布线、机架、液冷板/浸没舱等)会在每 MW 额外增加 $25M/MW 量级[40],对 GW 级园区影响巨大。3 N& N7 F1 L) `5 g" V# s
GPU/加速卡硬件 CAPEX0 V4 z' g% }2 I; o8 o/ r# x
& T* v. I! U0 j' N/ f/ q. C多数分析认为 GPU 占 AI 数据中心总 CAPEX 的 30–40%,其中 NVIDIA 单家毛利约等于整个行业 CAPEX 的近三成[36]。5 C+ h3 I6 i% A. ~
2.2 中国 vs 美国 vs 欧洲 vs 中东:1 MW 建设 CAPEX
/ P% a7 T& g( x, Y. q9 Y: L8 j结合 ChinaTalk、JLL、UAE Stargate 等[1][2][20][13](仅壳体+机电):
4 [$ ?* x. P* L7 H# g' ]# ^
) r! ~8 H, P m! d! o7 I区域 典型建设成本(壳体+机电,$M/MW) 备注, W! w; e' G/ X5 W: k' M
中国 $5.5–6.5M/MW 以西部算力基地为主,400MW ~ $2.4B[1][13], n: D+ a& P) O6 y8 Z, Z
美国 $8–12M/MW 典型超大算力园区 400MW ~ $4.0B[1]
4 e0 A9 ~1 h; [. B2 _; _! \2 T* e欧洲 $10.7–11.3M/MW 接近全球平均,部分核心城市更高[2][41]
b3 k2 [' M5 Z3 n; g中东 ≥$6M/MW UAE 5GW Stargate >$30B → ≥$6M/MW[20]# r4 O6 [9 p/ P" P0 s$ [/ _
结论:; I% x& ^$ L' Z3 L; m
* P$ h8 `: `, A2 K2 U7 y) D# [
单位 MW 壳体+机电 CAPEX:中国 ≈ 中东 < 美国 < 欧洲。
5 J! H/ k% G6 }$ I3 Y9 e. u若考虑土地、电网接入和许可周期,中东(特别是 UAE/沙特)在电力可得性和政府补贴方面往往优于欧洲,趋近美国甚至中国。' n; I- O2 H* e T
2.3 引入 GPU 后的全栈 CAPEX(以 400MW 集群为例)
# ]- _" n, c! ]5 W以 ChinaTalk 的 400MW NVIDIA GB200 NVL72 集群为例[1]:
# ~/ h/ S4 _5 R" {
8 n8 A- l: g- R假设:PUE=1.11,电力侧 400MW,中约 360MW 投入 IT;: a5 [. r% x/ ?
GPU 配置:6 C a3 r. e5 x2 A. C1 l
有效 312MW 用于 GB200 NVL72,约可容纳 2,154 racks(每 rack 144 GPUs,对应功耗 ~145kW/rack);( s+ ^. E$ Q8 I
每 rack 成本 ≈ $3.0–3.35M[34][69];
' v" f- q$ b( S$ r; R+ q4 g/ VGPU 总 CAPEX ≈ $6.5–7.2B 量级(ChinaTalk 抽样约 $5.6B 略保守[1])。
9 t3 m! D+ @' J; }与不同区域壳体+机电组合:
% e9 U8 t' S4 H8 T0 Z2 d: C: `8 e
以中值估算:
" d K+ ]1 V/ H4 r9 t6 h, B* `: p$ D+ q# C- X' H7 e
中国 400MW:壳体+机电 $2.4B + GPU $5.6B ≈ $8.0B' P1 L4 S3 Y7 f3 |
美国 400MW:壳体+机电 $4.0B + GPU $5.6B ≈ $9.6B
: f# ~# h. N0 @. B欧洲 400MW:壳体+机电 $4.5B + GPU $5.6B ≈ $10.1B8 O' I4 Y* y3 ~9 C- }1 z
中东 400MW:壳体+机电 $2.4–2.8B + GPU $5.6B ≈ $8.0–8.4B
. u# s) k/ g2 M3 [2 S可见:
" S1 A. n( B; a, W$ _/ u6 y" W1 A6 _/ N6 L# R1 o
GPU 成本在各区域大致相同,决定区域 CAPEX 差异的主要是壳体+机电与土地/电力接入。
( r+ k3 F* W( p, W( [; ~相比美国/欧洲,中国和中东可在 400MW 级别节省约 $1.6–2.1B CAPEX,这对 IRR 有直接影响。6 O: O# V. K! g' H9 K
三、运营期成本结构与区域对比
& s% o1 d4 N; x5 W, R0 k3.1 通用 OPEX 结构(高密 AI DC)/ J! f6 Z( u' F3 l
结合 ConstructElements、IEA、Microsoft/Google 披露[40][86][103][104]:
. ^! h" n5 o, {
F5 w: U# f4 y; `+ V% U9 l电力:约占总 OPEX 的 20–30%(传统 DC),对于 AI DC 因 GPU 负载密度提升,可达 30–40%。; L' S9 x' _6 P. Q
冷却与水资源:7 g' n. o+ S5 i7 h- Q" C5 @
能耗:传统风冷约占总功耗 30–40%[39];液体冷却可将 IT 与制冷合并大幅降 PUE 至 1.1 左右[29][115]。: [ o- C4 M, g( o
水耗:典型 DC 约 1.9 L/kWh 水用量[105],每日用水可达 300,000–5,000,000 加仑 规模[100][101]。
, _- Z7 i& k6 }; t# G人工:视地区而定,在中国/印度/东南亚占比 5–10%,在美欧可达 15–20%。
" T" N3 o( m h6 N: L) ?9 s& f) S托管/物业与维护:
4 B9 d' j" \7 B. Y2 X4 i, b2 i托管:高密机架约 $1,500/机架/月,标准机架约 $600/月[40][28];
6 z4 @4 v+ \- W# b硬件维护:LenovoPress 模型中按设备价 12%/年[28]。+ `; I3 J, \$ m. ]0 `
3.2 区域差异(以 400MW / 3 年期为例)
9 ]; g/ q7 b) M8 A: K使用 ChinaTalk 的电费与人工估算[1]:
3 O6 N% l: |& r, d6 h+ y. U% a1 ~2 A. }, y& {) a4 S
电费(3 年) – 假设 GPU 利用率 60%,IT 360MW,PUE=1.11:
/ k& b/ O6 O' _5 P6 l6 `6 {中国:约 $0.06/kWh → 3 年电费 ≈ $350M6 L, M+ Z. t. ~! F# \+ n' k
美国:约 $0.09/kWh → 3 年电费 ≈ $600M* S' _0 t1 x- r9 _
中东:约 $0.07–0.10/kWh → $400–550M0 W+ D7 v/ N) D- X* L
欧洲:约 $0.20/kWh 以上 → 电费 > $1B(显著劣势)" [2 U$ w* h; Q, {1 |: A$ S
水费(3 年) – 以 MS Fairwater 站点 280 万加仑/年为参照[1][103]:
; P& s- w+ z* V7 A% D: O8 f! z美国水价约 $5.18/千加仑,中国约 $2.57/千加仑[1]
! J4 ~* X& v" _% P9 T# c三年水费级别:1 h1 o" a5 O3 a5 U' f7 r( I
美国:$40k+& A1 F5 }" P+ K2 g1 E+ o' k
中国:$20k+: e/ C! i5 w6 b) ^# [% t
结论:水费是数量级上可忽略的小项,真正的约束是水资源总量与选址,而非成本。
; N+ U" ?' L4 d- A2 J人员成本(3 年) – 假设 500 名全职运维:
# L! `; M# ?6 V# m0 u美国:500 × $120k × 3 = $180M+, P) H K" j# R. E8 O
中国:500 × $22k × 3 = $33M+% u- Z" P0 a: ]1 M/ P
差异约 $150M,规模与 3 年电费差不多,是中美间第二大成本差异来源。, m& N+ x/ ^ c" }$ y7 S$ s
整体 OPEX 粗算(3 年) – 400MW 场景下:
8 m* _3 A- C; d' \. t- {3 ~5 [9 |4 a- L/ A9 b; \* h6 J
项目 中国 美国
" Q% F/ u+ _! k3 u% O$ v电费 $350M $600M
- ~! |% C; o- t; f- ~+ e1 ]水费 <$0.05M <$0.05M+ J |. y+ y: W. r' v
人员 $33M $184M
: {9 J m" O8 p9 p5 t- ]& h1 }其他维护/托管 同比例估算,地区差异主要体现在人工与地价 # W" Q9 D! n) |5 C- @
结论:
" s! W! a& Q* W7 Q- p2 e2 O& J- K# Q6 a. W! X( `
就 3 年期而言,中国与中东在 电价+人工 两项合计可比美国/欧洲节省 数百百万美元级,与整体 CAPEX(数十亿美元)相比不算决定性,但对净现值和现金流有实质贡献。, p% h+ I. ?' o( p1 w5 \* b |! U
对大模型服务商而言,更核心的是 GPU TCO 与 token 单价之间的剪刀差,而电价更多影响“边际利润率”而非“能不能赚钱”。
- O, x4 p% f% _( G四、基于 token 的成本与利润推演
2 D5 y$ Z0 z$ F$ s9 {3 F4.1 能源维度的 token 成本(题设 0.3 美元 vs 0.3 元)
& ~4 g1 c A3 ]: ^1 f& h2 ^统一假设:& d9 S/ |2 g- D$ Y7 V
, k7 T r6 x, {# U+ d. c6 v( U
典型大模型推理能耗:约 1 J/token(考虑 FP8/BF16 优化、Batch=256–512 时的能耗甜点[26][17][18])
1 g( ~3 t0 _" A# l: S1J = 2.78×10⁻⁴ Wh → 每个 token 约 2.78×10⁻⁴ Wh
! g9 f8 j7 v. V* F. Y1 百万 token:278 Wh = 0.278 kWh
; S5 K( |" }+ C) |3 C1 J3 m场景 A:美国电价 $0.30/kWh
; O7 w0 ~$ K- l- n r1 F* t电费/百万 token = 0.278 kWh × $0.30/kWh7 J4 J/ t& H3 f, K& y
≈ $0.0834 / 百万 token- k: R9 o8 }/ \6 Q5 h
场景 B:中国电价 0.3 元/kWh ≈ $0.042/kWh. A& S3 T7 n N% x6 O U- w
电费/百万 token = 0.278 kWh × $0.042
5 A9 }3 R4 S1 e% Q# ?8 K4 V≈ $0.0117 / 百万 token- w7 C6 M* Y* x3 P. o7 ~- ~# w7 U S
对比当前 API 价格(OpenAI 2026Q1)[62]) E2 p" m9 A6 y. W
以输出侧为主(成本最敏感):/ X& v: T2 W) t5 D0 d+ o! n9 a
q' |: R% @% P! b# g- q模型 输出价 ($/百万 token)+ ~' J- Q, {2 S7 f# y/ s. w
GPT‑5.2 $14
3 D( O% `3 B4 i) ^! B9 O+ z vGPT‑5.2 Pro $168' O- s. F/ [# O
GPT‑4.1 $89 Z& W7 p3 T; H" p7 r+ @9 _
GPT‑4o $104 x' A" u8 Q, e
GPT‑4o mini $0.60
6 C5 B7 Q; w. I6 K( e则:
* W) Y0 @5 o" V/ M
, L. p: R8 }# k* m+ Y4 z在美国 $0.30/kWh 的极端高电价下,电费占 GPT‑4o mini 收入的 ~14%(0.083/0.60),占 GPT‑4o 仅 0.8% 左右。
- s* K6 y8 e, I" R/ v, Z在中国 0.3 元/kWh 下,电费占 GPT‑4o mini 收入的 ~2%,占 GPT‑4o 的约 0.1%。3 V. D1 y2 U/ w: v `
相比之下,GPU 折旧+云溢价+开发/运维成本才是主导。
! N( m4 H4 G! z8 |. R; ^7 b结论:
' i w& M. Q. w4 O. C" h: N即便在“美国 $0.30/kWh vs 中国 0.3 元/kWh” 的极端对比下,每百万 token 电力成本差异约 $0.07,与主流 API 价格($0.6–$168/百万 token)相比仍属“小数点后两位”的影响。区域电价主要调节“利润率边际”,而不会改变“项目能否盈利”的结论。
2 V! @& X; r; E# S1 u; F: B W
4.2 全成本 per token:自建集群视角(基于 LenovoPress TCO)
# V* P s1 z" M: n3 L; N8 d以 LenovoPress 的 8×H100 Config A 为例[28]:
; L- @# A/ D+ @' q* r1 i
$ \( ^; A! s6 k3 o' [5 年摊销下,8×H100 本地推理 70B 模型:$ c+ T* p6 J; u' v% B Y' u( p
小时综合成本(CapEx摊销+Opex):$12.08/h3 K2 w. U# V& b3 y7 U0 D8 g
吞吐:30,576 tokens/s → 每小时 ≈ 110M tokens, L6 X! K+ }" i$ h; m
成本/百万 token ≈ 12.08 / 110 ≈ $0.11/M token
# {) f& w$ z; [2 z电费在其中的占比:1 f2 r, {* T6 A
Opex 6.37$/h 中电力+冷却约 $0.87/h[28]8 ~: m" e5 p6 h+ E L* A
电费/百万 token ≈ 0.87 / 110 ≈ $0.0079/M token! D2 ?: k8 V4 [$ _5 @" u
电费占 总 token 成本 ~7% 左右。
$ n) {' m2 \" Q! w! J) d若将美国电价从 ~$0.12/kWh 提高到 $0.30/kWh,则电费约增 2.5 倍,对总 token 成本影响约 +10–15%。
# A+ D$ I6 T( e! S9 i* G0 u- N若迁至中国西北 0.3 元/kWh 或中东低价长协,电费可再降 40–60%,总 token 成本再降低约 5–10%。
# B/ n, o, P9 ]: ?2 N( F& J$ s% V* _, }4 K# H5 r) @! C" r {2 _
因此:
2 c6 Y% P, V7 G7 s" a1 [5 A8 ^+ }5 w( j
在自建集群场景下,电价对 token 成本有可见但非决定性的影响(变化量级在 ±10–20%)。, g' S8 c1 I. Q! o5 U s
在云租和 API 模式下,电价影响则被进一步摊薄,绝大多数利润被云厂商的溢价和 GPU 供应链吸走。
. W# H& p5 }+ w5 {) @0 s/ }/ c五、不同芯片方案的建设与运营成本对比3 ]. Y: c, j. a7 A
5.1 NVIDIA 方案(H100/H200/B200/GB200)! g+ ?( ^) `1 j: N6 C
CAPEX:+ h) m: v$ Z# c: D3 |
" [0 Y, H2 U( N9 S1 i, r4 OH100:单卡市价 $25k–35k,8 卡服务器约 $250k+(Lenovo 配置价 $250k 左右)[9][28]。% @( U0 U# s" u
H200:显存提升,单卡价更高,8 卡节点约 $280k[28]。: Q4 k* j {' S% A9 K, B4 p7 f
B200:Blackwell 代 GPU,8 卡服务器约 $338k[28]。) u" m- k& m' W
GB200 NVL72:
/ Z4 ~. E/ ]3 y4 B8 [每 rack 带 72 GPU + 36 Grace CPU,售价约 $3.0–3.35M[34][69]。+ T) l' U4 u% A6 [' A! X
冷却系统每 rack 额外 $50–56k[35]。" I, Z2 Q& R, i' W2 X1 E
在 400MW 场景中,GPU 总 CAPEX 约 $5.6–7B,占总体 CAPEX 近 40%。5 O v2 f% x* d2 L
OPEX & 能效:
4 | M9 Z. O& m8 h' r
: \3 s% O. D% P单 GPU 功耗:" t( J0 Z% {( H2 M8 [& L4 N+ m
H100:TDP 700W;集群实际单 GPU 含服务器/网络开销可到 ~1,500W[16]。$ \) G' s6 q7 Z7 X
H200:功耗类似或稍高,但性能/W 提升[9][10]。
2 Q! R' N$ _3 l/ g) jB200:标称 1,000W TDP,但实测约 600W 左右[68][69]。
7 G3 \8 [2 Q, S/ ^Token 性能:
, D3 V- j! Q5 E1 vB200:官方推理基准中,可达 60,000 tokens/s/GPU 级别(gpt‑类模型)[68]。
8 b7 F( Q; {: HNVIDIA 的优势:+ e8 K% E* C6 s) \
2 P! ~; a; |" C. \
软件栈成熟(CUDA/TensorRT‑LLM),易于榨干硬件性能,batch 与多 GPU 并行调度成熟 → 在同等 PUE 与模型条件下可达更高 tokens per Watt。
- s% L9 Z/ |, W* ?- @; {但硬件价格与毛利极高,从 TCO 角度,“谁买单 GPU 溢价”是关键——云厂商多半将成本转嫁给 API 用户。" p0 e* j) m h5 s: e
5.2 Google TPU 方案
! P" T! f7 [, l: V1 U1 CCAPEX:
! q5 j0 d3 o G! S4 J' @3 H: `; D
单 TPU v4 定价约 $3.22/芯片小时,v5/v6 在云端按实例小时定价对外[52][54]。
% }7 a0 j& Y4 U* Q EGSR 估算:TPU 的出厂 ASP 约 $4,500–5,000/片(Google 内部成本)[54]。1 r* |. [% k% H: c9 l" q8 J1 N
8 TPU v5e 实例约 $11/h,而 8×H100 云价可高达该数值的 5–10 倍[52][54]。
2 k9 `' P1 N1 E9 [' k- F' |能效:
, T* `$ U9 C# K7 N6 U x
9 q$ Q; e5 r3 J( L- j: `7 UTPU v5e vs H100:
( ^ ]2 c% j0 B: ~同级推理场景下,8×TPU v5e ≈ 2,175 tokens/s(Llama2‑70B,INT8)[67],H100 需更高功耗才能匹配。
. k, B) _3 B/ d% J/ g r" _测试表明 v5e 功耗约为 H100 的 1/5 左右[67][52]。2 V3 Z) r2 x; \( T% g) V. D. t
新一代 Trillium/TPU v7:% x' q' @8 z1 Q0 W# d# J
能效比 TPU v5p 提升 ~67%,对 H200 或 B200 整体上能实现 2–3×性能/W 优势[52][65]。) s% c& {. z& R
Google 方案的特点:# g& ] g$ C7 {" x4 i$ [
/ I$ g. d; x" A6 b( l自用闭环——Google Cloud + TPU + Gemini,利润来自整体云栈,而非单个芯片;. k+ _& k0 B. _* l
对外公布的 API 价格较为激进,TPU 方案在 tokens/W 与 tokens/$ 上具有显著优势,尤其在内部工作负载。1 H# T* h6 \5 K7 S. D2 a( k; K
5.3 华为昇腾 910B / 910C 方案
% C8 i2 C' H8 o* CCAPEX:, n5 _" S% X) o }- l! T
E( t4 N: f1 Q5 ]3 |
单 910B 芯片成本约 50,000 元人民币 ≈ $7k[60];910C 约 110,000 元[60]。
& ?. W7 J9 M2 l与 A100 对比:/ ]# v" R6 \+ }+ t$ \+ H0 C5 H. D
FP16 算力 320–376 TFLOPS,功耗 310W,性能接近甚至略高于 A100(400W)[80][81][82]。
& T" `2 g5 X% K+ w市场报道中,NVIDIA H20 在中国售价约 10 万元/片,而 910B 更便宜 30–40%[61][72]。: S9 l y5 i) T/ x
使用昇腾构建类似 400MW 级别集群,总 GPU CAPEX 相较 NVIDIA 可节省 30–60%,视集群规模与供货条件而定。
9 x7 P0 N# l) a( L$ mOPEX & 能效:2 u; b$ k! U0 R- L
9 S$ P, ]! r7 L" v# _# K0 S
910B 功耗 310W,FP16 320–376 TFLOPS → 性能/W 与 A100/H20 接近或更优[80][81][82]。
0 a! o2 \2 `: V- }部分推理 benchmark 显示,长上下文(>4k token)推理时,910B 在 tokens-per-watt 上可超过 H200[71]。
5 z4 N+ S1 p7 A# Z- l: n6 u在中国电价(0.3–0.4 元/kWh)环境下,昇腾方案在 TCO/tokens 维度有明显优势,但生态与软件栈仍在追赶 CUDA。
5 m$ f$ M5 X; C5.4 平头哥真武 810E(PPU)方案
/ {5 r8 I0 y; _. `3 H" _% iCAPEX:2 j1 H9 {& ?8 G3 i6 N! Y
! \8 N) H5 Y6 l& o7 T7 y技术参数:
( i* x+ p5 A4 u0 D. a2 }, |96GB HBM2e,片间互联带宽 700GB/s,自研 ICN 互联,PCIe 5.0 ×16,400W 功耗级别[59][102][111]。- a' r. p$ D" d% m2 l5 p
性能:官方宣称整体性能超过 A800 与主流国产 GPU,与 NVIDIA H20 大致相当,升级代际可逼近/超过 A100[59][110]。% F: o3 A* @# B, D; K
价格:
5 v* b4 S# @! L5 @6 q) f$ L未公开详细单价;多个媒体报道指出“单位算力成本可下降 ~40%”,与英伟达 H20 有 3–4 成价差[74][112]。8 b$ n' \* y' i5 X
结合国内报道:
4 S- x6 M H; y) H F V# @2025 年出货量数十万片,已在阿里云实现多个万卡集群部署,服务 400+ 客户[59][111]。0 L2 D8 B# H! Q
数量规模与生态成熟度迅速提升,使得 真武+昇腾 成为中国公有云/算力租赁的主力基础。
3 |9 ~0 B1 t' N3 N2 xOPEX & 能效:
5 Z3 ^7 W' t5 G3 C
8 X" F6 r7 {) T' g- Y4 Z400W TDP、96GB HBM2e,使其在 高上下文、RAG、大模型训练+推理一体化场景 中具有良好性能/能效平衡;
2 P8 [( C. D) Q6 A ? H" ]在中国低电价 + 低人工成本环境下,真武方案可将 AI 推理服务的综合 token 成本进一步压缩 —— 对标 NVIDIA H20,本地算力提供商可在保持 ~8–9 成性能的前提下降价 30–40% 仍保持毛利[74][112]。8 j1 @+ f' N# Q1 _0 X4 C% v
六、综合比较与策略建议 V. x4 L. m1 x
6.1 区域维度:在哪里建 AI 数据中心?# m: D/ T( M( \5 g3 P; j
纯经济性(TCO/tokens)排序(假设无政策/合规约束):
- i6 l, }& m% X' r+ W3 m# {
0 q# f$ d, N" [2 T/ b中国西部/北部(电价低、人力低、建设成本低)2 w0 J) d! O$ U; p- A9 L
中东(UAE/沙特)(电价中等偏低、土地与电力可得性好、政策支持)* X$ _# l( _) `. z
美国电价低但人工高;东海岸/加州电价上涨压力大
! J1 K4 E7 t# |5 x S% o- }欧洲电价高、审批严格,但接近高价值企业客户和数据主权要求
" i" J. A1 T; z2 ?6 d5 |! I+ h! a! P若以“美国 $0.30/kWh vs 中国 0.3 元/kWh”极端场景比较:! A( t( o8 ?" W" G& j* ]
; _5 t; a3 G) v6 W/ b3 x1 r纯电费/百万 token 差异:约 $0.083 vs $0.012 → 差别 ~$0.07/M tokens;
9 T0 ~" {$ k3 l/ L4 f! d2 ]对比 API 价格:差异对整体利润率的影响远小于是否使用 NVIDIA vs 国产芯片、自建 vs 云租的差异;6 [- K0 C; H- H+ u5 Q% n1 X9 a! k6 ]
但在极高利用率的 自建超级集群 场景,电价仍然能在 5 年 TCO 上带来 10–20% 的边际优化,是选址决策的重要考虑。: U- s% _9 z$ b H
6.2 技术栈维度:选哪家芯片/云栈?* R2 R3 L4 p" S8 v X
若目标是全球最优 tokens/$ 且不受出口管制:# r, e" Y" ~. L( g! b
3 W) i5 F& F9 B& a' n! `Google TPU v7/Trillium + 自建 on-prem:性能/能效与成本的综合最优,但前提是可以直接获得 TPU 硬件与软件栈授权(现实中仅限 Google 内部和极少数大客户)。
6 V8 p, v+ s* E, F若在美国/欧洲,能自由采购 NVIDIA:
8 L5 ?/ E3 A: H; Z" `6 o0 M8 u8 j
. l/ C2 T6 v2 f0 T+ y短中期内,NVIDIA B200/GB200 NVL72 仍是最佳实践:
0 @3 S! d- I. U0 T( D2 e成熟的软件栈与生态,极高的 tokens/s/GPU;) T: f6 d$ x8 C! `6 r
在云厂商/超大规模自建模式下,配合液冷与 PUE~1.1,可取得较低的 token 成本;
$ O/ |7 V4 V. q% x* p4 k. B但要谨慎评估 GPU CAPEX≈总投资 40% 的集中风险。
* E! m+ Y4 O! O9 k4 J6 n! H: E若在中国或存在出口管制约束:/ x5 q' X) x5 u [! s$ F
+ Q7 L) w, Z; _0 ^& C昇腾 910B/910C + 平头哥真武 810E 是现实可行的主力组合:7 H: n! W$ w( E: {8 A3 Q/ ]+ a
性能上已能覆盖大部分 GPT‑4 类推理需求;6 w% R( n3 S* L: f
单片成本显著低于 H20/H100,集群 CAPEX 明显更友好;" f& ?1 ^0 b3 |2 q
软硬件全栈国产(CANN + MindSpore + 通义/Qwen 等),可避免制裁风险;
* m$ `* l, b8 n1 A9 y) R6 c9 u建议配合:% C3 W; z4 z M4 A3 |# G0 E
高效液冷(PUE~1.1)、0 Y) q! w; S1 P+ A# ^3 m8 A
大 batch、路由(浅层任务走小模型/低成本芯片)、! t7 ?5 D3 a2 K4 X& V3 T4 A1 L
强量化(FP8/INT4)与分层缓存策略,进一步摊薄 token 成本。* `4 i( v d4 Z! p2 L! U1 a2 i( _
长远看,“tokens-per-watt / PCE” 取代单纯 PUE/FLOPS 成为核心 KPI:- D. S s* C! v) V/ k
9 l* l( x/ ]: L& ~* Q( T* @0 @数据中心运营者应从“PUE 1.5→1.1”的设施思维,转向“每瓦输出多少有价值 token”的AI 工厂思维[29][118];
1 H4 e' v0 E+ \这意味着:( l! h# z7 Z8 _' N# `% a# T
优先选择 更高 tokens/J 的芯片架构(例如 TPU v7、B200、后续国产芯片);
" W8 J9 H# _5 K4 S8 Q精细化调优 batch size、路由策略、CoT 深度,将“energy-per-token”作为最优先指标来优化[17][26]。
# w3 J5 [ M1 B! i6.3 针对你关心的具体问题的简要回答( @4 Z: ~. C. U; e* D
AI 数据中心建设 vs 运营成本的大体比例?
9 X. d( `/ W4 M- t1 ^* r+ J( N& v7 n( \% t# E, k% x
在 5 年期 TCO 视角下,CAPEX(尤其 GPU)约占总成本 50–70%,运营成本(电力+冷却+人工+维护)约 30–50%。
Y3 s( p- Z, E$ o其中 GPU 自身 CAPEX 占到总 CAPEX 的 30–40%[36]。8 O5 B$ h. H. j' n& t% e4 Q2 R) n3 M
中国、美国、欧洲、中东的成本结构区别?3 B1 d' Z) B2 @+ Y/ L( ]
3 q" z4 ]% c8 E
建设期:
3 S7 G! D2 \, }6 Y4 `8 t中国/中东的壳体+机电成本明显低于美欧(约 5–7 vs 8–12 vs 10–11M $/MW)[1][2][20]。
; v$ z- _* o( |2 w4 s1 t运营期:
; x, k2 ^8 p/ T' ?电价:中东 ≈ 中国西部 < 美国平均 < 欧洲
1 r; [$ v; d/ ^+ u2 y/ x6 Q/ J人工:中 国 ≪ 美 欧,中东居中。
/ ?( v! a, d2 o$ z5 J( w. d' U在美国 $0.3/kWh 与中国 0.3 元/kWh 下 token 成本与利润率?# p) D" j5 \$ @6 I" G+ g1 V
0 \- k% n& s; { q
对于典型 1 J/token 推理负载:0 a" N1 g2 o0 O0 \3 K6 Y
美国 $0.30/kWh:电费约 $0.083/M token
$ d- u, L+ K _) t5 v中国 0.3 元/kWh:电费约 $0.012/M token: R- }: C& W% f
对比 OpenAI 等对外价格($0.6–168/M token),电费无论在中国还是美国都只是利润表里的“小头”,主导因素是 GPU TCO 和平台溢价。
# e5 j% N4 \+ Y0 M; Y不同技术方案(NVIDIA / Google / 昇腾 / 平头哥)的建设与运营成本谁更有利?
) e; t2 r9 y4 Z) q: \
3 J# D7 e& c+ ?6 `8 ]0 U ?在可获得 TPU 的前提下:Google TPU v7 在 tokens/W 和 tokens/$ 上最优;
_9 ^8 `" L O, z ?+ j0 G; i& C全球通用方案:NVIDIA Blackwell 全家桶(B200/GB200)+ 液冷,但 CAPEX 巨大;
7 V Z2 q' k0 Q0 f中国/被管制市场:昇腾 + 真武 是当前最有经济性与可持续性的路线,综合来看能把 token 成本压到 NVIDIA 方案的 40–70%。 |
评分
-
查看全部评分
|