TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沉宝 发表于 2025-2-22 00:10
2 J. X t! H# `, f9 ?# A$ |: D3 Q. `欢迎讨论。
8 m6 G) L& y; m+ p: g1 L% ]2 l! y# j+ w, ^& C6 _# K
首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ...
$ E! Y1 O! `7 h& [刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本0 a( p2 a) P- n, y
显卡用的是3070M 16G,环境是Ubuntu 24.04.26 U+ R. \' a" F/ `" P
输入大概是10不到一点,输出大概是5,勉强可用
' F# f1 w J$ l( `0 _因为都是整的垃圾配件,总体的成本大概不到4000人民币
! x# C! _9 s* G0 u, |8 d: c
& s" \+ ~1 ~. W, w* r我估计如果他能够用DDR4+至强的话,应该可以到7-8的输出 l' ]0 k) |6 R. f) X+ m+ g2 [
如果是这个速度的话,个人轻量使用已经没有特别大的问题了 |
|