TA的每日心情 | 怒 2025-8-7 11:56 |
---|
签到天数: 1132 天 [LV.10]大乘
|
沉宝 发表于 2025-2-22 00:10' j& q9 j+ v6 o& Z! s- l* h
欢迎讨论。, Y& {, O# L7 f. e
$ L- G, S# I, K* i首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ... ( U+ c, {: j% T' e$ K: g6 ]/ c
刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本, J6 Y! x/ h, L
显卡用的是3070M 16G,环境是Ubuntu 24.04.2
" ^" K. U5 F. U: c% c输入大概是10不到一点,输出大概是5,勉强可用 B: y0 i- Z( k( C+ d0 ?$ e* \
因为都是整的垃圾配件,总体的成本大概不到4000人民币1 u j( Y4 M* B e+ Y6 o
" q& f9 D4 a( R
我估计如果他能够用DDR4+至强的话,应该可以到7-8的输出& h2 T) z" u+ q0 a
如果是这个速度的话,个人轻量使用已经没有特别大的问题了 |
|