设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 2300|回复: 4
打印 上一主题 下一主题

[信息技术] 继续请教问题:关于 Pytorch 的 Autograd

[复制链接]
  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    跳转到指定楼层
    楼主
     楼主| 发表于 2023-2-14 13:09:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 雷达 于 2023-2-14 13:12 编辑
    ! G$ @/ X( g$ J& }, h1 Q1 S* O( U" J/ V- S
    为预防老年痴呆,时不时学点新东东玩一玩。. G: S, n, f; J' f' d9 Y" V" j
    Pytorch 下面的代码做最简单的一元线性回归:
    + @# M5 w7 i! M----------------------------------------------5 y& n4 S1 q9 V3 T# G
    import torch+ e. c& F) v: {2 m: d+ @' D' _
    import numpy as np
    ( W4 V( a9 y7 g+ mimport matplotlib.pyplot as plt
      ~) c# R" ^0 Q/ b2 \import random) P: c* K/ I3 q! X! |$ _. B, O, `: ?0 `  ?
    ! Z& ^( C9 P+ Q1 I1 N( [
    x = torch.tensor(np.arange(1,100,1))
    8 F4 Q, z" M. P; [' ly = (x*27+15+random.randint(-2,3)).reshape(-1)  # y=wx+b, 真实的w0 =27, b0=158 s) L8 r9 [$ z% L

    * u; ^, f9 n1 Q' r% Iw = torch.tensor(0.,requires_grad=True)  #设置随机初始 w,b
    % H6 X  U' m8 t9 lb = torch.tensor(0.,requires_grad=True)0 l" w6 K! |  R! D3 Q3 i' I
    , l; M- P! e" q, j* ?) p$ X
    epochs = 100* ~$ ]* _- D$ M, L
    2 X( |0 N) _8 ?
    losses = []' E; f' G6 N4 ]) G4 p
    for i in range(epochs):
    / S& ?2 l% Z7 z: r  y_pred = (x*w+b)    # 预测
    # c' ?9 S$ W7 K# G; s0 [- P  y_pred.reshape(-1)
    . H. e+ l, j7 D! b2 M8 P3 ~ 3 y9 m7 a/ `3 Z4 h+ y
      loss = torch.square(y_pred - y).mean()   #计算 loss4 o; s+ t* M# r( H/ C, o0 C) o' ?4 n
      losses.append(loss)! I  M3 h- P) l0 c
      ; G8 k6 b& S( ]1 B* ~
      loss.backward() # autograd6 D, t) z: T% K; `$ F) Y
      with torch.no_grad():
    6 n( n& @  }+ z    w  -= w.grad*0.0001   # 回归 w8 D/ ^" s+ N$ Y9 s5 U4 N4 i
        b  -= b.grad*0.0001    # 回归 b
    # c  E2 H& {9 f. w% D+ o  w.grad.zero_()  
    5 W: e* e0 w. k" d: v2 G/ h' }; e/ b  b.grad.zero_()0 F8 I" m& U* v# L9 d8 H# t2 o7 b

    : C2 U% S. ~% U1 p6 b  aprint(w.item(),b.item()) #结果
      Y9 a, Z0 p+ K
    7 p3 p0 }2 d" U3 V* bOutput: 27.26387596130371  0.4974517822265625
    ( o+ ~4 c( J) ]  A----------------------------------------------
    / b+ Y; I9 q5 E- k# y) |, m3 d6 z最后的结果,w可以回到 w0 = 27 附近,b却回不去 b0=15。两处红字,损失函数是矢量计算后的均值,感觉 b 的回归表达有问题。* E+ k9 r& R2 ~, T0 [/ q4 F
    高手们帮看看是神马原因?
    4 ~; m" _0 n* C$ D' H7 X

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不明觉厉

    查看全部评分

    该用户从未签到

    沙发
    发表于 2023-2-14 19:23:02 | 只看该作者
    本帖最后由 老福 于 2023-2-14 21:58 编辑
    . I4 d8 A6 v: B( z9 p
    % B: k7 G8 j& j' o/ a, g没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    & I  ]' @' V* z! l2 {-------1 A2 f( v0 L& r7 ]3 l
    不好意思,再看一遍,好像你在自算回归而不是用现成的工具直接出结果,上面的评论只有一点用,就是确认是不是算法有问题。
    . ?8 {, [: n, e$ v  w! a$ a3 G-------" F( }# f0 F3 f! E' R4 r
    算法诊断部分,建议把循环次数改为1000, 再看看loss是不是收敛。有点怀疑你循环次数不够,因为你起点是0, 步长很小。只是直观建议。

    评分

    参与人数 1爱元 +10 收起 理由
    雷达 + 10 谢谢建议

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    板凳
     楼主| 发表于 2023-2-14 21:52:57 | 只看该作者
    老福 发表于 2023-2-14 19:23; W" F, T- Z( x. h
    没有用过pytorch,但你把随机噪音部分改成均值为0的正态分布再试试看是不是符合预期?
    7 v3 O# r4 f" X# l-------
      p4 l$ i/ R. W/ y; `$ d: B不好意思, ...

    & U7 o5 q& ~3 D8 U! U/ o谢谢,算法应该没问题,就是最简单的线性回归。
    : ^7 J& E1 [' V" G我特意没有用现成的工具,就是想从最基本的地方深入理解一下。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2023-2-14 22:00:48 | 只看该作者
    本帖最后由 老福 于 2023-2-14 22:02 编辑 2 @5 r" R0 [' S4 q7 Z
    雷达 发表于 2023-2-14 21:523 [. ?6 E1 N5 L" f3 d3 U# [
    谢谢,算法应该没问题,就是最简单的线性回归。
    * h- l6 N6 `+ j8 R我特意没有用现成的工具,就是想从最基本的地方深入理解 ...

    8 a  e% q' H* t. H9 P, _
    + S1 s; O" ~" V1 Y  v5 w* b/ M* v刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。. m3 R5 j# O1 K) _
    . `( N+ }5 z" n/ F9 ]4 c/ q6 F
    或者把b但的起点改为1试试。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2025-9-22 22:19
  • 签到天数: 1183 天

    [LV.10]大乘

    5#
     楼主| 发表于 2023-2-15 00:25:26 | 只看该作者
    本帖最后由 雷达 于 2023-2-15 00:31 编辑 + C7 J6 e1 r! `
    老福 发表于 2023-2-14 22:00
    ( D! ^' ^$ h2 u3 m/ v刚才更新了一下,建议增加循环次数或调一下步长,查一下loss曲线。; G& x) T9 N4 t( d( z' q
    1 i9 D7 c9 b& K( j4 G
    或者把b但的起点改为1试试。 ...
    # ~5 M9 y- ]/ p* B8 H/ e: }' h- ~; }
    + \+ Y+ @% D0 o- N2 u
    你是对的。
    1 r6 N6 v0 n. A( X+ r去掉了随机部分! w7 g7 G! y% C# f: ]6 P( d6 r
    #y = (x*27+15+random.randint(-2,3)).reshape(-1)' L) a1 u8 p2 N2 E
    y = (x*27+15).reshape(-1)# J# q" x7 \. U

    5 S9 f- K/ x5 ?3 r2 c5 H循环次数加成10倍,就看到 b 收敛了0 A  o4 e4 r" o# g" ]
    w , b
    + `' `& X% I4 B27.002620697021484 14.8261671066284185 v: t7 q9 J7 g' x1 d, s8 y

    8 d0 e: [0 ~# `/ x; h和 b 的起始位置无关,但 labeled data 用 y = (x*27+15+random.randint(-2,3)).reshape(-1) ,收敛就很慢。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-1-8 13:40 , Processed in 0.027421 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表