设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 晨枫
打印 上一主题 下一主题

[科研心得] 问题:如何从数据里估算普瓦松分布的均值?

[复制链接]
  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    68#
    发表于 2019-2-4 23:49:10 | 只看该作者
    1, 计算最大值,
    2 H( e! [4 s' f- F) O' X8 v2, 计算左右的斜率! t: ?; ]+ T1 U* u- G8 a
    3, 计算左右直线的交点。
    * p# P: ?6 Q" v6 X: P- U( l1 R% D4, 由交点根据斜率反推峰值的大概值。这个是quick&dirty的解决办法。想要准确,还得曲线拟合。2阶应该就可以了。过高反而会引入误差。但是拟合的资源消耗可能系统付不起。
    % X$ m8 h! K- {/ u
      b- z7 b$ w9 ^http://www.aswetalk.net/bbs/home ... um&picid=1029230 o5 }; V' t0 L9 q% H9 Y' o" [' y3 X
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-7-26 05:11
  • 签到天数: 1017 天

    [LV.10]大乘

    67#
    发表于 2019-2-4 22:53:44 | 只看该作者
    晨枫 发表于 2019-2-4 22:38( Y8 T- p7 E) b5 P0 g+ i; a, [
    嗯,我再想想。谢谢。

    6 l/ _7 _& c8 a" L我曾经想过一个和42楼类似的办法。区别是分母不是板数,而是各个板加在一起的温度的和。如果这条曲线真的是个density function,也就是说,曲线下的面积等于1的话,这个办法是可以的。这个办法就是把温度类比成统计学里的sample size来处理了。但是曲线下的面积等于1这个假设肯定不对。我曾经想过把它scale成1就是的了。但问题是你的纵坐标0度的设置应该纯粹是arbitrary的,但是这个0度的设置会直接影响scaling以及最后结果,因此这个办法也不行。
    3 `4 R( ^$ ?' Z5 ^6 t9 s% Z# u- Q7 Y  q
    ) S  h, @' f9 d- f% G如果想不出数学上的分析解的话,我的建议是你想一想人的直觉是怎么来处理这个问题的。你前面说,人眼一下就能看出来。把人直觉的逻辑想清楚的话,写个if then else的程序实现应该不算很难。
    4 Z3 h5 Z9 P; O: ?1 {# }& I4 R" f
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    66#
     楼主| 发表于 2019-2-4 22:46:52 | 只看该作者
    视觉错误 发表于 2019-2-4 08:45
    ! [3 p' w. R. B4 A- n同意伯爵的看法,本质上是个曲线拟合。
    3 }, ]2 Q( Y' J5 F/ t这个曲线有点像某种分布曲线,晨大强调这个造成误解了。 ...
    ' x' j0 y! t2 f1 O4 K- A
    抱歉!我还特意提一句,这不是统计问题,但还是误导了。多谢各位指点。我这会儿有很多办法可以试试了!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-4-14 22:10
  • 签到天数: 354 天

    [LV.8]合体

    65#
    发表于 2019-2-4 22:45:39 | 只看该作者
    同意伯爵的看法,本质上是个曲线拟合。, Y4 z- @# q( G6 u
    这个曲线有点像某种分布曲线,晨大强调这个造成误解了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    64#
     楼主| 发表于 2019-2-4 22:44:55 | 只看该作者
    视觉错误 发表于 2019-2-4 08:42
    - n0 y- \0 a5 N8 h1 g( D  i* D: x9 h这个峰值位置还需要用于控制吗?
    5 _% L6 U8 ~: \. {我理解这个峰值位置计算出来也就是用于参考吧。 ...
    ! M/ s& |% R/ W) U% v. u
    我就是想用于控制。这对应于吸收塔里放热反应的热点位置,决定了吸收效率。跑得太偏了,要么浪费能源,要么吸收不达标。传统的单点温度控制效果有限,很容易被上下移动的峰值位置所“误导”。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-4-14 22:10
  • 签到天数: 354 天

    [LV.8]合体

    63#
    发表于 2019-2-4 22:42:59 | 只看该作者
    晨枫 发表于 2019-2-4 22:259 W# H/ w! H$ k) w
    是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作 ...

    : o5 |2 G6 E/ C/ a9 k这个峰值位置还需要用于控制吗?* n: n, H' Z* R, f- {
    我理解这个峰值位置计算出来也就是用于参考吧。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    62#
     楼主| 发表于 2019-2-4 22:42:56 | 只看该作者
    雨楼 发表于 2019-2-4 08:37
    ( S: s8 Z6 _2 Q8 [1. 20个数据点在分布上有没有规律。比如两头低中间高。- `1 t: D$ h  g3 g) f$ b, m
    2。规律稳定么?3 W$ K# Z' p' O( @$ }
    3。可不可以简化成20个点里找最 ...

    5 W1 d( X* ?- G1 t: ?两头低,中间高,但峰值形状随工艺条件而变,可以从“一头歪”的泊松变到对称的正态,然后继续变到往另一头歪的泊松。选最大值然后插值也是可以的,我就是在想是不是有可以一次性计算出来的,而不需要这样搜索。
    / x  k: G& j- {" Q
    ( V4 P7 }# r% `# |如果42楼的办法最终不行,我可能回过来用你的办法。谢谢!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    61#
     楼主| 发表于 2019-2-4 22:38:58 | 只看该作者
    Dracula 发表于 2019-2-4 08:337 V: {4 z; `8 x. A2 V7 t- Z
    42楼那个办法不对。那是把这当成个统计学的问题来处理,但这不是个统计学问题。你的纵坐标是温度,不是sa ...
    " ~9 m' r3 _1 I: i) ^
    嗯,我再想想。谢谢。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    60#
     楼主| 发表于 2019-2-4 22:38:00 | 只看该作者
    雨楼 发表于 2019-2-4 08:31/ }5 f( A6 o5 s
    就是正态分布然后在x轴上平移么? 类似Y=(X-a)^2.
    5 p) C9 I5 {: N6 V
    差不多。我开始也想过用抛物线然后平移,但平移量本身也要最小二乘出来。可能还是可以线性化然后用简单的最小二乘。我来试试看。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    59#
    发表于 2019-2-4 22:37:37 | 只看该作者
    晨枫 发表于 2019-2-4 00:03
    ( F  @$ d6 m  t/ p- s咳咳,这个其实不是统计问题,是从有限的温度测量估计温度分布曲线的问题。吸收塔一共20块塔板,每块塔板 ...

    ) g4 l) l0 v  A1. 20个数据点在分布上有没有规律。比如两头低中间高。$ n/ f2 _3 k% X  X# R) A! V% b0 o
    2。规律稳定么?; f4 C2 B* Q+ Y$ b6 F* [" k
    3。可不可以简化成20个点里找最大值。
    - w) s( ?; U: y: ^. Y6 W6 B4。峰值如果不在采样点(塔板),而在塔板之间,只能按相邻塔板的问题计算温度曲线斜率,然后插值,而其要比较峰值塔板两侧的斜率,取较大的。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    58#
     楼主| 发表于 2019-2-4 22:35:21 | 只看该作者
    数值分析 发表于 2019-2-4 04:34
    * W5 g1 K) k# I+ n7 i* J" c多解释一句scale那块儿。因为泊松分布曲线下面的面积是1,而你的histogram显然不是,所以你的histogram和 ...

    2 L3 [4 K0 q5 x0 D3 E多谢!记住了!
    1 R+ K/ H4 W. Z- _- i8 b; ~! B8 D. O' J; l! \$ R6 N
    其实你说的办法我已经试过。我把正态分布一边的尾巴砍掉,至少外观上接近泊松或者对数正态。只要有峰在,估计出来均值就还不错,越对称越准确,就有点窃喜。但对道理不摸底,不敢放手用。除非在数学上站得住脚,否则在线的时候没人看着,给我乱估一个就完蛋了。现在看来,道理就是你说的,这个办法不只适用于正态分布。曲线只有只有半边的话,就有点悬,这个可以理解。一般到不了这个情况,程序里简单判别一下也不难,另作处理。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-7-26 05:11
  • 签到天数: 1017 天

    [LV.10]大乘

    57#
    发表于 2019-2-4 22:33:46 | 只看该作者
    晨枫 发表于 2019-2-4 22:20
    ! m3 E% {0 S+ h4 E$ a对,就是这个意思。我也提到了,不是统计问题,只是“形似”,想看看统计里有没有现成的办法。楼上42楼就 ...
    ) Z1 E' {! \9 S/ b  `1 [3 B
    42楼那个办法不对。那是把这当成个统计学的问题来处理,但这不是个统计学问题。你的纵坐标是温度,不是sample size,不能这么用。最明显的是,那个办法解出来的量纲是温度,而你想要的应该是具体是那块板,因此那个解和你想要的没什么关系。( b3 J/ k5 ]1 M% S6 x
    6 ]& ?' M( ?$ {# o
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2020-1-3 00:51
  • 签到天数: 71 天

    [LV.6]出窍

    56#
    发表于 2019-2-4 22:31:30 | 只看该作者
    晨枫 发表于 2019-2-3 23:46
    ( s3 |9 ^3 I( M/ a6 [8 n4 E是我描述得不好。再来一遍。( l$ |- y) d2 r& a
    ; Q: h# t6 D, H2 d
    我有一条样子像泊松分布的温度分布曲线,但只有几个稀疏的点,想用类似泊松 ...
    , A$ m- z. u& ^8 i1 ~
    就是正态分布然后在x轴上平移么? 类似Y=(X-a)^2.
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    55#
     楼主| 发表于 2019-2-4 22:26:58 | 只看该作者
    松叶牡丹 发表于 2019-2-4 00:36) K. I7 o7 `  ]0 k
    晨大辛苦,您太客气了。祝新年快乐!

    . d4 I+ r! z7 e+ O2 w( R松叶MM新年快乐!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    54#
     楼主| 发表于 2019-2-4 22:26:25 | 只看该作者
    gnomegordon 发表于 2019-2-4 00:39
    + s) W2 q  n* T5 T2 a' Kapologize. 网上搜code太麻烦,还得验证。最好有本书可以翻翻 或者搜library

    ; [1 x0 U' v  @再次感谢。楼下45楼有好办法,我先试试那个办法,比kernel density简单多了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    53#
     楼主| 发表于 2019-2-4 22:25:29 | 只看该作者
    视觉错误 发表于 2019-2-4 04:02: R' P: }1 z9 D- [$ P+ t
    我记得MATLAB支持OPC
    / j% [  g+ `: y9 a! s5 L
    是的,我以前还试过用MATLAB C通过OPC与DCS相连,在技术上这是做得到的,但可靠性达不到要求。OPC是不作为可靠的控制信息通道使用的,只能传送点监视数据或者一般数据采集。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    52#
     楼主| 发表于 2019-2-4 22:23:42 | 只看该作者
    视觉错误 发表于 2019-2-4 03:40
    1 F7 m7 f, Z0 g( j石化行业的DCS应该Honeywell多吧,这年头不支持OPC的很少了。, Q; H: p0 C7 {# `
    数据送到电脑上算,算了以后在送回去。 ...

    2 n/ z0 V5 p( _- i我们有OPC,问题是可靠性。用以下层基本的回路控制一般不用OPC,当机或者“交通堵塞”的后果太大。这是惯例。只有上层的APC可以用OPC,当了就自动shed到基本控制。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    51#
     楼主| 发表于 2019-2-4 22:21:02 | 只看该作者
    小刀 发表于 2019-2-4 06:39
    % Y$ C+ p" p6 W! n' y+ w: E可以试试GMM Guassian Mixed Model去拟合统计分布
    ( K4 _/ B" l6 A0 A
    这个还是太复杂了。用在控制回路里,必须KISS。但还是要谢一个!
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    50#
     楼主| 发表于 2019-2-4 22:20:16 | 只看该作者
    Dracula 发表于 2019-2-4 08:070 k6 T- s% h7 O
    我又看了一下你这个题,终于看明白了。你的问题是一条曲线类似于统计学上Poisson或者log-normal的density f ...

    ' @2 V9 K8 x; ?: O4 g. D对,就是这个意思。我也提到了,不是统计问题,只是“形似”,想看看统计里有没有现成的办法。楼上42楼就是我一开始想到的办法,但只想到那能用于正态分布,正想改造为对数正态,没想到可以直接套泊松。这就好了。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    49#
     楼主| 发表于 2019-2-4 22:17:54 | 只看该作者
    数值分析 发表于 2019-2-4 00:56/ b6 v9 z0 u$ x0 }) H' r
    你应该不用拟合分布函数吧?你只想知道峰值的位置,然后你又知道(或者说你假设)是泊松分布,所以峰值的位 ...

    % Q7 ^/ X& z  W3 N  o# j6 {这个办法好!回头试一下!我是打算用这个办法当正态分布处理的,没想到也可以相当直接地套到泊松分布。可能这就解决我的问题了!多谢!
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-6-16 22:20 , Processed in 0.048407 second(s), 17 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表