|
|
本帖最后由 Menuett 于 2013-12-22 15:59 编辑
( C' G7 v4 M# g5 x: t煮酒正熟 发表于 2013-12-20 12:05 ( b; h/ ~5 u/ D' b
基本可以说是显著的。总的来说,在商界做统计学分析,95%信心水平是用得最多的,当95%上不显著时,都会去 ...
4 o+ D2 ?. R/ o& J) }" j& C
! y& u7 H7 I# N. I8 q# p这个其实是一种binomial response,应该用Contigency Table或者Logisitic Regression(In case there are cofactors)来做。只记比率丢弃了Number of trial的信息(6841和1217个客户)。 1 r! j$ R* @9 o. M
+ i6 ^$ t4 _+ b5 Z6 U$ {结果p=0.5731。 远远不显著。要在alpha level 0.05的水平上检验出76.42%和75.62%的区别,即使实验组和对照组各自样本大小相同,各自尚需44735个样本(At power level 80%)。see: Statistical Methods for Rates and Proportions by Joseph L. Fleiss (1981)% ]+ f8 D9 d% i
* ? ^- s1 I3 Y, J7 eR example:
3 Z0 s5 ?4 O2 N1 j: l. B; j' P' x2 a3 c' {3 W, \
> M<-as.table(rbind(c(1668,5173),c(287,930))); | }" r( s% D5 p8 S6 b
> chisq.test(M); {/ L3 e# e' @- _9 J7 N3 h
) x/ @- V9 V6 m* Q
Pearson's Chi-squared test with Yates' continuity correction
" i# v- l, ?# }- R% V9 u, n
( m- k4 j( C5 |# Ldata: M
* L9 m3 Q/ i: I, ~X-squared = 0.3175, df = 1, p-value = 0.57315 \! T6 ]* H; p, c
$ A% b' \4 A2 t) ~- }Python example:* O; ]* D0 a8 s1 K& x+ [6 I
/ D; }' L) B7 O4 M! |8 p: q- k1 y>>> from scipy import stats
! s- H9 H7 G# @* ~) O>>> stats.chi2_contingency([[6841-5173,5173],[1217-930,930]])' i3 k1 V2 l; X! C/ k; {3 a4 S& h/ u
(0.31748297614660292, 0.57312422493552839, 1, array([[ 1659.73628692, 5181.26371308],
( \ b; ^8 w7 K* `3 P [ 295.26371308, 921.73628692]])) |
|