|
|
本帖最后由 Menuett 于 2013-12-22 15:59 编辑
& n/ Z8 H- C( k s6 r- g7 J8 w煮酒正熟 发表于 2013-12-20 12:05 ![]()
) _4 X2 T8 t; G- Q/ [" @基本可以说是显著的。总的来说,在商界做统计学分析,95%信心水平是用得最多的,当95%上不显著时,都会去 ... 8 ^7 Y$ o1 N. A
- W2 O9 P- N" d
这个其实是一种binomial response,应该用Contigency Table或者Logisitic Regression(In case there are cofactors)来做。只记比率丢弃了Number of trial的信息(6841和1217个客户)。 ( y0 r: u- D! o% _0 W3 n
) J0 H4 ?! n5 L! E结果p=0.5731。 远远不显著。要在alpha level 0.05的水平上检验出76.42%和75.62%的区别,即使实验组和对照组各自样本大小相同,各自尚需44735个样本(At power level 80%)。see: Statistical Methods for Rates and Proportions by Joseph L. Fleiss (1981)! x( K( y N" Y) R; [3 T( ~2 h
3 f1 q/ h, F; _# U9 [0 F
R example:
9 L! |& m3 y1 [6 E; l, Q& U, Q- n. D! |' e; l9 J6 W3 y
> M<-as.table(rbind(c(1668,5173),c(287,930)))
/ _9 u# F: z! o' q> chisq.test(M): @9 ~0 G4 @& Y) M* f' f2 i
9 [6 S* I. p! o$ D Pearson's Chi-squared test with Yates' continuity correction
. s( A5 N) q" H0 ?' r' n: k7 o% j' m% p$ b
data: M9 n$ J6 H0 Y$ j. M }; `/ k7 W
X-squared = 0.3175, df = 1, p-value = 0.57313 ~3 b. q2 y1 ^- S/ l
) l! w- O* r, S( E; h$ P f' C
Python example:
5 ?3 q# l0 B+ u h& k5 `2 D3 l/ v7 s) Y
>>> from scipy import stats
% E/ H3 t0 I& ]" B% d; J" b>>> stats.chi2_contingency([[6841-5173,5173],[1217-930,930]])
) ~6 g" q2 }& G(0.31748297614660292, 0.57312422493552839, 1, array([[ 1659.73628692, 5181.26371308],
# k, j; {$ U5 t6 j& ]* Z* i [ 295.26371308, 921.73628692]])) |
|