爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 + u2 f- @& W2 D( E
% \+ z) X2 O& [+ O8 M
其实是个概率问题。
# T0 [; w7 f* Q# i' K. G9 j那本CLRS算法导论中,第 5-2 练习题。
$ }  p1 J5 }! T1 E+ Q在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
1 ?* h6 l5 x6 C$ I问题就是这个人的表述0 F* J* V% C) R2 V* C
https://math.stackexchange.com/q ... orithm-running-time' f+ X" w" V9 _3 W$ q4 B: r) d9 Z

- Q# s& A6 R' N  h+ m- h按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)1 v  M. T0 W+ G3 H1 ?

$ ^( |5 Z# Z5 a; c" a" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 5 [6 Q) ]- T+ q) V4 \0 o  N
2 V, \+ j8 e* q" l$ V* q
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
+ z; M2 ?. b5 F5 C
; z% f7 a/ c/ D4 L3 A5 `老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
6 a: F1 |9 T7 I& m% e6 t" i2 a; S" e3 N+ ^: k: F  x# A
您对答案的理解似乎有误。
! T. d4 T. o5 D, `: o随机变量X是测试过的元素的数目
* j, l* r9 O( I# U  E而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
* m, ]% M/ h4 ?7 ?. j3 x+ y$ a9 E0 j所以才有E(x)=sum(E(Xi))。5 v& t5 K- t7 h4 q& F
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
/ N# u2 u+ H0 \4 m2 A( H您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
$ q- A/ G# w3 k! ~( s  o
3 ^' U  |4 j" t1 `3 OE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
! T5 x2 E: L0 V$ ^6 J1 a" x# W4 W2 A3 r
然后从头开始:
% @$ e% P( U7 g6 |! m: A9 bE(k|k)=1+ i4 R9 G$ C% ]9 o$ O  T0 r& f
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
1 M; U7 L# j, G3 QE(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)9 o9 b8 y7 B7 b! A$ o
Finally, we can easily get E(k|n)=(n+1)/(k+1)- A  @% p, K7 ^. |/ }9 S5 S
$ A# c5 l' `5 m
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
" }# t1 ~' p3 b5 ]  [您对答案的理解似乎有误。& y/ J& R9 ~9 d+ U, ~! D: W  ]) z; {
随机变量X是测试过的元素的数目4 A9 `: ^! V+ J6 g4 J9 l6 K- m
而随机变量Xi是另一组随机变量,每一个都是个ind ...

- L1 k$ Z! F! f; w9 q5 @明白了。
4 u8 V& d6 ?5 g9 P; C" M0 U: g是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
* u0 @! _% ]6 T0 G( K多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
/ Z$ H5 R6 A) z: X- d+ j7 ?- S这个题目可以用递归的方法解决:
" J: W$ ]$ n( y  x% S' s* C% Y  q5 ?+ u. l0 `# q
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
, m- [6 N* D: E

  s" y6 t0 y' l! \: |$ {递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
( h) t2 }6 g- I递归法也是可以的。
5 ~: }9 x# e( {6 m2 B$ n
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
* \* |3 d; W7 ]1 i0 c$ Q+ q
老福 发表于 2022-3-26 12:01, P! ]+ B* I0 e
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

" ?% I8 \+ S& L* m# M) N' l  {! r, B
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。) Q! Z' {& A: [1 U6 I* X
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。2 z3 P& y9 ^. G7 O

$ Z) w! [; b/ k' D( l& F而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
2 d- C4 [2 U2 ^2 K# J: U  b所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
2 {+ ]  z5 C* R9 O6 @) ]' Z! S* Y
4 v, X. P$ i& J- L( ILet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
# E  b+ H% \. D6 ^0 i# E1 B
& a6 f. m9 z& YFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
/ g4 ]6 W9 t8 S: L& i$ V! j  B' `" |6 b
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
/ T8 h; v# [% j$ ?  f5 b) i6 R6 V/ w
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
9 i, A# t' V7 }
+ b5 H( z& P: R1 D. E) N5 F( W理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2