爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 ( V& B! ^% z, J: x0 W

5 G! ?- n0 o1 z; l! j0 X1 P+ f其实是个概率问题。, Z/ C: E% K: @7 }1 _, U$ _4 t
那本CLRS算法导论中,第 5-2 练习题。& k; \( D# ~7 v; m4 d
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。) u! q: o; L* {4 |
问题就是这个人的表述( J0 N1 f! P- I7 m8 D* J3 ^) ^
https://math.stackexchange.com/q ... orithm-running-time
' H8 {9 x7 [) {
9 P( S9 X. m  f0 |0 H按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
- C  d, I) B4 p8 v4 C& T9 I
% q) O4 x* T$ |  X  p" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". 0 z: d, }( H) U0 H3 y/ u: Z

1 n: W% E7 ~$ n8 Y没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。! ]! M; F% |0 b! u* V
# p  ?5 v6 F( M
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 9 N. N& A/ N4 k$ A
( G1 B* b" d# |8 X: i3 S- D9 X- _
您对答案的理解似乎有误。
3 b: S1 L# c" M2 V! t) B0 a+ a" Q随机变量X是测试过的元素的数目" F) i  D# t( q5 N
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。3 K& w$ D; }$ k2 _, i
所以才有E(x)=sum(E(Xi))。& K. a. V7 z! _' I
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1); [" u" d9 j3 O! \7 Y
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
7 L" B) K9 s* x( y/ j; I/ r, ~6 i0 _  [' N; {1 \! w# c
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
' ?  n" F0 K$ M6 O5 r
) ~) x# h8 q* i" U! c然后从头开始:$ R7 J# i% G( K, l8 C2 `
E(k|k)=17 A$ M5 o. s5 N4 x
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1). Y) e& J0 M$ q& t* Z& r
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)9 o8 _, `* k* |
Finally, we can easily get E(k|n)=(n+1)/(k+1)
. w4 I$ h8 @$ l# O3 z) M
+ u( e" I- f9 Y6 Y$ L原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
( Z, c, G9 A& H1 M您对答案的理解似乎有误。
( H" x+ [* q. I4 W随机变量X是测试过的元素的数目
8 G8 ]' [7 B6 U2 t  D2 U而随机变量Xi是另一组随机变量,每一个都是个ind ...
. _* w4 a0 f  J
明白了。, y( {( q- Q; u, k8 O5 B
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1); G) V0 M- u( u1 N
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44- g* n' |: K6 M8 C" h+ f
这个题目可以用递归的方法解决:
6 b: H, f+ o# t; }1 Q+ T  `- F' d5 v' B& m4 v
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
9 A' t: X3 z2 k; v

4 E2 ~& t1 h4 T7 M! z递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:070 [  c4 L( j: {. _8 f
递归法也是可以的。
" O, P' @5 \: v- G  j9 b- C
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
/ m: e' B; @8 f4 J& T$ X
老福 发表于 2022-3-26 12:014 P5 K# ?+ k' y) `/ W" h
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

& s; G) J2 i: Z' k7 P) g7 ~' v; f7 L, Q9 z9 L2 b4 t; a# p* i
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
' H3 `% R4 v; ~- `否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。8 O" O+ p* T& J; A# F/ r

* k3 m) @7 ?5 E/ D( e  m而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
9 V3 i7 b. W0 n+ b所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。& g3 ?. A  h  f% c

9 n- }9 X! ?8 R$ S; lLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
0 g- y- ]) _+ k
/ x2 t0 t% q  |4 W+ S7 UFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
6 s' Q5 _: Y1 _5 e& I1 w; {' |6 w+ }' ]6 W3 t) C* Y! a, m
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
, l% T9 {3 D: |& t$ ~9 \( a- f$ x3 ^& ?) H1 {5 r  `
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).$ {# B' Y3 a/ y8 k2 i

- q3 {) q) ~( b& ]% l* I7 o理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2