爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 , E1 F& `7 @& o' [
3 ]- O) p; L- C3 `- h2 z& o
其实是个概率问题。4 S) a: E$ c6 T, |+ f. o
那本CLRS算法导论中,第 5-2 练习题。/ y; `' f9 W1 N
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
& h. {, q  c6 M$ @1 d问题就是这个人的表述
; z& I+ T0 l, R2 j: D" W" H/ Y, ~https://math.stackexchange.com/q ... orithm-running-time8 m5 w8 r. T9 I4 G! u( h

0 c7 y. W; g6 X; M4 x按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)$ g% f+ r5 o1 D7 H* {% h$ F0 h
6 i) t' a$ e9 y! N; F/ R
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
; G; ]" G& `# o% A) J
5 W3 @( C' s2 u3 u. D0 w5 l; f7 d没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。( x& S2 |+ v0 Q3 Y: m- m

; q3 J! f6 R$ r! s. X老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 ) p! O- ?2 h2 c% g

7 R) S' F& O3 u$ F& }9 A! f, B% }您对答案的理解似乎有误。% B( J  A; s/ y. t
随机变量X是测试过的元素的数目: p: a% g( z  ]' f( N
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
8 i* A4 u* D' q- I% [) t# t$ p所以才有E(x)=sum(E(Xi))。) I! b# U/ ~' V3 A# l  f
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)% {$ U+ v! o0 `9 ^
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
) Q  i: m  K) y/ L
4 ?! _4 x" `2 c9 ^% QE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
3 ~- y+ y$ V, T
* |1 u7 Q7 S0 p# _然后从头开始:; t) M& P5 \% p
E(k|k)=1
2 \# B- N+ h4 N1 k+ Y1 |+ wE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)! w- B: A4 o+ S( b. m. M
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
' O' ?, i! f% Q( U, Z% z  bFinally, we can easily get E(k|n)=(n+1)/(k+1)# ~0 ~! H4 [$ X' {( F& ~7 J/ p! E2 p
9 f3 u3 F1 d2 |5 g
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32& ^3 s8 r$ E$ L2 j: d
您对答案的理解似乎有误。
5 t1 U8 F4 g$ H+ |随机变量X是测试过的元素的数目- h$ |6 I5 n: a/ ~" @. u' B! r6 c
而随机变量Xi是另一组随机变量,每一个都是个ind ...
; t% e$ b9 z1 f
明白了。
* q. p$ y5 D7 o# l6 n是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)" i" R1 s. v7 E7 C
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
9 Z. q) x+ F' A# Y这个题目可以用递归的方法解决:+ q5 {6 ~% L8 j2 l2 D

  I3 Y  Q: j  Y- U& zE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

: Z" h' C5 C/ Z* |! j9 c5 g
( q6 h, P7 u8 c5 f递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
0 S# \/ I1 Y$ R递归法也是可以的。
. B$ P% Q2 a$ b6 W
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
* w2 j* u. e$ v3 y9 b1 S/ C# A
老福 发表于 2022-3-26 12:01& @- V6 M) p1 f5 K
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...

% h- q( H+ X5 O- q! j6 g' u+ H5 ~3 p, @' y4 g2 e, f
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
, K" a) j7 E: \5 u9 O# T否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。4 F' n4 m5 j% B

; K/ y  m9 r- h$ \而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。8 L/ Z# i8 ?+ P% F! _/ n4 U
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
1 C8 o' @1 }& z& m8 B
0 n, J. ~# O4 c' F/ V: ~Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 6 y# f2 Z. ~) ~  O! g3 Q0 c

8 E+ n/ J; z' [- W1 pFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.0 y' ^2 w4 i. u/ K0 d' A  [0 M

* Z, b) b& ~  O/ w* nFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).+ D* x$ o' e. w# @9 ^
2 W8 n0 w* ?  `6 k6 H
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).; d5 K( K& m* x' i. n- L

8 A8 X1 F. q. S9 c, B2 g4 c, E理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2