爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 ) X7 [" O& U, O! \6 [
: f* d% R. c3 A" c! f
其实是个概率问题。
$ T% u- @* @! r  D! O那本CLRS算法导论中,第 5-2 练习题。
  O2 O. o5 B8 L; b: u6 @9 h9 a( U在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。0 K3 Q% T+ D0 c$ U4 J' L
问题就是这个人的表述7 }" m2 Z- ]0 B) Y- u9 g# R% z
https://math.stackexchange.com/q ... orithm-running-time
. E0 r- C( a$ T* J1 H4 {' e6 }0 W3 z' |
按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
" G" ?, x1 b- q- n' F" l; W! W8 Q5 Y+ q! M7 `, C8 I
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x".
/ _+ ?/ P5 t' L% ^
* }3 |* O5 w- _, i# O7 w+ ?1 H没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
& t) [- |$ ?) a2 E9 k2 `
8 ~9 G0 [+ N5 R: W) j老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
" q* }6 B* o$ r# ?& E% I5 u! |. N& L3 x
您对答案的理解似乎有误。
4 D7 ~+ N5 k$ L8 Y6 U  A随机变量X是测试过的元素的数目
& X# x5 L$ d, Y% @. b而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。- G9 d7 b" l8 R" w# \/ r
所以才有E(x)=sum(E(Xi))。! ^1 X, |+ {  F% @' e! c  l7 c
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
2 I- u6 ^5 a; a- K3 _您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
9 m1 S( C2 v! P$ J! ^3 r. v& _/ r( F, F0 [) Y: ^3 p8 g
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
* O, M3 Z6 T- n9 n8 P
6 a3 Z# n5 B+ U然后从头开始:
- }, G: j$ _2 B& O. jE(k|k)=1
3 Y- a2 |8 T) Q5 u" NE(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)' ~9 I( @; |( C
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)% f% X) ^7 W; Z' L# O
Finally, we can easily get E(k|n)=(n+1)/(k+1)' r8 I) [5 H/ ^3 ?, w9 V

" e- M, |2 E  t; u7 f& w原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
: s! a+ Y: x+ n% _您对答案的理解似乎有误。
3 v% N' l7 s. U' ^; y# o随机变量X是测试过的元素的数目
( W  s3 m; `/ e1 N6 t而随机变量Xi是另一组随机变量,每一个都是个ind ...

3 z; g' @7 k6 R* F; y  C0 m- x明白了。
+ M" e- V" b6 L6 h! m6 L是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
" \* ~/ m, z" h: z& x3 F多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44) _& L# v) K' B* S/ x- C& q: B
这个题目可以用递归的方法解决:# f9 D! D5 @  Y5 i# h/ B
0 Z# b( U- _) j6 u' [) |
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
6 \* e: @& B% ]" ?. O2 W
6 a6 C$ P0 F4 \
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
1 i% u) h( o# F, w- I& S! v递归法也是可以的。

+ V# s0 a5 T; h6 O其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 $ A" N/ o' C  a  J0 w
老福 发表于 2022-3-26 12:01
) C( t8 r9 I: f, c( b: f其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
' T9 r0 y0 |  G: Y

% g% S0 W' n4 I9 v: A) f; h我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。" {; j1 o9 J  ~& F; |8 T+ I
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。; z) e, h& P- y1 n& m
- z4 z8 ?# F1 B4 D; z( G( D; @
而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。+ c9 m+ B( \, ?
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
' s" f% w9 }4 ]* T( K( h( b
/ M7 k# y6 b% @% Z) v/ T2 rLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. ! f1 v5 l, z# a- K- G9 G

2 E1 @7 x9 P. n5 U! `$ zFor w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
5 |; _# W0 K- Y: E, T4 e' o; f5 ~! H$ ]; t1 F3 r5 n
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
! L1 K. M9 e5 N/ C+ P- C/ w. s0 K* q
3 _7 X6 g7 u/ }' ~There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).4 T) o  f* H- }+ B5 V: M

) ?# z) }: L& s( K9 Q/ c. r0 `6 A理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2