爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑   j+ ?9 c5 I' f" T0 X( a6 l

# r; ~6 b3 ^" Q, R7 c其实是个概率问题。
% t$ C5 X. p' \. @2 B$ D那本CLRS算法导论中,第 5-2 练习题。) O/ b, F( m; W% I9 w0 d3 l* b5 c1 `
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。3 j) r3 A% w" [- Z5 W2 T8 d
问题就是这个人的表述! f$ u+ @2 Y* b) h8 j- V) F4 z
https://math.stackexchange.com/q ... orithm-running-time
; J# o4 x# m2 w  B/ d
9 u4 m& e% ]3 m按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
2 h2 g$ j0 j2 h8 \
$ r$ b. U& Z" Q) h3 n5 x3 T- p/ h" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". + U3 ^! A/ V0 _/ z& Q
# s, U# Z* ~3 j
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。7 L! b. X1 o8 p- p3 C: Q

6 @1 b& A4 r' h; f老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
, ^* z* g1 D! g$ M5 v+ m
: t$ S5 \( ^* g/ K# f1 G您对答案的理解似乎有误。
& N* y# D8 v1 I# L/ p; V随机变量X是测试过的元素的数目% N, t% C$ Y  A( h( e7 R8 F
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
! o& @: J5 J$ `所以才有E(x)=sum(E(Xi))。" _2 Z" J" r8 l1 f. ^
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)6 Y0 O3 O/ z& C! ~* ?1 m1 Y
您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
$ {. ~5 d3 G+ v: Y9 z7 h: R. V# L  V* X0 @2 }
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
' S2 U* w" Q. t* V0 a6 J0 |2 N+ x% c# \% X( F
然后从头开始:
* r# S4 K: t; o8 \. s( @E(k|k)=1% O/ ^& f/ {" Q4 s4 x6 }% N
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
- n3 y1 F2 b( D% {' y7 U  [3 }E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1), J+ Q" s8 x; |' s
Finally, we can easily get E(k|n)=(n+1)/(k+1), j( L. B4 N: T: g! u5 X

1 E9 D: H+ J! n8 j  `% T原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32) b2 p# w7 ^0 y& }/ {  _. @
您对答案的理解似乎有误。/ k3 f- R" q% g9 z
随机变量X是测试过的元素的数目/ {( q9 G' b6 X8 O* P
而随机变量Xi是另一组随机变量,每一个都是个ind ...
4 `5 l3 k1 @% h9 z) s8 h
明白了。
) a# \+ ]9 y0 X9 b, z' w5 e; L是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)
! l7 w4 I2 ?6 p. n, z! A5 [4 z多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:445 h8 m/ @2 u* G& c
这个题目可以用递归的方法解决:
; v; b2 ]1 N% K# {6 K/ C/ J+ [- _2 ]  b( _2 q. N, \# p
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
$ z- ?) {" j) c( c2 a2 n5 u% P

  }9 A; @( k7 x/ r! H" ^& H# X& M' y递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
$ G9 |  _4 ]8 b/ g4 \! V/ r2 D递归法也是可以的。

: L8 N6 e& F' o: O" M1 ~其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
  C$ i8 h( M0 |5 f1 v
老福 发表于 2022-3-26 12:01
$ S% B) l$ Q. F其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
3 p& j! K, Q5 T  U% `6 B3 M5 _4 x

0 e' F8 o5 ?0 g2 ?& E8 F- N我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。. e5 U9 N" {& N  i9 W* o: |
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
' C4 U% V/ n' f3 j; p
+ A6 a' C# `; J/ N- I  k而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
4 E5 d- Q# `# v. O$ F所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
8 A% c! _# G: k( G' b
! t' b' l! a5 ^9 s3 A6 ?2 cLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. $ u) X3 m% S  O; s' s( b5 b
+ ~; `; Z5 I- j- C; F
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
1 a4 `) F) T* q. [) b2 C* m
2 B6 C. u2 [) Y' M4 |" eFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).# X% D0 N( {3 T+ ?4 O, B* Y

* ]; u% Q% e5 o" l: Y: dThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
1 f# v( v5 u$ D- h& d8 g3 o: e9 c( ^7 g+ h4 e9 u) n7 c9 ?; i
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2