爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
7 x8 \# ?9 f( R/ e9 Y! `. a  A" ~  z% v) u5 p. q
其实是个概率问题。
& N1 f( r7 k3 N# f3 [. j那本CLRS算法导论中,第 5-2 练习题。, V  D+ g; q0 D
在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
7 K. i& Q8 e, C问题就是这个人的表述' M+ [  p: T) i
https://math.stackexchange.com/q ... orithm-running-time
9 K  i+ k5 d, K. A
: s3 H. [) n# @7 G0 J6 _$ R按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)9 H+ j6 v; V9 C1 L0 V+ h& A! j

5 f& n$ x- C  v% J1 \" e$ Y" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". ( ^+ _4 f) ^! a' \2 p

8 p6 ?, F9 ?3 Q. W, V没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。
7 g% v4 ^* ^4 i' Z( ], n' r" G& D- J5 _2 l( S
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑
% ?1 Z9 E8 Z! w9 ~% h0 f/ r
4 \3 S2 y: i2 N8 Y& S$ d- T% o* ^您对答案的理解似乎有误。
3 U8 @/ L( x. @5 b+ S" v随机变量X是测试过的元素的数目
- K( U3 s/ W5 W) ]' s而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
4 C  O3 ?, i) v2 P所以才有E(x)=sum(E(Xi))。
3 Z: |& _' {" Z: z* X. Z8 o& h而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
" e! V' Y4 w! h! S8 Q% ?( l您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
7 U  r  [- X2 ]% p6 ?  |% J* n9 @; u) z( j  M
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
( x6 p5 I# u* Q1 n7 `# Z# M) ]5 }
2 s! r$ ~: {* Z+ W! }" w3 ]8 y然后从头开始:
' s8 m* i( n1 t3 T3 TE(k|k)=1
2 |4 x5 G6 R2 S. Z) `2 A" a, [E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)( \" d( O; u$ |, |1 V
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
! u" i0 ~1 u0 SFinally, we can easily get E(k|n)=(n+1)/(k+1)
) q" W$ f1 j- s1 y/ q# v5 |. T( r! e) e4 c/ e0 }
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
2 T( G' H5 G& _1 L您对答案的理解似乎有误。
" {1 ]' i& C; }* v' L随机变量X是测试过的元素的数目. I& [: d2 i8 V
而随机变量Xi是另一组随机变量,每一个都是个ind ...
! S; Y: g: D1 ]* J- i# ~
明白了。7 V: b. ^8 A# n1 j; p4 E
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)& U; R5 R/ b/ t+ G% Y
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:445 t6 r  [1 u- H4 N& \  O
这个题目可以用递归的方法解决:
9 D7 Q0 W0 N6 f! t" K& _& ]0 F+ K  z4 w; v0 x) E
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
% ~0 I. @& n3 D% _
4 ?, L8 F1 m7 \& _& B
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
9 G6 L8 ^5 X! V: A/ n递归法也是可以的。

9 k9 P/ u* ~% V5 a& x4 {其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑
2 C5 k- Z% L8 w  Y; L
老福 发表于 2022-3-26 12:01/ W+ G# t! ]6 f0 G
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
, K. X& v. Z6 I; B8 }/ q
; i. L& L% k: [8 S% F
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
* \* E7 ^+ b, k; q: V否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
- a# u- M- L* F6 d2 t" w2 @, D
0 X7 h' _; R0 m* b而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
! k/ ]# f9 l) E5 i% T9 v6 j所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。& H+ D0 M7 ?! z
# ^: G# V; W$ P5 x
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. 6 m" i+ J* v  ^# f4 E, f
) w3 q) A3 o. x# H& {+ j2 Q6 w8 a
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.+ d/ B+ P0 s% p* x/ X+ E

" y/ t& Q/ k* n0 @  B; WFor w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).
2 l: L& A$ s! P8 @
: y6 {* R) Z# D* ^! H; ]2 g# W! E/ rThere are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
  {3 N- K: Z% Q6 D: Q& g
% X# w% Q: l# s" k) \理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2