爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑 ! G; R9 T2 B  }: \" h

  T3 f, I( O9 c/ g其实是个概率问题。
8 q& J! a  E4 Z) l9 r( D那本CLRS算法导论中,第 5-2 练习题。
: G  z. H7 S$ C6 }7 ]5 s在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
& V2 @- m9 ~  r问题就是这个人的表述4 `* e8 q: T- x9 P
https://math.stackexchange.com/q ... orithm-running-time! P5 c3 S, h* E% f  `1 v# w2 ~

5 k4 T5 t0 C8 L. h按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
& Y" Y+ z& o, l5 A1 ]# j& d) y2 W
" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". & t/ K" V; T7 T/ u! P0 I
7 ?2 q- w0 }4 I! z* j" Y& v; Y
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。. O& w/ ]- q2 L& f' y" b
9 {6 c4 N- C0 q  q3 r, J- N3 k
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑 + \% j; U. Q# ]0 P$ P
& F# G+ _5 x% T* N$ J/ P5 B
您对答案的理解似乎有误。, e' S6 a7 c' b/ D+ C: u' L
随机变量X是测试过的元素的数目6 K1 c! |; U+ x. n& K! y
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
; X3 F7 F% a$ C. j9 Y' `2 E7 x所以才有E(x)=sum(E(Xi))。/ {) z, @$ `) g; F% n: s
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
" k. _1 a& n8 R您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:1 K! e# }7 V: X/ t

" t/ w* C3 \) b; F5 a9 v/ zE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)8 v" W+ w) W; P' O9 ?" [

7 P2 X$ Y) _# ]: W6 N7 I6 Y然后从头开始:
1 C3 t* P' u# m/ ^8 d' \E(k|k)=1' N) e* m" ]( |# g0 K( W( r- u
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)
6 k* ?; o2 t/ K- L5 s7 _E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1), @: |. S5 C$ S
Finally, we can easily get E(k|n)=(n+1)/(k+1)8 t; R& Y6 L+ s+ N* X% h
2 K+ v3 ^( X- m, u0 w! c: W  o
原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
5 Y% a! n: ]! X$ \, A8 p您对答案的理解似乎有误。
) }7 y  C! l5 h& B& b随机变量X是测试过的元素的数目0 v1 E$ B1 C, M% @' K2 \
而随机变量Xi是另一组随机变量,每一个都是个ind ...
" P) P* T/ Z" E2 V+ p8 H+ F
明白了。, x& j. e( S) ~5 u$ p9 a
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)/ M. L+ _0 S# H: Q! W; D( R
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
* L; N7 ~4 P5 b- |* k9 K这个题目可以用递归的方法解决:
. n7 b- O% k/ X1 m; V
+ j' e& C. k: |5 e6 h5 o( C% BE(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
. z2 J) S; j, m5 y" ?3 Q1 L
) M3 M: B; J) j# W6 C, M
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
- u: T$ i6 A$ x: O- j! F  R递归法也是可以的。
& Z1 ]9 z1 d: C6 `7 \( V, F, Y
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 9 Y* T0 D- ?4 e! U+ l7 _
老福 发表于 2022-3-26 12:01% ?! h& ?: @4 n0 M
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
, E# t8 C0 [0 `/ s7 X7 |
, b$ F- o! ]7 ~& i! {* W
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。
' Y4 _' b1 `: @否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。
1 w, ?  j/ x7 f" t* d
1 r3 M- R# e" Y! I, I# n! P而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。' q0 g1 J9 y3 j9 M+ |% \) t+ ]
所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
9 e  m) H9 k8 l% l- C# V3 ?3 `
) A% v6 V! ?# i6 \# k+ q5 FLet S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}.
, y1 W: Z2 P/ H; ?6 Y, `+ p$ k3 j
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.
% P. V$ a0 N6 x0 S8 W0 u/ l( i( J5 J, K
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).; {3 u  ^6 L7 G9 z- Z: f
/ ?, r% T: E  m  j, S& L4 X
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).
& ^. m$ A% U8 [3 a% d( u  \$ _( w! g* v, Q9 |: e0 Q9 k/ {; p" [7 R- z
理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2