爱吱声

标题: 此间大牛多,请教算法高手一个问题 [打印本页]

作者: 雷达    时间: 2022-3-26 08:43
标题: 此间大牛多,请教算法高手一个问题
本帖最后由 雷达 于 2022-3-26 08:54 编辑
- v$ Q( {: E4 {4 y. b
' e  v/ X+ ]2 }1 U( f其实是个概率问题。
" u9 N6 p6 g0 @7 o那本CLRS算法导论中,第 5-2 练习题。
) j3 E' m7 S! N7 M在 n 长的数列中有 k 个相同的 x 值,用顺序算法搜第一个 x 。
7 l4 u& l2 ^6 n- V' w6 S: ~1 D' G& C1 I5 I问题就是这个人的表述3 f. x- H- D2 J, c8 l/ J
https://math.stackexchange.com/q ... orithm-running-time3 h: L4 W, F" `9 b& F; ~3 [

% v: r' X0 W: s0 T1 g5 w8 k) ^按照答案,从头开始,之前没有出现过 x 的前提下,每一个元素是  x 的概率是 1/k; 不是  x 的概率是 1/(k+1)
( }7 Q7 z% A: [1 e  S- Y
9 D. |- t: A* z+ F3 ]9 ]$ r" If i is an index such that A≠x then P(Xi)=1/(k+1) since we examine it only if it occurs before every one of the k indices that contains x". ! I9 T. a, Y) g0 r
; G# p% @- y1 {* M, N+ q! I
没看懂,这个   P(Xi)=1/(k+1) 怎么来的? 按直觉,这个概率应该和 n 有关,假设 n = 10000, k = 5 的情况 和 n = 10, k = 5 的情况比较,概率应该不一样才对吧。: J7 ^0 i3 t: z1 \# z( w0 D& |
; c" z: w+ z. t. g9 i- l
老了,脑子水掉了,希望有高手解释清楚一点。多谢。
作者: 数值分析    时间: 2022-3-26 10:32
本帖最后由 数值分析 于 2022-3-26 10:56 编辑   g7 r) s4 q  u# c

' U6 I! B* r1 U* v) F# A# @您对答案的理解似乎有误。" l+ b4 m/ D/ c6 K) ]
随机变量X是测试过的元素的数目4 D) }. o0 p/ C
而随机变量Xi是另一组随机变量,每一个都是个indicator,取值是0或者1,含义为第i个元素是否被测试过,而不是该元素是否等于欲查找的值。
; Y' D& W) S& ^: w7 e7 ^所以才有E(x)=sum(E(Xi))。/ x+ g% {9 M# O; c3 b% m  @8 v4 u4 g: X
而如果 A[ i ]!= x,那么k个x值元素将整个数组分为了k+1个区间,而我们检查了这个元素,所以这个元素必须位于第一个区间,所以概率是1/(k+1)
7 r/ A0 m& q/ k+ \8 w$ b; J您再想想?
作者: 老福    时间: 2022-3-26 10:44
这个题目可以用递归的方法解决:
6 B3 i" O  Y2 g6 z& D. S" x- u: _0 F$ ]2 g
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)
& v" L: F! n9 J7 g' X' W3 D, N1 X4 {* P  G
然后从头开始:& J2 V9 `4 V. ^  k% c/ _( j. G
E(k|k)=1% e5 l2 n. ]; |0 L: t! q
E(k|k+1)=1+((1)/(k+1))*E(k|k)=1+(1/(k+1))=(k+2)/(k+1)3 ]. A; t( H/ ^* S
E(k|k+2)=1+(2/(k+2))*E(k|k+1)=1+(2/(k+2))*(k+2)/(k+1)=(k+3)/(k+1)
6 |% D! D# I- J& j* QFinally, we can easily get E(k|n)=(n+1)/(k+1)6 i4 y% S9 ^" h4 H, Y: b

. z+ i7 I8 @) q1 R原文的解法有点绕,还没想明白。
作者: 雷达    时间: 2022-3-26 11:00
数值分析 发表于 2022-3-26 10:32
2 z! s. T7 ^( L+ W  l6 n您对答案的理解似乎有误。2 k7 e8 O+ C7 K  z( v& I! n4 ^
随机变量X是测试过的元素的数目
" D$ o8 Y$ U5 K而随机变量Xi是另一组随机变量,每一个都是个ind ...
8 d$ u! G( u1 j9 m# q& g* t
明白了。. Y; e( ~/ q. G) t0 c
是指的某非x元素在所有x之前的概率,实际上有 k+1 种可能的位置关系,所以在所有x之前就是 1/(k+1)* U5 N% Z! V% Y2 m3 G2 b, e3 u4 G
多谢
作者: 雷达    时间: 2022-3-26 11:07
老福 发表于 2022-3-26 10:44
: K9 a. o1 ]$ |: U这个题目可以用递归的方法解决:
" m( [! y6 Y: g( P# D+ C/ _  V: A& m1 P  ~  E4 W
E(k|n)=1*(k/n)+(1+E(k|n-1))*((n-k)/n)=1+((n-k)/n)*E(k|n-1)

. p" b7 s" [' D' c/ X3 |- E; x9 n0 X2 ~( T, N4 e
递归法也是可以的。
作者: 老福    时间: 2022-3-26 12:01
雷达 发表于 2022-3-26 11:07
& F% M" S! A! M# ^3 t/ u$ s4 Z8 L递归法也是可以的。
. r- d# b5 z* H( ?
其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/(k+1)。
作者: 数值分析    时间: 2022-3-26 14:46
本帖最后由 数值分析 于 2022-3-26 14:51 编辑 # c5 \8 V0 @( d2 G( y
老福 发表于 2022-3-26 12:01
6 \8 E- u" u! j其实原文的解释似是而非,试想i=1的情形,对于概率P(X1=1), 无论A1是不是x, 这个概率应该是1, 而不是1/( ...
" i4 Q) k8 e& }. |
! c4 o2 y: p' J/ e
我觉得这个答案的作者其实是吧下标i作为元素的编号,而不是位置。4 h7 @. w# }) j( Q' W% \9 w4 l8 U
否则没法按元素是否等于x来分类,因为某一个位置是否等于x本身就是个随机事件。, L( W  l. `; J

! y  g1 I/ T+ M* z8 ^而这个答案的作者其实是把每一个元素编了号,然后再考虑这个元素在数组中的位置的。故此对应于某一个元素,其是否等于x是个确定的事件,所以元素可以分为两类讨论,等于x的和不等于x的。
/ x3 S- i: V  M3 L. k& z/ q; U所以A[ i ]这个写法有点误导,这里这个A并不是要做搜索的那个数组,而是所有元素的列表。
作者: 老福    时间: 2022-3-27 00:32
一开始我一直顺着原文的叙述试图理解概率为何为1/(k+1), 很困惑。谢谢数值分析坛友的提醒,终于想明白了。下面试着用同一思路但不同的语言叙述一下,作为总结。
, |* {: B! E# Z. v. W# }6 p8 Z& K
Let S be the set of the n elements in which there are k and only k elements that have value x. For each element w, let I be the indicator if w is examined or not, that is, I(w) = 1 if w is examined and 0 if w is not examined. X, the number of elements being examined, will be the sum of I(w) for all w in S. Accordingly, E[X] will be the sum of E[I(w)]=P{I(w)=1}. . B6 q$ e4 p" A) C, N
. F# ~( u2 s7 e5 ?9 W9 f
For w that has a value x, the chance of w being examined is the chance that w is at the first position of a permutation of k x-valued elements. Therefore it's 1/k.5 G2 e$ A" J7 s0 ?* t' N, g
$ |0 \1 B# j/ k( ^0 \2 }
For w that has a value not being x, the chance of x being examined is the chance that w is at the first position of a permutation of all k x-valued elements plus w. Therefore it's 1/(k+1).8 p% a+ B& A0 }
9 U- _. U) S  R: |4 ^/ O* G6 ?; q- [
There are k elements that have value x and n-k elements that are not equal to x, so the sum of all these probabilities will be k*(1/k) + (n-k)*(1/(k+1)) = (n+1)/(k+1).+ d3 n/ u3 K) _/ ]) L4 ]

2 V: _" N) C' q# j- E理解上述解法的一个关键点是对于所有不等于x的element,它能不能有机会被查验取决于而且只取决于它与k个值为x的elements的相对位置。




欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) Powered by Discuz! X3.2