承接上一篇文章。
这篇文章主要介绍生日悖论中,概率什么时候超过 1 2 \frac{1}{2} 21,以及一个简单的例子。
记号
∣
U
∣
|U|
∣U∣:表示
U
U
U的大小。 例如
U
=
00
,
01
,
10
,
11
U={00, 01, 10, 11}
U=00,01,10,11,则
∣
U
∣
=
4
|U|=4
∣U∣=4。
∃
\exists
∃:表示存在的意思。
生日悖论(The birthday paradox)
设
r
1
,
r
2
,
.
.
.
,
r
n
∈
U
r_1,r_2,...,r_n \in U
r1,r2,...,rn∈U,且
r
1
,
r
2
,
.
.
.
,
r
n
r_1,r_2,...,r_n
r1,r2,...,rn是独立同分布(independent identically distributed, i.i.d.)的随机变量,有如下定理:
定理:当
n
=
1.2
×
∣
U
∣
1
/
2
n=1.2\times|U|^{1/2}
n=1.2×∣U∣1/2时,有
P
r
[
∃
i
≠
j
:
r
j
=
r
j
]
>
1
2
.
Pr[\exists i\neq j:r_j=r_j]>\frac{1}{2}.
Pr[∃i=j:rj=rj]>21.
对定理的解释:当变量的个数足够多的时候( n = 1.2 × ∣ U ∣ 1 / 2 n=1.2\times|U|^{1/2} n=1.2×∣U∣1/2,只要求达到 U U U的开根号),就存在下标不同的两个数 r i , r j r_i,r_j ri,rj,相同的概率超过 1 2 \frac{1}{2} 21。
生日悖论的例子
令 U = { 0 , 1 } 128 U=\{0, 1\}^{128} U={0,1}128,那么从 U U U中经过大约 1.2 × 2 64 1.2\times 2^{64} 1.2×264次随机取样,样本中很有可能存在两个数相同。
预告:下一篇将介绍对称密码(Symmetric Ciphers)的定义、一次一密(One Time Pad,OTP)、以及完全保密(perfecy secrecy)。