在对不了解概率的人解释期望时,我总是敷衍地将期望解释为均值。这种敷衍的说法之所以行得通,正是由于大数定律起了作用。
人们在实践中发现,尽管每个随机变量的取值不同,但当随机变量大量出现时,它们的均值却相对恒定,这个规律就是大数定律。
一个公平的骰子
我们有一个公平的骰子,每个点数出现的概率都是1/6,如果只投掷一次,完全无法预测它的点数,但是如果把连续投掷20次看作一次试验,却发现每次试验的点数的均值总是在3.5附近徘徊。每次试验投掷的次数越多,点数的均值越稳定。
import numpy as np
import matplotlib.pyplot as plt
fig = plt.figure(figsize=(10, 5))
plt.subplots_adjust(hspace=0.5, wspace=0.3)
m = 100 # 试验的次数
for i in range(1, 5):
n = 2 * 10 ** i # 每次试验投掷n次骰子
mean_list = [np.random.randint(1, 7, n).mean() for i in range(1, m + 1)] # 每次试验的均值
ax = fig.add_subplot(2, 2, i)
ax.plot(list(range(1, m + 1)), mean_list, label='均值')
plt.yticks(list(range(0, 7))) # 重置y轴的坐标
ax.set_xlabel('试验次数')
ax.set_ylabel('均值')
ax.set_title('每次试验投{}次骰子'.format(n))
ax.legend(loc='upper right')
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.show()
均值的期望和均值的方差
我们用随机变量X1表示第一次投骰子的结果,X2表示第二次……,一个公平的骰子可以得到下面的结论:
连续投掷后将形成一个随机变量序列{ X1, X2, ……, Xn},这个序列的均值是:
序列中的每个变量都是随机的,因此它们的和及均值也是随机的,也就是说