AdaBoost第m轮弱分类器的样本权重与第m-1轮的强分类器之间的关系证明-CSDN博客

☞ ░ 前往老猿Python博客 ░ https://blog.csdn.net/LaoYuanPython

在这里插入图片描述

一. AdaBoost概述

AdaBoost从弱学习算法出发，通过多轮迭代，反复学习，得到一系列弱分类器（又称为基本分类器），然后组合这些弱分类器，构成一个强分类器，具体算法和原理请参考《提升方法AdaBoost自适应提升算法(https://blog.csdn.net/LaoYuanPython/article/details/148452847)》。

二、AdaBoost中的权重更新

为了便于后文的理解，将AdaBoost算法中涉及的相关符号在此重新介绍一下：

$w_{m,i}：$ 第 $m$ 轮第 $i$ 个样本的权重
$Z_m$ ：第m轮的归一化因子（使权重和为1）
$\alpha_m$ ：是弱分类器 $G_m(x)$ 的权重
$y_i \in \{-1,+1\}$ 是真实标签
$G_m(x)$ ：第 m 个弱分类器
$F_{m-1}(x)$ ：前 m-1 个弱分类器的加权组合，即第 m 次迭代之前的强分类器
$\alpha_m$ ：第 m 个弱分类器的权重
$e_m$ ：第m轮迭代的分类类误差率记为
exp(x)：指数函数 $e^x$

AdaBoost的样本权重更新遵循以下递推关系：

$公式1：w_{m+1,i} = \frac{w_{m,i}}{Z_m} \cdot e^{-\alpha_m y_i G_m(x_i)}$

第m轮迭代后得到的强分类器为 $F_m(x)$ ，从提升算法可知：
$F_m(x) = F_{m-1}(x) + \alpha_m G_m(x)\\[10pt]$

三、样本权重与第m-1轮的强分类器关系分析

推导 $w_{m,i}$ 和 $F_{m-1}(x_i)$ 之间的关系：

在第 $m$ 次迭代中，样本 $x_i$ 的权重 $w_{m,i}$ 是根据第 $m - 1$ 次迭代的权重 $w_{m-1,i}$ 和当前弱分类器 $G_{m-1}(x)$ 的预测结果更新的：
$w_{mi} = \frac{w_{m-1}(i) \cdot \exp(-\alpha_{m-1} y_i G_{m-1}(x_i))}{Z_{m-1}}$
递归推导 $w_{m,i}$ 和 $w_{m-2,i}$ 之间的关系
在第 $m - 1$ 次迭代中，样本 $x_i$ 的权重 $w_{m-1,i}$ 是根据第 $m - 2$ 次迭代的权重 $w_{m-2,i}$ 和当前弱分类器 $G_{m-2}(x)$ 的预测结果更新的：
$w_{m-1}(i) = \frac{w_{m-2}(i) \cdot \exp(-\alpha_{m-2} y_i G_{m-2}(x_i))}{Z_{m-2}}$
将 $w_{m-1}(i)$ 代入 $w_{mi}$ 的表达式中：
$w_{mi}= \frac{\left( \frac{w_{m-2}(i) \cdot \exp(-\alpha_{m-2} y_i G_{m-2}(x_i))}{Z_{m-2}} \right) \cdot \exp(-\alpha_{m-1} y_i G_{m-1}(x_i))}{Z_{m-1}}$
简化后：
$w_{mi} = \frac{w_{m-2}(i) \cdot \exp(-\alpha_{m-2} y_i G_{m-2}(x_i) - \alpha_{m-1} y_i G_{m-1}(x_i))}{Z_{m-2} Z_{m-1}}$
递归推导 $w_{m,i}$ 和 $w_{1,i}$ 之间的关系
继续上述步骤过程，直到右边等式只有 $w_{1,i}$ ：
$w_{mi} = \frac{w_{m-3}(i) \cdot \exp(-\alpha_{m-3} y_i G_{m-3}(x_i) - \alpha_{m-2} y_i G_{m-2}(x_i) - \alpha_{m-1} y_i G_{m-1}(x_i))}{Z_{m-3} Z_{m-2} Z_{m-1}}$
$\vdots$
$w_{mi} = \frac{w_1(i) \cdot \exp \left( -\sum_{j=1}^{m-1} \alpha_j y_i G_j(x_i) \right)}{Z_1 Z_2 \cdots Z_{m-1}}$
将 $F_{m-1}(x_i)$ 代入上述公式
$F_{m-1}(x_i) = \sum_{j=1}^{m-1} \alpha_j G_j(x_i)$
得到：
$w_{mi} = \frac{w_1(i) \cdot \exp(-y_i F_{m-1}(x_i))}{Z_1 Z_2 \cdots Z_{m-1}}$
即：
$w_{mi} = \frac{w_1(i) \cdot e^{-y_i F_{m-1}(x_i)}}{Z_1 Z_2 \cdots Z_{m-1}}$

根据提升算法，以上公式中：

$w_{1,i}$ 初始化为1/N
在第m（m>1）轮迭代时，可以根据公式1计算出该轮迭代的权值，并根据分类误差率 $e_m$ 得到弱分类器的系数α
$z_m$ 为归一化因子，由算法可知，其值与本轮迭代的权值 $w_m、α_m、G_m(x_i)和实际标签值y_i$ 相关，对每轮迭代来说是一个常量，因此可以说： $w_{mi}的值与e^{-y_i F_{m-1}(x_i)}$ 成正比，记为：
$w_{mi} ∝ e^{-y_i F_{m-1}(x_i)}$

四、小结

本文介绍了AdaBoost提升算法第m轮弱分类器的样本权重与第m-1轮的强分类器之间的关系，并通过算术推导进行了证明。通过推导可以确认 $w_{mi}$ 和前 $m - 1$ 次迭代的强分类器 $F_{m-1}(x_i)$ 存在正比例关系，这个关系对于利用AdaBoost的损失函数求弱分类器的权重值非常有用。