机器学习的主要目的是从训练集上学到数据的真实模型,从而能够在未见过的测试集上也表现良好,我们把这种能力叫做泛化能力。一般假设训练集和测试集是iid的。
模型的容量
模型的容量是指模型拟合复杂函数的能力,体现在模型的假设空间(Hypothesis Space)大小,即模型可以表示的函数集的大小。如下图,多项式越大表示假设空间越大,但是增加搜索难度和计算代价。
过拟合与欠拟合
当模型的容量过大时,网络模型除了学习到训练集数据的模态之外,还把额外的观测误差也学习进来,导致学习的模型在训练集上面表现较好,但是在未见的样本上表现不佳,也就是模型泛化能力偏弱,我们把这种现象叫作过拟合(Overfitting)。当模型的容量过小时,模型不能够很好地学习到训练集数据的模态,导致训练集上表现不佳,同时在未见的样本上表现也不佳,我们把这种现象叫作欠拟合(Underfitting)。
如下图,如果用简单的函模型去学习,容易学到图a所示