案例学习
机器学习就是让机器具备找一个函数的能力
根据要找的函数不同,机器学习可分为不同种类别
- 函数为一个数值/标量(scalar),则此种机器学习的任务称为回归(regression)
- 事先准备一些选项,称为类别(class),函数的输出从类别里选择,该任务称为分类(classification)
- 除此之外,让机器产生一些有结构的输出的问题称为结构化学习(structured learning)
例:预测空气质量/股票的任务为回归,输入为相关参数数值,输出也为一个数值
判断一个邮件是否是垃圾邮件的任务为分类,给出的选项只有两个——是/否
让机器产生出一个有结构的东西,例如画一张图/写篇文章/生成代码框架,此种任务称为结构化学习
找函数的步骤
1.写出函数(从假设空间中找出一个函数)
假设一个线性函数 f = w x 1 + b f=wx_1+b f=wx1+b带有未知参数(parameter),此函数在机器学习里称为模型(model), x 1 x_1 x1为已知量,称为特征(feature), w w w和 b b b是未知参数,分别称为权重(weight)和偏置(bias)
2.定义损失
损失(loss)也为一个函数,函数的输入为模型参数,可写为 L ( w , b ) L(w,b) L(w,b),预测结果为 y ^ \hat{y} y^,实际结果为 y y y,真实的值称为标签(label),可以将估值与真实值的 差距 e e e, e = ∣ y − y ^ ∣ e=|y-\hat{y}| e=∣y−y^∣,可以计算每一个输入值的误差,求和取平均 L = 1 N ∑ n e n L={1\over{N}}\sum\limits_{n}{e_n} L=N1n∑en,其中N代表训练数据的个数, e e e称为平均绝对误差(Mean Absolute Error,MAE), e = ( y ^ − y ) 2 e=(\hat{y}-y)^2 e=(y^−y)2为均方误差(Mean Squared Error,MSE)
3.最优化
找一个 w 跟 b w跟b w跟b,把未知的参数找一个数值出来,看代哪一个数值进去可以让损失 L L L的值最小,就是要找的 w 跟 b w跟b w跟b,这个可以让损失最小的 w 跟 b 称为 w ∗ 跟 b ∗ w跟b称为w∗跟b∗ w跟b称为w∗跟b∗,代表它们是最好的一组 w 跟 b w跟b w跟b,可以让损失的值最小,梯度下降(gradient descent)是经常会使用优化的方法。