【李宏毅《深度学习详解》（LeeDL-Tutorial）苹果书】学习笔记（一）机器学习基础之案例学习

Techhuman

已于 2025-02-15 20:54:09 修改

阅读量535

点赞数 24

分类专栏：机器学习教程笔记文章标签：深度学习学习笔记

于 2025-02-12 23:59:27 首次发布

本文链接：https://blog.csdn.net/learner_Van/article/details/145598078

版权

机器学习教程笔记专栏收录该内容

8 篇文章

订阅专栏

案例学习

机器学习就是让机器具备找一个函数的能力
根据要找的函数不同，机器学习可分为不同种类别

函数为一个数值/标量(scalar)，则此种机器学习的任务称为回归(regression)
事先准备一些选项，称为类别(class)，函数的输出从类别里选择，该任务称为分类(classification)
除此之外，让机器产生一些有结构的输出的问题称为结构化学习(structured learning)

例：预测空气质量/股票的任务为回归，输入为相关参数数值，输出也为一个数值
判断一个邮件是否是垃圾邮件的任务为分类，给出的选项只有两个——是/否
让机器产生出一个有结构的东西，例如画一张图/写篇文章/生成代码框架，此种任务称为结构化学习

找函数的步骤

1.写出函数（从假设空间中找出一个函数）

假设一个线性函数 $f=wx_1+b$ 带有未知参数(parameter)，此函数在机器学习里称为模型(model)， $x_1$ 为已知量，称为特征(feature)， $w$ 和 $b$ 是未知参数，分别称为权重(weight)和偏置(bias)

2.定义损失

损失(loss)也为一个函数，函数的输入为模型参数，可写为 $L (w, b)$ ，预测结果为 $\hat{y}$ ，实际结果为 $y$ ，真实的值称为标签(label)，可以将估值与真实值的差距 $e$ ， $e=|y-\hat{y}|$ ，可以计算每一个输入值的误差，求和取平均 $L={1\over{N}}\sum\limits_{n}{e_n}$ ，其中N代表训练数据的个数， $e$ 称为平均绝对误差(Mean Absolute Error,MAE)， $e=(\hat{y}-y)^2$ 为均方误差(Mean Squared Error,MSE)

3.最优化

找一个 $w 跟 b$ ，把未知的参数找一个数值出来，看代哪一个数值进去可以让损失 $L$ 的值最小，就是要找的 $w 跟 b$ ，这个可以让损失最小的 $w 跟 b 称为 w * 跟 b *$ ，代表它们是最好的一组 $w 跟 b$ ，可以让损失的值最小，梯度下降(gradient descent)是经常会使用优化的方法。