【漫话机器学习系列】012.深度学习（Deep Learning）基础

最新推荐文章于 2025-04-16 20:19:52 发布

IT古董

最新推荐文章于 2025-04-16 20:19:52 发布

阅读量1.6k

点赞数 51

分类专栏：漫话机器学习系列专辑文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/IT_ORACLE/article/details/144549868

版权

深度学习基础概述

深度学习（Deep Learning）是一种基于人工神经网络的大规模机器学习方法，在图像识别、语音处理、自然语言理解等领域具有广泛的应用。深度学习模型的构建包括数据准备、损失函数设计、优化算法选择、网络架构搭建、测试数据验证以及结果评价等环节。以下将从这些方面系统介绍深度学习的核心组成部分。

1. 数据

数据是深度学习的基础，模型的表现很大程度上取决于数据的质量与数量。

深度学习需要大量高质量数据作为训练基础。常见的数据形式包括：

图像数据（如 CIFAR-10, ImageNet）
文本数据（如 IMDB 影评数据集）
时间序列数据（如股票价格、天气数据）

数据集划分

训练集（Training Set）：用于训练模型，提供样本和目标标签。
验证集（Validation Set）：用于调整超参数，监控模型在训练过程中的表现，避免过拟合。
测试集（Test Set）：在模型完全训练后，用于评估最终性能。

数据预处理

标准化：将数据转化为均值为0，方差为1的分布。
归一化：将数据缩放到[0,1]或[-1,1]之间。
分割数据集：将数据划分为训练集、验证集和测试集（如 70%:15%:15%）。
数据增强：对于图像或音频等数据，通过旋转、翻转、裁剪等方法增加数据量，提高模型的泛化能力。

2. 损失函数（Loss Function）

损失函数用于衡量模型的预测值与真实值之间的差距，是优化模型的重要依据。根据任务不同，可以选择不同的损失函数。

分类任务

交叉熵损失（Cross-Entropy Loss）
用于多分类任务：
$L = - \frac{1}{N} \sum_{i=1}^{N} \sum_{k=1}^{K} y_{i,k} \log \hat{y}_{i,k}$

N：样本数量
C：类别数
$y_{i,k}$ ：真实标签（one-hot 编码）
$\hat{y}_{i,k}$ ：模型预测的概率分布（通过 softmax 输出）
交叉熵损失惩罚模型在目标类别上预测概率较低的情况，目标是最小化损失值。
二分类交叉熵（Binary Cross-Entropy, BCE）
$L = - \frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]$
焦点损失（Focal Loss）
适用于类别极不平衡场景。

回归任务

均方误差（Mean

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。