优化器/模型参数/超参数

iisugar

于 2025-03-19 22:35:05 发布

阅读量415

点赞数 4

文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iisugar/article/details/146382645

版权

参数（Parameters） vs. 超参数（Hyperparameters）

1.1 参数（Parameters）

定义：模型中需要学习的变量，例如神经网络中的权重（Weight）和偏置（Bias）。
例子：
- 线性回归中的 ww 和 bb（y=wx+by=wx+b）。
- BERT中的注意力权重、全连接层的参数。
调整者：优化器（Optimizer） 负责调整这些参数，使其在训练过程中不断优化。

1.2 超参数（Hyperparameters）

定义：由开发者手动设置的参数，控制训练过程，但不会被优化器直接学习。
例子：
- 优化器类型（如Adam、SGD）。
- 学习率（Learning Rate）（如 lr=2e-5）。
- 批量大小（Batch Size）（如 batch_size=32）。
- 训练轮次（Epochs）（如 num_epochs=5）。
调整者：开发者 需要手动调整或通过超参数优化技术（如网格搜索）寻找最佳值。
超参数的调整需要人工干预或超参数优化算法，例如：
手动调整：尝试不同的学习率（如 1e-4、5e-5）。
超参数优化工具：
- 网格搜索（Grid Search）：遍历超参数组合。
- 贝叶斯优化（Bayesian Optimization）：智能搜索最佳超参数。
- 随机搜索（Random Search）：随机尝试超参数组合。

2. 优化器的作用

优化器只调整模型参数（Parameters），不调整超参数（Hyperparameters）

优化器的核心任务：
根据损失函数的梯度，自动更新模型参数（如权重、偏置），使其在训练过程中逐步优化。
优化器无法调整超参数：
超参数（如学习率、优化器类型）是开发者预先设置的，优化器只能按照这些超参数的规则工作。

概念	定义	谁调整它？	例子
参数	模型的可学习变量（权重、偏置）	优化器（自动调整）	BERT的注意力权重、线性层的 ww
超参数	开发者设置的训练控制参数	开发者或超参数工具	学习率、批量大小、优化器类型

博客等级

码龄7年

40
原创

343
点赞

259
收藏

118
粉丝

关注

私信

热门文章

上一篇：: agent调用流程

下一篇：: 机器学习和深度学习中参数概览

最新评论

AI第一天自我理解笔记--微调大模型
iisugar: 学习率这种超参数调优调一下；数据优化标注
node npm
CSDN-Ada助手: 推荐 Vue入门技能树：https://edu.csdn.net/skill/vue?utm_source=AI_act_vue
启动图谱和neo4j
CSDN-Ada助手: 恭喜您写完了第6篇博客，题目“启动图谱和neo4j”真是引人入胜！您对于图谱和neo4j的介绍相当详尽，读后让我对这个领域有了更深入的了解。我非常期待您未来更多的创作，希望您可以继续分享您的见解和经验。对于下一步的创作建议，我想提出一点谦虚的建议。既然您已经探索了图谱和neo4j的基础知识，或许可以考虑进一步探讨一些高级的应用场景或者深入技术细节。比如，您可以分享一些实际案例，说明图谱和neo4j如何应用于某个具体行业或问题领域，这样读者可以更好地理解其实际价值。当然，这只是一个建议，期待您未来的精彩创作！
yarn没有，vue启动不了
CSDN-Ada助手: 恭喜你撰写第5篇博客！对于标题中提到的问题，我很遗憾听到你在使用yarn和启动Vue时遇到了困难。不过，你的坚持写作让我非常钦佩。为了解决这个问题，我建议你先仔细检查你的yarn安装是否正确，并确保你的Vue项目的依赖项已经正确安装。如果问题依然存在，我建议你参考一些相关的技术文档或向社区寻求帮助，他们可能会给你提供一些有价值的解决方案。继续保持写作的热情，期待看到你下一篇博客的发布！
linux（Ubuntu）下的安装与配置
CSDN-Ada助手: 恭喜你写了第四篇博客！标题"linux（Ubuntu）下的安装与配置"听起来很有实用价值。你的博客内容对于那些想在Linux系统中安装和配置Ubuntu的人来说一定非常有帮助。我很高兴看到你持续创作，并且分享了关于Linux的知识。接下来，我建议你可以考虑写一些关于Ubuntu下常见应用程序的使用指南，或者分享一些高级配置技巧。不过，请继续保持谦虚态度，因为你的博客已经展示了你对Linux的深入了解。期待你未来的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。