SSD训练修改梯度下降法

在SSD的python执行文件ssd_pascal.py中有如下代码用于创建solver配置文件，
solver = caffe_pb2.SolverParameter(
train_net=train_net_file,
test_net=[test_net_file],
snapshot_prefix=snapshot_prefix,
**solver_param)
其中solver_param是一个字典，包含了训练一些超参数的设置，
solver_param = {
# Train parameters
'base_lr': base_lr,
'weight_decay': 0.0005,
'lr_policy': "multistep",
#'stepvalue': [80000, 100000, 120000],
'stepvalue': [80000,100000,120000],
'gamma': 0.1,
'momentum': 0.9,
'iter_size': iter_size,
#'max_iter': 120000,
#'snapshot': 80000,
'max_iter': 120000,
'snapshot': 10000,
'display': 10,
'average_loss': 10,
'type': "SGD",
'solver_mode': solver_mode,
'device_id': device_id,
'debug_info': False,
'snapshot_after_train': True,
# Test parameters
'test_iter': [test_iter],
#'test_interval': 10000,
'test_interval': 10000,
'eval_type': "detection",
'ap_version': "11point",
'test_initialization': False,
}
我把优化方法从SGD改为Adam，训练正常进行，但是明显不对，因为loss显示输出还是从sgd_layer.cpp中输出的，模型结果确实也不对。请问caffe_pb2.SolverParameter是在哪里定义，我想看看里面怎么调用这个参数

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2017-12-24 14:58
关注
http://blog.csdn.net/xierhacker/article/details/53261008

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

英伟达SSD视觉算法模型训练、转换与部署
2024-06-06 16:36

科技人生的博客深度学习的训练和推理流程，是先采用高性能图形服务器使用深度学习框架来训练（Training）机器学习算法，研究大量的数据来学习一个特定的场景，完成后得到模型参数，再部署到终端执行机器学习推理（Inference），以...
ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型！速度精度双提高
2020-11-28 21:33

weixin_39882271的博客【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch size扩大到1000以上，大...
SSD训练数据集流程（学习记录）
2022-09-14 21:50

道人兄的博客 SSD训练数据集流程（学习记录）
Python+AI -黑马- 人脸识别Python人工智能-9.4G网盘下载.txt
2024-11-30 12:02

第二部分“深度学习优化进阶”可能讲解了深度学习模型训练中的优化技术和算法，如梯度下降、学习率调整等，帮助学生深入理解和掌握深度学习模型的调优过程。第三部分“卷积神经网络”则专注于图像处理领域中非常重要...
AI系统——梯度累积算法
2022-01-08 21:16

ZOMI酱的博客在深度学习训练的时候，数据的batch size...在GPU内存不变的情况下，模型越来越大，那么这就意味着数据的batch size智能缩小，这个时候，梯度累积（Gradient Accumulation）可以作为一种简单的解决方案来解决这个问题。
ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型:自动化所提出矩衰减优化的目标检测快速训练方法...
2020-12-06 22:28

weixin_39710951的博客 CASIA解锁更多智能之美【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch ...
从零开始大模型开发与微调：梯度下降算法
2024-11-10 01:56

AI天才研究院的博客《从零开始大模型开发与微调：梯度下降算法》关键词：大模型、梯度下降算法、预训练、微调、深度学习摘要：本文将从零开始，深入探讨大模型的开发与微调过程，重点关注
ssd pytorch版手把手源码（包括模型、代码、和数据）
2020-04-30 09:10

优化器通常选用SGD（随机梯度下降），并且可能包含动量和权重衰减。 7. 模型评估与推理：完成训练后，可以使用测试集对模型进行评估，计算平均精度（mAP）等指标。对于实际应用，将训练好的模型部署到推理系统中，...
人工智能算法面试大总结-总目录
2022-09-15 09:23

啥都生的博客说说梯度下降法算法步骤？说说你知道的优化函数？展开说说梯度下降、批次梯度下降、随机梯度下降？说说Batch的影响？说说批量梯度下降与随机梯度下降区别？说说哪些方法对梯度引入动量进行改进？说说哪些方法...
SSD算法代码介绍（一）：训练参数配置
2018-02-17 15:14

AI之路的博客 SSD算法是object detection领域比较经典的算法，github上有一个写得比较好的MXNet版本的实现代码，项目地址：https://github.com/zhreshold/mxnet-ssd，想要本地实现可以参考项目地址中README.md的介绍或者参考博客...
使用预先训练的SSD模型检测害虫
2021-04-11 08:02

最后，“neural-network”（神经网络）是深度学习的基础，SSD模型本身就是一个深度神经网络，它通过反向传播和梯度下降优化来调整权重，以提高预测的准确性。综上所述，这个项目会涉及以下步骤： 1. 使用Python和...
医学人工智能影像诊断算法的操作步骤
2024-08-11 16:44

V搜xhliang0246的博客随着医学影像领域的高速融合与人工智能技术的快速崛起，伴随算法算力、数据等关键要素的积累和突破，人工智能技术在精准医学领域的科研应用也随之飞快增长，相关科研成果和学术论文数量逐年激增，医学影像人工智能...
没有解决我的问题, 去提问

SSD训练修改梯度下降法

1条回答 默认 最新

1条回答默认最新