我用的是mistgpu3080的12G跑的yolov5,用的数据集有四千多张,训练集三千九百多张,但是开始训练总是在第一个epoch结束之后报错“RuntimeError: Unable to find a valid cuDNN algorithm to run convolution”,我搜索了一下,大部分都是因为显存不够报错,改下batchsize就好了,但是我的显存占用只有百分之十,gpu利用率只有7%,我将batchsize从16改到2,甚至最后改到1😤,把numworker改到0还是在第一轮之后报这个错误,我这个是因为什么呢,求大佬解答一下

自己数据集跑yolov5报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- 追cium 2023-03-17 02:40关注
参考GPT和自己的思路:
您好!看您的描述,您已经尝试通过调整batchsize和num_workers来解决这个问题,但仍然无法解决。根据报错信息“Unable to find a valid cuDNN algorithm to run convolution”,这个错误通常与cuDNN库有关,可能是版本不兼容或安装有问题。您可以逐步排除以下一些可能原因:
确保您的cuDNN库的版本与您的GPU驱动程序和CUDA版本兼容,并已正确安装和配置。您可以尝试重新安装正确的cuDNN,也可以使用CUDA自带的cuDNN库。
检查您的代码中关于cuDNN的配置是否正确,例如使用了正确的算法、参数等。
检查您的代码是否存在其他问题,如内存泄漏等,可能会引起意外的cuDNN错误。
如果您使用的是第三方库或框架,请查看其文档或其他用户的反馈,看看是否有类似的问题或解决方法。
希望这些建议能对您有所帮助!
解决评论 打赏 举报无用 2