自己数据集跑yolov5报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

我用的是mistgpu3080的12G跑的yolov5，用的数据集有四千多张，训练集三千九百多张，但是开始训练总是在第一个epoch结束之后报错“RuntimeError: Unable to find a valid cuDNN algorithm to run convolution”，我搜索了一下，大部分都是因为显存不够报错，改下batchsize就好了，但是我的显存占用只有百分之十，gpu利用率只有7%，我将batchsize从16改到2，甚至最后改到1😤，把numworker改到0还是在第一轮之后报这个错误，我这个是因为什么呢，求大佬解答一下

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
追cium 2023-03-17 02:40
关注
参考GPT和自己的思路：

您好！看您的描述，您已经尝试通过调整batchsize和num_workers来解决这个问题，但仍然无法解决。根据报错信息“Unable to find a valid cuDNN algorithm to run convolution”，这个错误通常与cuDNN库有关，可能是版本不兼容或安装有问题。您可以逐步排除以下一些可能原因：

确保您的cuDNN库的版本与您的GPU驱动程序和CUDA版本兼容，并已正确安装和配置。您可以尝试重新安装正确的cuDNN，也可以使用CUDA自带的cuDNN库。

检查您的代码中关于cuDNN的配置是否正确，例如使用了正确的算法、参数等。

检查您的代码是否存在其他问题，如内存泄漏等，可能会引起意外的cuDNN错误。

如果您使用的是第三方库或框架，请查看其文档或其他用户的反馈，看看是否有类似的问题或解决方法。

希望这些建议能对您有所帮助！
解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

YOLOV5跑自己的数据集RuntimeError: Unable to find a valid cuDNN algorithm to run convolution报错解决
2024-10-29 13:28

努力的BigJiang的博客 YOLOV5跑自己的数据集RuntimeError: Unable to find a valid cuDNN algorithm to run convolution报错解决
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2024-10-14 17:02

教我改bug的博客 RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
BEVFormer环境配置，报错：RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2024-05-05 21:46

V10LET_Yan的博客 python=3.8 遇到的问题使用官方的安装文档，运行如下训练软件代码时，会报错：RuntimeError: Unable to find a valid cuDNN algorithm to run convolution 运行此处的代码时，如果你是个人学生党，使用自己的电脑，...
复现r2unet或rnn过程中报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2024-02-28 14:31

蓝海渔夫的博客今天尝试用pytorch复现了r2unet...看上去像是cudnn版本问题，但是其实是循环网络模块需要的显存太大了。我把batch size从20调到10之后，再次报错。这次的报错就很明显了，说明了显存占用问题。我再次将batch size降到5.
【error】RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2025-01-04 10:20

费马的弟弟费劲的博客当出现错误是如下的问题时【error】RuntimeError: Unable to find a valid cuDNN algorithm to run convolution 有很多博客让我们更新cuda，使显卡能够正确支持cuda的运行，这种方法有时候是没有问题的。...
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution问题解决
2023-03-31 09:54

NOAHCHAN1987的博客使用YOLOv5 训练模型时，报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution 原因：设置的批大小batch-size过大。
YOLOv5训练过程中RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2022-02-24 20:20

这糖有点苦的博客 YOLOv5训练过程中出现报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution 解决方法：把batch size调小一点
【bug解决】RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2022-11-24 19:35

千与编程的博客 2.其实问题更加简单，是模型的训练的batch-size训练过大了，调整更小，就可以了。解决办法：安装对应的cudnn，以及cuda，找到对应的torch框架，进行安装。1.模型训练的环境中cudnn，CUDA的版本号不匹配。
RuntimeError:unable to find a valid cuDNN algorithm to convolution
2023-07-26 18:14

m0_46630689的博客由于虚拟环境都已经创建完成，目前是在Linux上进行安装，根据“链接2”中的安装代码，直接进行pytorch和cuda的安装。如果环境中已经装过其他...解决办法：安装对应的cudnn，以及cuda，找到对应的torch框架，进行安装。
yolov5-6.1 RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
2022-07-23 17:34

佪眸伊笑的博客错误信息： RuntimeError: CUDA out of memory. Tried to allocate 26.00 MiB (GPU 0; 2.00 GiB total capacity; 745.25 MiB already allocated; 0 bytes free; 788.00 MiB reserved in total by PyTorch) 原因： ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月17日

自己数据集跑yolov5报错RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

1条回答 默认 最新

问题事件

1条回答默认最新