和鲸社区的GPU环境出现报错

报错场景：
运行torch1.8.0

报错内容：


Args in experiment:
Namespace(activation='gelu', attn='prob', batch_size=32, c_out=1, checkpoints='./checkpoints/', cols=None, d_ff=2048, d_layers=1, d_model=512, data='chicken', data_path='月均价.csv', dec_in=1, des='test', detail_freq='m', devices='0,1,2,3', distil=True, do_predict=True, dropout=0.1, e_layers=2, embed='timeF', enc_in=1, factor=5, features='S', freq='m', gpu=0, inverse=True, itr=100, label_len=6, learning_rate=0.0001, loss='mse', lradj='type1', mix=True, model='informer', n_heads=8, num_workers=0, output='./output', output_attention=False, padding=0, patience=5, pred_len=1, random_choos=True, root_path='./data/chicken/', s_layers=[3, 2, 1], seed=12345, seq_len=12, target='price', train_epochs=100, use_amp=False, use_gpu=True, use_multi_gpu=False)
提示：由于未来还没有发生，在真实值数据中没有这个月份数据，故而无法画出未来预测值~未来值的对比图!
Program to continue！>>>
Use GPU: cuda:0
>>>>>>>start training :  informer_chicken_ftS_sl12_ll6_pl1_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_test_0  >>>>>>>>>>>>>>>>>>>>>>>>>>
train 104
val 18
test 33
Traceback (most recent call last):
  File "main_informer.py", line 289, in <module>
    model,info_dict,all_epoch_train_loss,all_epoch_vali_loss,all_epoch_test_loss,epoch_count = exp.train(setting,info_dict,run_name_dir_ckp,run_ex_dir)
  File "/home/mw/project/exp/exp_informer.py", line 240, in train
    pred, true = self._process_one_batch(train_data, batch_x, batch_y, batch_x_mark, batch_y_mark)
  File "/home/mw/project/exp/exp_informer.py", line 498, in _process_one_batch
    outputs = self.model(batch_x, batch_x_mark, dec_inp, batch_y_mark)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/model.py", line 69, in forward
    enc_out = self.enc_embedding(x_enc, x_mark_enc)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/embed.py", line 107, in forward
    x = self.value_embedding(x) + self.position_embedding(x) + self.temporal_embedding(x_mark)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/mw/project/models/embed.py", line 37, in forward
    x = self.tokenConv(x.permute(0, 2, 1)).transpose(1,2)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/conv.py", line 263, in forward
    return self._conv_forward(input, self.weight, self.bias)
  File "/opt/conda/lib/python3.8/site-packages/torch/nn/modules/conv.py", line 256, in _conv_forward
    return F.conv1d(F.pad(input, self._reversed_padding_repeated_twice, mode=self.padding_mode),
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

一篇文章学会大模型【魔搭社区教程】【本地部署通义Qwen2大模型：配置+微调+部署，带你训练自己的行业大模型！】【源代码】【已经解决天坑】【程序员猫爪】
2024-12-25 21:43

程序员猫爪的博客一篇文章学会大模型【魔搭社区教程】【程序员猫爪】【本地部署通义Qwen2大模型：配置+微调+部署，带你训练自己的行业大模型！】【已经解决天坑】
ai大赛gogogo
2022-04-16 17:26

AKA老实人的博客第一节：AI大赛信息介绍关联分析：啤酒尿布属于推荐系统连接分析：影响力排序算法谷爱凌机器学习包：sklearn CGB catboost paddle 提供v100 gpu 启发式算法：运筹学服务调度 operation...
Transformer的手动实现讲解（超详细解释与代码注释）
2025-03-17 21:16

LL-2001的博客 3️⃣ 通过划分到h个头，增强特征表达鲁棒性，并行计算提升训练速度，支持大规模GPU加速。 4.Encoder 4.1 Add&Norm 针对Multi-Head Attention的Add&Norm： L a y e r N o r m ( X + M u l t i H e a d A t t e n t ...
AI绘画 stable diffusion Midjourney 官方GPT文档 AIGC百科全书资料收集
2023-08-17 15:12

KK_crazy的博客教学AI绘画 AIGC工具 SD教程。
【腾讯Bugly干货分享】人人都可以做深度学习应用：入门篇
2017-02-27 11:11

腾讯Bugly的博客 2016年，继虚拟现实（VR）之后，人工智能（AI）的概念全面进入大众的视野。谷歌，微软，IBM等科技巨头纷纷重点布局，AI 貌似将成为互联网的下一个风口。很多开发同学，对人工智能非常感兴趣，确不知从何入手进行学习...
零基础小白深度学习入门篇
2020-05-19 12:50

MuNian123的博客 2017年，围棋界发生了一件比较重大的事，Master（AlphaGo）以60连胜横扫天下，击败各路世界冠军，人工智能以气势如虹的姿态出现在我们人类面前。围棋曾经一度被称为“人类智慧的堡垒”，如今，这座堡垒也随之成为...
深度学习【PyTorch 基础回顾】PyTorch & Tensor 主要特点 | 再次认识 Tensor（张量）| 详细实例讲述 | PyTorch中文文档 | 基于PyTorch实现手写数字识别
2023-05-04 08:52

追光者♂的博客 PyTorch是一个由 Facebook开发的开源深度学习框架，它最初是为了研究人员和工程师开发的，现在已经成为了广泛使用的深度学习工具。PyTorch的核心设计理念是简化深度学习模型的开发和训练过程，它提供了一套易于使用...
Windows下使用Darknet训练自己的数据集（模型：yolov4-tiny、数据集：垃圾分类）
2022-01-18 12:16

非非非非常时刻的博客网上寻找资源，推荐网站：和鲸社区、AI studio社区 3.自己制作数据集 ps：对于不同的深度学习框架和模型算法，需要的数据集格式也不尽相同。本文采用的是VOC格式数据集，是适用于Darknet训练的第二步：制作数据集 ...
人人都可以做深度学习应用：入门篇
2019-03-04 10:16

zmjames2000的博客 2016年，继虚拟现实（VR）之后，人工智能（AI）的概念全面进入大众的视野。谷歌，微软，IBM等科技巨头纷纷重点布局，AI 貌似将成为互联网的下一个风口。很多开发同学，对人工智能非常感兴趣，确不知从何入手进行...
创意无限！AI绘画、ChatGPT、AIGC工具合集，让你的创作梦想成真
2023-09-01 15:07

KK_crazy的博客我们为你带来了一款令人兴奋的AIGC工具合集，集成了AI绘画、ChatGPT等功能，助你轻松实现想法、创作艺术、解决问题，而一切都在你的指尖。 AI绘画：创意无限可能无需任何绘画技能，AI绘画功能将成为你的艺术灵感...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月13日

和鲸社区的GPU环境出现报错

0条回答 默认 最新

问题事件

0条回答默认最新