记录一下使用多gpu出现的报错。在一开始的时候,使用的是单gpu能够正常训练和验证,但使用多gpu的时候就会报RuntimeError: shape '[xxx,xxx]' is invalid for input of size xxx错误,查找了一下原因并不是网络结构间的输入输出的shape不对应,而是train和val的batchsize应该都是gpu数量的整数倍。
记录一下使用多gpu出现的报错。在一开始的时候,使用的是单gpu能够正常训练和验证,但使用多gpu的时候就会报RuntimeError: shape '[xxx,xxx]' is invalid for input of size xxx错误,查找了一下原因并不是网络结构间的输入输出的shape不对应,而是train和val的batchsize应该都是gpu数量的整数倍。