CUDA:计算两个16位浮点型向量的标量积的实例 #include "cuda_fp16.h" #include "helper_cuda.h" #include <cstdio> #include <cs