这个问题与使用的显卡有关,但可以暂时不考虑显卡的问题。希望举例说明
2条回答 默认 最新
- CSDN专家-深度学习进阶 2022-04-25 08:18关注
调用核函数的时候,可以有多个block,,每个block所能容纳的最大线程数也是有限的。其实在硬件上,每个block里面的所有thread会共用一个处理器核心,而且它们共享的shared memory也是有限的;所以从设计角度出发,CUDA限制了每个block最多只能有1024个线程。
当然可以使用多个block,跟thread的1到3维结构一样,block也可以按照1到3维组织起来,用blockIdx索引,这个block的集合被叫做“grid”,一个grid里面的block数量往往是根据实际数据需要决定的,经常会超出GPU实际拥有的处理器核心数量。
参考CUDA编程 (2.1)—— 核函数、线程层级 - 知乎 hello大家好,这篇文章我们正式开始学习CUDA编程的具体操作。CUDA的语言是一种类似C++的代码风格,结合下文将会介绍的编程模型,相信大家会对CUDA编程有个初步的感受,有个大方向。当然如果想要真正从入门到精通CU…https://zhuanlan.zhihu.com/p/398427344
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报