Table of Contents

CUDA 核函数


限制

  1. 不能递归
  2. 不能有返回值
  3. 参数的数量(或者说参数的总字节数)有上限
  4. 内部不能声明静态变量

技巧

数据类型

线程同步

__syncthreads();

同步范围是整个Block,一个线程运行到syncthreads后,就会等待所有其他线程也运行到syncthreads
用另一个方式解释就是,A线程运行到了第N个syncthreads,那么它就会等待其他线程也执行到第N个syncthreads,然后再恢复执行,直到第N+1个syncthreads