__syncthreads();
同步范围是整个Block,一个线程运行到syncthreads后,就会等待所有其他线程也运行到syncthreads 用另一个方式解释就是,A线程运行到了第N个syncthreads,那么它就会等待其他线程也执行到第N个syncthreads,然后再恢复执行,直到第N+1个syncthreads