NVCC、NVRTC、PTX、SASS和cubin、fatbin
cuda的编译流程.drawio.txt
基本流程:
图中出现的一些概念的简单解释:
# AI生成,未测试 # PTX nvcc -arch=sm_70 -ptx kernel.cu -o kernel.ptx # fatbin nvcc -arch=sm_70 --fatbin kernel.cu -o kernel.fatbin