AI:CUDA Graph API 是 CUDA 10 引入的一种高级机制,用于将多个 GPU 操作(kernel 启动、拷贝、memset 等)预先“组织成图”(DAG),然后作为一个整体进行启动
TODO