https://github.com/NVIDIA/NVTX
AI:NVTX (NVIDIA Tools Extension) 是 NVIDIA 提供的一个“打标”库,允许你在程序里主动插入性能区段的标记(需要修改代码)。
NVTX(NVIDIA Tools Extension)主要就是用来辅助性能分析和调优的。它是 NVIDIA 提供的一个库,允许开发者在自己的代码中插入标记(marker)或者范围(range),这些标记和范围可以在性能分析工具(比如 Nsight Systems、Nsight Compute、Visual Profiler、CUDA Profiler 等)里显示出来,帮助你更好地定位和分析代码的性能瓶颈。
// Generated by AI #include <nvtx3/nvToolsExt.h> nvtxRangeId_t rangeId = nvtxRangeStartA("MyKernel"); // 执行你想分析的代码 nvtxRangeEnd(rangeId);