Zhonghui

每个不曾起舞的日子,都是对生命的辜负

User Tools

Site Tools


程序:cuda:nvtx

NVTX

https://github.com/NVIDIA/NVTX

AI:NVTX (NVIDIA Tools Extension) 是 NVIDIA 提供的一个“打标”库,允许你在程序里主动插入性能区段的标记(需要修改代码)。
NVTX(NVIDIA Tools Extension)主要就是用来辅助性能分析和调优的。它是 NVIDIA 提供的一个库,允许开发者在自己的代码中插入标记(marker)或者范围(range),这些标记和范围可以在性能分析工具(比如 Nsight Systems、Nsight Compute、Visual Profiler、CUDA Profiler 等)里显示出来,帮助你更好地定位和分析代码的性能瓶颈。


基础使用

// Generated by AI
 
#include <nvtx3/nvToolsExt.h>
 
nvtxRangeId_t rangeId = nvtxRangeStartA("MyKernel");
// 执行你想分析的代码
nvtxRangeEnd(rangeId);
/var/www/DokuWikiStick/dokuwiki/data/pages/程序/cuda/nvtx.txt · Last modified: 2025/07/13 09:36 by zhonghui