我想从我的GPU应用程序中提取数据,以检查其限制。我必须使用 nvprof ,因为该应用程序在远程服务器上运行,因此我应该创建一个文件,以在 Visual Profiler 中本地导入。我尝试使用nvprof -o file_name <app> <params>nvprof --analysis-metrics --output-profile file_name <app> <params>创建文件,但是当我在Visual Profiler中导入这些文件时,在“分析”部分中某些字段为空:“全局内存加载数据不足”,“全局内存存储数据不足”,“内核SM数据不足”。我如何生成文件(或更多文件)以获取“分析”部分的所有信息?我用 nvcc 标记-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v编译cuda代码。
这些是空字段的一些示例:cuda - 将CUDA nvprof输出导出到Visual Profiler-LMLPHP

最佳答案

您可以尝试添加 session ,而不是将prof文件导入可视化探查器。
我遇到了类似的问题。我所做的就是根据here中的指示添加 session ,您将能够看到所有信息。

10-04 20:14