1、在运行Tensorflow等程序时会使用到NVIDIA的GPU,所以在程序运行时需要监控GPU的运行情况

使用 nvidia-smi 命令 ,显示如下:

Linux下监视GPU、CPU的使用情况-LMLPHP

nvidia-smi 显示解读:

GPU:本机中的GPU编号,为0,1,2等
Name:GPU 类型,GTX1080、Tesla K80等
Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态
Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温
Temp:温度,单位摄氏度
Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能
Pwr:Usage/Cap:能耗表示
Bus-Id:涉及GPU总线的相关信息
Disp.A:Display Active,表示GPU的显示是否初始化
Memory-Usage:显存使用率
Volatile GPU-Util:浮动的GPU利用率
Uncorr. ECC:关于ECC的东西
Compute M.:计算模式
Processes 显示每块GPU上每个进程所使用的显存情况。

注意:显存占用和GPU占用是两个不一样的东西,显卡是由GPU和显存等组成的,显存和GPU的关系有点类似于内存和CPU的关系。

nvidia-smi -L 命令:列出所有可用的 NVIDIA 设备

显示如下:

Linux下监视GPU、CPU的使用情况-LMLPHP

watch -n 10 nvidia-smi 命令:周期性的显示GPU的情况,10 表示每10秒显示一次

2、关于CPU使用情况查看的命令

详见:ubuntu查看系统资源占用(内存,cpu和进程)

05-15 04:42