我需要一个DTrace脚本,该脚本返回CPU使用率,内存使用率以及所使用的网络输入和输出字节,并按区域汇总数据。像这样的东西:

ZONE  %CPU %MEM NET_INPUT NET_OUTPUT
zone1 25%  12%   86012     1294
zone2 48%  65%   86012     7354
zone3  8%  14%  268153    68746

现在,我正在使用:
prstat -Z -c -n 1,99999 5 1

返回类似的内容(没有网络流量):
Please wait...
   PID USERNAME  SIZE   RSS STATE  PRI NICE      TIME  CPU PROCESS/NLWP
 32051 root     1090M 1079M sleep    1    0  12:57:25 0,4% qemu-system-x86/7
ZONEID    NPROC  SWAP   RSS MEMORY      TIME  CPU ZONE
  3228        2 1090M 1079M   2,2%  12:57:25 0,4% 6ce064b6-fec9-4daa-ba2b-0082f73fca73
     0      105 2075M  633M   1,1% 202:56:51 0,4% global
  3031        2 2105M 2094M   4,3%  17:04:52 0,3% e32fb987-35f7-4860-a04a-ca26c327d4ba
(...)
  3411       18   81M   54M   0,1%   0:00:04 0,0% 52120eb6-2e20-4a64-8f7a-235a44d9f100
Total: 894 processes, 5460 lwps, load averages: 0,53, 0,53, 0,54

为了将数据与网络流量结合起来,我需要做同样的事情,但是要用DTrace完成,以后再做更多的调查。

最佳答案

这样的脚本不存在的原因是,使用DTrace很难获得CPU/内存使用率。 DTrace最适合在特定事件上采样数据。要使用DTrace获得CPU利用率,您需要跟踪CPU每次空闲时的空闲时间,然后进行一些添加。请注意,这不同于DTrace提供的用于跟踪调度程序操作的提供程序,因为这些操作是基于每个线程而不是基于每个CPU。内存更加令人讨厌,因为您将跟踪每个内存分配和释放。

要获取这些数据源,最好从kstat中提取数据(听起来好像您使用的是Solaris,而AFAIK是唯一具有kstat的平台)。您可以使用以下方式找到您要查找的信息:

$ sudo kstat unix:0:system_misc:ncpus      # this is the number of CPUs you have
module: unix                            instance: 0
name:   system_misc                     class:    misc
        ncpus                           2

$ sudo kstat cpu::sys:cpu_ticks*           # ticks of each type for each core since boot
module: cpu                             instance: 0
name:   sys                             class:    misc
        cpu_ticks_idle                  9375292
        cpu_ticks_kernel                82658
        cpu_ticks_user                  23684
        cpu_ticks_wait                  0

module: cpu                             instance: 1
name:   sys                             class:    misc
        cpu_ticks_idle                  9410367
        cpu_ticks_kernel                49141
        cpu_ticks_user                  21956
        cpu_ticks_wait                  0

$ sudo kstat unix:0:system_pages:physmem   # pages of physical memory (multiply by page size for number of bytes)
module: unix                            instance: 0
name:   system_pages                    class:    pages
        physmem                         1045390

$ sudo kstat unix:0:system_pages:freemem   # pages of free memory (multiply by page size for number of bytes)
module: unix                            instance: 0
name:   system_pages                    class:    pages
        freemem                         880842

请注意,您需要从CPU滴答计数器的最后一个读数中减去每个新读数-否则,您将跟踪自系统启动以来的滴答总数。当计数器溢出时,将它们设置为0,然后将新值添加到它们(这不仅仅是盲目加法溢出)。

您还可以使用kstat监视使用link:0::通过网络链接读取/写入的字节数。我不确定是否可以按区域找到此信息,但是可能也有一个kstat可以跟踪该信息。

我想如果您确定要使用DTrace监视值,则可以通过跟踪内核中这些计数器被修改的时刻并记录修改来强制执行此操作。但是,我并没有真正意识到这样做的意义,因为您已经发现使用其他方法会更容易。为什么不编写一个启动两个数据源并将结果组合成更好看的脚本?

关于monitoring - Dtrace脚本返回按区域汇总的%CPU,%内存和网络输入/输出,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14579255/

10-11 22:49