sar介绍:

sar  -[*] 命令后报错的解决办法:

报错内容如下:

Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
解决办法
root@botoo:/botoo/sayhello-master/sayhello-master# sar -f
Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
root@botoo:/botoo/sayhello-master/sayhello-master# sudo chmod o+w /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# sar -r
Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# sudo /etc/init.d/sysstat restart
[ ok ] Restarting sysstat (via systemctl): sysstat.service.
root@botoo:/botoo/sayhello-master/sayhello-master# sar -r
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
:: PM 41.94 46.68

sar 参数说明

  • -A 汇总所有的报告
  • -a 报告文件读写使用情况
  • -B 报告附加的缓存的使用情况
  • -b 报告缓存的使用情况
  • -c 报告系统调用的使用情况
  • -d 报告磁盘的使用情况
  • -g 报告串口的使用情况
  • -h 报告关于buffer使用的统计数据
  • -m 报告IPC消息队列和信号量的使用情况
  • -n 报告命名cache的使用情况
  • -p 报告调页活动的使用情况
  • -q 报告运行队列和交换队列的平均长度
  • -R 报告进程的活动情况
  • -r 报告没有使用的内存页面和硬盘块
  • -u 报告CPU的利用率
  • -v 报告进程、i节点、文件和锁表状态
  • -w 报告系统交换活动状况
  • -y 报告TTY设备活动状况

查看CPU使用率sar -u

root@botoo:/# sar -u
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM CPU %user %nice %system %iowait %steal %idle
:: PM all 0.00 0.00 1.00 0.00 0.00 99.00
:: PM all 1.00 0.00 0.00 0.00 0.00 99.00
:: PM all 0.00 0.00 0.00 0.00 0.00 100.00
Average: all 0.34 0.00 0.34 0.00 0.00 99.33

sar -u 1 3 后面的参数是1秒一次,总共采样3次

可以看到这台机器使用了虚拟化技术,有相应的时间消耗; 各列的指标分别是:

  • %user 用户模式下消耗的CPU时间的比例;
  • %nice 通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间的比例
  • %system 系统模式下消耗的CPU时间的比例;
  • %iowait CPU等待磁盘I/O导致空闲状态消耗的时间比例;
  • %steal 利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的时间比例;
  • %idle CPU空闲时间比例;

查看平均负载 sar -q

指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;与其它命令相比,它能查看各项指标随时间变化的情况;

root@botoo:/# sar -q
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM runq-sz plist-sz ldavg- ldavg- ldavg- blocked
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
Average: 0.04 0.01 0.00
  • runq-sz:运行队列的长度(等待运行的进程数)
  • plist-sz:进程列表中进程(processes)和线程(threads)的数量
  • ldavg-1:最后1分钟的系统平均负载 ldavg-5:过去5分钟的系统平均负载
  • ldavg-15:过去15分钟的系统平均负载

查看物理内存使用状况 sar -r

root@botoo:/# sar -r
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
:: PM 41.95 46.68
:: PM 41.95 46.68
:: PM 41.95 46.68
Average: 41.95 46.68
  • kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
  • kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
  • %memused:物理内存使用率,这个值是kbmemused和内存总量(不包括swap)的一个百分比.
  • kbbuffers和kbcached:这两个值就是free命令中的buffer和cache.
  • kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
  • %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比

查看页面交换发生状况  sar -W

页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用这个命令来确认是否发生了大量的交换;

root@botoo:/# sar -W
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM pswpin/s pswpout/s
:: PM 0.00 0.00
:: PM 0.00 0.00
:: PM 0.00 0.00
Average: 0.00 0.00
  • pswpin/s:每秒系统换入的交换页面(swap page)数量
  • pswpout/s:每秒系统换出的交换页面(swap page)数量

要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来;

  • 怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看
  • 怀疑内存存在瓶颈,可用sar -B、sar -r 和 sar -W 等来查看
  • 怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看
05-11 13:06