sar介绍:
sar -[*] 命令后报错的解决办法:
报错内容如下:
Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
解决办法
root@botoo:/botoo/sayhello-master/sayhello-master# sar -f
Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
root@botoo:/botoo/sayhello-master/sayhello-master# sudo chmod o+w /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# sar -r
Cannot open /var/log/sysstat/sa21: No such file or directory
Please check if data collecting is enabled
root@botoo:/botoo/sayhello-master/sayhello-master# vim /etc/default/sysstat
root@botoo:/botoo/sayhello-master/sayhello-master# sudo /etc/init.d/sysstat restart
[ ok ] Restarting sysstat (via systemctl): sysstat.service.
root@botoo:/botoo/sayhello-master/sayhello-master# sar -r
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
:: PM 41.94 46.68
sar 参数说明
- -A 汇总所有的报告
- -a 报告文件读写使用情况
- -B 报告附加的缓存的使用情况
- -b 报告缓存的使用情况
- -c 报告系统调用的使用情况
- -d 报告磁盘的使用情况
- -g 报告串口的使用情况
- -h 报告关于buffer使用的统计数据
- -m 报告IPC消息队列和信号量的使用情况
- -n 报告命名cache的使用情况
- -p 报告调页活动的使用情况
- -q 报告运行队列和交换队列的平均长度
- -R 报告进程的活动情况
- -r 报告没有使用的内存页面和硬盘块
- -u 报告CPU的利用率
- -v 报告进程、i节点、文件和锁表状态
- -w 报告系统交换活动状况
- -y 报告TTY设备活动状况
查看CPU使用率sar -u
root@botoo:/# sar -u
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM CPU %user %nice %system %iowait %steal %idle
:: PM all 0.00 0.00 1.00 0.00 0.00 99.00
:: PM all 1.00 0.00 0.00 0.00 0.00 99.00
:: PM all 0.00 0.00 0.00 0.00 0.00 100.00
Average: all 0.34 0.00 0.34 0.00 0.00 99.33
sar -u 1 3 后面的参数是1秒一次,总共采样3次
可以看到这台机器使用了虚拟化技术,有相应的时间消耗; 各列的指标分别是:
- %user 用户模式下消耗的CPU时间的比例;
- %nice 通过nice改变了进程调度优先级的进程,在用户模式下消耗的CPU时间的比例
- %system 系统模式下消耗的CPU时间的比例;
- %iowait CPU等待磁盘I/O导致空闲状态消耗的时间比例;
- %steal 利用Xen等操作系统虚拟化技术,等待其它虚拟CPU计算占用的时间比例;
- %idle CPU空闲时间比例;
查看平均负载 sar -q
指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;与其它命令相比,它能查看各项指标随时间变化的情况;
root@botoo:/# sar -q
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM runq-sz plist-sz ldavg- ldavg- ldavg- blocked
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
:: PM 0.04 0.01 0.00
Average: 0.04 0.01 0.00
- runq-sz:运行队列的长度(等待运行的进程数)
- plist-sz:进程列表中进程(processes)和线程(threads)的数量
- ldavg-1:最后1分钟的系统平均负载 ldavg-5:过去5分钟的系统平均负载
- ldavg-15:过去15分钟的系统平均负载
查看物理内存使用状况 sar -r
root@botoo:/# sar -r
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
:: PM 41.95 46.68
:: PM 41.95 46.68
:: PM 41.95 46.68
Average: 41.95 46.68
- kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
- kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
- %memused:物理内存使用率,这个值是kbmemused和内存总量(不包括swap)的一个百分比.
- kbbuffers和kbcached:这两个值就是free命令中的buffer和cache.
- kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
- %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比
查看页面交换发生状况 sar -W
页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用这个命令来确认是否发生了大量的交换;
root@botoo:/# sar -W
Linux 4.4.--generic (botoo) // _x86_64_ ( CPU) :: PM pswpin/s pswpout/s
:: PM 0.00 0.00
:: PM 0.00 0.00
:: PM 0.00 0.00
Average: 0.00 0.00
- pswpin/s:每秒系统换入的交换页面(swap page)数量
- pswpout/s:每秒系统换出的交换页面(swap page)数量
要判断系统瓶颈问题,有时需几个 sar 命令选项结合起来;
- 怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看
- 怀疑内存存在瓶颈,可用sar -B、sar -r 和 sar -W 等来查看
- 怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看