公司上架了一批戴尔服务器,公司要求对这些服务器的硬件做一系列的监控,如CPU的温度,内存,风扇的状态,转速,磁盘等硬件的监控。
在对服务器的硬件监控上,目前业界主要基于如下两种:
1、服务器自带的工具 ,比如HP的hpacucli,DELL的OMSA等
2、智能平台管理接口 (IPMI,全称Intelligent Platform Management Interface)
基于以上两种,通过nagios、zabbix或自研运维平台等包裹,进行预警操作。
由于公司使用的服务器全部为DELL PowerEdge系列的,因此这里将以如何对DELL PowerEdge系列服务器硬件进行监控这一实际案例为主。
一、OMSA 介绍
DELL OMSA的全称为Dell Openmanage Server Administrator,它是戴尔公司基于自主研发力量开发的IT系统管理解决方案,通过与业内领先的系统管理解决方案供应商密切配合,在深入了解用户对系统管理需求的基础上,OMSA系统管理方案可以全面解决系统管理人员最关心的系统部署、系统监控和系统变更三大系统管理问题。它通过提供以下两种方式来对本地和远程的服务器进行管理和监控。
1、基于Web浏览器的集成图形用户界面(GUI)
大家可能对DELL的IDRAC更熟悉一点,OMSA其实就是 IDRAC企业版的开源社区版。这里列出IDRAC和OMSA的web界面,两者看着非常相似,功能上也是非常相似。
可以通过web访问OMSA界面,如果公司IDRAC是企业级的,可以通过IDRAC查看硬件的信息情况,使用浏览器访问https://ip_address 打开OMSA的web页面。这里注意,一定要使用https去访问,否则页面会打不开。
戴尔服务器IDRAC出厂的默认的IP地址是:192.168.0.120 用户名/密码:root/calvin 即可登录,
就可以硬件信息情况了。
2、也可以部署OMSA平台查看硬件信息
下面介绍如何安装使用OMSA。由于我们公司主要使用的是Centos6系列的产品,因此这里列举CentOS6部署方式。