我正在使用神经节3.7.2监视hadoop(2.6.0-cdh5.4.0)集群(7个服务器),并且在hadoop和hbase上启用了metrics2。
我在一台服务器上安装了gmetad,在其他服务器上使用yum安装了gmond;
一开始,监视器运行良好,我可以在神经节网页上看到正常的监视器数据,但是问题是:
几个小时后,rrd文件过多,因此我必须为路径/ var / lib / ganglia / rrds建立符号链接(symbolic link),几天后,rrd文件几乎占据了1TB磁盘空间,并且网页无法显示监控数据,有人知道如何解决吗?

gmond config(使用单通道):

globals {
daemonize = yes
setuid = yes
user = ganglia
debug_level = 0
max_udp_msg_len = 1472
mute = no
deaf = no
allow_extra_data = yes
host_dmax = 86400 /*secs. Expires (removes from web interface) hosts in 1 day */
host_tmax = 20 /*secs */
cleanup_threshold = 300 /*secs */
gexec = no
send_metadata_interval = 60 /*secs */
}

最佳答案

解决了这个问题,我做了以下工作:

  • 将默认rrd规则更改为:
    RRAs“RRA:AVERAGE:0.5:1:256”“RRA:AVERAGE:0.5:24:512”“RRA:AVERAGE:0.5:168:512”“RRA:AVERAGE:0.5:672:512”“RRA:AVERAGE: 0.5:5760:1024“
  • 关闭hadoop metric2的datanode.sink和nodemanager.sink;

  • 引用:http://www.perzl.org/ganglia/bestpractices.html##Best_Practices_Ganglia_Sampling

    关于hadoop - 神经节生成过多的rrd文件且无法自动删除,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34893301/

    10-09 03:23