打开 PMM Server
页面,如图所示点进Alerting --> Notification channels
输入钉钉的信息,并且 Save Test
测试结果,没问题了
如何使用 granafa 做告警呢?随便点开一个监控项,我这里以 galera cluster size
为例。
点击 Alert
如图所示
重点在于 Conditions
,这里我设置的表达式是
avg() query(C,5m,now) 3 - 3
avg() 含义:面板时间段内的平均值
大概意思就是 5分钟内的平均值要处于 3-3 这个范围。否则发出告警。
这是告警的备注
效果如图:
常见报错
添加 Alert 时提示 template variables are not supported in alert queries
官方回复:
https://github.com/grafana/grafana/issues/9334
Template variables are not supported in alerting.
Template variables should be used for discovery and drill down. Not controlling alert rules
处理方法:
复制这个 Dashboard 的 json,将里面的变量都改为常量。
如下例子:
原来的
"expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[$interval]) or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[5m])",
改为
"expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[1m])
or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[5m])",
再重新添加告警即可。