打开 PMM Server 页面,如图所示点进Alerting --> Notification channels

PMM 监控 MySQL 使用钉钉告警-LMLPHP

输入钉钉的信息,并且 Save Test

PMM 监控 MySQL 使用钉钉告警-LMLPHP

测试结果,没问题了

PMM 监控 MySQL 使用钉钉告警-LMLPHP

如何使用 granafa 做告警呢?随便点开一个监控项,我这里以 galera cluster size 为例。

PMM 监控 MySQL 使用钉钉告警-LMLPHP

点击 Alert 如图所示

PMM 监控 MySQL 使用钉钉告警-LMLPHP

重点在于 Conditions ,这里我设置的表达式是

avg() query(C,5m,now) 3 - 3

avg() 含义:面板时间段内的平均值

大概意思就是 5分钟内的平均值要处于 3-3 这个范围。否则发出告警。

这是告警的备注

PMM 监控 MySQL 使用钉钉告警-LMLPHP

效果如图:

PMM 监控 MySQL 使用钉钉告警-LMLPHP

常见报错

添加 Alert 时提示 template variables are not supported in alert queries

官方回复:

https://github.com/grafana/grafana/issues/9334
Template variables are not supported in alerting.
Template variables should be used for discovery and drill down. Not controlling alert rules

处理方法:

复制这个 Dashboard 的 json,将里面的变量都改为常量。

PMM 监控 MySQL 使用钉钉告警-LMLPHP

如下例子:

原来的

      "expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[$interval]) or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"$host\"}[5m])",

改为

      "expr": "max_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[1m])
or\nmax_over_time(mysql_global_status_wsrep_cluster_size{instance=~\"pxc1\"}[5m])",

再重新添加告警即可。

05-21 07:21