我有一个度量标准foo.bar
,一天多次增加(+1)。指标在一天内增加的次数为x
。我想通过警告最近24小时内的x
小于7天前同一工作日的x
*的一半来检测是否存在严重错误。
我可以为此使用什么警报?
最佳答案
您可以尝试发出类似以下内容的警报:divideSeries(hitcount(foo.bar,"1day"),hitcount(timeShift(foo.bar, "7d"), "1day"))
并设置一个警报,如果该值下降到0.5以下,则将其触发。我认为,如果在带有时间窗口的Grafana视图中运行警报的时间最好少于1天(这是昏暗的预感,请谨慎对待),这将是最好的方法。
如果hitcount
无法正确处理数据,则可以使用integral
(如果在Graphite本身中设置了汇总,则可以使用某些foo.bar.total
值)。但是,如果使用integral
,请当心this article中讨论的与准确性有关的陷阱。该文章还讨论了使用integral(hitcount(...))
的问题,但是由于hitcount
已经聚合,因此我认为这不会满足您的用例。我可能是错的。