我有一个度量标准foo.bar,一天多次增加(+1)。指标在一天内增加的次数为x。我想通过警告最近24小时内的x小于7天前同一工作日的x *的一半来检测是否存在严重错误。

我可以为此使用什么警报?

最佳答案

您可以尝试发出类似以下内容的警报:

divideSeries(hitcount(foo.bar,"1day"),hitcount(timeShift(foo.bar, "7d"), "1day"))

并设置一个警报,如果该值下降到0.5以下,则将其触发。我认为,如果在带有时间窗口的Grafana视图中运行警报的时间最好少于1天(这是昏暗的预感,请谨慎对待),这将是最好的方法。

如果hitcount无法正确处理数据,则可以使用integral(如果在Graphite本身中设置了汇总,则可以使用某些foo.bar.total值)。但是,如果使用integral,请当心this article中讨论的与准确性有关的陷阱。该文章还讨论了使用integral(hitcount(...))的问题,但是由于hitcount已经聚合,因此我认为这不会满足您的用例。我可能是错的。

08-28 06:49