所以我有以下格式的日志消息:

[INFO]  <blah.blah>       2016-06-27 21:41:38,263 some text
[INFO]  <blah.blah>       2016-06-28 18:41:38,262 some other text

现在我想删除所有不包含特定字符串“xyz”的日志并保留所有其他日志。我也想索引时间戳。

grokdebug并没有太大帮助。

这是我的尝试:
input {
    file {
         path => "/Users/username/Desktop/validateLogconf/logs/*"
      start_position => "beginning"

   }
}

filter {

  grok {
      match => {
      "message" => '%{SYSLOG5424SD:loglevel}  <%{JAVACLASS:job}>       %{GREEDYDATA:content}'
      }
  }

  date {
    match => [ "Date", "YYYY-mm-dd HH:mm:ss" ]
    locale => en
  }

}

output {
  stdout {
codec => plain {
                        charset => "ISO-8859-1"
                }

}
    elasticsearch {
        hosts => "http://localhost:9201"
        index => "hello"

  }
}

我是新手,所以上面的模式可能没有意义。请帮忙。

最佳答案

要删除不包含字符串xyz的消息:

if ([message] !~ "xyz") {
    drop { }
}

您的 grok 模式没有抓取日志的日期部分。
一旦您的 grok 模式中有一个包含日期的字段,您就可以在该字段上调用日期过滤器。
所以你的 grok 过滤器应该是这样的:
grok {
    match => {
        "message" => '%{SYSLOG5424SD:loglevel}  <%{JAVACLASS:job}>       %{TIMESTAMP_ISO8601:Date} %{GREEDYDATA:content}'
    }
}

我添加了一个部分来获取日期,它将在 Date 字段中。然后你可以使用日期过滤器:
date {
    match => [ "Date", "YYYY-mm-dd HH:mm:ss,SSS" ]
    locale => en
}

我添加了 ,SSS 以便格式与 Date 字段中的格式匹配。
解析的日期将存储在 @timestamp 字段中,除非使用 target 参数进行了不同的指定。

关于elasticsearch - 删除包含特定字符串的日志消息,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38068657/

10-11 08:36