所以我有以下格式的日志消息:
[INFO] <blah.blah> 2016-06-27 21:41:38,263 some text
[INFO] <blah.blah> 2016-06-28 18:41:38,262 some other text
现在我想删除所有不包含特定字符串“xyz”的日志并保留所有其他日志。我也想索引时间戳。
grokdebug并没有太大帮助。
这是我的尝试:
input {
file {
path => "/Users/username/Desktop/validateLogconf/logs/*"
start_position => "beginning"
}
}
filter {
grok {
match => {
"message" => '%{SYSLOG5424SD:loglevel} <%{JAVACLASS:job}> %{GREEDYDATA:content}'
}
}
date {
match => [ "Date", "YYYY-mm-dd HH:mm:ss" ]
locale => en
}
}
output {
stdout {
codec => plain {
charset => "ISO-8859-1"
}
}
elasticsearch {
hosts => "http://localhost:9201"
index => "hello"
}
}
我是新手,所以上面的模式可能没有意义。请帮忙。
最佳答案
要删除不包含字符串xyz
的消息:
if ([message] !~ "xyz") {
drop { }
}
您的 grok 模式没有抓取日志的日期部分。
一旦您的 grok 模式中有一个包含日期的字段,您就可以在该字段上调用日期过滤器。
所以你的 grok 过滤器应该是这样的:
grok {
match => {
"message" => '%{SYSLOG5424SD:loglevel} <%{JAVACLASS:job}> %{TIMESTAMP_ISO8601:Date} %{GREEDYDATA:content}'
}
}
我添加了一个部分来获取日期,它将在
Date
字段中。然后你可以使用日期过滤器:date {
match => [ "Date", "YYYY-mm-dd HH:mm:ss,SSS" ]
locale => en
}
我添加了
,SSS
以便格式与 Date
字段中的格式匹配。解析的日期将存储在
@timestamp
字段中,除非使用 target
参数进行了不同的指定。关于elasticsearch - 删除包含特定字符串的日志消息,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38068657/