我正在测试grok debugger,但无法解决问题。

示例文本:

2014-06-17 04:37:30,317 c.e.A.MyActivity INFO main MyActivity.java 53 com.example.ApLogback.MyActivity$1 onClick logger track

我应该如何构造grok regex / pattern字符串,以便它像以下部分一样拆分先前的示例文本:
{
    timestamp:2014-06-17 04:37:30,317
    logger:c.e.A.MyActivity
    level:info
    caller_thread:main
    caller_method:MyActivity.java
    caller_line:53
    caller_class:com.example.ApLogback.MyActivity$1
    caller_method: onClick
    msg: caller track
}

我当前的正则表达式是:
 (?<timestamp>[0-9]{4}-[0-9]{2}-[0-9]{2} [0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]{3}) (?<logger>.*)

但是它仅将日志字符串的开头部分分割。我当前的grok字符串的示例结果是:
    {
      "timestamp": [
        [
          "2014-06-17 04:37:30,317"
        ]
      ],
      "logger": [
        [
          "c.e.A.MyActivity INFO main MyActivity.java 53 com.example.ApLogback.MyActivity$1 onClick logger"
        ]
      ]
    }

最佳答案

Grok附带了许多已经定义好的模式,这些模式可以满足您的大多数需求,请在Grok Debugger/patterns上进行检查。

至于您问题的具体答案,下面是一个简单的示例,它可以满足您的需要。这只是如何使用已定义的grok模式来构建自己的模式的示例。

(?<timestamp>[0-9]{4}-[0-9]{2}-[0-9]{2} [0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]{3}) (?:%{JAVACLASS:logger}) (?:%{LOGLEVEL:level}) (?:%{WORD:caller_thread}) (?:%{JAVACLASS:caller_file}) (?:%{NONNEGINT:caller_line}) (?:%{JAVACLASS:caller_class}) (?:%{WORD:caller_method}) (?:%{GREEDYDATA:msg})

关于elasticsearch - grok调试器正则表达式用法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24256198/

10-11 19:21