此log4j日志的logstash grok过滤器应该是什么?

What should be the logstash grok filter for this log4j log?

我被要求将我们的log4j日志文件(暂时不使用Socket调用)整合到一个Logstash JSON文件中,然后将其输入到Elasticsearch中。 我们的代码使用RollingFileAppender。 这是一个示例日志条目。

1
2016-04-22 16:43:25,172 ERROR :SomeUser : 2 [com.mycompany.SomeClass]  AttributeSchema 'Customer |Customer |Individual|Individual|Quarter|Date' : 17.203 The Log Message.

这是我们log4j.properties文件中的ConversionPattern值

1
<param name="ConversionPattern" value="%d{ISO8601} %p %x %X{username}:%t [%c] %m %n" />

有人可以帮我写一个Logstash Grok过滤器来解析该行吗? 到目前为止,我有以下内容

1
2
3
4
5
6
7
8
9
10
filter {
  if [type] =="log4j" {
    grok {
        match => ["message","%{TIMESTAMP_ISO8601:logdate} %{LOGLEVEL:loglevel} %{GREEDYDATA:messsage}"]
    }
    date {
        match => ["logdate","yyyy-MM-dd HH:mm:ss,SSS","ISO8601"]
    }
  }
}

但是,当然,它将优先级之后的所有内容作为消息。 我想进一步分离以下字段(在Log4j模式布局中定义)

  • 用户(%X {username})
  • 类路径([%c])
  • 线程(%t)
  • 嵌套诊断内容(%x)
  • 邮件本身(%m)

我能够使以下过滤器起作用。

1
2
3
4
5
6
7
8
9
10
11
12
13
filter {
    mutate {
      strip =>"message"
    }
    grok {
      match => {
       "message" =>"%{TIMESTAMP_ISO8601:logdate} %{LOGLEVEL:loglevel} :%{DATA:thread} : %{NUMBER:thread_pool} \\[(?<classname>[^\\]]+)\\] %{SPACE} %{GREEDYDATA:msgbody}"
      }
    }
    date {
      match => ["logdate","yyyy-MM-dd HH:mm:ss,SSS","ISO8601"]
    }
}

但是,这特定于上述日志。

我有一个后续问题。 我如何"填充"模式以管理每个模式中的"空间"。 例如,一个ERROR日志级别占用5个空间,而一个INFO日志级别占用4个空间,那么如何进行管理以使其对ERROR和INFO日志都起作用?