Logsatsh 實(shí)踐

logsatsh 使用中多input與output

作中 在配置es的時(shí)候需要對logstash進(jìn)行配置,然而根據(jù)功能分配

input {
    log4j {
        type => "jpa"
        host => "192.168.51.73"
        port => 4560
    }

    log4j {
        type => "jpatest"
        host => "192.168.51.73"
        port => 4567
    }
}
output {
    stdout {
      codec => rubydebug
    }
    if [type] =="jap"{
        elasticsearch{
            hosts => ["192.168.51.73:9200"]
            index => "logsatsh-jpa-%{+YYYY.MM.dd}"
            document_type => "log4jboot_type
        }
    } else if [type] == "jpatest"{
        elasticsearch{
            hosts => ["192.168.51.73:9200"]
            index => "logsatsh-jpatest-%{+YYYY.MM.dd}"
            document_type => "log4jboot_type"
        }
    }else{
        elasticsearch{
            hosts => ["192.168.51.73:9200"]
            index => "log4jboot-%{+YYYY.MM.dd}"
            document_type => "log4jboot_type"
        }
    }

}

input 從文件中讀取

input{
     file{
        path => ["D:\Program Files (x86)\apache-tomcat-7.0.69-eclipse\apache-tomcat-7.0.69\logs\zjgqjyError.log"]
        type => "zjgqjy_error_file"
        start_position => "beginning"
      }        
}

使用codec+multiline來處理跨行的日志
log4j里面的記錄的java程序發(fā)生異常時(shí)森爽,經(jīng)常 會拋出一大堆異常
在input階段的編碼過程中人灼,加入正則判斷:

input{
    file{
        path => ["D:\Program Files (x86)\apache-tomcat-7.0.69-eclipse\apache-tomcat-7.0.69\logs\zjgqjyError.log"]
        type => "zjgqjy_error_file"
        start_position => "beginning"
        codec => multiline {
            pattern => "(^.+[ERROR]:.+)|(^.+Exception:.+)|(^\s+at .+)|(^\s+... \d+ more)|(^\s*Causedby:.+)"
            what => "previous"
        }
    }
}

對 multiline 插件來說,有三個(gè)設(shè)置比較重要:negate芙沥、pattern 和 what。

negate
    類型是 boolean
    默認(rèn)為 false
    否定正則表達(dá)式(如果沒有匹配的話)。
pattern
    必須設(shè)置
    類型為 string
    沒有默認(rèn)值
    要匹配的正則表達(dá)式胳泉。
what
    必須設(shè)置
    可以為 previous 或 next
    沒有默認(rèn)值
    如果正則表達(dá)式匹配了,那么該事件是屬于下一個(gè)或是前一個(gè)事件岩遗?

log4j - logStash - redis - logstash - elasticsearch

image.png
# log4j_to_redis 
input {
    log4j {
        type => "jpatest" 
        host => "192.168.51.73"
        port => 4567
    }
}
output {

        redis {
            host => "192.168.51.73"   # redis主機(jī)地址
            port => 6379              # redis端口號
            #db => 8                   # redis數(shù)據(jù)庫編號
            data_type => list    # 使用list模式
            key => "logstash_list_jpatest"  # 發(fā)布通道名稱
        }

}
#redis_to_elasticsearch
input {
   redis {
        data_type => "list"
        key => "logstash_list_jpatest"
        host => "192.168.51.73"
        port => 6379
        threads => 5 #使用多少個(gè)線程去讀
    }

}
output {

    elasticsearch{
        hosts => ["192.168.51.73:9200"]
        index => "logsatsh-redis-test-%{+YYYY.MM.dd}"
        document_type => "log4jboot_type"
    }
}

ogStash::Inputs::Redis 支持三種 data_type(實(shí)際上是redis_type)扇商,不同的數(shù)據(jù)類型會導(dǎo)致實(shí)際采用不同的 Redis 命令操作:

  • list => BLPOP
  • channel => SUBSCRIBE
  • pattern_channel => PSUBSCRIBE

這里我們使用 redis的 list 模式,其他兩種方式是訂閱宿礁、發(fā)布模式案铺, 這種方式在需要擴(kuò)展 logstash 成多節(jié)點(diǎn)集群的時(shí)候,會出現(xiàn)一個(gè)問題:通過頻道發(fā)布的一條信息梆靖,會被所有訂閱了該頻道的 logstash 進(jìn)程同時(shí)接收到控汉,然后輸出重復(fù)內(nèi)容!

Grok 正則捕獲

在 logsatsh 的使用中返吻,對于日志的收集通常需要對對應(yīng)的數(shù)據(jù)進(jìn)行捕獲姑子,將日志格式話,這里需要使用Logstash filter中基于正則的插件gork测僵。

gork 內(nèi)置了120多個(gè)正則街佑, 比如常見的Apache的log格式,Nginx的log格式 上面的正則庫都有成型的正則式捍靠,省去了自己編寫正則一大部分的工作

filter{
    grok {
        match => { "message" => "client:%{WORD:client},servername:%{WORD:servername}" } 
    }
}

上面代碼里面的 WORD 就是內(nèi)置的字符串正則沐旨,同樣的還有DATESTAMP_CN,IP,MAC等,通過組合可以將日志格式化剂公,變成json 的格式存儲希俩。

  grok {
         match => { "message" => "%{DATESTAMP_CN:[@metadata][logdate]} .* - %{WORD:opeType}\|%{WORD:name}\|Oid: %{WORD:oid}\|IP: %{IP:ip}\|MAC: %{GREEDYDATA:mac}\|%{WORD:result}\|%{GREEDYDATA:exception}\|" }
        match => { "message" => "%{DATESTAMP_CN:[@metadata][logdate]} .* - %{WORD:opeType}\|%{WORD:name}\|Oid: %{WORD:oid}\|IP: %{IP:ip}\|MAC: %{GREEDYDATA:mac}\|%{WORD:result}\|"  }
        match => { "message" => "%{DATESTAMP_CN:[@metadata][logdate]} .* - %{WORD:opeType}\|%{WORD:name}\|Oid: %{WORD:oid}\|IP: %{IP:ip}\|MAC: %{GREEDYDATA:mac}\|"  }
         match => { "message" => "%{DATESTAMP_CN:[@metadata][logdate]} .* - %{WORD:opeType}\|IP: %{IP:ip}\|MAC: %{GREEDYDATA:mac}\|%{WORD:result}\|"  }
         match => { "message" => "%{DATESTAMP_CN:[@metadata][logdate]} .* - %{WORD:opeType}\|IP: %{IP:ip}\|MAC: %{GREEDYDATA:mac}\|" }
         remove_field  => "message"
 }

首先行首使用DATESTAMP_CN規(guī)則來識別時(shí)間,并賦值給logdate字段名纲辽;然后.識別任意字符串(.代表任意一個(gè)字符颜武,包括特殊字符,代表個(gè)數(shù)是任意個(gè))拖吼;然后使用WORD規(guī)則(即匹配字符串規(guī)則鳞上,不包含特殊字符)識別到字符串并賦值給opeType字段;后面同理吊档。這些WORD篙议、IP、GREEDYDATA規(guī)則都是logstash內(nèi)部grok-patterns文件已經(jīng)定義好了的規(guī)則。用戶可以直接拿來使用鬼贱。
remove_field => "message"表示解析完成之后刪除原來的 message字段移怯,避免重復(fù)。
注意:5種正則規(guī)則的上下順序这难,下面的規(guī)則放在上面會導(dǎo)致可能內(nèi)容解析不全舟误,比如源數(shù)據(jù)是:請求交易名|操作員登錄名|操作員編號|ip地址|mac地址|返回結(jié)果|異常信息,如果按照“請求交易名|ip地址|mac地址|”規(guī)則去匹配姻乓,只能識別出3個(gè)字段嵌溢,而且匹配成功,不繼續(xù)往下執(zhí)行蹋岩,這樣識別的內(nèi)容就不全赖草。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市剪个,隨后出現(xiàn)的幾起案子秧骑,更是在濱河造成了極大的恐慌,老刑警劉巖禁偎,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腿堤,死亡現(xiàn)場離奇詭異,居然都是意外死亡如暖,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進(jìn)店門忌堂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盒至,“玉大人,你說我怎么就攤上這事士修〖纤欤” “怎么了?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵棋嘲,是天一觀的道長酒唉。 經(jīng)常有香客問我,道長沸移,這世上最難降的妖魔是什么痪伦? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮雹锣,結(jié)果婚禮上网沾,老公的妹妹穿的比我還像新娘。我一直安慰自己蕊爵,他們只是感情好辉哥,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般醋旦。 火紅的嫁衣襯著肌膚如雪恒水。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天饲齐,我揣著相機(jī)與錄音钉凌,去河邊找鬼。 笑死箩张,一個(gè)胖子當(dāng)著我的面吹牛甩骏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播先慷,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼饮笛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了论熙?” 一聲冷哼從身側(cè)響起福青,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎脓诡,沒想到半個(gè)月后无午,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡祝谚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年宪迟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片交惯。...
    茶點(diǎn)故事閱讀 38,605評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡次泽,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出席爽,到底是詐尸還是另有隱情意荤,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布只锻,位于F島的核電站玖像,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏齐饮。R本人自食惡果不足惜捐寥,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望沈矿。 院中可真熱鬧上真,春花似錦、人聲如沸羹膳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至就珠,卻和暖如春寇壳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背妻怎。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工壳炎, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人逼侦。 一個(gè)月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓匿辩,卻偏偏與公主長得像,于是被迫代替她去往敵國和親榛丢。 傳聞我的和親對象是個(gè)殘疾皇子铲球,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評論 2 348