ES使用logstash處理數(shù)據(jù)(探索)

背景

從某app里獲得了一堆日志轴脐,需要從日志中過濾信息膜楷,存入ES形真,然后再統(tǒng)計分析杉编。

原始數(shù)據(jù)

已經(jīng)通過kafka存入es,內(nèi)容結(jié)構(gòu)大致如下:

personID,groupID,logType,content
1,20,wx,{"signal":100}
1,20,wx,{"sys":"ios"}
2,20,wx,{"signal":10, "network": "4g"}
1,20,wx,{"signal":80}

日志索引存儲了四個字段咆霜,用戶ID(personID)邓馒,組ID(groupID),日志類型(logType)蛾坯,日志內(nèi)容(content)
其中绒净,日志內(nèi)容是JSON。每條日志里偿衰,存儲的content內(nèi)容格式不同,字段也不確定改览。

目標(biāo)

從日志數(shù)據(jù)中下翎,把和signal相關(guān)的數(shù)據(jù)過濾出來,進行統(tǒng)計分析宝当。

技術(shù)選型

  • 通過logstash快速將es中匹配的數(shù)據(jù)導(dǎo)入新索引中
  • 使用kibana進行目標(biāo)數(shù)據(jù)的初步統(tǒng)計分析

思路拆解

【1】
從日志數(shù)據(jù)中视事,過濾出content里的signal字段,字段是整形庆揩,數(shù)值理論上落在-100 ~ 100的區(qū)間里俐东。然后用一個索引:person_device_signal存儲起來。索引需要存儲兩個字段:personID, groupID, signal
然后就能用kibana對索引進行關(guān)于signal的各種平均值订晌,最值虏辫,方差等等的統(tǒng)計計算,也可以personID锈拨,groupID進行分桶然后再統(tǒng)計

【2】
logstash運行導(dǎo)入配置的命令是

./bin/logstash -f xxx.conf

【3】
logstash的導(dǎo)入配置.conf文件分為三個部分:

  • input
  • filter
  • output

【4】input砌庄,對數(shù)據(jù)輸入源的定義。
在這里奕枢,輸入源是:es

先確認(rèn)查詢語句娄昆,找到所有匹配signal的

{
  "query": {
    "match": {
      "content": "signal"
    }
  },
  "sort": [ "_doc" ]
}
input {
  elasticsearch {
    hosts => "localhost"
    index => "person_device_log"
    query => '{"query": {"match": {"content": "signal"}},"sort": [ "_doc" ]}'
    size => 500
    scroll => "5m"
    docinfo => true
  }
}

官方文檔: https://www.elastic.co/guide/en/logstash/current/plugins-inputs-elasticsearch.html#plugins-inputs-elasticsearch-hosts

【5】filter,對輸入的數(shù)據(jù)進行處理

filter {
  json {
    source => "content"
  }
  
  prune {
    whitelist_names => [ 'personID', 'groupID', 'signal']
  }
}

使用prune指定想要的字段才寫入新索引缝彬,避免json解析出來的其它附帶字段

【6】output指定對應(yīng)索引名稱

output {
  elasticsearch {
    hosts => "http://elasticsearch:9200"
    index => "person_device_signal"
    document_id => "%{id}"
   }
  stdout {}
}

注:document_id一定要寫上萌焰,保證數(shù)據(jù)不會因為重復(fù)執(zhí)行命令重復(fù)寫入

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市谷浅,隨后出現(xiàn)的幾起案子扒俯,更是在濱河造成了極大的恐慌奶卓,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件陵珍,死亡現(xiàn)場離奇詭異寝杖,居然都是意外死亡,警方通過查閱死者的電腦和手機互纯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進店門瑟幕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人留潦,你說我怎么就攤上這事只盹。” “怎么了兔院?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵殖卑,是天一觀的道長。 經(jīng)常有香客問我坊萝,道長孵稽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任十偶,我火速辦了婚禮菩鲜,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘惦积。我一直安慰自己接校,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布狮崩。 她就那樣靜靜地躺著蛛勉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪睦柴。 梳的紋絲不亂的頭發(fā)上诽凌,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機與錄音爱只,去河邊找鬼皿淋。 笑死,一個胖子當(dāng)著我的面吹牛恬试,可吹牛的內(nèi)容都是我干的窝趣。 我是一名探鬼主播,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼训柴,長吁一口氣:“原來是場噩夢啊……” “哼哑舒!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起幻馁,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤洗鸵,失蹤者是張志新(化名)和其女友劉穎越锈,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體膘滨,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡甘凭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了火邓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丹弱。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖铲咨,靈堂內(nèi)的尸體忽然破棺而出躲胳,到底是詐尸還是另有隱情,我是刑警寧澤纤勒,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布坯苹,位于F島的核電站,受9級特大地震影響摇天,放射性物質(zhì)發(fā)生泄漏粹湃。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一泉坐、第九天 我趴在偏房一處隱蔽的房頂上張望再芋。 院中可真熱鬧,春花似錦坚冀、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至构捡,卻和暖如春液南,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背勾徽。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工滑凉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人喘帚。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓畅姊,卻偏偏與公主長得像,于是被迫代替她去往敵國和親吹由。 傳聞我的和親對象是個殘疾皇子若未,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容