elasticsearch基本概念與查詢語(yǔ)法

序言

后面有大量類似于mysql的sum， group by查詢
elk
===

elk總體架構(gòu)

https://www.elastic.co/cn/products

Beat

基于go語(yǔ)言寫(xiě)的輕量型數(shù)據(jù)采集器味混，讀取數(shù)據(jù)细睡，迅速發(fā)送到Logstash進(jìn)行解析门粪，亦或直接發(fā)送到Elasticsearch進(jìn)行集中式存儲(chǔ)和分析。

Logstash

Logstash 是開(kāi)源的服務(wù)器端數(shù)據(jù)處理管道，能夠同時(shí)從多個(gè)來(lái)源采集數(shù)據(jù)、格式化數(shù)據(jù)躲胳，然后將數(shù)據(jù)發(fā)送到es進(jìn)行存儲(chǔ)。

ElasticSearch

Elasticsearch 是基于JSON的分布式搜索和分析引擎纤勒，是利用倒排索引實(shí)現(xiàn)的全文索引坯苹。

Kibana
Kibana 能夠可視化 Elasticsearch 中的數(shù)據(jù)并操作。

elasticsearch

es在elk生態(tài)圈中處于核心地位踊东，是開(kāi)源大規(guī)谋崩模基于倒排索引的全文搜索分析引擎，他幾乎能實(shí)時(shí)的支持存儲(chǔ)搜索分析闸翅。
優(yōu)勢(shì):

橫向可擴(kuò)展性: 增加服務(wù)器可直接配置在集群中
分片機(jī)制提供更好的分布性: 分而治之的方式來(lái)提升處理效率
高可用: 提供復(fù)制（replica）機(jī)制
實(shí)時(shí)性: 通過(guò)將磁盤(pán)上的文件放入文件緩存系統(tǒng)來(lái)提高查詢速度

基本概念

Index: 一系列文檔的集合，類似于mysql中數(shù)據(jù)庫(kù)的概念
Type: 在Index里面可以定義不同的type菊霜，type的概念類似于mysql中表的概念坚冀，是一系列具有相同特征數(shù)據(jù)的結(jié)合。
Document: 文檔的概念類似于mysql中的一條存儲(chǔ)記錄鉴逞，并且為json格式记某，在Index下的不同type下，可以有許多document构捡。
Shards: 在數(shù)據(jù)量很大的時(shí)候液南，進(jìn)行水平的擴(kuò)展，提高搜索性能
Replicas: 防止某個(gè)分片的數(shù)據(jù)丟失勾徽，可以并行得在備份數(shù)據(jù)里及搜索提高性能

elasticsearch查詢語(yǔ)法

_cat API

查詢當(dāng)前es集群的相關(guān)消息滑凉，包括集群中的index數(shù)量、運(yùn)行狀態(tài)、當(dāng)前集群所在的ip畅姊，目的在于將查詢的結(jié)果以更加友好的方式輸出咒钟。

cat: 輸出_cat api中所有支持的查詢命令
cat health: 檢查es集群運(yùn)行的狀況
cat count: 可以快速的查詢集群或者index中文檔的數(shù)量
cat indices: 查詢當(dāng)前集群中所有index的數(shù)據(jù)，包括index的分片數(shù)若未、document的數(shù)量朱嘴、存儲(chǔ)所用的空間大小...
其他cat api參考官方文檔: https://www.elastic.co/guide/en/elasticsearch/reference/5.5/cat.html

Search APIs

搜索數(shù)據(jù)，查詢語(yǔ)法多粗合，功能強(qiáng)大
REST request URI: 輕便快速的URI查詢方法
REST request body: 可以有許多限制條件的json格式查詢方法

"query": 在請(qǐng)求消息體中的query允許我們用Query DSL的方式查詢萍嬉。
- "term": 查詢時(shí)判斷某個(gè)document是否包含某個(gè)具體的值，不會(huì)對(duì)被查詢的值進(jìn)行分詞查詢
- "match" 將被查詢值進(jìn)行分詞隙疚，然后用評(píng)分機(jī)制(TF/IDF)進(jìn)行打分
- "match_phrase": 查詢指定段落
- "Bool": 結(jié)合其他真值查詢壤追，通常和must should mustnot(與或非)一起組合出復(fù)雜的查詢
- "range": 查詢時(shí)指定某個(gè)字段在某個(gè)特定的范圍
```
"range": {
      "FIELD": {# 指定具體過(guò)濾的字段
        "gte": 1,# gte: >=, gt: >
        "lte": 10
      }
    }
```
"from": 以一定的偏移量來(lái)查看我們檢索的結(jié)果，缺省從檢索的第一條數(shù)據(jù)開(kāi)始顯示
"size": 指定檢索結(jié)果中輸出的數(shù)據(jù)條數(shù)甚淡，缺省為10條
"sort": 允許我們將檢索的結(jié)果以指定的字段進(jìn)行排序顯示
"_source": 指定檢索結(jié)果輸出的字段
"script_fields": 該類型允許我們通過(guò)一個(gè)腳本來(lái)計(jì)算document中不存在的值大诸，比如我們需要計(jì)算install/click得到cti之類的

"script_fields": {
    "FIELD": {# 指定腳本計(jì)算之后值得名稱
      "script": {# 腳本內(nèi)的運(yùn)算
      }
    }
  }

"aggs": 基于搜索查詢，可以嵌套聚合來(lái)組合復(fù)雜的需求

"aggs": {
    "NAME": {# 指定結(jié)果的名稱
      "AGG_TYPE": {# 指定具體的聚合方法贯卦，
        TODO: # 聚合體內(nèi)制定具體的聚合字段
      }
    }
    TODO: # 該處可以嵌套聚合
  }

Query DSL

Query DSL是es提供的一套完整的基于json格式的結(jié)構(gòu)化查詢方法资柔，包含兩類不同的查詢語(yǔ)義：

Leaf query clauses: 葉子查詢句法就是在指定的字段中搜索指定的值，有match, term or range.
Compound query clauses: 復(fù)合查詢句法會(huì)包含葉子句法或者復(fù)合句法撵割，作用是為了多重查詢贿堰，有bool or dis_max.

Query and filter context

查詢語(yǔ)句的行為取決于它是使用查詢型上下文還是過(guò)濾型上下文

Query context: 在這種上下文環(huán)境中，查詢語(yǔ)句的返回的結(jié)果是”結(jié)果和查詢語(yǔ)句的匹配程序如何“啡彬，返回的結(jié)果數(shù)據(jù)中都會(huì)帶上_score值羹与，象征匹配程度；
Filter context: 過(guò)濾型上下文環(huán)境中庶灿，查詢語(yǔ)句則表面匹配與否（yes or no）纵搁。es內(nèi)置式為filter context保留緩存用來(lái)提高查詢性能，因此filter context
查詢的速度要快于query context

elasticsearch查詢示例

_cat api查詢示例

_cat查詢當(dāng)前es集群運(yùn)行的狀況

Kibana’s Console: `GET /_cat/health?v`
curl: `curl -XGET "127.0.0.1:9200/_cat/health?v"`

_cat查詢當(dāng)前es集群中所有的indices

Kibana’s Console: `GET /_cat/indices?v`
curl: `curl -XGET "127.0.0.1:9200/_cat/indices?v"`

_search api查詢示例

創(chuàng)建index

PUT /customer?pretty

output:

{
  "acknowledged": true,
  "shards_acknowledged": true
}

插入數(shù)據(jù)
日常任務(wù)中往踢，有時(shí)候往es插入數(shù)據(jù)的時(shí)候會(huì)出現(xiàn)504網(wǎng)關(guān)超時(shí)腾誉，這時(shí)候就需要手動(dòng)的插入少量數(shù)據(jù)

PUT /rta_daily_report/campaign/164983850_rba_20170808?pretty
{
  "doc": {
    "cid": 164983850,
    "advertiser_id": 799,
    "trace_app_id": "com.zeptolab.cats.google",
    "network_cid": "6656665",
    "platform": 1,
    "direct": 2,
    "last_second_domain": "",
    "jump_type": 2,
    "direct_trace_app_id": "",
    "mode": 0,
    "third": "kuaptrk.com",
    "hops": 9,
    "yyyymmdd": "2017-08-07T16:00:00",
    "type": "rba",
    "click": 2
  }
}

output:

{
  "_index": "rta_daily_report",
  "_type": "campaign",
  "_id": "164983851_rba_20170808",
  "_version": 1,
  "result": "created",
  "_shards": {
    "total": 2,
    "successful": 1,
    "failed": 0
  },
  "created": true
}

刪除數(shù)據(jù)
指定document_id刪除:

DELETE /rta_daily_report/campaign/164983850_rba_20170808?pretty

query中滿足一定條件刪除

POST rta_daily_report/_delete_by_query
{
  "query": { 
    "match": {
      "message": "some message"
    }
  }
}

根據(jù)具體document_id查詢

GET rta_daily_report/campaign/145603275_m_normal_20170804?pretty

output:

{
  "_index": "rta_daily_report",
  "_type": "campaign",
  "_id": "145603275_m_normal_20170804",
  "_version": 1,
  "found": true,
  "_source": {
    "cid": 145603275,
    "advertiser_id": 457,
    "trace_app_id": "id1105855019",
    "network_cid": "plr_gs_ios_cn_osv9",
    "platform": 2,
    "direct": 1,
    "last_second_domain": "tracking.lenzmx.com",
    "jump_type": 7,
    "direct_trace_app_id": "id1105855019",
    "mode": 3,
    "third": "3444.tlnk.io",
    "hops": 1,
    "yyyymmdd": "2017-08-03T16:00:00",
    "type": "m_normal",
    "click": 2,
    "impression": 3,
    "revenue": 0,
    "install": 0
  }
}

查詢所有數(shù)據(jù)
URI:

GET rta_daily_report/campaign/_search?q=*&pretty

request boy:

GET rta_daily_report/campaign/_search
{
  "query": {
    "match_all": {}
  }  
}

output:

"hits": {
    "total": 2705059,
    "max_score": 1,
    "hits": [
      {
        "_index": "rta_daily_report",
        "_type": "campaign",
        "_id": "163016610_rba_20170801",
        "_score": 1,
        "_source": {
          "cid": 163016610,
          "advertiser_id": 799,
          "trace_app_id": "mappstreet.videoeditor",
          "network_cid": "6287283",
          "platform": 1,
          "direct": 2,
          "last_second_domain": "",
          "jump_type": 2,
          "direct_trace_app_id": "",
          "mode": 0,
          "third": "aff.adsbreak.com",
          "hops": 8,
          "yyyymmdd": "2017-07-31T16:00:00",
          "type": "rba",
          "click": 0
        }
      },
      ....]
      }

查詢特定字段，并且指定排序字段
在indices為rta_daily_report中搜索type:rba,以日期升序輸出1個(gè)查詢結(jié)果
URI:

 GET rta_daily_report/_search?q=type:rba&sort=yyyymmdd:asc&pretty

request bofy:

GET rta_daily_report/_search
{
  "query": {
    "match": {
      "type": "rba"
    }
  },
  "sort": [
    {
      "yyyymmdd": {
        "order": "desc"
      }
    }
  ]
}

指定輸出字段
查詢類型為rba/b2t峻呕，按照日期降序排列利职，輸出制定字段，并且只輸出5條查詢結(jié)果瘦癌，如果要匹配段落猪贪，則用"match_phrase": { "address": "mill lane" }

GET rta_daily_report/_search
{
  "query": {
    "match": {
      "type": "rba b2t"
    }
  },
  "sort": [
    {
      "yyyymmdd": {
        "order": "desc"
      }
    }
  ],
  "_source": ["yyyymmdd", "type", "cid", "click", "revenue"],
  "size": 5
}

output:

"hits": {
    "total": 1327184,
    "max_score": null,
    "hits": [
      {
        "_index": "rta_daily_report",
        "_type": "campaign",
        "_id": "54870921_b2t_20170804",
        "_score": null,
        "_source": {
          "revenue": 76500,
          "yyyymmdd": "2017-08-03T16:00:00",
          "type": "b2t",
          "click": 22616,
          "cid": 54870921
        },
        "sort": [
          1501776000000
        ]
      },

bool組合復(fù)雜查詢
下例是查詢類型為b2t，收入必須大于0的所有單子的click讯私、revenue相關(guān)數(shù)據(jù)

GET rta_daily_report/_search
{
  "query": {
    "bool": {
      "must": [
        {"match": {
          "type": "b2t"
        }}
     ],
     "must_not": [
       {
         "range": {
           "revenue": {
             "lte": 0
           }
         }
       }
     ]
    }
  },
  "sort": [
    {
      "yyyymmdd": {
        "order": "desc"
      }
    }
  ],
  "_source": ["yyyymmdd", "type", "cid", "click", "revenue"],
  "size": 10       
}

聚合查詢
下例是類似于sql中的聚合查詢热押，查詢每天不同類型對(duì)應(yīng)的intall總量

GET /rta_daily_report/_search
{
  "size": 0,
  "aggs": {
    "sum_install": {
      "date_histogram": {
        "field": "yyyymmdd",
        "interval": "day"
      },
      "aggs": {
        "types": {
          "terms": {
            "field": "type.keyword",
            "size": 10
          },
          "aggs": {
            "install": {
              "sum": {
                "field": "install"
              }
            }
          }
        }
      }
    }
  }
}

output

"aggregations": {
    "sum_install": {
      "buckets": [
        {
          "key_as_string": "2017-07-31T00:00:00.000Z",
          "key": 1501459200000,
          "doc_count": 659553,
          "types": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
              {
                "key": "rba",
                "doc_count": 321811,
                "install": {
                  "value": 73835
                }
              },
              {
                "key": "m_normal",
                "doc_count": 321711,
                "install": {
                  "value": 18964
                }
              },

script查詢
下例通過(guò)document中的click,install字段西傀，計(jì)算出文檔中不存在的數(shù)據(jù)。

GET /rta_daily_report/campaign/_search?pretty
{
    "query" : {
      "bool": {
        "must": [
          {
            "range": {
              "click": {
                "gt": 0
              }
            }
          },
          {
            "range": {
              "install": {
                "gt": 0
              }
            }
          }
        ]
    }},
    "size": 100, 
    "script_fields": {
      "cti": {
        "script": {
          "lang": "painless",
          "inline": "1.0 * doc['install'].value / doc['click'].value"
        }
      }
    }
}

output

"hits": {
    "total": 23036,
    "max_score": 2,
    "hits": [
      {
        "_index": "rta_daily_report",
        "_type": "campaign",
        "_id": "160647918_rta_20170801",
        "_score": 2,
        "fields": {
          "cti": [
            0.0005970149253731343
          ]
        }
      },
      {
        "_index": "rta_daily_report",
        "_type": "campaign",
        "_id": "162293741_rta_20170801",
        "_score": 2,
        "fields": {
          "cti": [
            0.00007796055196070789
          ]
        }
      },

查詢一段時(shí)間內(nèi)的聚合數(shù)據(jù)

GET rta_daily_report/campaign/_search
{
  "size": 0,
  "aggs": {
    "snaptime": {
      "date_range": {
        "field": "@timestamp",
        "ranges": [
          {
            "from": "now-30d/d",
            "to": "now"
          }
        ]
      },
      "aggs": {
        "sum_revenue": {
          "sum": {
            "field": "revenue"
          }
        }
      }
    }
  }
}

output:

"aggregations": {
    "snaptime": {
      "buckets": [
        {
          "key": "2017-07-17T00:00:00.000Z-2017-08-16T03:30:16.995Z",
          "from": 1500249600000,
          "from_as_string": "2017-07-17T00:00:00.000Z",
          "to": 1502854216995,
          "to_as_string": "2017-08-16T03:30:16.995Z",
          "doc_count": 18685619,
          "sum_revenue": {
            "value": 6631665219
          }
        }
      ]
    }
  }

查詢某段時(shí)間內(nèi)聚合數(shù)據(jù)楞黄，并且script計(jì)算額外字段

GET rta_daily_report/campaign/_search
{

  "size": 0,
  "aggs" : {
    "cvr_per_month" : {
      "date_range" : {
        "field": "@timestamp",
        "ranges": [
          {
            "from": "now-30d/d",
            "to": "now"
          }
        ]
      },
      "aggs": {
        "sum_click": {
          "sum": {
            "field": "click"
          }
        },
        "sum_install": {
          "sum": {
            "field": "install"
          }
        },
        "cvr": {
          "bucket_script": {
            "buckets_path": {
              "install": "sum_install",
              "click": "sum_click"
            },
           "script": "1.0 * params.install / params.click"
          }
        }
      }
    }
  }
}

output: 
"aggregations": {
    "cvr_per_month": {
      "buckets": [
        {
          "key": "2017-07-17T00:00:00.000Z-2017-08-16T03:37:22.732Z",
          "from": 1500249600000,
          "from_as_string": "2017-07-17T00:00:00.000Z",
          "to": 1502854642732,
          "to_as_string": "2017-08-16T03:37:22.732Z",
          "doc_count": 18685619,
          "sum_click": {
            "value": 15067388421
          },
          "sum_install": {
            "value": 7602055
          },
          "cvr": {
            "value": 0.0005045370032012133
          }
        }
      ]
    }
  }

參考鏈接：
日期格式
 查詢語(yǔ)法1
查詢語(yǔ)法2

kibana

logstash

TODO:

常見(jiàn)問(wèn)題

最后編輯于：2018.09.09 13:48:13

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末池凄，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子鬼廓，更是在濱河造成了極大的恐慌肿仑，老刑警劉巖，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件碎税，死亡現(xiàn)場(chǎng)離奇詭異尤慰，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)雷蹂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)伟端，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人匪煌，你說(shuō)我怎么就攤上這事责蝠。” “怎么了萎庭？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵霜医，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我驳规，道長(zhǎng)肴敛，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任吗购，我火速辦了婚禮医男，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘捻勉。我一直安慰自己镀梭，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布踱启。她就那樣靜靜地躺著丰辣，像睡著了一般。火紅的嫁衣襯著肌膚如雪禽捆。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說(shuō)
那天飘哨，我揣著相機(jī)與錄音胚想，去河邊找鬼。笑死芽隆，一個(gè)胖子當(dāng)著我的面吹牛浊服，可吹牛的內(nèi)容都是我干的统屈。我是一名探鬼主播，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼牙躺，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼愁憔！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起孽拷，我...
開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤吨掌，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后脓恕，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體膜宋，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年炼幔，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了秋茫。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡乃秀，死狀恐怖肛著，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情跺讯，我是刑警寧澤枢贿，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站抬吟，受9級(jí)特大地震影響萨咕，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜火本，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一危队、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧钙畔，春花似錦茫陆、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0贊 19
一樁弒父案簿盅，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至揍魂，卻和暖如春桨醋，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背现斋。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工喜最，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人庄蹋。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓瞬内，卻偏偏與公主長(zhǎng)得像迷雪，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子虫蝶，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345

elasticsearch基本概念與查詢語(yǔ)法

序言

elk總體架構(gòu)

elasticsearch

基本概念

elasticsearch查詢語(yǔ)法

_cat API

Search APIs

Query DSL

Query and filter context

elasticsearch查詢示例

_cat api查詢示例

_search api查詢示例

kibana

logstash

常見(jiàn)問(wèn)題

推薦閱讀更多精彩內(nèi)容