聚合
在使用查詢query的時候讯私,可以使用 aggregations 框架來聚合數(shù)據(jù)。只需要在query語句構建的時候使用aggregations塊良狈。
一個aggregation可以被視作一個在doc集合的基礎上做分析的單元窥浪。它執(zhí)行上下文信息定義了這個集合。比如說search請求的query/filters的上下文壮啊,會被用來執(zhí)行頂層的聚合。
有許多不同類型的aggregations撑蒜,他們可以實現(xiàn)不同的需求歹啼,并且有不相同的輸出∽ぃ可以將這些聚類分為4個大家族
bucketing : 桶
這個系列的聚合狸眼,可以構建桶,每個桶關聯(lián)一個key和一個criterion浴滴。 當執(zhí)行聚合時拓萌,根據(jù)標準來評估,在上下文中的文檔集合中的每個文檔升略,并且當匹配這個標準時微王,該文檔被認為“落入”相關桶。 在聚合過程結束時品嚣,我們將最終得到一個桶列表炕倘,每個桶都有一組“屬于”這個桶的文檔。Metric : 指標
基于一個doc集合跟蹤和計算指標翰撑。Matrix:矩陣
操作多個字段罩旋,并且基于從requested文檔字段中抽取的值,產(chǎn)生一個矩陣眶诈。這種類型的聚合不支持腳本涨醋。Pipeline:管道
聚合其他聚合的輸出或者相關的指標。
由于每個桶有效地定義了一個文檔集(所有文檔屬于存儲桶)逝撬,所以可以潛在地關聯(lián)存儲桶級別的聚合东帅,并且它們將在該存儲桶的上下文中執(zhí)行。 這是聚合的真正力量在哪里:聚合可以嵌套球拦!
bucket 聚合可以包含子聚合(bucket 或 metric)。 子聚合將根據(jù)父聚合生成的bucket進行計算。 嵌套聚合的級別/深度沒有硬限制(可以在“父”聚合下嵌套聚合坎炼,本身就是另一個更高層聚合的子聚合)愧膀。
聚合的結構
下面的片段是聚合的基本結構:
"aggregations" : {
"<aggregation_name>" : {
"<aggregation_type>" : {
<aggregation_body>
}
[,"meta" : { [<meta_data_body>] } ]?
[,"aggregations" : { [<sub_aggregation>]+ } ]?
}
[,"<aggregation_name_2>" : { ... } ]*
}
JSON中的aggregations
對象(也可以使用aggs)將要進行聚合計算。用戶可以為每個聚合定義一個邏輯名稱(例如谣光,如果聚合計算平均價格檩淋,可以將其命名為avg_price)。這些邏輯名稱也將用于唯一標識響應中的聚合萄金。每個聚合都有一個特定類型(上述代碼片段中的<aggregation_type>)蟀悦,通常是body里的第一個key。每種類型的聚合根據(jù)聚合的性質來定義了其自己的body(例如氧敢,特定字段上的平均聚合將定義將計算平均值的字段)日戈。在聚合類型定義的相同級別,可以選擇定義一組附加聚合孙乖,盡管如果您定義的聚合具有壓力性質浙炼,這僅僅是有意義的。在這種情況下唯袄,您將在針對集合聚合級別定義的子聚合計算所有由聚合聚合構建的桶弯屈。例如,如果在范圍聚合范圍內定義了一組聚合恋拷,則將針對定義的范圍值來計算子聚合资厉。
Values Source
一些聚合基于另一個聚合的輸出。我們?yōu)橐粋€聚合設置了field蔬顾,這個聚合的結果中包含文檔中field的值宴偿,通常,values會從這些值中抽取阎抒。也可以定義一個script來為每一個doc生成一個值酪我,用。
如果為聚合設置了且叁,field和script2個字段都哭,script將被當作value script對待。像普通的scripts在doc級別被評估一樣逞带,value script在value級別被評估欺矫。在這種模式下,value重field中取得展氓,script被應用于 “transformation” 這些value上穆趴。
Elasticsearch使用mapping中的field類型來知道如何運行聚合,并且格式化響應遇汞。然后有2中清空未妹,es不能高清楚這些信息簿废,沒有別映射的的字段和存腳本。在這種情況下络它,可以使用value_type選項來制定類型族檬。可用的類型是string化戳,long(適用于所有的integer類型)单料,double,date,ip和boolean。