引言
雖然之前做過 elasticsearch 的項目,但是沒有對整個項目的知識點進行過系統(tǒng)的整理祈远。這次趁著對 elasticsearch 版本的升級的機會(從2.2 升級到 6.3) ,又專門花時間對涉及到的知識點重新梳理了一遍晴玖。
俗話說区岗,好記性不如爛筆頭涛救。為了加深對 elasticsearch 的理解,后面再做類似項目時更容易撿起來剂跟,以及對用到的同學(xué)提供方便减途。從本文開始,我會對 elasticsearch Query DSL 的知識點進行梳理曹洽。
在講解時我會盡量以實例代碼展示的方式進行最直觀的展現(xiàn)鳍置。紙上來得終覺淺,絕知此事要躬行送淆。做技術(shù)尤其要注重多實踐税产,懂了并不代表你就掌握了。強烈建議有志于深入了解這部分內(nèi)容的同學(xué)偷崩,對文中給出的代碼實例在?sense?中實踐一遍甚至是多遍辟拷。
注意: 本文基于 elasticsearch 6.3 版本, 如果您使用的是其他版本阐斜,一些內(nèi)容可能會有所變化衫冻,具體使用時還請以官方文檔為準
Query DSL 是 elasticsearch 的核心,搜索方面的項目大部分時間都耗費在對查詢結(jié)果的調(diào)優(yōu)上谒出。因此對 Query DSL 的理解越深入隅俘,越能節(jié)省項目時間,并給用戶好的體驗笤喳。
概要
Elasticsearch 提供了一個完整的 query DSL为居,并且是 JSON 形式的。它和 AST 比較類似杀狡,并且包含兩種類型的語句:
葉子查詢語句(Leaf Query)
用于查詢某個特定的字段蒙畴,如?match?,?term?或?range?等
復(fù)合查詢語句 (Compound query clauses)
用于合并其他的葉查詢或復(fù)合查詢語句,也就是說復(fù)合語句之間可以嵌套捣卤,用來表示一個復(fù)雜的單一查詢
??DSL?(domain-specific language)忍抽,領(lǐng)域特定語言指的是專注于某個應(yīng)用程序領(lǐng)域的計算機語言,又譯作領(lǐng)域?qū)S谜Z言董朝。不同于普通的跨領(lǐng)域通用計算機語言(GPL)鸠项,領(lǐng)域特定語言只用在某些特定的領(lǐng)域。
??AST(abstract syntax tree), 抽象語法樹是源代碼的抽象語法結(jié)構(gòu)的樹形表現(xiàn)形式子姜。樹上的每個節(jié)點都表示源代碼中的一種結(jié)構(gòu)祟绊。之所以說語法是“抽象”的楼入,是因為這里的語法并不會表示出真實語法中出現(xiàn)的每個細節(jié)。比如牧抽,嵌套括號被隱含在樹的結(jié)構(gòu)中嘉熊,并沒有以節(jié)點的形式呈現(xiàn);而類似于if-condition-then這樣的條件跳轉(zhuǎn)語句扬舒,可以使用帶有兩個分支的節(jié)點來表示阐肤。
——百度百科
Query and filter context
一個查詢語句究竟具有什么樣的行為和得到什么結(jié)果,主要取決于它到底是處于查詢上下文(Query Context) 還是過濾上下文(Filter Context)讲坎。兩者有很大區(qū)別孕惜,我們來看下:
Query context 查詢上下文
這種語句在執(zhí)行時既要計算文檔是否匹配,還要計算文檔相對于其他文檔的匹配度有多高晨炕,匹配度越高衫画,*_score* 分數(shù)就越高
Filter context 過濾上下文
過濾上下文中的語句在執(zhí)行時只關(guān)心文檔是否和查詢匹配,不會計算匹配度瓮栗,也就是得分削罩。
下面來看一個例子
GET /_search{"query": {"bool": {"must": [? ? ? ? {"match": {"title":"Search"}},? ? ? ? {"match": {"content":"Elasticsearch"}}? ? ? ? ],"filter": [? ? ? ? {"term":? {"status":"published"}},? ? ? ? {"range": {"publish_date": {"gte":"2015-01-01"}}}? ? ? ]? ? }? }}
對上面的例子分析下:
query?參數(shù)表示整個語句是處于 query context 中
bool?和?match?語句被用在 query context 中,也就是說它們會計算每個文檔的匹配度(_score)
filter?參數(shù)則表示這個子查詢處于 filter context 中
filter?語句中的?term?和?range?語句用在 filter context 中费奸,它們只起到過濾的作用弥激,并不會計算文檔的得分。
Match All Query
這個查詢最簡單愿阐,所有的?_score?都是 1.0秆撮。
GET /_search{"query": {"match_all": {}? ? }}
它的反面就是 Match None Query, 匹配不到任何文檔(不知道用它來做什么……)
GET /_search{"query": {"match_none": {}? ? }}
全文查詢 Full text queries
全文本查詢的使用場合主要是在出現(xiàn)大量文字的場合换况,例如 email body 或者文章中搜尋出特定的內(nèi)容职辨。
全文查詢主要分為下面幾種(此處列表中的鏈接為官方文檔鏈接,后續(xù)將各部分講解后戈二,會替換為講解鏈接):
全文查詢中最主要的查詢舒裤,包括模糊查詢(fuzzy matching) 或者臨近查詢(proximity queries)。
和?match?查詢比較類似觉吭,但是它會保留包含所有搜索詞項腾供,且位置與搜索詞項相同的文檔。
是一種輸入即搜索(search-as-you-type) 的查詢鲜滩,它和?match_phrase?比較類似伴鳖,區(qū)別就是會將查詢字符串的最后一個詞作為前綴來使用。
多字段版本的?match?query
只知道是一種特殊的查詢徙硅,具體干什么還不清楚榜聂,后面弄明白后會再來補充。
支持復(fù)雜的 Lucene query String 語法嗓蘑,除非你是專家用戶须肆,否則不推薦使用匿乃。
簡化版的?query_string?,語法更適合用戶操作豌汇。
小結(jié)
本文主要講解了 elasticsearch es 6.3 版本的 Query DSL 概要幢炸,Match All Query 。
歡迎工作一到八年的Java工程師朋友們加入Java高級交流群:828697593
本群提供免費的學(xué)習(xí)指導(dǎo)?架構(gòu)資料?以及免費的解答
不懂得問題都可以在本群提出來?之后還會有直播平臺和講師直接交流噢
哦對了拒贱,喜歡就別忘了關(guān)注一下哦~