ES分析器解析

es的分析器往往包括3個低級構(gòu)建塊包：

character filters - 字符過濾器，可以添加惨好、刪除或更改字符來轉(zhuǎn)換流，一個分析器可有多個字符過濾器；
tokenizer - 標記器仰剿，接受字符流，將其分解成單獨的標記痴晦，并輸出標記流南吮，一個分析器只能有一個標記器；
token filters - token過濾器誊酌，接受token流部凑，并可以添加、刪除或修改token碧浊，不允許更改每個token的位置或字符偏移量涂邀，一個分析器可有多個token過濾器，并按順序應用箱锐。

測試分析器

指定索引引用分析器

PUT my_index 
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik": {                //自定義一個名為std_folded的分析器
          "type": "custom",                //type自定義
          "tokenizer": "ik_smart",                //指定標記器                      
          "filter": [                //指定字符過濾器
            "lowercase",
            "asciifolding"
          ]
        }
      }
    }
  },
  "mappings": {                //設置映射
    "my_type": {
      "properties": {
        "my_text": {                //指定字段
          "type": "text",                //設置type比勉，String類型已被廢棄，用text或keyword
          "analyzer": "ik"                //指定分析器為上文定義的自定義分析器
        }
      }
    }
  }
}

測試分析器效果

GET my_index/_analyze 
{
  "analyzer": "std_folded",                 //按分析器名指定分析器
  "text":     "這里有最及時的動漫新番,最棒的ACG氛圍,最有創(chuàng)意的Up主"                //指定要分析的文本
}

測試字段指定的分析器效果

GET my_index/_analyze 
{
  "field": "my_text",                  //參考字段my_text使用的分析器
  "text":  "這里有最及時的動漫新番,最棒的ACG氛圍,最有創(chuàng)意的Up主"
}

Elasticsearch提供的內(nèi)置analyzers

Standard Analyzer

標準分析儀按照Unicode文本分段算法的定義驹止，將文本分割成單詞邊界的分詞浩聋。它刪除了大多數(shù)標點符號，小寫顯示分詞臊恋，并支持刪除stop words衣洁。

Simple Analyzer

當遇到不是字母的字符時，簡單的分析器會將文本分成條目抖仅。小寫顯示分詞坊夫。

Whitespace Analyzer

空格分析器遇到任何空格字符時都會將文本分為多個項目毙替。不會把分詞轉(zhuǎn)換為小寫字母。

Stop Analyzer

停止分析儀和Simple Analyzer類似践樱，但也支持stop words的刪除厂画。

Keyword Analyzer

一個“noop”分析器，它可以接受任何給定的文本拷邢，并輸出完全相同的文本作為一個單詞袱院。

Pattern Analyzer

使用正則表達式拆分分詞，支持lower-casing和stop words瞭稼。

Language Analyzers

Elasticsearch提供許多語言特定的分析器寿谴，如英語或法語裁良。

Fingerprint Analyzer

一個專門的分析儀分唾，它可以創(chuàng)建一個可用于重復檢測的指紋揭璃。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市悔雹，隨后出現(xiàn)的幾起案子复哆，更是在濱河造成了極大的恐慌，老刑警劉巖腌零，帶你破解...
沈念sama閱讀 221,273評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件梯找，死亡現(xiàn)場離奇詭異，居然都是意外死亡益涧，警方通過查閱死者的電腦和手機锈锤，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,349評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來闲询，“玉大人久免，你說我怎么就攤上這事∨せ。” “怎么了阎姥？”我有些...
開封第一講書人閱讀 167,709評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長寄狼。經(jīng)常有香客問我丁寄，道長氨淌，這世上最難降的妖魔是什么泊愧？我笑而不...
開封第一講書人閱讀 59,520評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮盛正，結(jié)果婚禮上删咱，老公的妹妹穿的比我還像新娘。我一直安慰自己豪筝，他們只是感情好痰滋，可當我...
茶點故事閱讀 68,515評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布摘能。她就那樣靜靜地躺著，像睡著了一般敲街。火紅的嫁衣襯著肌膚如雪团搞。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,158評論 1贊 308
城市分裂傳說
那天多艇，我揣著相機與錄音逻恐，去河邊找鬼。笑死峻黍，一個胖子當著我的面吹牛复隆，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播姆涩，決...
沈念sama閱讀 40,755評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼挽拂，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了骨饿？” 一聲冷哼從身側(cè)響起亏栈，我...
開封第一講書人閱讀 39,660評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎宏赘，沒想到半個月后仑扑，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,203評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡置鼻，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,287評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年镇饮，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片箕母。...
茶點故事閱讀 40,427評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡储藐，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出嘶是，到底是詐尸還是另有隱情钙勃，我是刑警寧澤，帶...
沈念sama閱讀 36,122評論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布聂喇，位于F島的核電站辖源，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏希太。R本人自食惡果不足惜克饶，卻給世界環(huán)境...
茶點故事閱讀 41,801評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望誊辉。院中可真熱鬧矾湃，春花似錦、人聲如沸堕澄。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,272評論 0贊 23
一樁弒父案霉咨，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至拍屑，卻和暖如春途戒，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背僵驰。一陣腳步聲響...
開封第一講書人閱讀 33,393評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工棺滞，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人矢渊。一個月前我還...
沈念sama閱讀 48,808評論 3贊 376
代替公主和親
正文我出身青樓继准，卻偏偏與公主長得像，于是被迫代替她去往敵國和親矮男。傳聞我的和親對象是個殘疾皇子移必，可洞房花燭夜當晚...
茶點故事閱讀 45,440評論 2贊 359