ES分析器解析

es的分析器往往包括3個低級構(gòu)建塊包:

  • character filters - 字符過濾器,可以添加惨好、刪除或更改字符來轉(zhuǎn)換流,一個分析器可有多個字符過濾器;
  • tokenizer - 標記器仰剿,接受字符流,將其分解成單獨的標記痴晦,并輸出標記流南吮,一個分析器只能有一個標記器;
  • token filters - token過濾器誊酌,接受token流部凑,并可以添加、刪除或修改token碧浊,不允許更改每個token的位置或字符偏移量涂邀,一個分析器可有多個token過濾器,并按順序應用箱锐。

測試分析器

指定索引引用分析器

PUT my_index 
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik": {                //自定義一個名為std_folded的分析器
          "type": "custom",                //type自定義
          "tokenizer": "ik_smart",                //指定標記器                      
          "filter": [                //指定字符過濾器
            "lowercase",
            "asciifolding"
          ]
        }
      }
    }
  },
  "mappings": {                //設置映射
    "my_type": {
      "properties": {
        "my_text": {                //指定字段
          "type": "text",                //設置type比勉,String類型已被廢棄,用text或keyword
          "analyzer": "ik"                //指定分析器為上文定義的自定義分析器
        }
      }
    }
  }
}

測試分析器效果

GET my_index/_analyze 
{
  "analyzer": "std_folded",                 //按分析器名指定分析器
  "text":     "這里有最及時的動漫新番,最棒的ACG氛圍,最有創(chuàng)意的Up主"                //指定要分析的文本
}

測試字段指定的分析器效果

GET my_index/_analyze 
{
  "field": "my_text",                  //參考字段my_text使用的分析器
  "text":  "這里有最及時的動漫新番,最棒的ACG氛圍,最有創(chuàng)意的Up主"
}

Elasticsearch提供的內(nèi)置analyzers

Standard Analyzer

標準分析儀按照Unicode文本分段算法的定義驹止,將文本分割成單詞邊界的分詞浩聋。它刪除了大多數(shù)標點符號,小寫顯示分詞臊恋,并支持刪除stop words衣洁。

Simple Analyzer

當遇到不是字母的字符時,簡單的分析器會將文本分成條目抖仅。小寫顯示分詞坊夫。

Whitespace Analyzer

空格分析器遇到任何空格字符時都會將文本分為多個項目毙替。不會把分詞轉(zhuǎn)換為小寫字母。

Stop Analyzer

停止分析儀和Simple Analyzer類似践樱,但也支持stop words的刪除厂画。

Keyword Analyzer

一個“noop”分析器,它可以接受任何給定的文本拷邢,并輸出完全相同的文本作為一個單詞袱院。

Pattern Analyzer

使用正則表達式拆分分詞,支持lower-casing和stop words瞭稼。

Language Analyzers

Elasticsearch提供許多語言特定的分析器寿谴,如英語或法語裁良。

Fingerprint Analyzer

一個專門的分析儀分唾,它可以創(chuàng)建一個可用于重復檢測的指紋揭璃。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市悔雹,隨后出現(xiàn)的幾起案子复哆,更是在濱河造成了極大的恐慌,老刑警劉巖腌零,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件梯找,死亡現(xiàn)場離奇詭異,居然都是意外死亡益涧,警方通過查閱死者的電腦和手機锈锤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來闲询,“玉大人久免,你說我怎么就攤上這事∨せ。” “怎么了阎姥?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長寄狼。 經(jīng)常有香客問我丁寄,道長氨淌,這世上最難降的妖魔是什么泊愧? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮盛正,結(jié)果婚禮上删咱,老公的妹妹穿的比我還像新娘。我一直安慰自己豪筝,他們只是感情好痰滋,可當我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布摘能。 她就那樣靜靜地躺著,像睡著了一般敲街。 火紅的嫁衣襯著肌膚如雪团搞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天多艇,我揣著相機與錄音逻恐,去河邊找鬼。 笑死峻黍,一個胖子當著我的面吹牛复隆,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播姆涩,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼挽拂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了骨饿?” 一聲冷哼從身側(cè)響起亏栈,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宏赘,沒想到半個月后仑扑,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡置鼻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年镇饮,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片箕母。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡储藐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出嘶是,到底是詐尸還是另有隱情钙勃,我是刑警寧澤,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布聂喇,位于F島的核電站辖源,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏希太。R本人自食惡果不足惜克饶,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望誊辉。 院中可真熱鬧矾湃,春花似錦、人聲如沸堕澄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拍屑,卻和暖如春途戒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背僵驰。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工棺滞, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人矢渊。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓继准,卻偏偏與公主長得像,于是被迫代替她去往敵國和親矮男。 傳聞我的和親對象是個殘疾皇子移必,可洞房花燭夜當晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務發(fā)現(xiàn)毡鉴,斷路器崔泵,智...
    卡卡羅2017閱讀 134,693評論 18 139
  • 查詢API關(guān)鍵字說明 1.matchAllQuery() 匹配全部文檔 2.matchQuery(String n...
    nothingp閱讀 2,505評論 0 4
  • 在三色日月下迎空飛舞越過云霄,我看到了倒映于我眼中的世界在此為你奏響旅程的序曲愿君能將希望傳播至遠方 早已知道結(jié)局...
    chajn閱讀 281評論 0 1
  • 1猪瞬、case when (判斷條件) then ... else ... end select ID,UserN...
    肉肉要次肉閱讀 1,677評論 0 0
  • 大學同學因跟老公為瑣碎的事吵架憎瘸,打個飛的就來深圳了,到的哪天我們湊齊了一桌麻將陈瘦,陪練到凌晨2點幌甘,回酒店后強撐...
    如水2016閱讀 146評論 0 0