Elasticsearch自定義analyzer

standard analyzer英文笛厦、數(shù)字按照空格來分詞,中文直接使用一元分詞果元,因此IP分詞后作為一個term员萍。例如 “the 192.168.0.1”腾降,分詞后為[the,192.168.0.1],如果搜索“192”就不會搜到碎绎。如果IP需要按照"."來分詞螃壤,支持IP模糊匹配,搜索“192”可以搜到192.168.0.1筋帖,那么就需要自己定義analyzer奸晴,來看看如何自定義analyzer。

rest建立索引設置settings的方式

PUT /my_index
{
   "settings":{
      "analysis":{
         "analyzer":{
            "my_analyzer":{ 
               "type":"custom",
               "tokenizer":"standard",
               "filter":["word_delimiter"]
            }
         }
      }
   },
   "mappings":{
      "my_type":{
         "properties":{
            "title": {
               "type":"string",
               "analyzer":"my_analyzer", 
               "search_analyzer":"my_analyzer"
              }
            }
         }
      }
   }
}

通過java API建立索引設置settings的方式為:

CreateIndexRequest createIndexRequest = new CreateIndexRequest(fullIndexName);
createIndexRequest.source(mapping);
CreateIndexResponse res = admin.create(createIndexRequest).actionGet();

測試分詞器的方式

curl -XGET 'http://localhost:9200/my_index/_analyze?pretty=1&analyzer=my_analyzer' -d '192.168.10.10'

比如分詞我是huawei is 192.168.10.10
standard analyzer的結(jié)果為:

{
  "tokens" : [ {
    "token" : "我",
    "start_offset" : 0,
    "end_offset" : 1,
    "type" : "<IDEOGRAPHIC>",
    "position" : 0
  }, {
    "token" : "是",
    "start_offset" : 1,
    "end_offset" : 2,
    "type" : "<IDEOGRAPHIC>",
    "position" : 1
  }, {
    "token" : "huawei",
    "start_offset" : 2,
    "end_offset" : 8,
    "type" : "<ALPHANUM>",
    "position" : 2
  }, {
    "token" : "is",
    "start_offset" : 9,
    "end_offset" : 11,
    "type" : "<ALPHANUM>",
    "position" : 3
  }, {
    "token" : "192.168.10.10",
    "start_offset" : 12,
    "end_offset" : 25,
    "type" : "<NUM>",
    "position" : 4
  } ]
}

my_analyzer的結(jié)果為:

{
  "tokens" : [ {
    "token" : "我",
    "start_offset" : 0,
    "end_offset" : 1,
    "type" : "<IDEOGRAPHIC>",
    "position" : 0
  }, {
    "token" : "是",
    "start_offset" : 1,
    "end_offset" : 2,
    "type" : "<IDEOGRAPHIC>",
    "position" : 1
  }, {
    "token" : "huawei",
    "start_offset" : 2,
    "end_offset" : 8,
    "type" : "<ALPHANUM>",
    "position" : 2
  }, {
    "token" : "is",
    "start_offset" : 9,
    "end_offset" : 11,
    "type" : "<ALPHANUM>",
    "position" : 3
  }, {
    "token" : "192",
    "start_offset" : 12,
    "end_offset" : 15,
    "type" : "<NUM>",
    "position" : 4
  }, {
    "token" : "168",
    "start_offset" : 16,
    "end_offset" : 19,
    "type" : "<NUM>",
    "position" : 5
  }, {
    "token" : "10",
    "start_offset" : 20,
    "end_offset" : 22,
    "type" : "<NUM>",
    "position" : 6
  }, {
    "token" : "10",
    "start_offset" : 23,
    "end_offset" : 25,
    "type" : "<NUM>",
    "position" : 7
  } ]
}

可以看出my_analyzer達到了我們的目的日麸。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末寄啼,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子代箭,更是在濱河造成了極大的恐慌墩划,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嗡综,死亡現(xiàn)場離奇詭異乙帮,居然都是意外死亡,警方通過查閱死者的電腦和手機蛤高,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碑幅,“玉大人戴陡,你說我怎么就攤上這事」嫡牵” “怎么了恤批?”我有些...
    開封第一講書人閱讀 164,911評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長裹赴。 經(jīng)常有香客問我喜庞,道長诀浪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,737評論 1 294
  • 正文 為了忘掉前任延都,我火速辦了婚禮雷猪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘晰房。我一直安慰自己求摇,他們只是感情好,可當我...
    茶點故事閱讀 67,753評論 6 392
  • 文/花漫 我一把揭開白布殊者。 她就那樣靜靜地躺著与境,像睡著了一般。 火紅的嫁衣襯著肌膚如雪猖吴。 梳的紋絲不亂的頭發(fā)上摔刁,一...
    開封第一講書人閱讀 51,598評論 1 305
  • 那天,我揣著相機與錄音海蔽,去河邊找鬼共屈。 笑死,一個胖子當著我的面吹牛准潭,可吹牛的內(nèi)容都是我干的趁俊。 我是一名探鬼主播,決...
    沈念sama閱讀 40,338評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼刑然,長吁一口氣:“原來是場噩夢啊……” “哼寺擂!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起泼掠,我...
    開封第一講書人閱讀 39,249評論 0 276
  • 序言:老撾萬榮一對情侶失蹤怔软,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后择镇,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體挡逼,經(jīng)...
    沈念sama閱讀 45,696評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,888評論 3 336
  • 正文 我和宋清朗相戀三年腻豌,在試婚紗的時候發(fā)現(xiàn)自己被綠了家坎。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,013評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡吝梅,死狀恐怖虱疏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情苏携,我是刑警寧澤做瞪,帶...
    沈念sama閱讀 35,731評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響装蓬,放射性物質(zhì)發(fā)生泄漏著拭。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,348評論 3 330
  • 文/蒙蒙 一牍帚、第九天 我趴在偏房一處隱蔽的房頂上張望儡遮。 院中可真熱鬧,春花似錦履羞、人聲如沸峦萎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽爱榔。三九已至,卻和暖如春糙及,著一層夾襖步出監(jiān)牢的瞬間详幽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評論 1 270
  • 我被黑心中介騙來泰國打工浸锨, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留唇聘,地道東北人。 一個月前我還...
    沈念sama閱讀 48,203評論 3 370
  • 正文 我出身青樓柱搜,卻偏偏與公主長得像迟郎,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子聪蘸,可洞房花燭夜當晚...
    茶點故事閱讀 44,960評論 2 355

推薦閱讀更多精彩內(nèi)容