IK中文分析器的安裝和配置

GitHub IK插件地址

https://github.com/medcl/elasticsearch-analysis-ik

需要注意IK插件的版本,要和ElasticSearch對(duì)應(yīng),否則出錯(cuò)(而且應(yīng)該按照第二種命令的方式進(jìn)行下載,簡(jiǎn)單不易錯(cuò),開(kāi)始按照第一種出現(xiàn)了找不到文件的錯(cuò)誤)

1.安裝方式(我用第一種錯(cuò)誤了,第二種直接就好使,但是主要版本對(duì)應(yīng)關(guān)系)

optional 1 - download pre-build package from here: https://github.com/medcl/elasticsearch-analysis-ik/releases unzip plugin to folder your-es-root/plugins/

optional 2 - use elasticsearch-plugin to install ( version > v5.5.1 ): ./bin/elasticsearch-plugin install [https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v5.6.1/elasticsearch-analysis-ik-5.6.1.zip](https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v5.6.1/elasticsearch-analysis-ik-5.6.1.zip)

IK version ES version
5.6.1 5.6.1
5.5.3 5.5.3

2.安裝完成之后可以測(cè)試效果對(duì)比

1.測(cè)試內(nèi)置的標(biāo)準(zhǔn)分析器效果standard

curl -XPOST http://localhost:9200/_analyze?pretty -d '{ "analyzer": "standard", "text": "庖丁解牛成語(yǔ)中文english test" }'
2.測(cè)試剛剛安裝好的ik分詞分析器插件的效果
curl -XPOST http://localhost:9200/_analyze?pretty -d '{ "analyzer": "ik_max_word", "text": "庖丁解牛成語(yǔ)中文english test" }'
3.GitHub上復(fù)制的原話(就用ik_max_word靠譜)
移除名為 ik 的analyzer和tokenizer,請(qǐng)分別使用 ik_smart 和 ik_max_word
ik_max_word 和 ik_smart 什么區(qū)別?
ik_max_word: 會(huì)將文本做最細(xì)粒度的拆分,比如會(huì)將“中華人民共和國(guó)國(guó)歌”拆分為“中華人民共和國(guó),中華人民,中華,華人,人民共和國(guó),人民,人,民,共和國(guó),共和,和,國(guó)國(guó),國(guó)歌”琼娘,會(huì)窮盡各種可能的組合顷扩;
ik_smart: 會(huì)做最粗粒度的拆分帚稠,比如會(huì)將“中華人民共和國(guó)國(guó)歌”拆分為“中華人民共和國(guó),國(guó)歌”窃植。

4.ElasticSearch Reference的地址,解析Analyzer
https://www.elastic.co/guide/en/elasticsearch/reference/current/analyzer-anatomy.html
Anlyzer由character filter+tokenizer+token filter組成,添加的這個(gè)ik實(shí)際上主要是tonkenizer分詞器的效果,之后要改可以和其他filter組合 IK的Git上的一句話:Analyzer: ik_smart , ik_max_word , Tokenizer: ik_smart , ik_max_word 組合示例(這個(gè)就是看一下,不能復(fù)制直接用) POST _analyze { "tokenizer": "standard", "filter": [ "lowercase", "asciifolding" ], "text": "Is this déja vu?" }

3.IK熱更新IK Analysis for Elasticsearch

https://github.com/medcl/elasticsearch-analysis-ik
修改 elasticsearch-root目錄/config/analysis-ik/IKAnalyzer.cfg.xml
<!-用戶可以在這里配置遠(yuǎn)程擴(kuò)展字典 -->
<entry key="remote_ext_dict">http://localhost:8080/elasticsearch/ik/remote_my_dict.txt</entry>
其實(shí)配置好那個(gè)url就可以,隨便用什么可以被訪問(wèn)的http服務(wù)器就行(我在linux弄的tomcat)
配置好之后在remote_my_dict.txt中隨時(shí)添加詞就可以,不用重啟elasticsearch的服務(wù)(但是加完詞,測(cè)試查詢不會(huì)立馬生效,得過(guò)個(gè)10多秒,不知道具體怎么回事.估計(jì)是用定時(shí)器去特定時(shí)間發(fā)送那個(gè)鏈接的請(qǐng)求吧) `

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市志电,隨后出現(xiàn)的幾起案子骇笔,更是在濱河造成了極大的恐慌,老刑警劉巖竿拆,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件宙拉,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡丙笋,警方通過(guò)查閱死者的電腦和手機(jī)谢澈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)御板,“玉大人锥忿,你說(shuō)我怎么就攤上這事〉±撸” “怎么了敬鬓?”我有些...
    開(kāi)封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我钉答,道長(zhǎng)础芍,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任数尿,我火速辦了婚禮仑性,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘右蹦。我一直安慰自己诊杆,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布何陆。 她就那樣靜靜地躺著晨汹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪贷盲。 梳的紋絲不亂的頭發(fā)上宰缤,一...
    開(kāi)封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音晃洒,去河邊找鬼慨灭。 笑死,一個(gè)胖子當(dāng)著我的面吹牛球及,可吹牛的內(nèi)容都是我干的氧骤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼吃引,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼筹陵!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起镊尺,我...
    開(kāi)封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤朦佩,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后庐氮,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體语稠,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年弄砍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了仙畦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡音婶,死狀恐怖慨畸,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情衣式,我是刑警寧澤寸士,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布檐什,位于F島的核電站,受9級(jí)特大地震影響弱卡,放射性物質(zhì)發(fā)生泄漏厢汹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一谐宙、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧界弧,春花似錦凡蜻、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至条获,卻和暖如春忠荞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背帅掘。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工委煤, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人修档。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓碧绞,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親吱窝。 傳聞我的和親對(duì)象是個(gè)殘疾皇子讥邻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容