無(wú)標(biāo)題文章

Ik分詞器

有的時(shí)候,用戶搜索的關(guān)鍵字能庆,可能是一句話施禾,不是很規(guī)范脚线。所以在 Solr 中查詢出的時(shí)候搁胆,就需要將用戶輸入的關(guān)鍵字進(jìn)行分詞。?

  目前有很多優(yōu)秀的中文分詞組件邮绿。本篇只以 ?IKAnalyzer 分詞為例渠旁,講解如何在 solr ?中及集成中文分詞,使用 IKAnalyzer的原因 IK 比其他中文分詞維護(hù)的勤快船逮,和 Solr 集成也相對(duì)容易顾腊。具體就不多介紹,這里直接solr 集成 IK 的方法.

分詞的測(cè)試使用curl或者postman都可以挖胃,我個(gè)人傾向于postman,主要是能保存杂靶,要方便一些

ik分詞器:

分詞技術(shù)是搜索技術(shù)里面的一塊基石。很多人用過(guò)酱鸭,如果你只是為了簡(jiǎn)單快速地搭一個(gè)搜索引擎吗垮,你確實(shí)不用了解太深。但一旦涉及效果問(wèn)題凹髓,分詞器上就可以做很多文章烁登。例如, 在實(shí)我們際用作電商領(lǐng)域的搜索的工作中蔚舀,類目預(yù)判的實(shí)現(xiàn)就極須依賴分詞饵沧,至少需要做到可以對(duì)分詞器動(dòng)態(tài)加規(guī)則锨络。再一個(gè)簡(jiǎn)單的例子,如果你的優(yōu)化方法就是對(duì)不同的詞分權(quán)重狼牺,提高一些重點(diǎn)詞的權(quán)重的話羡儿,你就需要依賴并理解分詞器。本文將根據(jù)ik分配器的原碼對(duì)其實(shí)現(xiàn)做一定分析是钥。其中的重點(diǎn)失受,

主要3點(diǎn):1、詞典樹(shù)的構(gòu)建咏瑟,即將現(xiàn)在的詞典加載到一個(gè)內(nèi)存結(jié)構(gòu)中去拂到,

2、詞的匹配查找码泞,也就相當(dāng)生成對(duì)一個(gè)句話中詞的切分方式兄旬,

3、歧義判斷余寥,即對(duì)不同切分方式的判定领铐,哪種應(yīng)是更合理的

今天主要學(xué)的就是和elasticsearch相關(guān)的知識(shí),學(xué)習(xí)啦如何連接elasticsearch的網(wǎng)頁(yè)elasticsearch-head-master宋舷,這樣可以讓我們可以更加方便的操作elasticsearch和更加直觀的看到操作elasticsearch的變化绪撵,還有就是學(xué)習(xí)啦如何使用java對(duì)elasticsearch進(jìn)行操作,然后就是吧elasticsearch和我們自己用的數(shù)據(jù)庫(kù)連接啦祝蝠,這樣可以方便我們查看數(shù)據(jù)和調(diào)用數(shù)據(jù)音诈。

作者:少年_2ddb

鏈接:http://www.reibang.com/p/e910d9df8dcb

來(lái)源:簡(jiǎn)書(shū)

簡(jiǎn)書(shū)著作權(quán)歸作者所有,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處绎狭。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末细溅,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子儡嘶,更是在濱河造成了極大的恐慌喇聊,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蹦狂,死亡現(xiàn)場(chǎng)離奇詭異誓篱,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)凯楔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門窜骄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人啼辣,你說(shuō)我怎么就攤上這事啊研。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵党远,是天一觀的道長(zhǎng)削解。 經(jīng)常有香客問(wèn)我,道長(zhǎng)沟娱,這世上最難降的妖魔是什么氛驮? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮济似,結(jié)果婚禮上矫废,老公的妹妹穿的比我還像新娘。我一直安慰自己砰蠢,他們只是感情好蓖扑,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著台舱,像睡著了一般律杠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上竞惋,一...
    開(kāi)封第一講書(shū)人閱讀 51,370評(píng)論 1 302
  • 那天柜去,我揣著相機(jī)與錄音,去河邊找鬼拆宛。 笑死嗓奢,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的浑厚。 我是一名探鬼主播股耽,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼瞻颂!你這毒婦竟也來(lái)了豺谈?” 一聲冷哼從身側(cè)響起郑象,我...
    開(kāi)封第一講書(shū)人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤贡这,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后厂榛,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體盖矫,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年击奶,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辈双。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡柜砾,死狀恐怖湃望,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤证芭,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布瞳浦,位于F島的核電站,受9級(jí)特大地震影響废士,放射性物質(zhì)發(fā)生泄漏叫潦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一官硝、第九天 我趴在偏房一處隱蔽的房頂上張望矗蕊。 院中可真熱鬧,春花似錦氢架、人聲如沸傻咖。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)没龙。三九已至,卻和暖如春缎玫,著一層夾襖步出監(jiān)牢的瞬間硬纤,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工赃磨, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留筝家,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓邻辉,卻偏偏與公主長(zhǎng)得像溪王,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子值骇,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • # Python 資源大全中文版 我想很多程序員應(yīng)該記得 GitHub 上有一個(gè) Awesome - XXX 系列...
    小邁克閱讀 2,985評(píng)論 1 3
  • 第一章 1.Web信息檢索的特點(diǎn)是什么莹菱? 答:(1)規(guī)模大。人類生產(chǎn)40億網(wǎng)頁(yè)[Google,2004]吱瘩,而書(shū)才1...
    叕燚閱讀 358評(píng)論 0 0
  • 越害怕的東西越要去學(xué)習(xí)道伟,對(duì)于程序員來(lái)說(shuō)害怕莫過(guò)于美術(shù),所以開(kāi)始學(xué)點(diǎn)3d建模使碾。 開(kāi)源免費(fèi)的Blender近年來(lái)大熱蜜徽,...
    好孩子橙米文閱讀 536評(píng)論 0 0
  • spring官方文檔:http://docs.spring.io/spring/docs/current/spri...
    牛馬風(fēng)情閱讀 1,679評(píng)論 0 3
  • 第5章 引用類型(返回首頁(yè)) 本章內(nèi)容 使用對(duì)象 創(chuàng)建并操作數(shù)組 理解基本的JavaScript類型 使用基本類型...
    大學(xué)一百閱讀 3,233評(píng)論 0 4