solr7.4配置core創(chuàng)建及分詞配置

1、solr配置

? ? ? ? 首先我使用的是solr7.4所以下載解壓后無需進行tomcat關聯(lián),直接在解壓目錄下solr-7.4.0/bin/solr start 就可以運行 化戳,也可進入到bin目錄使用./solr start 進行運行戴已,solr默認端口為8983本橙,如需要自定義端口扳躬,則在啟動是后面加上 -p 如./solr start -p 8888,啟動后,在瀏覽器中輸入http://localhost:8983/solr即可跳轉到solr控制臺頁面



2、創(chuàng)建Core

? ? ? solr以文件的方式將數據存儲在core下贷币,接下來我們就創(chuàng)建自己的core击胜,點擊控制臺左邊的Core admin


點擊Add Core


core home的路徑的查看我們稍后再聊,點擊Add Core役纹,我們認為會在core home路徑下偶摔,創(chuàng)建了一個名為coreTest的文件夾并完成core的創(chuàng)建,然而


上方紅色報錯信息中指出的/Users/edz/Documents/ide/solr/solr-7.4.0/server/solr/ 即為core home路徑促脉,可以用如下方式查看


我們進入到core home中


發(fā)現(xiàn)僅僅是創(chuàng)建了coreTest文件夾啰挪,core并未成功創(chuàng)建,因為我們缺少solrconfig.xml,將solr-7.4.0/server/solr/configsets/_default/下的conf文件夾嘲叔,復制到新建的core目錄下,即coreTest,再次點擊Add Core


創(chuàng)建成功抽活,點擊左側Core Selector選擇新添加的coreForCheck


添加自定義key



看到了存儲類型硫戈,就要開始講一下分詞了,講分詞之前我們先看一下field type的類別下硕,


他的這些類別實際上是在配置文件中丁逝,配置文件路徑如下 solr home/coreTest(上面創(chuàng)建core時的instanceDir路口)/conf/managed-schema 我們打開看一下


下拉列表中的類型都是在此文件中配置的,solr默認添加了英文的分詞梭姓,但是沒有中文分詞霜幼,這意味在此文件中并無英文分詞的filed type,如果我們要進行分詞誉尖,需進行如下操作



3罪既、分詞配置

下載ik分詞的jar包

鏈接: https://pan.baidu.com/s/116BEGAB0HXMtIei8SViyqw 密碼: d3hy

將jar包復制到路徑solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib下铡恕,在上文提到的配置文件managed-schema中添加中文分詞的field類別

<fieldType name="worddata_ik" class="solr.TextField">?

?????<analyzer type="index">?

?????????<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" conf="ik.conf" useSmart="false"/>?

?????????<filter class="solr.LowerCaseFilterFactory"/>

?????</analyzer>?

?????<analyzer type="query">?

?????????<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" conf="ik.conf" useSmart="true"/>

?????????<filter class="solr.LowerCaseFilterFactory"/>?

?????</analyzer>?

?</fieldType>


添加solr自帶的中文分詞

將solr-7.4.0\contrib\analysis-extras\lucene-libs中的lucene-analyzers-smartcn-7.4.0.jar 復制到

solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib下琢感,在配置文件managed-schema中添加中文分詞的field類別

<fieldType name="worddata_smart" class="solr.TextField" positionIncrementGap="100"> ????<analyzer type="index">

?????????<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> ????</analyzer>

?????<analyzer type="query">?

?????????<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> ????</analyzer>

?</fieldType>

重啟solr, bin/solr restart -force

再次進行添加

為方便比較,再建一個field


再添加一個使用自帶分詞


進行分詞校驗



結果如下

無中文分詞的字段


ik分詞


自帶分詞


上述為基本solr操作探熔,下一步研究添加自定義分詞詞匯??

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子晴圾,更是在濱河造成了極大的恐慌黄绩,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件其垄,死亡現(xiàn)場離奇詭異苛蒲,居然都是意外死亡,警方通過查閱死者的電腦和手機绿满,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門撤防,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事寄月」枷ィ” “怎么了?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵漾肮,是天一觀的道長厂抖。 經常有香客問我,道長克懊,這世上最難降的妖魔是什么忱辅? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮谭溉,結果婚禮上墙懂,老公的妹妹穿的比我還像新娘。我一直安慰自己扮念,他們只是感情好损搬,可當我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著柜与,像睡著了一般巧勤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上弄匕,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天颅悉,我揣著相機與錄音,去河邊找鬼迁匠。 笑死剩瓶,一個胖子當著我的面吹牛,可吹牛的內容都是我干的城丧。 我是一名探鬼主播儒搭,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼芙贫!你這毒婦竟也來了搂鲫?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤磺平,失蹤者是張志新(化名)和其女友劉穎魂仍,沒想到半個月后,有當地人在樹林里發(fā)現(xiàn)了一具尸體拣挪,經...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡擦酌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了菠劝。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赊舶。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出笼平,到底是詐尸還是另有隱情园骆,我是刑警寧澤,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布寓调,位于F島的核電站锌唾,受9級特大地震影響,放射性物質發(fā)生泄漏夺英。R本人自食惡果不足惜晌涕,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望痛悯。 院中可真熱鬧余黎,春花似錦、人聲如沸载萌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽炒考。三九已至,卻和暖如春霎迫,著一層夾襖步出監(jiān)牢的瞬間斋枢,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工知给, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留瓤帚,地道東北人。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓涩赢,卻偏偏與公主長得像戈次,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子筒扒,可洞房花燭夜當晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內容