建立Solr引擎

準(zhǔn)備安裝包

jdk-8u151-linux-x64.tar.gz:下載地址
solr-7.1.0:下載地址
ik-analyzer-solr7.x.zip:下載地址

由于 ik-analyzer的版本兼容問題奈惑,此處提供的可以兼容solr7.x譬挚,如果是其他版本的逻澳,請注意此問題捏膨。

安裝jdk1.8.0

新增配置/etc/profile如下:

#set java environment
export JAVA_HOME=/usr/local/jdk1.8.0
export JRE_HOME=${JAVA_HOME}/jre  
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib  
export PATH=${JAVA_HOME}/bin:$PATH

安裝solr7.1

下載solr7.1后解壓至需要放置的目錄迅耘,我放在/usr/local/solr-7.1.0下,如下圖:


solr5之后發(fā)布版本自帶jetty服務(wù)器税娜,可以自行啟動月洛。bin/solr start [-p port],默認(rèn)端口號8983践叠。 可以通過netstat -anp | grep 8983言缤,命令查看端口是否占用。solr引擎運(yùn)行后禁灼,可以通過url:http://localhost:8983/solr/#/ ,進(jìn)入solr管理列表界面管挟,如下圖:

配置中文分詞器IK Analyzer

將ik的jar文件 拷貝到 server/solr-webapp/webapp/WEB-INF/lib 目錄下

cp ik-analyzer-solr7x.jar /usr/local/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/lib

將IKAnalyzer配置文件,停滯詞詞典拷貝到server/solr-webapp/webapp/WEB-INF/classes/

cp stopword.dic IKAnalyzer.cfg.xml /usr/local/solr-7.1.0/server/solr-webapp/webapp/WEB-INF/classes/

配置IKAnalyzer分詞器的擴(kuò)展詞典弄捕,停止詞詞典

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 擴(kuò)展配置</comment>
    <!--用戶可以在這里配置自己的擴(kuò)展字典 
    <entry key="ext_dict">ext.dic;</entry> 
    -->
    <!--用戶可以在這里配置自己的擴(kuò)展停止詞字典-->                    
    <entry key="ext_stopwords">stopword.dic;</entry>
</properties>

配置Solr文件引入IKAnalyzer模塊
需要新建一個core模塊僻孝,進(jìn)行數(shù)據(jù)管理,新建命令如下:

bin/solr create -c ifiction

執(zhí)行成功后會在/usr/local/solr-7.1.0/server/solr生成ifiction文件守谓。
編輯/usr/local/solr-7.1.0/server/solr/ifiction/conf/managed-schema文件穿铆,添加下面代碼引入IKAnalyzer模塊:

    <fieldType name="text_ik" class="solr.TextField">     
        <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType> 

配置需要分詞的字段:summary

    <field name="fid" type="pint" indexed="true" stored="true" multiValued="false" />
    <field name="type" type="pint" indexed="true" stored="true" multiValued="false" />
    <field name="title" type="string" indexed="true" stored="true" multiValued="false" />
    <field name="cover" type="string" indexed="true" stored="true" multiValued="false" />
    <field name="writer" type="string" indexed="true" stored="true" multiValued="false" />
    <field name="tags" type="string" indexed="true" stored="true" multiValued="false" /> 
    <field name="summary" type="text_ik" indexed="true" stored="true" multiValued="false" />
    <field name="updateline" type="pint" indexed="true" stored="true" multiValued="false" />
    <field name="sort_base" type="pint" indexed="true" stored="true" multiValued="false" /> 
                                                                                                                       
    <!-- This can be enabled, in case the client does not know what fields may be searched. It isn't enabled by default
         because it's very expensive to index everything twice. -->
    <copyField source="title" dest="_text_"/>
    <copyField source="writer" dest="_text_"/>
    <copyField source="tags" dest="_text_"/>
    <copyField source="summary" dest="_text_"/>

配置完成需要重啟solr引擎,sudo /usr/local/solr-7.1.0/bin/solr restart -force斋荞。
說明:
(1)type="text_ik"荞雏,是引入IKAnalyzer模塊時的name配置的,下面測試solr的中文分詞如下圖:


(2)copyField 這個是復(fù)制字段平酿,將配置的source都收集到 text 域上凤优,可以用作全文檢索,就如上述英文注釋描述蜈彼。

至此筑辨,solr引擎及中文分詞的模塊搭建也就全部完成。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末幸逆,一起剝皮案震驚了整個濱河市棍辕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌还绘,老刑警劉巖楚昭,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異拍顷,居然都是意外死亡哪替,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進(jìn)店門菇怀,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凭舶,“玉大人,你說我怎么就攤上這事爱沟∷” “怎么了?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵呼伸,是天一觀的道長身冀。 經(jīng)常有香客問我钝尸,道長,這世上最難降的妖魔是什么搂根? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任珍促,我火速辦了婚禮,結(jié)果婚禮上剩愧,老公的妹妹穿的比我還像新娘猪叙。我一直安慰自己,他們只是感情好仁卷,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布穴翩。 她就那樣靜靜地躺著,像睡著了一般锦积。 火紅的嫁衣襯著肌膚如雪芒帕。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天丰介,我揣著相機(jī)與錄音背蟆,去河邊找鬼。 笑死哮幢,一個胖子當(dāng)著我的面吹牛淆储,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播家浇,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼碴裙!你這毒婦竟也來了钢悲?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤舔株,失蹤者是張志新(化名)和其女友劉穎莺琳,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體载慈,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡惭等,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了办铡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辞做。...
    茶點(diǎn)故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖寡具,靈堂內(nèi)的尸體忽然破棺而出秤茅,到底是詐尸還是另有隱情,我是刑警寧澤童叠,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布框喳,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏五垮。R本人自食惡果不足惜乍惊,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望放仗。 院中可真熱鬧润绎,春花似錦、人聲如沸匙监。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽亭姥。三九已至稼钩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間达罗,已是汗流浹背坝撑。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留粮揉,地道東北人巡李。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像扶认,于是被迫代替她去往敵國和親侨拦。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 一.簡介 Solr是一個獨(dú)立的企業(yè)級搜索應(yīng)用服務(wù)器辐宾,它對外提供類似于Web-service的API接口狱从。用戶可以通...
    泰安青年閱讀 3,668評論 0 37
  • 總結(jié)包括:1 了解前端打包方案的黑暗歷史2 模塊化發(fā)展3 Webpack3 打包流程 在說webpack之前, 我...
    NOTEBOOK2閱讀 227評論 0 1
  • 目的:泛解析后的域名訪問到tomcat的時候分發(fā)到對應(yīng)的項(xiàng)目中 將tomcat端口修改為80 找到tomcat配置...
    楽祀閱讀 628評論 0 0
  • 家里要搬遷了,對于年邁的父母自然是好事叠纹,生活在平房里面季研,每天還的壓水,拿柴燒火做飯誉察。我從父母的眼中看到了開...
    小櫻桃嬌閱讀 99評論 0 0
  • “我心悅卿卿兮与涡,卿卿悅我乎?”這句話持偏,是我耳聞過最美的告白之一驼卖。 可是,這句話鸿秆,像是在鼓勵那些勇于追求愛情的人去表...
    美文小屋閱讀 574評論 0 0