全文搜索引擎Solr工具使用

??Solr是一個高性能笋鄙,采用Java5開發(fā),基于Lucene的全文搜索服務(wù)器怪瓶。同時對其進(jìn)行了擴(kuò)展萧落,提供了比Lucene更為豐富的查詢語言,同時實(shí)現(xiàn)了可配置洗贰、可擴(kuò)展并對查詢性能進(jìn)行了優(yōu)化找岖,并且提供了一個完善的功能管理界面,是一款非常優(yōu)秀的全文搜索引擎敛滋。

1.下載solr

官網(wǎng):http://lucene.apache.org/solr/

2.目錄結(jié)構(gòu)(版本:6.3.0)

3.啟動solr

solr默認(rèn)使用jetty部署许布,也可以使用tomcat部署,本次采用默認(rèn)jetty部署绎晃,進(jìn)入solr目錄蜜唾,輸入:bin/solr start命令,出現(xiàn)Happy searching!字符證明啟動成功箕昭,默認(rèn)端口號8983

4.訪問solr

瀏覽器訪問本地solr地址:http://localhost:8983/solr/#/

5.新增配置文件

在server/solr目錄下灵妨,有一個README.txt的文件,其中說明了如何建立solr core落竹。最簡單的建立是直接復(fù)制solr中為我們提供好的例子,打開server/solr/configsets目錄會發(fā)現(xiàn)里面已經(jīng)有三個例子货抄,因?yàn)槲覀兪且獜臄?shù)據(jù)庫導(dǎo)入數(shù)據(jù)述召,所以復(fù)制 “data_driven_schema_configs” 這個例子并改名為 “case_task”。

6.導(dǎo)入中文分詞工具IK?Analyzer

下載地址:http://download.csdn.net/detail/linzhiqiang0316/9537326

IK分詞包內(nèi)容:

7.整合中文分詞工具IK?Analyzer

將ik-analyzer-solr5-5.x.jar這個jar包放入solr項(xiàng)目下的dist目錄下面蟹地,將IKAnalyzer.cfg.xml积暖,mydict.dic(搜狗的擴(kuò)展詞庫),stopword.dic放在solr項(xiàng)目下的server/resources目錄下面

8.導(dǎo)入需要的jar包

為了導(dǎo)入數(shù)據(jù)和鏈接mysql怪与,我們還需要導(dǎo)入兩個重要的jar包夺刑。由于mysql的jar包并沒有在項(xiàng)目中,我是復(fù)制了一份放到了dist目錄下面了。另外兩個需要的jar包就是dist目錄下帶有“dataimport”標(biāo)識的jar包遍愿。

然后打開myCollections/conf/solrconfig.xml存淫,引用上面提到的jar包和中文分詞工具jar包如下。

9.數(shù)據(jù)庫字段

10.添加requestHandler

繼續(xù)修改case_task/conf/solrconfig.xml沼填,搜索? ,然后在該行之上添加如下代碼桅咆。

data-config.xml

11.建立連接配置文件

在case_task/conf目錄下新建data-config.xml, 內(nèi)容如下。

```

deltaImportQuery="select * from case_task where id='${dih.delta.id}'"

deltaQuery="select id from case_task where last_modify_time> '${dataimporter.last_index_time}'">

```

說明:

dataSource是數(shù)據(jù)庫數(shù)據(jù)源坞笙。Entity就是一張表對應(yīng)的實(shí)體岩饼,pk是主鍵,query是查詢語句薛夜。Field對應(yīng)一個字段籍茧,column是數(shù)據(jù)庫里的column名,后面的name屬性對應(yīng)著Solr的Filed的名字梯澜。其中solrdata是數(shù)據(jù)庫名寞冯,case_task是表名。

其中deltaQuery是增量索引腊徙,原理是從數(shù)據(jù)庫中根據(jù)deltaQuery指定的SQL語句查詢出所有需要增量導(dǎo)入的數(shù)據(jù)的ID號简十。然后根據(jù)deltaImportQuery指定的SQL語句返回所有這些ID的數(shù)據(jù),即為這次增量導(dǎo)入所要處理的數(shù)據(jù)撬腾。核心思想是:通過內(nèi)置變量“${dih.delta.id}”和 “${dataimporter.last_index_time}”來記錄本次要索引的id和最近一次索引的時間螟蝙。

12.managed-schema配置field信息

搜索?

添加中文分詞IK配置信息:

13.添加我們剛剛建立的core

(1).點(diǎn)擊Core Admin,配置我們建立的solr Core的信息民傻,如下所示:

(2).測試索引是否成功

索引成功

(3).監(jiān)測查詢成功

查詢成功

(4).檢測中文分詞

檢測成功

14.其他操作

(1).刪除所有索引:

http://localhost:8983/solr/case_task/update/?stream.body=%3Cdelete%3E%3Cquery%3E*:*%3C/query%3E%3C/delete%3E&stream.contentType=text/xml;charset=utf-8&commit=true

(2).添加所有索引:

http://localhost:8983/solr/case_task/dataimport?command=full-import&clean=false&commit=true

(3).新增索引:

http://localhost:8983/solr/case_task/dataimport?command=delta-import&clean=false&commit=true

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末胰默,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子漓踢,更是在濱河造成了極大的恐慌牵署,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件喧半,死亡現(xiàn)場離奇詭異奴迅,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)挺据,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進(jìn)店門取具,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人扁耐,你說我怎么就攤上這事暇检。” “怎么了婉称?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵块仆,是天一觀的道長构蹬。 經(jīng)常有香客問我,道長悔据,這世上最難降的妖魔是什么庄敛? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮蜜暑,結(jié)果婚禮上铐姚,老公的妹妹穿的比我還像新娘。我一直安慰自己肛捍,他們只是感情好隐绵,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拙毫,像睡著了一般依许。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上缀蹄,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天峭跳,我揣著相機(jī)與錄音,去河邊找鬼缺前。 笑死蛀醉,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的衅码。 我是一名探鬼主播拯刁,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼逝段!你這毒婦竟也來了垛玻?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤奶躯,失蹤者是張志新(化名)和其女友劉穎帚桩,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體嘹黔,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡账嚎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了儡蔓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片醉锄。...
    茶點(diǎn)故事閱讀 39,834評論 1 347
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖浙值,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情檩小,我是刑警寧澤开呐,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響筐付,放射性物質(zhì)發(fā)生泄漏卵惦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一瓦戚、第九天 我趴在偏房一處隱蔽的房頂上張望沮尿。 院中可真熱鬧,春花似錦较解、人聲如沸畜疾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽啡捶。三九已至,卻和暖如春奸焙,著一層夾襖步出監(jiān)牢的瞬間瞎暑,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工与帆, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留了赌,地道東北人。 一個月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓玄糟,卻偏偏與公主長得像勿她,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子茶凳,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 一嫂拴、前言 在開發(fā)網(wǎng)站/App項(xiàng)目的時候,通常需要搭建搜索服務(wù)贮喧。比如筒狠,新聞類應(yīng)用需要檢索標(biāo)題/內(nèi)容,社區(qū)類應(yīng)用需要檢...
    Ceelog閱讀 5,916評論 2 36
  • 兩年前用過solr5.1版本的箱沦,當(dāng)時只是簡單入個門辩恼,拿來在項(xiàng)目里建個全文索引,然后再query谓形,其他什么也沒做灶伊,還...
    Coselding閱讀 3,093評論 3 22
  • 1 準(zhǔn)備工作及相關(guān)介紹 solr和lucene的版本是同步更新的,最新版本是6.5.0寒跳。本案例使用4.10.3 j...
    阿太哥閱讀 2,330評論 1 5
  • 需求明確聘萨,原應(yīng)用使用mysql數(shù)據(jù)庫,基本功能CRUD童太,增加一個搜索功能米辐。數(shù)據(jù)庫名wenda胸完,下有一個questi...
    明明找靈氣閱讀 3,788評論 1 3
  • 4.河水的秘密 闊格爾森草原上,青年男女們二人一組翘贮,騎馬并轡走向指定地點(diǎn)赊窥。去的途中,小伙子向姑娘逗趣狸页、開玩笑锨能。到達(dá)...
    田夢田閱讀 227評論 2 0