搜索引擎技術(shù)選型

??近期问麸,業(yè)主對POI檢索提出了一些想法燥翅,針對之前簡單的WordSegment分詞和模糊匹配搜索需要進行一些更為符合業(yè)主需求的調(diào)整迈嘹。于是這幾天對搜索引擎進行了一些技術(shù)選型拿穴;

一泣洞、Apache Lucene

??Lucene是一個開源的高性能、可擴展的全文檢索引擎工具包默色,但不是一個完整的全文檢索引擎球凰,而是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎腿宰。所以它是一套信息檢索工具包呕诉,可以說是當(dāng)今最先進、最高效的全功能開源搜索引擎框架吃度。使用起來相對復(fù)雜甩挫。
??參考: Lucene解析 - 基本概念

二、Elasticsearch

??Elasticsearch是一個實時的分布式搜索和分析引擎椿每∫琳撸可以快速處理大規(guī)模數(shù)據(jù)〖浠ぃ可以用于全文搜索亦渗、結(jié)構(gòu)化搜索和分析。

??使用:

??分布式實時文件存儲汁尺,并將每一個字段都編入索引法精,使其可以被搜索;
??實時分析的分布式搜索引擎痴突;
??可以擴展到上百臺服務(wù)器搂蜓,處理PB級別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。

??案例:

??維基百科辽装、英國衛(wèi)報洛勉、StackOverFlow、Github如迟、Goldman Sachs(股票分析)

??優(yōu)點:

??1、 分布式,不需要其他組件殷勘,實時分發(fā)此再;
??2、 完全支持Apache Lucene的接近實時的搜索玲销;
??3输拇、 處理多租戶不需要特殊配置,而Solr則需要更多的高級設(shè)置贤斜;(多租戶技術(shù))
??4策吠、 采用Gateway的概念,使得完備份更加簡單瘩绒;(gateway)
??5猴抹、 各節(jié)點組成對等的網(wǎng)絡(luò)結(jié)構(gòu),某些節(jié)點出現(xiàn)故障時會自動分配其他節(jié)點代替其進行工
????作锁荔。(分布式)

??缺點:

??沒有集成Lucene的新功能

三蟀给、Solr

??Solr是Apache Lucene項目的開源企業(yè)搜索平臺。主要功能包括全文檢索阳堕、命中標(biāo)示跋理、分面搜索、動態(tài)聚類恬总、數(shù)據(jù)庫集成前普,以及富文本的處理。是高度可擴展的壹堰,并提供了分布式搜索和索引復(fù)制拭卿。是最流行的企業(yè)級搜索引擎。是一個獨立的全文搜索服務(wù)器缀旁。

??優(yōu)點:

??1记劈、 有一個更大、更成熟的用戶并巍、開發(fā)和貢獻者社區(qū)目木;
??2、 不考慮建索引的同時進行搜索懊渡,速度更快刽射;
??3、 支持添加多種格式的索引剃执。

??缺點:

??建立索引時誓禁,搜索效率下降,實時索引搜索效率不高肾档。

??對比

??單純的對已有數(shù)據(jù)進行搜索時摹恰,Solr更快


圖一

??實時建立索引時辫继,Solr會產(chǎn)生io阻塞,查詢性能較差俗慈,Elasticsearch具有更明顯的優(yōu)勢姑宽。


圖二

圖三
??總結(jié)

??相對來講,如果考慮靜態(tài)搜索闺阱,Sorl相對更合適炮车;如果考慮實時,涉及到分布式酣溃,Elastic相對合適瘦穆。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市赊豌,隨后出現(xiàn)的幾起案子扛或,更是在濱河造成了極大的恐慌,老刑警劉巖亿絮,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件告喊,死亡現(xiàn)場離奇詭異,居然都是意外死亡派昧,警方通過查閱死者的電腦和手機黔姜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蒂萎,“玉大人秆吵,你說我怎么就攤上這事∥宕龋” “怎么了纳寂?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長泻拦。 經(jīng)常有香客問我毙芜,道長,這世上最難降的妖魔是什么争拐? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任腋粥,我火速辦了婚禮,結(jié)果婚禮上架曹,老公的妹妹穿的比我還像新娘隘冲。我一直安慰自己,他們只是感情好绑雄,可當(dāng)我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布展辞。 她就那樣靜靜地躺著,像睡著了一般万牺。 火紅的嫁衣襯著肌膚如雪罗珍。 梳的紋絲不亂的頭發(fā)上洽腺,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機與錄音靡砌,去河邊找鬼已脓。 笑死,一個胖子當(dāng)著我的面吹牛通殃,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播厕宗,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼画舌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了已慢?” 一聲冷哼從身側(cè)響起曲聂,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎佑惠,沒想到半個月后朋腋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡膜楷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年旭咽,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赌厅。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡穷绵,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出特愿,到底是詐尸還是另有隱情仲墨,我是刑警寧澤,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布揍障,位于F島的核電站目养,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏毒嫡。R本人自食惡果不足惜癌蚁,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望审胚。 院中可真熱鬧匈勋,春花似錦、人聲如沸膳叨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽菲嘴。三九已至饿自,卻和暖如春汰翠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昭雌。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工复唤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人烛卧。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓佛纫,卻偏偏與公主長得像,于是被迫代替她去往敵國和親总放。 傳聞我的和親對象是個殘疾皇子呈宇,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容