原文作者: xingguang
原文鏈接:https://www.tiance.club/post/3482167954.html
學(xué)習(xí)了什么是Elasticsearch之后娜搂,針對(duì)工程而言薛闪,我們更加關(guān)心的是Elasticsearch它能干什么辛馆?能在什么地方發(fā)揮作用?跟其它類(lèi)似的東西相比它不同的地方在哪里?
歸納起來(lái)就是Elasticsearch在什么場(chǎng)景下豁延,相比于其他類(lèi)似的技術(shù)而言昙篙,它更適合做什么
1、Elasticsearch的功能
(1)分布式的搜索引擎和數(shù)據(jù)分析引擎
搜索:百度诱咏,網(wǎng)站的站內(nèi)搜索苔可,IT系統(tǒng)的檢索
數(shù)據(jù)分析:電商網(wǎng)站,最近7天牙膏這種商品銷(xiāo)量排名前十的商家有哪些袋狞; 新聞網(wǎng)站硕蛹,最近一個(gè)月訪問(wèn)量排名前3的新聞板塊是哪些
原文作者: xingguang
原文鏈接:https://www.tiance.club/post/3482167954.html
(2)全文檢索,結(jié)構(gòu)化檢索硕并,數(shù)據(jù)分析
全文檢索:我想搜索商品名稱(chēng)包含牙膏的商品,select * from products where product_name like "%牙膏%"
結(jié)構(gòu)化檢索:我想搜索商品分類(lèi)為日化用品的商品有哪些秧荆,select * from products where category_id="日化用品"
數(shù)據(jù)分析:我們分析每一個(gè)商品分類(lèi)下有多少個(gè)商品倔毙,select category_id,count(*) from products group by category_id
(3)對(duì)海量數(shù)據(jù)進(jìn)行近實(shí)時(shí)的處理
分布式:ES自動(dòng)可以將海量數(shù)據(jù)分散到多臺(tái)服務(wù)器上去存儲(chǔ)和檢索
海量數(shù)據(jù)的處理:分布式以后,就可以采用大量的服務(wù)器去存儲(chǔ)和檢索數(shù)據(jù)乙濒,自然而然就可以實(shí)現(xiàn)海量數(shù)據(jù)的處理了
近實(shí)時(shí):檢索個(gè)數(shù)據(jù)要花費(fèi)1個(gè)小時(shí)(這就不叫做近實(shí)時(shí)陕赃,叫做離線批處理,batch-processing);在秒級(jí)別對(duì)數(shù)據(jù)進(jìn)行搜索和分析才叫做近實(shí)時(shí)
2颁股、Elasticsearch的適用場(chǎng)景
國(guó)外:
(1)維基百科 全文檢索么库、高亮、搜索推薦
(2)The Guardian(國(guó)外新聞網(wǎng)站) 用戶行為日志(點(diǎn)擊甘有,瀏覽诉儒,收藏,評(píng)論)+社交網(wǎng)絡(luò)數(shù)據(jù)(對(duì)某某新聞的相關(guān)看法)亏掀,數(shù)據(jù)分析忱反,給到每篇新聞文章的作者,讓他們知道他的文章的公眾反饋(好滤愕、壞温算、熱門(mén)。间影。注竿。)
(3)Stack Overflow(國(guó)外程序異常討論論壇),全文檢索,搜索到相關(guān)問(wèn)題和答案巩割,如果程序報(bào)錯(cuò)了裙顽,就會(huì)將報(bào)錯(cuò)信息粘貼到里面去,搜索有沒(méi)有對(duì)應(yīng)的答案
(4)github喂分,搜索上千億行的代碼
(5)電商網(wǎng)站锦庸,檢索商品
(6)日志數(shù)據(jù)的分析 elk技術(shù)
(7)商品價(jià)格監(jiān)控網(wǎng)站,用戶設(shè)定某商品的價(jià)格閾值蒲祈,當(dāng)?shù)陀谠撻撝档臅r(shí)候甘萧,發(fā)送通知消息給用戶
(8)BI系統(tǒng),商業(yè)智能Business Intelligence梆掸。比如有個(gè)大型商場(chǎng)集團(tuán)扬卷,BI,分析一下某某地區(qū)最近3年的用戶消費(fèi)金額的趨勢(shì)以及用戶群體的組成構(gòu)成酸钦,產(chǎn)出相關(guān)的數(shù)張報(bào)表怪得。
原文作者: xingguang
原文鏈接:https://www.tiance.club/post/3482167954.html
國(guó)內(nèi)
站內(nèi)搜索(電商、招聘卑硫、門(mén)戶等等)
IT系統(tǒng)搜索(OA徒恋、CRM、ERP等等)
數(shù)據(jù)分析
3欢伏、Elasticsearch的特點(diǎn)
(1)可以作為大型分布式集群(數(shù)百臺(tái)服務(wù)器)技術(shù)入挣,處理PB級(jí)的數(shù)據(jù),服務(wù)大公司硝拧;也可以運(yùn)行在單機(jī)上服務(wù)于小公司
(2)Elasticsearch不是什么新技術(shù)径筏,主要是將全文檢索、數(shù)據(jù)分析以及分布式技術(shù)障陶,合并在了一起滋恬,才形成了獨(dú)一無(wú)二的ES:lucene(全文檢索),商用的數(shù)據(jù)分析軟件抱究,分布式數(shù)據(jù)庫(kù)
(3)對(duì)用戶而言恢氯,是開(kāi)箱即用的,非常簡(jiǎn)單媳维,作為中小型應(yīng)用酿雪,直接3分鐘部署一下ES,就可以作為生產(chǎn)環(huán)境的系統(tǒng)來(lái)使用了侄刽,此時(shí)的場(chǎng)景是數(shù)據(jù)量不大指黎,操作不是太復(fù)雜
(4)數(shù)據(jù)庫(kù)的功能面對(duì)很多領(lǐng)域是不夠用的(事務(wù),還有各種聯(lián)機(jī)事務(wù)型的操作)州丹;特殊的功能醋安,比如全文檢索杂彭,同義詞處理,相關(guān)度排名吓揪,復(fù)雜數(shù)據(jù)分析亲怠,海量數(shù)據(jù)的近實(shí)時(shí)處理,Elasticsearch作為傳統(tǒng)數(shù)據(jù)庫(kù)的一個(gè)補(bǔ)充柠辞,提供了數(shù)據(jù)庫(kù)所不能提供的很多功能
原文作者: xingguang
原文鏈接:https://www.tiance.club/post/3482167954.html