es是什么
- 分布式的實(shí)時(shí)文件存儲(chǔ)沙咏,每個(gè)字段都被索引并可被搜索
- 分布式的實(shí)時(shí)分析搜索引擎
- 可以擴(kuò)展到上百臺(tái)服務(wù)器鞋诗,處理PB級(jí)結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)
es:面向文檔
我們知道,關(guān)系型數(shù)據(jù)庫(kù)以記錄和行的形式存儲(chǔ)數(shù)據(jù)雄家,但是ElasticSearch中昭伸,是以文檔的形式存儲(chǔ)數(shù)據(jù)。
但區(qū)別在于离陶,文檔要比數(shù)據(jù)表的行更加靈活稼虎。因?yàn)槲臋n可以是多層次的,文檔鼓勵(lì)你將屬于一個(gè)邏輯試題的數(shù)據(jù)保存在同一個(gè)文檔中招刨,而不是散落在各個(gè)表的不同行中霎俩,這樣查詢效率很高,因?yàn)槲覀儫o(wú)需連接其他的表沉眶,我們學(xué)習(xí)關(guān)系型數(shù)據(jù)庫(kù)時(shí)打却,一定知道鏈表查詢是多么費(fèi)時(shí)的。
es索引能處理多大的數(shù)據(jù)
單一索引的極限取決于存儲(chǔ)索引的硬件谎倔、索引的設(shè)計(jì)柳击、如何處理數(shù)據(jù)以及你為索引備份了多少副本。
通常來(lái)說(shuō)片习,一個(gè)ElasticSearch分片捌肴,不能處理多于21億偏文檔,或者多于2740億的唯一詞條藕咏,但達(dá)到這個(gè)極限之前状知,我們可能就沒(méi)有足夠的磁盤(pán)空間了。當(dāng)然一個(gè)分片如果很大的話孽查,讀寫(xiě)性能將會(huì)變得非常差饥悴。
es優(yōu)缺點(diǎn)
es是一個(gè)基于Lucene的搜索服務(wù)器,他提供了一個(gè)分布式多用戶能力的全文檢索引擎盲再,基于restful web接口西设,es用java開(kāi)發(fā),是當(dāng)前流行的企業(yè)級(jí)搜索引擎答朋,設(shè)計(jì)用于云計(jì)算中贷揽,能夠達(dá)到實(shí)時(shí)搜索,穩(wěn)定可靠绿映,快速,安裝使用方便。
優(yōu)點(diǎn):
- 分布式:節(jié)點(diǎn)對(duì)外表現(xiàn)對(duì)等叉弦,加入節(jié)點(diǎn)自動(dòng)均衡
- ElasticSearch完全支持Apache Lucene的接近實(shí)時(shí)搜索
- 各節(jié)點(diǎn)組成對(duì)等的網(wǎng)絡(luò)結(jié)構(gòu)丐一,當(dāng)某結(jié)點(diǎn)出現(xiàn)故障時(shí)會(huì)自動(dòng)分配其他節(jié)點(diǎn)代替其進(jìn)行工作
- 橫向可擴(kuò)展,如果你需要增加一臺(tái)服務(wù)器淹冰,只需要做點(diǎn)配置库车,然后啟動(dòng)就完事了
- 高可用:提供復(fù)制機(jī)制,一個(gè)分片可以設(shè)置多個(gè)復(fù)制樱拴,是的某臺(tái)服務(wù)器宕機(jī)的情況下柠衍,集群仍可以照常運(yùn)行,并會(huì)把由于服務(wù)器宕機(jī)丟失的復(fù)制恢復(fù)到其他可用節(jié)點(diǎn)上晶乔;這點(diǎn)類似于HDFS的復(fù)制機(jī)制
缺點(diǎn):
- 不支持事務(wù)
- 相對(duì)吃內(nèi)存