導(dǎo)讀:在傳統(tǒng)消息系統(tǒng)中季率,存在一些問(wèn)題。一方面描沟,消息的存儲(chǔ)和服務(wù)一般是緊耦合的飒泻,節(jié)點(diǎn)的擴(kuò)容和運(yùn)維不便鞭光,特別是在需要多備份來(lái)保證高可用性的場(chǎng)景。另一方面泞遗,消息的消費(fèi)模式被固定衰猛,在企業(yè)內(nèi)部需要維護(hù)多套系統(tǒng)來(lái)保證不同的消息消費(fèi)場(chǎng)景。另外消息系統(tǒng)中刹孔,多租戶,多機(jī)房互備等企業(yè)級(jí)的特性和功能也不太豐富娜睛。
Apache Pulsar采用了分層的架構(gòu)髓霞,解決了存儲(chǔ)計(jì)算的耦合,同時(shí)提供了很好的擴(kuò)展性和可維護(hù)性畦戒。Pulsar也通過(guò)訂閱層的抽象方库,提供了統(tǒng)一的消息消費(fèi)模型。特別是在Pulsar的設(shè)計(jì)之初障斋,就注重對(duì)多租戶纵潦,多機(jī)房互備等方面的需求,提供了眾多完備的企業(yè)級(jí)的特性垃环。
Apache Pulsar從2015年初在Yahoo全球近十個(gè)機(jī)房?jī)?nèi)部大規(guī)模部署邀层,穩(wěn)定服務(wù)了Yahoo內(nèi)部郵箱,金融遂庄,F(xiàn)lickr寥院,廣告,NoSQL等眾多的應(yīng)用場(chǎng)景涛目,一共創(chuàng)建了80多個(gè)租戶秸谢,230多萬(wàn)個(gè)topic。 智聯(lián)招聘在18年用Pulsar替換了線上原有的RabbitMQ霹肝,作為內(nèi)部的消息總線估蹄,服務(wù)內(nèi)部的20多個(gè)應(yīng)用,每天會(huì)產(chǎn)生6億多條消息和3TB的數(shù)據(jù)沫换。在減輕硬件臭蚁,運(yùn)維和部署成本的同時(shí),為系統(tǒng)提供了更好的服務(wù)質(zhì)量和擴(kuò)展性苗沧。
Apache Pulsar刊棕,是一個(gè)使用Apache Bookkeeper提供持久化的pub/sub消息平臺(tái),它可以提供如下特性:
跨地域復(fù)制
多租戶
零數(shù)據(jù)丟失
零Rebalancing時(shí)間
統(tǒng)一的隊(duì)列和流模型
高可擴(kuò)展性
高吞吐量
Pulsar Proxy
函數(shù)
Apache Pulsar的文檔對(duì)這些特性都有詳細(xì)解釋待逞,有興趣可以去看官方文檔甥角。
架構(gòu)
Pulsar使用分層結(jié)構(gòu),將存儲(chǔ)機(jī)制與broker隔離開(kāi)來(lái)识樱。此體系結(jié)構(gòu)為Pulsar提供以下好處:
獨(dú)立擴(kuò)展broker
獨(dú)立擴(kuò)展存儲(chǔ)(Bookies)
更容易容器化Zookeeper, Broker and Bookies
ZooKeeper提供集群的配置和狀態(tài)存儲(chǔ)
亮點(diǎn)如下:
負(fù)載均衡器:Pulsar內(nèi)置負(fù)載均衡器嗤无,可在內(nèi)部將負(fù)載分配給所有broker
服務(wù)發(fā)現(xiàn):Pulsar具有內(nèi)置的服務(wù)發(fā)現(xiàn)功能震束,可以識(shí)別在何處以及如何連接到broker。
全局復(fù)制器:可以在為同一個(gè)命名空間配置的N個(gè)borker之間復(fù)制數(shù)據(jù)当犯。
全局ZK: 全局ZK用于實(shí)現(xiàn)跨地域復(fù)制
跨地域復(fù)制
跨地域復(fù)制是Pulsar提供的解決方案垢村。全局集群可以在名稱空間級(jí)別進(jìn)行配置,以便在任意數(shù)量的集群(n-wayMesh解決方案)中進(jìn)行復(fù)制嚎卫。從下面的示例中嘉栓,數(shù)據(jù)中心C沒(méi)有消費(fèi)者,但數(shù)據(jù)中心A或B中仍會(huì)根據(jù)訂閱模型消費(fèi)消息拓诸。
多租戶
多租戶特性通過(guò)對(duì)數(shù)據(jù)存儲(chǔ)的隔離侵佃,幫助為企業(yè)建立Pulsar集群。這一內(nèi)置功能將大大降低組織的基礎(chǔ)設(shè)施建設(shè)和運(yùn)營(yíng)成本奠支。
零Rebalancing時(shí)間
Pulsar的分層架構(gòu)和代理的無(wú)狀態(tài)性質(zhì)有助于實(shí)現(xiàn)零Rebalancing時(shí)間馋辈。如果一個(gè)新的broker被添加到集群中,它將立即可用倍谜;無(wú)需在集群中rebalancing數(shù)據(jù)迈螟。
從Bookies的角度來(lái)看:當(dāng)一個(gè)新的Bookie添加到集群中時(shí),由于其底層的分布式日志架構(gòu)(讀/寫(xiě)隔離)尔崔,該節(jié)點(diǎn)立刻可以寫(xiě)入數(shù)據(jù)答毫。基于段復(fù)制配置的數(shù)據(jù)rebalance在后臺(tái)進(jìn)行季春,不會(huì)對(duì)集群產(chǎn)生任何影響烙常。
統(tǒng)一的隊(duì)列和流模型
Pulsar使用同一個(gè)模型支持流和隊(duì)列語(yǔ)義。這個(gè)特性可以通過(guò)訂閱模型實(shí)現(xiàn)鹤盒。消費(fèi)者使用訂閱模型中的任何一個(gè)訂閱主題:
Exclusive - 支持流語(yǔ)義
Failover - 支持流語(yǔ)義
Shared - 支持隊(duì)列語(yǔ)義
函數(shù)
函數(shù)是能夠在Pulsar內(nèi)部或外部存在的本地監(jiān)聽(tīng)器蚕脏。從用途本身來(lái)看,函數(shù)可用于基于內(nèi)容的路由侦锯,這將幫助企業(yè)應(yīng)用程序路由預(yù)期的消息驼鞭。
Proxy
當(dāng)broker部署在云或Kubernetes中時(shí),需要使用proxy將broker暴露于外部世界尺碰。Proxy本身可以提供身份驗(yàn)證和授權(quán)挣棕。Proxy內(nèi)置將授權(quán)令牌傳遞給broker以進(jìn)行命名空間權(quán)限驗(yàn)證的功能。
結(jié)論
Apache Pulsar使用基于分層體系結(jié)構(gòu)的pub/sub模型亲桥,它具有跨地域復(fù)制洛心、多租戶、零Rebalancing時(shí)間等功能题篷。
原文地址:https://medium.com/@pckeyan/apache-pulsar-gentle-introduction-465ca6da0e18