一嗡综、 消息隊(duì)列概述
消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件,主要解決應(yīng)用耦合杜漠、異步消息极景、流量削鋒等問題。實(shí)現(xiàn)高性能驾茴、高可用盼樟、可伸縮和最終一致性架構(gòu)。是大型分布式系統(tǒng)不可缺少的中間件沟涨。
目前在生產(chǎn)環(huán)境恤批,使用較多的消息隊(duì)列有ActiveMQ、RabbitMQ裹赴、ZeroMQ喜庞、Kafka、MetaMQ棋返、RocketMQ等延都。
二、 消息隊(duì)列應(yīng)用場景
下面詳細(xì)介紹一下消息隊(duì)列在實(shí)際應(yīng)用中常用的使用場景睛竣。場景分為異步處理晰房、應(yīng)用解耦、流量削鋒和消息通訊四個場景射沟。
2.1 異步處理
場景說明:用戶注冊后殊者,需要發(fā)送注冊郵件和發(fā)送注冊信息,傳統(tǒng)的做法有兩種:串行方式验夯、并行方式
串行方式
將注冊信息寫入數(shù)據(jù)庫成功后猖吴,發(fā)送注冊郵件,然后發(fā)送注冊短信挥转,而所有任務(wù)執(zhí)行完成后海蔽,返回信息給客戶端
并行方式
將注冊信息寫入數(shù)據(jù)庫成功后,同時進(jìn)行發(fā)送注冊郵件和發(fā)送注冊短信的操作绑谣。而所有任務(wù)執(zhí)行完成后党窜,返回信息給客戶端。同串行方式相比借宵,并行方式可以提高執(zhí)行效率幌衣,減少執(zhí)行時間。
上面的比較可以發(fā)現(xiàn)暇务,假設(shè)三個操作均需要50ms的執(zhí)行時間泼掠,排除網(wǎng)絡(luò)因素怔软,則最終執(zhí)行完成,串行方式需要150ms择镇,而并行方式需要100ms挡逼。
因?yàn)閏pu在單位時間內(nèi)處理的請求數(shù)量是一致的,假設(shè):CPU每1秒吞吐量是100此腻豌,則串行方式1秒內(nèi)可執(zhí)行的請求量為1000/150家坎,不到7次;并行方式1秒內(nèi)可執(zhí)行的請求量為1000/100吝梅,為10次虱疏。
由上可以看出,傳統(tǒng)串行和并行的方式會受到系統(tǒng)性能的局限苏携,那么如何解決這個問題做瞪?
我們需要引入消息隊(duì)列,將不是必須的業(yè)務(wù)邏輯右冻,異步進(jìn)行處理装蓬,由此改造出來的流程為
根據(jù)上述的流程纱扭,用戶的響應(yīng)時間基本相當(dāng)于將用戶數(shù)據(jù)寫入數(shù)據(jù)庫的時間牍帚,發(fā)送注冊郵件、發(fā)送注冊短信的消息在寫入消息隊(duì)列后乳蛾,即可返回執(zhí)行結(jié)果暗赶,寫入消息隊(duì)列的時間很快,幾乎可以忽略肃叶,也有此可以將系統(tǒng)吞吐量提升至20QPS蹂随,比串行方式提升近3倍,比并行方式提升2倍因惭。
2.2 應(yīng)用解耦
場景說明:用戶下單后糙及,訂單系統(tǒng)需要通知庫存系統(tǒng)。
傳統(tǒng)的做法為:訂單系統(tǒng)調(diào)用庫存系統(tǒng)的接口筛欢。如下圖所示:
傳統(tǒng)方式具有如下缺點(diǎn):
-1. 假設(shè)庫存系統(tǒng)訪問失敗,則訂單減少庫存失敗唇聘,導(dǎo)致訂單創(chuàng)建失敗
-2. 訂單系統(tǒng)同庫存系統(tǒng)過度耦合
如何解決上述的缺點(diǎn)呢版姑?需要引入消息隊(duì)列,引入消息隊(duì)列后的架構(gòu)如下圖所示:
- 訂單系統(tǒng):用戶下單后剥险,訂單系統(tǒng)進(jìn)行數(shù)據(jù)持久化處理,然后將消息寫入消息隊(duì)列宪肖,返回訂單創(chuàng)建成功
- 庫存系統(tǒng):使用拉/推的方式表制,獲取下單信息健爬,庫存系統(tǒng)根據(jù)訂單信息,進(jìn)行庫存操作么介。
假如在下單時庫存系統(tǒng)不能正常使用娜遵。也不影響正常下單,因?yàn)橄聠魏笕蓝蹋唵蜗到y(tǒng)寫入消息隊(duì)列就不再關(guān)心其后續(xù)操作了设拟。由此實(shí)現(xiàn)了訂單系統(tǒng)與庫存系統(tǒng)的應(yīng)用解耦。
2.3 流量削鋒
流量削鋒也是消息隊(duì)列中的常用場景久脯,一般在秒殺或團(tuán)搶活動中使用廣泛纳胧。
應(yīng)用場景:秒殺活動,一般會因?yàn)榱髁窟^大帘撰,導(dǎo)致流量暴增跑慕,應(yīng)用掛掉。為解決這個問題摧找,一般需要在應(yīng)用前端加入消息隊(duì)列核行。
- 可以控制參與活動的人數(shù);
- 可以緩解短時間內(nèi)高流量對應(yīng)用的巨大壓力慰于;
流量削鋒處理方式系統(tǒng)圖如下:
- 服務(wù)器在接收到用戶請求后钮科,首先寫入消息隊(duì)列。這時如果消息隊(duì)列中消息數(shù)量超過最大數(shù)量婆赠,則直接拒絕用戶請求或返回跳轉(zhuǎn)到錯誤頁面绵脯;
- 秒殺業(yè)務(wù)根據(jù)秒殺規(guī)則讀取消息隊(duì)列中的請求信息,進(jìn)行后續(xù)處理休里。
2.4 日志處理
日志處理是指將消息隊(duì)列用在日志處理中蛆挫,比如Kafka的應(yīng)用,解決大量日志傳輸?shù)膯栴}妙黍。架構(gòu)簡化如下:
- 日志采集客戶端:負(fù)責(zé)日志數(shù)據(jù)采集悴侵,定時寫受寫入Kafka隊(duì)列;
- Kafka消息隊(duì)列:負(fù)責(zé)日志數(shù)據(jù)的接收拭嫁,存儲和轉(zhuǎn)發(fā)可免;
- 日志處理應(yīng)用:訂閱并消費(fèi)kafka隊(duì)列中的日志數(shù)據(jù);
這種架構(gòu)在實(shí)際開發(fā)中的應(yīng)用做粤,可以參照案例:新浪技術(shù)分享:我們?nèi)绾慰赶?2億條實(shí)時日志的分析處理
- Kafka:接收用戶日志的消息隊(duì)列浇借。
- Logstash:做日志解析,統(tǒng)一成JSON輸出給Elasticsearch怕品。
- Elasticsearch:實(shí)時日志分析服務(wù)的核心技術(shù)妇垢,一個schemaless,實(shí)時的數(shù)據(jù)存儲服務(wù),通過index組織數(shù)據(jù)闯估,兼具強(qiáng)大的搜索和統(tǒng)計(jì)功能灼舍。
- Kibana:基于Elasticsearch的數(shù)據(jù)可視化組件,超強(qiáng)的數(shù)據(jù)可視化能力是眾多公司選擇ELK stack的重要原因涨薪。
2.5 消息通訊
消息通訊是指骑素,消息隊(duì)列一般都內(nèi)置了高效的通信機(jī)制,因此也可以用在純的消息通訊尤辱。比如實(shí)現(xiàn)點(diǎn)對點(diǎn)消息隊(duì)列砂豌、聊天室等。
點(diǎn)對點(diǎn)通訊
在點(diǎn)對點(diǎn)通訊架構(gòu)設(shè)計(jì)中光督,客戶端A和客戶端B共用一個消息隊(duì)列阳距,即可實(shí)現(xiàn)消息通訊功能。
聊天室通訊
客戶端A结借、客戶端B筐摘、直至客戶端N訂閱同一消息隊(duì)列,進(jìn)行消息的發(fā)布與接收船老,即可實(shí)現(xiàn)聊天通訊方案架構(gòu)設(shè)計(jì)咖熟。
三、 消息中間件示例
3.1 電商系統(tǒng)
消息隊(duì)列采用高可用柳畔、可持久化的消息中間件馍管。比如Active MQ,Rabbit MQ薪韩,Rocket MQ确沸。
- 應(yīng)用將主干邏輯處理完成后,寫入消息隊(duì)列俘陷。消息發(fā)送是否成功可以開啟消息的確認(rèn)模式罗捎。(消息隊(duì)列返回消息接收成功狀態(tài)后,應(yīng)用再返回拉盾,這樣保障消息的完整性)
- 擴(kuò)展流程(發(fā)短信桨菜、配送處理)訂閱隊(duì)列消息。采用推或拉的方式獲取消息并處理捉偏。
- 消息將應(yīng)用解耦的同時倒得,帶來了數(shù)據(jù)一致性問題,可以采用最終一致性方式解決夭禽。比如主數(shù)據(jù)寫入數(shù)據(jù)庫屎暇,擴(kuò)展應(yīng)用根據(jù)消息隊(duì)列,并結(jié)合數(shù)據(jù)庫方式實(shí)現(xiàn)基于消息隊(duì)列的后續(xù)處理驻粟。
3.2 日志收集系統(tǒng)
分為Zookeeper注冊中心,日志收集客戶端,Kafka集群和Storm集群(OtherApp)四部分組成蜀撑。
- Zookeeper注冊中心挤巡,提出負(fù)載均衡和地址查找服務(wù);
- 日志收集客戶端酷麦,用于采集應(yīng)用系統(tǒng)的日志矿卑,并將數(shù)據(jù)推送到kafka隊(duì)列;
- Kafka集群:接收沃饶,路由母廷,存儲,轉(zhuǎn)發(fā)等消息處理糊肤;
- Storm集群:與OtherApp處于同一級別琴昆,采用拉的方式消費(fèi)隊(duì)列中的數(shù)據(jù);
四馆揉、JMS消息服務(wù)
講消息隊(duì)列就不得不提JMS 业舍。JMS(Java Message Service,Java消息服務(wù))API是一個消息服務(wù)的標(biāo)準(zhǔn)/規(guī)范,允許應(yīng)用程序組件基于JavaEE平臺創(chuàng)建升酣、發(fā)送舷暮、接收和讀取消息。它使分布式通信耦合度更低噩茄,消息服務(wù)更加可靠以及異步性下面。
在EJB架構(gòu)中,有消息bean可以無縫的與JM消息服務(wù)集成绩聘。在J2EE架構(gòu)模式中沥割,有消息服務(wù)者模式,用于實(shí)現(xiàn)消息與應(yīng)用直接的解耦君纫。
4.1 消息模型
在JMS標(biāo)準(zhǔn)中驯遇,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。
4.1.1 P2P模式
P2P模式包含三個角色:消息隊(duì)列(Queue)蓄髓,發(fā)送者(Sender)叉庐,接收者(Receiver)。每個消息都被發(fā)送到一個特定的隊(duì)列会喝,接收者從隊(duì)列中獲取消息陡叠。隊(duì)列保留著消息,直到他們被消費(fèi)或超時肢执。
P2P的特點(diǎn)
- 每個消息只有一個消費(fèi)者(Consumer)(即一旦被消費(fèi)枉阵,消息就不再在消息隊(duì)列中)
- 發(fā)送者和接收者之間在時間上沒有依賴性,也就是說當(dāng)發(fā)送者發(fā)送了消息之后预茄,不管接收者有沒有正在運(yùn)行兴溜,它不會影響到消息被發(fā)送到隊(duì)列
- 接收者在成功接收消息之后需向隊(duì)列應(yīng)答成功
如果希望發(fā)送的每個消息都會被成功處理的話侦厚,那么需要P2P模式。
4.1.2 Pub/Sub模式
包含三個角色:主題(Topic)拙徽,發(fā)布者(Publisher)刨沦,訂閱者(Subscriber) 。多個發(fā)布者將消息發(fā)送到Topic,系統(tǒng)將這些消息傳遞給多個訂閱者膘怕。
Pub/Sub的特點(diǎn)
- 每個消息可以有多個消費(fèi)者
- 發(fā)布者和訂閱者之間有時間上的依賴性想诅。針對某個主題(Topic)的訂閱者,它必須創(chuàng)建一個訂閱者之后岛心,才能消費(fèi)發(fā)布者的消息来破。
- 為了消費(fèi)消息,訂閱者必須保持運(yùn)行的狀態(tài)忘古。
為了緩和這樣嚴(yán)格的時間相關(guān)性徘禁,JMS允許訂閱者創(chuàng)建一個可持久化的訂閱。這樣存皂,即使訂閱者沒有被激活(運(yùn)行)晌坤,它也能接收到發(fā)布者的消息。
如果希望發(fā)送的消息可以不被做任何處理旦袋、或者只被一個消息者處理骤菠、或者可以被多個消費(fèi)者處理的話,那么可以采用Pub/Sub模型疤孕。
4.2消息消費(fèi)
在JMS中商乎,消息的產(chǎn)生和消費(fèi)都是異步的。對于消費(fèi)來說祭阀,JMS的消息者可以通過兩種方式來消費(fèi)消息鹉戚。
- 同步
訂閱者或接收者通過receive方法來接收消息,receive方法在接收到消息之前(或超時之前)將一直阻塞专控; - 異步
訂閱者或接收者可以注冊為一個消息監(jiān)聽器抹凳。當(dāng)消息到達(dá)之后,系統(tǒng)自動調(diào)用監(jiān)聽器的onMessage方法伦腐。
JNDI:Java命名和目錄接口,是一種標(biāo)準(zhǔn)的Java命名系統(tǒng)接口赢底。可以在網(wǎng)絡(luò)上查找和訪問服務(wù)柏蘑。通過指定一個資源名稱幸冻,該名稱對應(yīng)于數(shù)據(jù)庫或命名服務(wù)中的一個記錄,同時返回資源連接建立所必須的信息咳焚。
JNDI在JMS中起到查找和訪問發(fā)送目標(biāo)或消息來源的作用洽损。
4.3JMS編程模型
1. ConnectionFactory
創(chuàng)建Connection對象的工廠,針對兩種不同的JMS消息模型革半,分別有QueueConnectionFactory和TopicConnectionFactory兩種碑定×髀耄可以通過JNDI來查找ConnectionFactory對象。
2. Destination
Destination的意思是消息生產(chǎn)者的消息發(fā)送目標(biāo)或者說消息消費(fèi)者的消息來源延刘。對于消息生產(chǎn)者來說旅掂,它的Destination是某個隊(duì)列(Queue)或某個主題(Topic);對于消息消費(fèi)者來說,它的Destination也是某個隊(duì)列或主題(即消息來源)访娶。
所以,Destination實(shí)際上就是兩種類型的對象:Queue觉阅、Topic可以通過JNDI來查找Destination崖疤。
3. Connection
Connection表示在客戶端和JMS系統(tǒng)之間建立的鏈接(對TCP/IP Socket的包裝)。Connection可以產(chǎn)生一個或多個Session典勇。跟ConnectionFactory一樣劫哼,Connection也有兩種類型:QueueConnection和TopicConnection。
4. Session
Session是操作消息的接口割笙∪ㄉ眨可以通過session創(chuàng)建生產(chǎn)者、消費(fèi)者伤溉、消息等般码。Session提供了事務(wù)的功能。當(dāng)需要使用session發(fā)送/接收多個消息時乱顾,可以將這些發(fā)送/接收動作放到一個事務(wù)中板祝。同樣,也分QueueSession和TopicSession走净。
5. 消息的生產(chǎn)者
消息生產(chǎn)者由Session創(chuàng)建券时,并用于將消息發(fā)送到Destination。同樣伏伯,消息生產(chǎn)者分兩種類型:QueueSender和TopicPublisher橘洞。可以調(diào)用消息生產(chǎn)者的方法(send或publish方法)發(fā)送消息说搅。
6. 消息消費(fèi)者
消息消費(fèi)者由Session創(chuàng)建炸枣,用于接收被發(fā)送到Destination的消息。兩種類型:QueueReceiver和TopicSubscriber蜓堕∨茁玻可分別通過session的createReceiver(Queue)或createSubscriber(Topic)來創(chuàng)建。當(dāng)然套才,也可以session的creatDurableSubscriber方法來創(chuàng)建持久化的訂閱者迂猴。
7. MessageListener
消息監(jiān)聽器。如果注冊了消息監(jiān)聽器背伴,一旦消息到達(dá)沸毁,將自動調(diào)用監(jiān)聽器的onMessage方法峰髓。EJB中的MDB(Message-Driven Bean)就是一種MessageListener。
深入學(xué)習(xí)JMS對掌握J(rèn)AVA架構(gòu)息尺、EJB架構(gòu)有很好的幫助携兵,消息中間件也是大型分布式系統(tǒng)必須的組件。本次分享主要做全局性介紹搂誉,具體的深入需要大家學(xué)習(xí)徐紧,實(shí)踐,總結(jié)炭懊,領(lǐng)會并级。
五、常用消息隊(duì)列
一般商用的容器侮腹,比如WebLogic嘲碧,JBoss,都支持JMS標(biāo)準(zhǔn)父阻,開發(fā)上很方便愈涩。但免費(fèi)的比如Tomcat,Jetty等則需要使用第三方的消息中間件加矛。本部分內(nèi)容介紹常用的消息中間件(Active MQ履婉,Rabbit MQ,Zero MQ荒椭,Kafka)以及他們的特點(diǎn)谐鼎。
5.1 ActiveMQ
ActiveMQ 是Apache出品,最流行的趣惠,能力強(qiáng)勁的開源消息總線狸棍。ActiveMQ 是一個完全支持JMS1.1和J2EE 1.4規(guī)范的 JMS Provider實(shí)現(xiàn),盡管JMS規(guī)范出臺已經(jīng)是很久的事情了味悄,但是JMS在當(dāng)今的J2EE應(yīng)用中間仍然扮演著特殊的地位草戈。
ActiveMQ特性如下:
- 多種語言和協(xié)議編寫客戶端。
語言: Java,C,C++,C#,Ruby,Perl,Python,PHP侍瑟。
應(yīng)用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP - 完全支持JMS1.1和J2EE 1.4規(guī)范 (持久化唐片,XA消息,事務(wù))
- 對Spring的支持涨颜。
ActiveMQ可以很容易內(nèi)嵌到使用Spring的系統(tǒng)里面去费韭,而且也支持Spring2.0的特性 - 通過了常見J2EE服務(wù)器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試,其中通過JCA 1.5 resource adaptors的配置庭瑰,可以讓ActiveMQ可以自動的部署到任何兼容J2EE 1.4 商業(yè)服務(wù)器上
- 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
- 支持通過JDBC和journal提供高速的消息持久化
- 從設(shè)計(jì)上保證了高性能的集群星持,客戶端-服務(wù)器,點(diǎn)對點(diǎn)
- 支持Ajax
- 支持與Axis的整合
- 可以很容易得調(diào)用內(nèi)嵌JMS provider弹灭,進(jìn)行測試
5.2 RabbitMQ
RabbitMQ是流行的開源消息隊(duì)列系統(tǒng)督暂,用erlang語言開發(fā)揪垄。RabbitMQ是AMQP(高級消息隊(duì)列協(xié)議)的標(biāo)準(zhǔn)實(shí)現(xiàn)。支持多種客戶端逻翁,如:Python饥努、Ruby、.NET八回、Java括尸、JMS不恭、C冤竹、PHP钾恢、ActionScript、XMPP滴铅、STOMP等,支持AJAX就乓,持久化汉匙。用于在分布式系統(tǒng)中存儲轉(zhuǎn)發(fā)消息,在易用性生蚁、擴(kuò)展性噩翠、高可用性等方面表現(xiàn)不俗。
上圖中有幾個重要概念:
- Broker:簡單來說就是消息隊(duì)列服務(wù)器實(shí)體邦投。
- Exchange:消息交換機(jī)伤锚,它指定消息按什么規(guī)則,路由到哪個隊(duì)列志衣。
- Queue:消息隊(duì)列載體屯援,每個消息都會被投入到一個或多個隊(duì)列。
- Binding:綁定念脯,它的作用就是把Exchange和Queue按照路由規(guī)則綁定起來狞洋。
- Routing Key:路由關(guān)鍵字,Exchange根據(jù)這個關(guān)鍵字進(jìn)行消息投遞绿店。
- vhost:虛擬主機(jī)吉懊,一個broker里可以開設(shè)多個vhost,用作不同用戶的權(quán)限分離假勿。
- producer:消息生產(chǎn)者借嗽,就是投遞消息的程序。
- consumer:消息消費(fèi)者转培,就是接受消息的程序恶导。
- channel:消息通道,在客戶端的每個連接里堡距,可建立多個channel甲锡,每個channel代表一個會話任務(wù)兆蕉。
消息隊(duì)列的使用過程,如下:
- 客戶端連接到消息隊(duì)列服務(wù)器缤沦,打開一個channel虎韵。
- 客戶端聲明一個exchange,并設(shè)置相關(guān)屬性缸废。
- 客戶端聲明一個queue包蓝,并設(shè)置相關(guān)屬性。
- 客戶端使用routing key企量,在exchange和queue之間建立好綁定關(guān)系测萎。
- 客戶端投遞消息到exchange。
exchange接收到消息后届巩,就根據(jù)消息的key和已經(jīng)設(shè)置的binding硅瞧,進(jìn)行消息路由,將消息投遞到一個或多個隊(duì)列里恕汇。
5.3 ZeroMQ
號稱史上最快的消息隊(duì)列腕唧,它實(shí)際類似于Socket的一系列接口,他跟Socket的區(qū)別是:普通的socket是端到端的(1:1的關(guān)系)瘾英,而ZMQ卻是可以N:M 的關(guān)系枣接,人們對BSD套接字的了解較多的是點(diǎn)對點(diǎn)的連接,點(diǎn)對點(diǎn)連接需要顯式地建立連接缺谴、銷毀連接但惶、選擇協(xié)議(TCP/UDP)和處理錯誤等,而ZMQ屏蔽了這些細(xì)節(jié)湿蛔,讓你的網(wǎng)絡(luò)編程更為簡單膀曾。ZMQ用于node與node間的通信,node可以是主機(jī)或者是進(jìn)程阳啥。
引用官方的說法: “ZMQ(以下ZeroMQ簡稱ZMQ)是一個簡單好用的傳輸層妓肢,像框架一樣的一個socket library,他使得Socket編程更加簡單苫纤、簡潔和性能更高碉钠。是一個消息處理隊(duì)列庫,可在多個線程卷拘、內(nèi)核和主機(jī)盒之間彈性伸縮喊废。ZMQ的明確目標(biāo)是“成為標(biāo)準(zhǔn)網(wǎng)絡(luò)協(xié)議棧的一部分,之后進(jìn)入Linux內(nèi)核”±醯埽現(xiàn)在還未看到它們的成功污筷。但是,它無疑是極具前景的、并且是人們更加需要的“傳統(tǒng)”BSD套接字之上的一層封裝瓣蛀。ZMQ讓編寫高性能網(wǎng)絡(luò)應(yīng)用程序極為簡單和有趣陆蟆。”
特點(diǎn)是:
- 高性能惋增,非持久化叠殷;
- 跨平臺:支持Linux、Windows诈皿、OS X等林束。
- 多語言支持; C稽亏、C++壶冒、Java、.NET截歉、Python等30多種開發(fā)語言胖腾。
- 可單獨(dú)部署或集成到應(yīng)用中使用;
- 可作為Socket通信庫使用瘪松。
與RabbitMQ相比胸嘁,ZMQ并不像是一個傳統(tǒng)意義上的消息隊(duì)列服務(wù)器,事實(shí)上凉逛,它也根本不是一個服務(wù)器,更像一個底層的網(wǎng)絡(luò)通訊庫群井,在Socket API之上做了一層封裝状飞,將網(wǎng)絡(luò)通訊、進(jìn)程通訊和線程通訊抽象為統(tǒng)一的API接口书斜。支持“Request-Reply “诬辈,”Publisher-Subscriber“,”Parallel Pipeline”三種基本模型和擴(kuò)展模型荐吉。
ZeroMQ高性能設(shè)計(jì)要點(diǎn):
- 無鎖的隊(duì)列模型
對于跨線程間的交互(用戶端和session)之間的數(shù)據(jù)交換通道pipe焙糟,采用無鎖的隊(duì)列算法CAS;在pipe兩端注冊有異步事件样屠,在讀或者寫消息到pipe的時穿撮,會自動觸發(fā)讀寫事件。 - 批量處理的算法
對于傳統(tǒng)的消息處理痪欲,每個消息在發(fā)送和接收的時候悦穿,都需要系統(tǒng)的調(diào)用,這樣對于大量的消息业踢,系統(tǒng)的開銷比較大栗柒,zeroMQ對于批量的消息,進(jìn)行了適應(yīng)性的優(yōu)化知举,可以批量的接收和發(fā)送消息瞬沦。 - 多核下的線程綁定太伊,無須CPU切換
區(qū)別于傳統(tǒng)的多線程并發(fā)模式,信號量或者臨界區(qū)逛钻, zeroMQ充分利用多核的優(yōu)勢僚焦,每個核綁定運(yùn)行一個工作者線程,避免多線程之間的CPU切換開銷绣的。
5.4 Kafka
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)叠赐,它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動作流數(shù)據(jù)。 這種動作(網(wǎng)頁瀏覽屡江,搜索和其他用戶的行動)是在現(xiàn)代網(wǎng)絡(luò)上的許多社會功能的一個關(guān)鍵因素芭概。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。 對于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng)惩嘉,但又要求實(shí)時處理的限制罢洲,這是一個可行的解決方案。Kafka的目的是通過Hadoop的并行加載機(jī)制來統(tǒng)一線上和離線的消息處理文黎,也是為了通過集群機(jī)來提供實(shí)時的消費(fèi)惹苗。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),有如下特性:
- 通過O(1)的磁盤數(shù)據(jù)結(jié)構(gòu)提供消息的持久化耸峭,這種結(jié)構(gòu)對于即使數(shù)以TB的消息存儲也能夠保持長時間的穩(wěn)定性能桩蓉。(文件追加的方式寫入數(shù)據(jù),過期的數(shù)據(jù)定期刪除)
- 高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數(shù)百萬的消息劳闹。
- 支持通過Kafka服務(wù)器和消費(fèi)機(jī)集群來分區(qū)消息院究。
- 支持Hadoop并行數(shù)據(jù)加載。
Kafka相關(guān)概念
Broker
Kafka集群包含一個或多個服務(wù)器本涕,這種服務(wù)器被稱為broker
Topic
每條發(fā)布到Kafka集群的消息都有一個類別业汰,這個類別被稱為Topic。(物理上不同Topic的消息分開存儲菩颖,邏輯上一個Topic的消息雖然保存于一個或多個broker上但用戶只需指定消息的Topic即可生產(chǎn)或消費(fèi)數(shù)據(jù)而不必關(guān)心數(shù)據(jù)存于何處)
Partition
Parition是物理上的概念样漆,每個Topic包含一個或多個Partition.
Producer
負(fù)責(zé)發(fā)布消息到Kafka Broker
Consumer
消息消費(fèi)者,向Kafka Broker讀取消息的客戶端晦闰。
Consumer Group
每個Consumer屬于一個特定的Consumer Group(可為每個Consumer指定group name放祟,若不指定group name則屬于默認(rèn)的group)。
Kafka一般應(yīng)用在大數(shù)據(jù)日志處理或?qū)?shí)時性(少量延遲)呻右,可靠性(少量丟數(shù)據(jù))要求稍低的場景使用舞竿。
六、參考資料
以下是本次分享參考的資料和推薦大家參考的資料窿冯。
參考資料(可參考資料):
JMS
點(diǎn)對點(diǎn)和發(fā)布訂閱模型的對比
深入淺出JMS(一)--JMS基本概念
RabbitMQ
百度百科-RabbitMQ
柯南君:看大數(shù)據(jù)時代下的IT架構(gòu)(2)消息隊(duì)列之RabbitMQ-基礎(chǔ)概念詳細(xì)介紹
Zero MQ
高性能的通訊庫-zeroMQ的幾個高性能特征
百度文庫-ZeroMQ使用環(huán)境和結(jié)構(gòu)詳細(xì)分析
Kafka
百度百科-Kafka
Apache Kafka:下一代分布式消息系統(tǒng)
kafka:一個分布式消息系統(tǒng)
參考:
大型網(wǎng)站架構(gòu)系列:分布式消息隊(duì)列(一)
大型網(wǎng)站架構(gòu)系列:消息隊(duì)列(二)