一北专、消息隊(duì)列概述
消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件禀挫,主要解決應(yīng)用解耦,異步消息拓颓,流量削鋒等問(wèn)題语婴,實(shí)現(xiàn)高性能,高可用驶睦,可伸縮和最終一致性架構(gòu)砰左。目前使用較多的消息隊(duì)列有ActiveMQ,RabbitMQ场航,ZeroMQ缠导,Kafka,MetaMQ溉痢,RocketMQ
二僻造、消息隊(duì)列應(yīng)用場(chǎng)景
以下介紹消息隊(duì)列在實(shí)際應(yīng)用中常用的使用場(chǎng)景憋他。異步處理,應(yīng)用解耦髓削,流量削鋒和消息通訊四個(gè)場(chǎng)景竹挡。
2.1異步處理
場(chǎng)景說(shuō)明:用戶注冊(cè)后,需要發(fā)注冊(cè)郵件和注冊(cè)短信立膛。傳統(tǒng)的做法有兩種 1.串行的方式揪罕;2.并行方式
a、串行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后宝泵,發(fā)送注冊(cè)郵件好啰,再發(fā)送注冊(cè)短信。以上三個(gè)任務(wù)全部完成后儿奶,返回給客戶端坎怪。
b、并行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后廓握,發(fā)送注冊(cè)郵件的同時(shí)搅窿,發(fā)送注冊(cè)短信。以上三個(gè)任務(wù)完成后隙券,返回給客戶端男应。與串行的差別是,并行的方式可以提高處理的時(shí)間
假設(shè)三個(gè)業(yè)務(wù)節(jié)點(diǎn)每個(gè)使用50毫秒鐘娱仔,不考慮網(wǎng)絡(luò)等其他開(kāi)銷(xiāo)沐飘,則串行方式的時(shí)間是150毫秒,并行的時(shí)間可能是100毫秒牲迫。
因?yàn)镃PU在單位時(shí)間內(nèi)處理的請(qǐng)求數(shù)是一定的耐朴,假設(shè)CPU1秒內(nèi)吞吐量是100次。則串行方式1秒內(nèi)CPU可處理的請(qǐng)求量是7次(1000/150)盹憎。并行方式處理的請(qǐng)求量是10次(1000/100)
小結(jié):如以上案例描述筛峭,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量,吞吐量陪每,響應(yīng)時(shí)間)會(huì)有瓶頸影晓。如何解決這個(gè)問(wèn)題呢?
引入消息隊(duì)列檩禾,將不是必須的業(yè)務(wù)邏輯挂签,異步處理。改造后的架構(gòu)如下:
按照以上約定盼产,用戶的響應(yīng)時(shí)間相當(dāng)于是注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)的時(shí)間饵婆,也就是50毫秒。注冊(cè)郵件戏售,發(fā)送短信寫(xiě)入消息隊(duì)列后侨核,直接返回草穆,因此寫(xiě)入消息隊(duì)列的速度很快,基本可以忽略芹关,因此用戶的響應(yīng)時(shí)間可能是50毫秒续挟。因此架構(gòu)改變后紧卒,系統(tǒng)的吞吐量提高到每秒20 QPS侥衬。比串行提高了3倍,比并行提高了兩倍跑芳。
2.2應(yīng)用解耦
場(chǎng)景說(shuō)明:用戶下單后轴总,訂單系統(tǒng)需要通知庫(kù)存系統(tǒng)。傳統(tǒng)的做法是博个,訂單系統(tǒng)調(diào)用庫(kù)存系統(tǒng)的接口怀樟。如下圖:
傳統(tǒng)模式的缺點(diǎn):假如庫(kù)存系統(tǒng)無(wú)法訪問(wèn),則訂單減庫(kù)存將失敗盆佣,從而導(dǎo)致訂單失敗往堡,訂單系統(tǒng)與庫(kù)存系統(tǒng)耦合
如何解決以上問(wèn)題呢?引入應(yīng)用消息隊(duì)列后的方案共耍,如下圖:
訂單系統(tǒng):用戶下單后虑灰,訂單系統(tǒng)完成持久化處理,將消息寫(xiě)入消息隊(duì)列痹兜,返回用戶訂單下單成功
庫(kù)存系統(tǒng):訂閱下單的消息穆咐,采用拉/推的方式,獲取下單信息字旭,庫(kù)存系統(tǒng)根據(jù)下單信息对湃,進(jìn)行庫(kù)存操作
假如:在下單時(shí)庫(kù)存系統(tǒng)不能正常使用。也不影響正常下單遗淳,因?yàn)橄聠魏笈钠猓唵蜗到y(tǒng)寫(xiě)入消息隊(duì)列就不再關(guān)心其他的后續(xù)操作了。實(shí)現(xiàn)訂單系統(tǒng)與庫(kù)存系統(tǒng)的應(yīng)用解耦
2.3流量削鋒
流量削鋒也是消息隊(duì)列中的常用場(chǎng)景屈暗,一般在秒殺或團(tuán)搶活動(dòng)中使用廣泛斤儿。
應(yīng)用場(chǎng)景:秒殺活動(dòng),一般會(huì)因?yàn)榱髁窟^(guò)大恐锦,導(dǎo)致流量暴增往果,應(yīng)用掛掉。為解決這個(gè)問(wèn)題一铅,一般需要在應(yīng)用前端加入消息隊(duì)列陕贮。
a、可以控制活動(dòng)的人數(shù)
b潘飘、可以緩解短時(shí)間內(nèi)高流量壓垮應(yīng)用
用戶的請(qǐng)求肮之,服務(wù)器接收后掉缺,首先寫(xiě)入消息隊(duì)列。假如消息隊(duì)列長(zhǎng)度超過(guò)最大數(shù)量戈擒,則直接拋棄用戶請(qǐng)求或跳轉(zhuǎn)到錯(cuò)誤頁(yè)面眶明。
秒殺業(yè)務(wù)根據(jù)消息隊(duì)列中的請(qǐng)求信息,再做后續(xù)處理
2.4日志處理
日志處理是指將消息隊(duì)列用在日志處理中筐高,比如Kafka的應(yīng)用搜囱,解決大量日志傳輸?shù)膯?wèn)題。架構(gòu)簡(jiǎn)化如下
日志采集客戶端柑土,負(fù)責(zé)日志數(shù)據(jù)采集蜀肘,定時(shí)寫(xiě)受寫(xiě)入Kafka隊(duì)列
Kafka消息隊(duì)列,負(fù)責(zé)日志數(shù)據(jù)的接收稽屏,存儲(chǔ)和轉(zhuǎn)發(fā)
日志處理應(yīng)用:訂閱并消費(fèi)kafka隊(duì)列中的日志數(shù)據(jù)
2.5消息通訊
消息通訊是指扮宠,消息隊(duì)列一般都內(nèi)置了高效的通信機(jī)制,因此也可以用在純的消息通訊狐榔。比如實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)消息隊(duì)列坛增,或者聊天室等
點(diǎn)對(duì)點(diǎn)通訊:
客戶端A和客戶端B使用同一隊(duì)列,進(jìn)行消息通訊薄腻。
聊天室通訊:
客戶端A收捣,客戶端B,客戶端N訂閱同一主題被廓,進(jìn)行消息發(fā)布和接收坏晦。實(shí)現(xiàn)類(lèi)似聊天室效果。
以上實(shí)際是消息隊(duì)列的兩種消息模式嫁乘,點(diǎn)對(duì)點(diǎn)或發(fā)布訂閱模式昆婿。模型為示意圖,供參考蜓斧。
三仓蛆、消息中間件示例
3.1電商系統(tǒng)
消息隊(duì)列采用高可用,可持久化的消息中間件挎春。比如Active MQ看疙,Rabbit MQ,Rocket Mq直奋。
(1)應(yīng)用將主干邏輯處理完成后能庆,寫(xiě)入消息隊(duì)列。消息發(fā)送是否成功可以開(kāi)啟消息的確認(rèn)模式脚线。(消息隊(duì)列返回消息接收成功狀態(tài)后搁胆,應(yīng)用再返回捐韩,這樣保障消息的完整性)
(2)擴(kuò)展流程(發(fā)短信她按,配送處理)訂閱隊(duì)列消息地沮。采用推或拉的方式獲取消息并處理镰禾。
(3)消息將應(yīng)用解耦的同時(shí),帶來(lái)了數(shù)據(jù)一致性問(wèn)題顾腊,可以采用最終一致性方式解決粤铭。比如主數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù),擴(kuò)展應(yīng)用根據(jù)消息隊(duì)列杂靶,并結(jié)合數(shù)據(jù)庫(kù)方式實(shí)現(xiàn)基于消息隊(duì)列的后續(xù)處理梆惯。
3.2日志收集系統(tǒng)
分為Zookeeper注冊(cè)中心,日志收集客戶端伪煤,Kafka集群和Storm集群(OtherApp)四部分組成加袋。
Zookeeper注冊(cè)中心凛辣,提出負(fù)載均衡和地址查找服務(wù)
日志收集客戶端抱既,用于采集應(yīng)用系統(tǒng)的日志,并將數(shù)據(jù)推送到kafka隊(duì)列
Kafka集群:接收扁誓,路由防泵,存儲(chǔ),轉(zhuǎn)發(fā)等消息處理
Storm集群:與OtherApp處于同一級(jí)別蝗敢,采用拉的方式消費(fèi)隊(duì)列中的數(shù)據(jù)
四捷泞、JMS消息服務(wù)
講消息隊(duì)列就不得不提JMS 。JMS(JAVA Message Service寿谴,java消息服務(wù))API是一個(gè)消息服務(wù)的標(biāo)準(zhǔn)/規(guī)范锁右,允許應(yīng)用程序組件基于JavaEE平臺(tái)創(chuàng)建、發(fā)送讶泰、接收和讀取消息咏瑟。它使分布式通信耦合度更低,消息服務(wù)更加可靠以及異步性痪署。
在EJB架構(gòu)中码泞,有消息bean可以無(wú)縫的與JM消息服務(wù)集成。在J2EE架構(gòu)模式中狼犯,有消息服務(wù)者模式余寥,用于實(shí)現(xiàn)消息與應(yīng)用直接的解耦。
4.1消息模型
在JMS標(biāo)準(zhǔn)中悯森,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)宋舷。
4.1.1 P2P模式
P2P模式包含三個(gè)角色:消息隊(duì)列(Queue),發(fā)送者(Sender)瓢姻,接收者(Receiver)祝蝠。每個(gè)消息都被發(fā)送到一個(gè)特定的隊(duì)列,接收者從隊(duì)列中獲取消息。隊(duì)列保留著消息续膳,直到他們被消費(fèi)或超時(shí)改艇。
P2P的特點(diǎn)
每個(gè)消息只有一個(gè)消費(fèi)者(Consumer)(即一旦被消費(fèi),消息就不再在消息隊(duì)列中)
發(fā)送者和接收者之間在時(shí)間上沒(méi)有依賴性坟岔,也就是說(shuō)當(dāng)發(fā)送者發(fā)送了消息之后谒兄,不管接收者有沒(méi)有正在運(yùn)行,它不會(huì)影響到消息被發(fā)送到隊(duì)列
接收者在成功接收消息之后需向隊(duì)列應(yīng)答成功
如果希望發(fā)送的每個(gè)消息都會(huì)被成功處理的話社付,那么需要P2P模式承疲。
4.1.2 Pub/Sub模式
包含三個(gè)角色主題(Topic),發(fā)布者(Publisher)鸥咖,訂閱者(Subscriber) 多個(gè)發(fā)布者將消息發(fā)送到Topic燕鸽,系統(tǒng)將這些消息傳遞給多個(gè)訂閱者。
Pub/Sub的特點(diǎn)
每個(gè)消息可以有多個(gè)消費(fèi)者
發(fā)布者和訂閱者之間有時(shí)間上的依賴性啼辣。針對(duì)某個(gè)主題(Topic)的訂閱者啊研,它必須創(chuàng)建一個(gè)訂閱者之后,才能消費(fèi)發(fā)布者的消息
為了消費(fèi)消息鸥拧,訂閱者必須保持運(yùn)行的狀態(tài)
為了緩和這樣嚴(yán)格的時(shí)間相關(guān)性党远,JMS允許訂閱者創(chuàng)建一個(gè)可持久化的訂閱。這樣富弦,即使訂閱者沒(méi)有被激活(運(yùn)行)沟娱,它也能接收到發(fā)布者的消息。
如果希望發(fā)送的消息可以不被做任何處理腕柜、或者只被一個(gè)消息者處理济似、或者可以被多個(gè)消費(fèi)者處理的話,那么可以采用Pub/Sub模型盏缤。
4.2消息消費(fèi)
在JMS中砰蠢,消息的產(chǎn)生和消費(fèi)都是異步的。對(duì)于消費(fèi)來(lái)說(shuō)蛾找,JMS的消息者可以通過(guò)兩種方式來(lái)消費(fèi)消息娩脾。
(1)同步
訂閱者或接收者通過(guò)receive方法來(lái)接收消息,receive方法在接收到消息之前(或超時(shí)之前)將一直阻塞打毛;
(2)異步
訂閱者或接收者可以注冊(cè)為一個(gè)消息監(jiān)聽(tīng)器柿赊。當(dāng)消息到達(dá)之后,系統(tǒng)自動(dòng)調(diào)用監(jiān)聽(tīng)器的onMessage方法幻枉。
JNDI:Java命名和目錄接口,是一種標(biāo)準(zhǔn)的Java命名系統(tǒng)接口碰声。可以在網(wǎng)絡(luò)上查找和訪問(wèn)服務(wù)熬甫。通過(guò)指定一個(gè)資源名稱胰挑,該名稱對(duì)應(yīng)于數(shù)據(jù)庫(kù)或命名服務(wù)中的一個(gè)記錄,同時(shí)返回資源連接建立所必須的信息。
JNDI在JMS中起到查找和訪問(wèn)發(fā)送目標(biāo)或消息來(lái)源的作用瞻颂。
五豺谈、常用消息隊(duì)列
一般商用的容器,比如WebLogic贡这,JBoss茬末,都支持JMS標(biāo)準(zhǔn),開(kāi)發(fā)上很方便盖矫。但免費(fèi)的比如Tomcat丽惭,Jetty等則需要使用第三方的消息中間件。本部分內(nèi)容介紹常用的消息中間件(Active MQ,Rabbit MQ辈双,Zero MQ,Kafka)以及他們的特點(diǎn)责掏。
5.1 ActiveMQ
ActiveMQ 是Apache出品,最流行的湃望,能力強(qiáng)勁的開(kāi)源消息總線换衬。ActiveMQ 是一個(gè)完全支持JMS1.1和J2EE 1.4規(guī)范的 JMS Provider實(shí)現(xiàn),盡管JMS規(guī)范出臺(tái)已經(jīng)是很久的事情了喜爷,但是JMS在當(dāng)今的J2EE應(yīng)用中間仍然扮演著特殊的地位冗疮。
ActiveMQ特性如下:
⒈ 多種語(yǔ)言和協(xié)議編寫(xiě)客戶端萄唇。語(yǔ)言: Java,C,C++,C#,Ruby,Perl,Python,PHP檩帐。應(yīng)用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP
⒉ 完全支持JMS1.1和J2EE 1.4規(guī)范 (持久化,XA消息另萤,事務(wù))
⒊ 對(duì)Spring的支持湃密,ActiveMQ可以很容易內(nèi)嵌到使用Spring的系統(tǒng)里面去,而且也支持Spring2.0的特性
⒋ 通過(guò)了常見(jiàn)J2EE服務(wù)器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測(cè)試四敞,其中通過(guò)JCA 1.5 resource adaptors的配置泛源,可以讓ActiveMQ可以自動(dòng)的部署到任何兼容J2EE 1.4 商業(yè)服務(wù)器上
⒌ 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
⒍ 支持通過(guò)JDBC和journal提供高速的消息持久化
⒎ 從設(shè)計(jì)上保證了高性能的集群,客戶端-服務(wù)器忿危,點(diǎn)對(duì)點(diǎn)
⒏ 支持Ajax
⒐ 支持與Axis的整合
⒑ 可以很容易得調(diào)用內(nèi)嵌JMS provider达箍,進(jìn)行測(cè)試
5.2 Kafka
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)铺厨。 這種動(dòng)作(網(wǎng)頁(yè)瀏覽缎玫,搜索和其他用戶的行動(dòng))是在現(xiàn)代網(wǎng)絡(luò)上的許多社會(huì)功能的一個(gè)關(guān)鍵因素。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過(guò)處理日志和日志聚合來(lái)解決解滓。 對(duì)于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng)赃磨,但又要求實(shí)時(shí)處理的限制,這是一個(gè)可行的解決方案洼裤。Kafka的目的是通過(guò)Hadoop的并行加載機(jī)制來(lái)統(tǒng)一線上和離線的消息處理邻辉,也是為了通過(guò)集群機(jī)來(lái)提供實(shí)時(shí)的消費(fèi)。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),有如下特性:
通過(guò)O(1)的磁盤(pán)數(shù)據(jù)結(jié)構(gòu)提供消息的持久化值骇,這種結(jié)構(gòu)對(duì)于即使數(shù)以TB的消息存儲(chǔ)也能夠保持長(zhǎng)時(shí)間的穩(wěn)定性能莹菱。(文件追加的方式寫(xiě)入數(shù)據(jù),過(guò)期的數(shù)據(jù)定期刪除)
高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數(shù)百萬(wàn)的消息
支持通過(guò)Kafka服務(wù)器和消費(fèi)機(jī)集群來(lái)分區(qū)消息
支持Hadoop并行數(shù)據(jù)加載
Kafka相關(guān)概念
Broker
Kafka集群包含一個(gè)或多個(gè)服務(wù)器吱瘩,這種服務(wù)器被稱為broker[5]
Topic
每條發(fā)布到Kafka集群的消息都有一個(gè)類(lèi)別芒珠,這個(gè)類(lèi)別被稱為T(mén)opic。(物理上不同Topic的消息分開(kāi)存儲(chǔ)搅裙,邏輯上一個(gè)Topic的消息雖然保存于一個(gè)或多個(gè)broker上但用戶只需指定消息的Topic即可生產(chǎn)或消費(fèi)數(shù)據(jù)而不必關(guān)心數(shù)據(jù)存于何處)
Partition
Parition是物理上的概念皱卓,每個(gè)Topic包含一個(gè)或多個(gè)Partition.
Producer
負(fù)責(zé)發(fā)布消息到Kafka broker
Consumer
消息消費(fèi)者,向Kafka broker讀取消息的客戶端部逮。
Consumer Group
每個(gè)Consumer屬于一個(gè)特定的Consumer Group(可為每個(gè)Consumer指定group name娜汁,若不指定group name則屬于默認(rèn)的group)。
一般應(yīng)用在大數(shù)據(jù)日志處理或?qū)?shí)時(shí)性(少量延遲)兄朋,可靠性(少量丟數(shù)據(jù))要求稍低的場(chǎng)景使用掐禁。