一种柑、消息隊(duì)列概述
消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件岗仑,主要解決應(yīng)用解耦,異步消息聚请,流量削鋒等問(wèn)題荠雕,實(shí)現(xiàn)高性能,高可用良漱,可伸縮和最終一致性架構(gòu)舞虱。目前使用較多的消息隊(duì)列有ActiveMQ,RabbitMQ母市,ZeroMQ矾兜,Kafka,MetaMQ患久,RocketMQ
二椅寺、消息隊(duì)列應(yīng)用場(chǎng)景
以下介紹消息隊(duì)列在實(shí)際應(yīng)用中常用的使用場(chǎng)景。異步處理蒋失,應(yīng)用解耦返帕,流量削鋒和消息通訊四個(gè)場(chǎng)景。
2.1 異步處理
場(chǎng)景說(shuō)明:用戶注冊(cè)后篙挽,需要發(fā)注冊(cè)郵件和注冊(cè)短信荆萤。傳統(tǒng)的做法有兩種 1.串行的方式;2.并行方式
a铣卡、串行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后链韭,發(fā)送注冊(cè)郵件,再發(fā)送注冊(cè)短信煮落。以上三個(gè)任務(wù)全部完成后敞峭,返回給客戶端。
b蝉仇、并行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后旋讹,發(fā)送注冊(cè)郵件的同時(shí),發(fā)送注冊(cè)短信轿衔。以上三個(gè)任務(wù)完成后沉迹,返回給客戶端。與串行的差別是害驹,并行的方式可以提高處理的時(shí)間
假設(shè)三個(gè)業(yè)務(wù)節(jié)點(diǎn)每個(gè)使用50毫秒鐘鞭呕,不考慮網(wǎng)絡(luò)等其他開(kāi)銷(xiāo),則串行方式的時(shí)間是150毫秒裙秋,并行的時(shí)間可能是100毫秒琅拌。
因?yàn)镃PU在單位時(shí)間內(nèi)處理的請(qǐng)求數(shù)是一定的,假設(shè)CPU1秒內(nèi)吞吐量是100次摘刑。則串行方式1秒內(nèi)CPU可處理的請(qǐng)求量是7次(1000/150)进宝。并行方式處理的請(qǐng)求量是10次(1000/100)
小結(jié):如以上案例描述,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量枷恕,吞吐量党晋,響應(yīng)時(shí)間)會(huì)有瓶頸。如何解決這個(gè)問(wèn)題呢徐块? 引入消息隊(duì)列未玻,將不是必須的業(yè)務(wù)邏輯,異步處理胡控。改造后的架構(gòu)如下:
按照以上約定扳剿,用戶的響應(yīng)時(shí)間相當(dāng)于是注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)的時(shí)間,也就是50毫秒昼激。注冊(cè)郵件庇绽,發(fā)送短信寫(xiě)入消息隊(duì)列后,直接返回橙困,因此寫(xiě)入消息隊(duì)列的速度很快瞧掺,基本可以忽略,因此用戶的響應(yīng)時(shí)間可能是50毫秒凡傅。因此架構(gòu)改變后辟狈,系統(tǒng)的吞吐量提高到每秒20 QPS。比串行提高了3倍夏跷,比并行提高了兩倍哼转。
2.2應(yīng)用解耦
場(chǎng)景說(shuō)明:用戶下單后,訂單系統(tǒng)需要通知庫(kù)存系統(tǒng)拓春。傳統(tǒng)的做法是释簿,訂單系統(tǒng)調(diào)用庫(kù)存系統(tǒng)的接口。如下圖:
訂單系統(tǒng):用戶下單后,訂單系統(tǒng)完成持久化處理匆光,將消息寫(xiě)入消息隊(duì)列套像,返回用戶訂單下單成功
庫(kù)存系統(tǒng):訂閱下單的消息,采用拉/推的方式终息,獲取下單信息夺巩,庫(kù)存系統(tǒng)根據(jù)下單信息贞让,進(jìn)行庫(kù)存操作
假如:在下單時(shí)庫(kù)存系統(tǒng)不能正常使用。也不影響正常下單柳譬,因?yàn)橄聠魏笤牛唵蜗到y(tǒng)寫(xiě)入消息隊(duì)列就不再關(guān)心其他的后續(xù)操作了。實(shí)現(xiàn)訂單系統(tǒng)與庫(kù)存系統(tǒng)的應(yīng)用解耦
2.3 流量削鋒
流量削鋒也是消息隊(duì)列中的常用場(chǎng)景美澳,一般在秒殺或團(tuán)搶活動(dòng)中使用廣泛
销部。
應(yīng)用場(chǎng)景:秒殺活動(dòng),一般會(huì)因?yàn)榱髁窟^(guò)大制跟,導(dǎo)致流量暴增舅桩,應(yīng)用掛掉。為解決這個(gè)問(wèn)題雨膨,一般需要在應(yīng)用前端加入消息隊(duì)列擂涛。
a、可以控制活動(dòng)的人數(shù)
b哥放、可以緩解短時(shí)間內(nèi)高流量壓垮應(yīng)用
用戶的請(qǐng)求歼指,服務(wù)器接收后,首先寫(xiě)入消息隊(duì)列甥雕。假如消息隊(duì)列長(zhǎng)度超過(guò)最大數(shù)量踩身,則直接拋棄用戶請(qǐng)求或跳轉(zhuǎn)到錯(cuò)誤頁(yè)面。秒殺業(yè)務(wù)根據(jù)消息隊(duì)列中的請(qǐng)求信息社露,再做后續(xù)處理
2.4 日志處理
日志處理是指將消息隊(duì)列用在日志處理中挟阻,比如Kafka的應(yīng)用,解決大量日志傳輸?shù)膯?wèn)題峭弟。架構(gòu)簡(jiǎn)化如下
日志采集客戶端附鸽,負(fù)責(zé)日志數(shù)據(jù)采集,定時(shí)寫(xiě)受寫(xiě)入Kafka隊(duì)列
Kafka消息隊(duì)列瞒瘸,負(fù)責(zé)日志數(shù)據(jù)的接收坷备,存儲(chǔ)和轉(zhuǎn)發(fā)
日志處理應(yīng)用:訂閱并消費(fèi)kafka隊(duì)列中的日志數(shù)據(jù)
2.5 消息通訊
消息通訊是指,消息隊(duì)列一般都內(nèi)置了高效的通信機(jī)制情臭,因此也可以用在純的消息通訊
省撑。比如實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)消息隊(duì)列,或者聊天室等
點(diǎn)對(duì)點(diǎn)通訊:
客戶端A和客戶端B使用同一隊(duì)列俯在,進(jìn)行消息通訊竟秫。
聊天室通訊:
客戶端A,客戶端B跷乐,客戶端N訂閱同一主題肥败,進(jìn)行消息發(fā)布和接收。實(shí)現(xiàn)類(lèi)似聊天室效果。
以上實(shí)際是消息隊(duì)列的兩種消息模式馒稍,點(diǎn)對(duì)點(diǎn)或發(fā)布訂閱模式皿哨。模型為示意圖,供參考纽谒。
三往史、消息中間件示例
3.1 電商系統(tǒng)
消息隊(duì)列采用高可用,可持久化的消息中間件佛舱。比如Active MQ,Rabbit MQ挨决,Rocket Mq请祖。
(1)應(yīng)用將主干邏輯處理完成后,寫(xiě)入消息隊(duì)列脖祈。消息發(fā)送是否成功可以開(kāi)啟消息的確認(rèn)模式肆捕。(消息隊(duì)列返回消息接收成功狀態(tài)后,應(yīng)用再返回盖高,這樣保障消息的完整性)
(2)擴(kuò)展流程(發(fā)短信慎陵,配送處理)訂閱隊(duì)列消息。采用推或拉的方式獲取消息并處理喻奥。
(3)消息將應(yīng)用解耦的同時(shí)席纽,帶來(lái)了數(shù)據(jù)一致性問(wèn)題,可以采用最終一致性方式解決撞蚕。比如主數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)润梯,擴(kuò)展應(yīng)用根據(jù)消息隊(duì)列,并結(jié)合數(shù)據(jù)庫(kù)方式實(shí)現(xiàn)基于消息隊(duì)列的后續(xù)處理甥厦。
3.2日志收集系統(tǒng)
分為Zookeeper注冊(cè)中心纺铭,日志收集客戶端,Kafka集群和Storm集群(OtherApp)四部分組成刀疙。
Zookeeper注冊(cè)中心舶赔,提出負(fù)載均衡和地址查找服務(wù)
日志收集客戶端,用于采集應(yīng)用系統(tǒng)的日志谦秧,并將數(shù)據(jù)推送到kafka隊(duì)列
Kafka集群:接收竟纳,路由,存儲(chǔ)油够,轉(zhuǎn)發(fā)等消息處理
Storm集群:與OtherApp處于同一級(jí)別蚁袭,采用拉的方式消費(fèi)隊(duì)列中的數(shù)據(jù)
四、JMS消息服務(wù)
講消息隊(duì)列就不得不提JMS 石咬。JMS(JAVA Message Service揩悄,java消息服務(wù))API是一個(gè)消息服務(wù)的標(biāo)準(zhǔn)/規(guī)范,允許應(yīng)用程序組件基于JavaEE平臺(tái)創(chuàng)建鬼悠、發(fā)送删性、接收和讀取消息亏娜。它使分布式通信耦合度更低,消息服務(wù)更加可靠以及異步性蹬挺。在EJB架構(gòu)中维贺,有消息bean可以無(wú)縫的與JM消息服務(wù)集成。在J2EE架構(gòu)模式中巴帮,有消息服務(wù)者模式溯泣,用于實(shí)現(xiàn)消息與應(yīng)用直接的解耦。
4.1 消息模型
在JMS標(biāo)準(zhǔn)中榕茧,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)垃沦。
4.1.1 P2P模式
P2P的特點(diǎn)
每個(gè)消息只有一個(gè)消費(fèi)者(Consumer)(即一旦被消費(fèi)缎讼,消息就不再在消息隊(duì)列中)
發(fā)送者和接收者之間在時(shí)間上沒(méi)有依賴性收夸,也就是說(shuō)當(dāng)發(fā)送者發(fā)送了消息之后,不管接收者有沒(méi)有正在運(yùn)行血崭,它不會(huì)影響到消息被發(fā)送到隊(duì)列
接收者在成功接收消息之后需向隊(duì)列應(yīng)答成功
如果希望發(fā)送的每個(gè)消息都會(huì)被成功處理的話咱圆,那么需要P2P模式。
4.1.2 Pub/Sub模式
包含三個(gè)角色主題(Topic)功氨,發(fā)布者(Publisher)序苏,訂閱者(Subscriber) 多個(gè)發(fā)布者將消息發(fā)送到Topic,系統(tǒng)將這些消息傳遞給多個(gè)訂閱者捷凄。
Pub/Sub的特點(diǎn)
每個(gè)消息可以有多個(gè)消費(fèi)者
發(fā)布者和訂閱者之間有時(shí)間上的依賴性忱详。針對(duì)某個(gè)主題(Topic)的訂閱者,它必須創(chuàng)建一個(gè)訂閱者之后跺涤,才能消費(fèi)發(fā)布者的消息
為了消費(fèi)消息匈睁,訂閱者必須保持運(yùn)行的狀態(tài)
為了緩和這樣嚴(yán)格的時(shí)間相關(guān)性,JMS允許訂閱者創(chuàng)建一個(gè)可持久化的訂閱桶错。這樣航唆,即使訂閱者沒(méi)有被激活(運(yùn)行),它也能接收到發(fā)布者的消息院刁。
如果希望發(fā)送的消息可以不被做任何處理糯钙、或者只被一個(gè)消息者處理、或者可以被多個(gè)消費(fèi)者處理的話,那么可以采用Pub/Sub模型任岸。
4.2 消息消費(fèi)
在JMS中再榄,消息的產(chǎn)生和消費(fèi)都是異步的。對(duì)于消費(fèi)來(lái)說(shuō)享潜,JMS的消息者可以通過(guò)兩種方式來(lái)消費(fèi)消息困鸥。
(1)同步
訂閱者或接收者通過(guò)receive方法來(lái)接收消息,receive方法在接收到消息之前(或超時(shí)之前)將一直阻塞剑按;
(2)異步
訂閱者或接收者可以注冊(cè)為一個(gè)消息監(jiān)聽(tīng)器疾就。當(dāng)消息到達(dá)之后,系統(tǒng)自動(dòng)調(diào)用監(jiān)聽(tīng)器的onMessage方法艺蝴。
JNDI:Java命名和目錄接口,是一種標(biāo)準(zhǔn)的Java命名系統(tǒng)接口虐译。可以在網(wǎng)絡(luò)上查找和訪問(wèn)服務(wù)吴趴。通過(guò)指定一個(gè)資源名稱(chēng),該名稱(chēng)對(duì)應(yīng)于數(shù)據(jù)庫(kù)或命名服務(wù)中的一個(gè)記錄侮攀,同時(shí)返回資源連接建立所必須的信息锣枝。
JNDI在JMS中起到查找和訪問(wèn)發(fā)送目標(biāo)或消息來(lái)源的作用。
五兰英、常用消息隊(duì)列
一般商用的容器撇叁,比如WebLogic,JBoss畦贸,都支持JMS標(biāo)準(zhǔn)陨闹,開(kāi)發(fā)上很方便。但免費(fèi)的比如Tomcat薄坏,Jetty等則需要使用第三方的消息中間件趋厉。本部分內(nèi)容介紹常用的消息中間件(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他們的特點(diǎn)胶坠。
5.1 ActiveMQ
ActiveMQ 是Apache出品君账,最流行的,能力強(qiáng)勁的開(kāi)源消息總線沈善。ActiveMQ 是一個(gè)完全支持JMS1.1和J2EE 1.4規(guī)范的 JMS Provider實(shí)現(xiàn)乡数,盡管JMS規(guī)范出臺(tái)已經(jīng)是很久的事情了,但是JMS在當(dāng)今的J2EE應(yīng)用中間仍然扮演著特殊的地位闻牡。
ActiveMQ特性如下:
⒈ 多種語(yǔ)言和協(xié)議編寫(xiě)客戶端净赴。語(yǔ)言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應(yīng)用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP
⒉ 完全支持JMS1.1和J2EE 1.4規(guī)范 (持久化罩润,XA消息玖翅,事務(wù))
⒊ 對(duì)Spring的支持,ActiveMQ可以很容易內(nèi)嵌到使用Spring的系統(tǒng)里面去,而且也支持Spring2.0的特性
⒋ 通過(guò)了常見(jiàn)J2EE服務(wù)器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測(cè)試烧栋,其中通過(guò)JCA 1.5 resource adaptors的配置写妥,可以讓ActiveMQ可以自動(dòng)的部署到任何兼容J2EE 1.4 商業(yè)服務(wù)器上
⒌ 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
⒍ 支持通過(guò)JDBC和journal提供高速的消息持久化
⒎ 從設(shè)計(jì)上保證了高性能的集群,客戶端-服務(wù)器审姓,點(diǎn)對(duì)點(diǎn)
⒏ 支持Ajax
⒐ 支持與Axis的整合⒑ 可以很容易得調(diào)用內(nèi)嵌JMS provider珍特,進(jìn)行測(cè)試
5.2 Kafka
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)魔吐。 這種動(dòng)作(網(wǎng)頁(yè)瀏覽扎筒,搜索和其他用戶的行動(dòng))是在現(xiàn)代網(wǎng)絡(luò)上的許多社會(huì)功能的一個(gè)關(guān)鍵因素。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過(guò)處理日志和日志聚合來(lái)解決酬姆。 對(duì)于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng)嗜桌,但又要求實(shí)時(shí)處理的限制,這是一個(gè)可行的解決方案辞色。Kafka的目的是通過(guò)Hadoop的并行加載機(jī)制來(lái)統(tǒng)一線上和離線的消息處理骨宠,也是為了通過(guò)集群機(jī)來(lái)提供實(shí)時(shí)的消費(fèi)。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)相满,有如下特性:
通過(guò)O(1)的磁盤(pán)數(shù)據(jù)結(jié)構(gòu)提供消息的持久化层亿,這種結(jié)構(gòu)對(duì)于即使數(shù)以TB的消息存儲(chǔ)也能夠保持長(zhǎng)時(shí)間的穩(wěn)定性能。(文件追加的方式寫(xiě)入數(shù)據(jù)立美,過(guò)期的數(shù)據(jù)定期刪除)
高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數(shù)百萬(wàn)的消息
支持通過(guò)Kafka服務(wù)器和消費(fèi)機(jī)集群來(lái)分區(qū)消息
支持Hadoop并行數(shù)據(jù)加載
Kafka相關(guān)概念
Broker
Kafka集群包含一個(gè)或多個(gè)服務(wù)器匿又,這種服務(wù)器被稱(chēng)為broker[5]
Topic
每條發(fā)布到Kafka集群的消息都有一個(gè)類(lèi)別,這個(gè)類(lèi)別被稱(chēng)為T(mén)opic建蹄。(物理上不同Topic的消息分開(kāi)存儲(chǔ)碌更,邏輯上一個(gè)Topic的消息雖然保存于一個(gè)或多個(gè)broker上但用戶只需指定消息的Topic即可生產(chǎn)或消費(fèi)數(shù)據(jù)而不必關(guān)心數(shù)據(jù)存于何處)
Partition
Partition 是物理上的概念,每個(gè)Topic包含一個(gè)或多個(gè)Partition.
Producer
負(fù)責(zé)發(fā)布消息到Kafka broker
Consumer
消息消費(fèi)者洞慎,向Kafka broker讀取消息的客戶端痛单。
Consumer Group
每個(gè)Consumer屬于一個(gè)特定的Consumer Group(可為每個(gè)Consumer指定group name,若不指定group name則屬于默認(rèn)的group)劲腿。
一般應(yīng)用在大數(shù)據(jù)日志處理或?qū)?shí)時(shí)性(少量延遲)桦他,可靠性(少量丟數(shù)據(jù))要求稍低的場(chǎng)景使用。