轉(zhuǎn)自:http://www.cnblogs.com/linjiqin/p/5720865.html
一、消息隊(duì)列概述
消息隊(duì)列中間件是分布式系統(tǒng)中重要的組件消玄,主要解決應(yīng)用解耦徙融,異步消息,流量削鋒等問(wèn)題跷坝,實(shí)現(xiàn)高性能砖茸,高可用隘擎,可伸縮和最終一致性架構(gòu)。目前使用較多的消息隊(duì)列有ActiveMQ凉夯,RabbitMQ货葬,ZeroMQ采幌,Kafka,MetaMQ震桶,RocketMQ
二休傍、消息隊(duì)列應(yīng)用場(chǎng)景
以下介紹消息隊(duì)列在實(shí)際應(yīng)用中常用的使用場(chǎng)景。異步處理蹲姐,應(yīng)用解耦磨取,流量削鋒和消息通訊四個(gè)場(chǎng)景。
2.1異步處理
場(chǎng)景說(shuō)明:用戶注冊(cè)后柴墩,需要發(fā)注冊(cè)郵件和注冊(cè)短信忙厌。傳統(tǒng)的做法有兩種 1.串行的方式;2.并行方式
a江咳、串行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后逢净,發(fā)送注冊(cè)郵件,再發(fā)送注冊(cè)短信歼指。以上三個(gè)任務(wù)全部完成后爹土,返回給客戶端。
b踩身、并行方式:將注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)成功后胀茵,發(fā)送注冊(cè)郵件的同時(shí),發(fā)送注冊(cè)短信惰赋。以上三個(gè)任務(wù)完成后,返回給客戶端呵哨。與串行的差別是赁濒,并行的方式可以提高處理的時(shí)間
假設(shè)三個(gè)業(yè)務(wù)節(jié)點(diǎn)每個(gè)使用50毫秒鐘,不考慮網(wǎng)絡(luò)等其他開(kāi)銷孟害,則串行方式的時(shí)間是150毫秒拒炎,并行的時(shí)間可能是100毫秒。
因?yàn)镃PU在單位時(shí)間內(nèi)處理的請(qǐng)求數(shù)是一定的挨务,假設(shè)CPU1秒內(nèi)吞吐量是100次击你。則串行方式1秒內(nèi)CPU可處理的請(qǐng)求量是7次(1000/150)。并行方式處理的請(qǐng)求量是10次(1000/100)
小結(jié):如以上案例描述谎柄,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量丁侄,吞吐量,響應(yīng)時(shí)間)會(huì)有瓶頸朝巫。如何解決這個(gè)問(wèn)題呢鸿摇?
引入消息隊(duì)列,將不是必須的業(yè)務(wù)邏輯劈猿,異步處理拙吉。改造后的架構(gòu)如下:
按照以上約定潮孽,用戶的響應(yīng)時(shí)間相當(dāng)于是注冊(cè)信息寫(xiě)入數(shù)據(jù)庫(kù)的時(shí)間,也就是50毫秒筷黔。注冊(cè)郵件往史,發(fā)送短信寫(xiě)入消息隊(duì)列后,直接返回佛舱,因此寫(xiě)入消息隊(duì)列的速度很快椎例,基本可以忽略,因此用戶的響應(yīng)時(shí)間可能是50毫秒名眉。因此架構(gòu)改變后粟矿,系統(tǒng)的吞吐量提高到每秒20 QPS。比串行提高了3倍损拢,比并行提高了兩倍陌粹。
2.2應(yīng)用解耦
場(chǎng)景說(shuō)明:用戶下單后,訂單系統(tǒng)需要通知庫(kù)存系統(tǒng)福压。傳統(tǒng)的做法是掏秩,訂單系統(tǒng)調(diào)用庫(kù)存系統(tǒng)的接口。如下圖:
傳統(tǒng)模式的缺點(diǎn):假如庫(kù)存系統(tǒng)無(wú)法訪問(wèn)荆姆,則訂單減庫(kù)存將失敗蒙幻,從而導(dǎo)致訂單失敗,訂單系統(tǒng)與庫(kù)存系統(tǒng)耦合
如何解決以上問(wèn)題呢胆筒?引入應(yīng)用消息隊(duì)列后的方案邮破,如下圖:
訂單系統(tǒng):用戶下單后,訂單系統(tǒng)完成持久化處理仆救,將消息寫(xiě)入消息隊(duì)列抒和,返回用戶訂單下單成功
庫(kù)存系統(tǒng):訂閱下單的消息,采用拉/推的方式彤蔽,獲取下單信息摧莽,庫(kù)存系統(tǒng)根據(jù)下單信息,進(jìn)行庫(kù)存操作
假如:在下單時(shí)庫(kù)存系統(tǒng)不能正常使用顿痪。也不影響正常下單镊辕,因?yàn)橄聠魏螅唵蜗到y(tǒng)寫(xiě)入消息隊(duì)列就不再關(guān)心其他的后續(xù)操作了蚁袭。實(shí)現(xiàn)訂單系統(tǒng)與庫(kù)存系統(tǒng)的應(yīng)用解耦
2.3流量削鋒
流量削鋒也是消息隊(duì)列中的常用場(chǎng)景征懈,一般在秒殺或團(tuán)搶活動(dòng)中使用廣泛。
應(yīng)用場(chǎng)景:秒殺活動(dòng)揩悄,一般會(huì)因?yàn)榱髁窟^(guò)大受裹,導(dǎo)致流量暴增,應(yīng)用掛掉。為解決這個(gè)問(wèn)題棉饶,一般需要在應(yīng)用前端加入消息隊(duì)列厦章。
a、可以控制活動(dòng)的人數(shù)
b照藻、可以緩解短時(shí)間內(nèi)高流量壓垮應(yīng)用
用戶的請(qǐng)求袜啃,服務(wù)器接收后,首先寫(xiě)入消息隊(duì)列幸缕。假如消息隊(duì)列長(zhǎng)度超過(guò)最大數(shù)量群发,則直接拋棄用戶請(qǐng)求或跳轉(zhuǎn)到錯(cuò)誤頁(yè)面。
秒殺業(yè)務(wù)根據(jù)消息隊(duì)列中的請(qǐng)求信息发乔,再做后續(xù)處理
2.4日志處理
日志處理是指將消息隊(duì)列用在日志處理中熟妓,比如Kafka的應(yīng)用,解決大量日志傳輸?shù)膯?wèn)題栏尚。架構(gòu)簡(jiǎn)化如下
日志采集客戶端起愈,負(fù)責(zé)日志數(shù)據(jù)采集,定時(shí)寫(xiě)受寫(xiě)入Kafka隊(duì)列
Kafka消息隊(duì)列译仗,負(fù)責(zé)日志數(shù)據(jù)的接收抬虽,存儲(chǔ)和轉(zhuǎn)發(fā)
日志處理應(yīng)用:訂閱并消費(fèi)kafka隊(duì)列中的日志數(shù)據(jù)
2.5消息通訊
消息通訊是指,消息隊(duì)列一般都內(nèi)置了高效的通信機(jī)制纵菌,因此也可以用在純的消息通訊阐污。比如實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)消息隊(duì)列,或者聊天室等
點(diǎn)對(duì)點(diǎn)通訊:
客戶端A和客戶端B使用同一隊(duì)列咱圆,進(jìn)行消息通訊笛辟。
聊天室通訊:
客戶端A,客戶端B序苏,客戶端N訂閱同一主題手幢,進(jìn)行消息發(fā)布和接收。實(shí)現(xiàn)類似聊天室效果杠览。
以上實(shí)際是消息隊(duì)列的兩種消息模式弯菊,點(diǎn)對(duì)點(diǎn)或發(fā)布訂閱模式纵势。模型為示意圖踱阿,供參考。
三钦铁、消息中間件示例
3.1電商系統(tǒng)
消息隊(duì)列采用高可用软舌,可持久化的消息中間件。比如Active MQ牛曹,Rabbit MQ佛点,Rocket Mq。
(1)應(yīng)用將主干邏輯處理完成后,寫(xiě)入消息隊(duì)列超营。消息發(fā)送是否成功可以開(kāi)啟消息的確認(rèn)模式鸳玩。(消息隊(duì)列返回消息接收成功狀態(tài)后,應(yīng)用再返回演闭,這樣保障消息的完整性)
(2)擴(kuò)展流程(發(fā)短信不跟,配送處理)訂閱隊(duì)列消息。采用推或拉的方式獲取消息并處理米碰。
(3)消息將應(yīng)用解耦的同時(shí)窝革,帶來(lái)了數(shù)據(jù)一致性問(wèn)題,可以采用最終一致性方式解決吕座。比如主數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)虐译,擴(kuò)展應(yīng)用根據(jù)消息隊(duì)列,并結(jié)合數(shù)據(jù)庫(kù)方式實(shí)現(xiàn)基于消息隊(duì)列的后續(xù)處理吴趴。
3.2日志收集系統(tǒng)
分為Zookeeper注冊(cè)中心漆诽,日志收集客戶端,Kafka集群和Storm集群(OtherApp)四部分組成史侣。
Zookeeper注冊(cè)中心拴泌,提出負(fù)載均衡和地址查找服務(wù)
日志收集客戶端,用于采集應(yīng)用系統(tǒng)的日志惊橱,并將數(shù)據(jù)推送到kafka隊(duì)列
Kafka集群:接收蚪腐,路由,存儲(chǔ)税朴,轉(zhuǎn)發(fā)等消息處理
Storm集群:與OtherApp處于同一級(jí)別回季,采用拉的方式消費(fèi)隊(duì)列中的數(shù)據(jù)
四、JMS消息服務(wù)
講消息隊(duì)列就不得不提JMS 正林。JMS(JAVA Message Service泡一,java消息服務(wù))API是一個(gè)消息服務(wù)的標(biāo)準(zhǔn)/規(guī)范,允許應(yīng)用程序組件基于JavaEE平臺(tái)創(chuàng)建觅廓、發(fā)送鼻忠、接收和讀取消息。它使分布式通信耦合度更低杈绸,消息服務(wù)更加可靠以及異步性帖蔓。
在EJB架構(gòu)中,有消息bean可以無(wú)縫的與JM消息服務(wù)集成瞳脓。在J2EE架構(gòu)模式中塑娇,有消息服務(wù)者模式,用于實(shí)現(xiàn)消息與應(yīng)用直接的解耦劫侧。
4.1消息模型
在JMS標(biāo)準(zhǔn)中埋酬,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)哨啃。
4.1.1 P2P模式
P2P模式包含三個(gè)角色:消息隊(duì)列(Queue),發(fā)送者(Sender)写妥,接收者(Receiver)拳球。每個(gè)消息都被發(fā)送到一個(gè)特定的隊(duì)列,接收者從隊(duì)列中獲取消息珍特。隊(duì)列保留著消息醇坝,直到他們被消費(fèi)或超時(shí)。
P2P的特點(diǎn)
每個(gè)消息只有一個(gè)消費(fèi)者(Consumer)(即一旦被消費(fèi)次坡,消息就不再在消息隊(duì)列中)
發(fā)送者和接收者之間在時(shí)間上沒(méi)有依賴性呼猪,也就是說(shuō)當(dāng)發(fā)送者發(fā)送了消息之后,不管接收者有沒(méi)有正在運(yùn)行砸琅,它不會(huì)影響到消息被發(fā)送到隊(duì)列
接收者在成功接收消息之后需向隊(duì)列應(yīng)答成功
如果希望發(fā)送的每個(gè)消息都會(huì)被成功處理的話宋距,那么需要P2P模式。
4.1.2 Pub/Sub模式
包含三個(gè)角色主題(Topic)症脂,發(fā)布者(Publisher)谚赎,訂閱者(Subscriber) 多個(gè)發(fā)布者將消息發(fā)送到Topic,系統(tǒng)將這些消息傳遞給多個(gè)訂閱者诱篷。
Pub/Sub的特點(diǎn)
每個(gè)消息可以有多個(gè)消費(fèi)者
發(fā)布者和訂閱者之間有時(shí)間上的依賴性壶唤。針對(duì)某個(gè)主題(Topic)的訂閱者,它必須創(chuàng)建一個(gè)訂閱者之后棕所,才能消費(fèi)發(fā)布者的消息
為了消費(fèi)消息闸盔,訂閱者必須保持運(yùn)行的狀態(tài)
為了緩和這樣嚴(yán)格的時(shí)間相關(guān)性,JMS允許訂閱者創(chuàng)建一個(gè)可持久化的訂閱琳省。這樣迎吵,即使訂閱者沒(méi)有被激活(運(yùn)行),它也能接收到發(fā)布者的消息针贬。
如果希望發(fā)送的消息可以不被做任何處理击费、或者只被一個(gè)消息者處理、或者可以被多個(gè)消費(fèi)者處理的話桦他,那么可以采用Pub/Sub模型蔫巩。
4.2消息消費(fèi)
在JMS中,消息的產(chǎn)生和消費(fèi)都是異步的快压。對(duì)于消費(fèi)來(lái)說(shuō)圆仔,JMS的消息者可以通過(guò)兩種方式來(lái)消費(fèi)消息。
(1)同步
訂閱者或接收者通過(guò)receive方法來(lái)接收消息嗓节,receive方法在接收到消息之前(或超時(shí)之前)將一直阻塞荧缘;
(2)異步
訂閱者或接收者可以注冊(cè)為一個(gè)消息監(jiān)聽(tīng)器皆警。當(dāng)消息到達(dá)之后拦宣,系統(tǒng)自動(dòng)調(diào)用監(jiān)聽(tīng)器的onMessage方法。
JNDI:Java命名和目錄接口,是一種標(biāo)準(zhǔn)的Java命名系統(tǒng)接口⊥宜恚可以在網(wǎng)絡(luò)上查找和訪問(wèn)服務(wù)绸罗。通過(guò)指定一個(gè)資源名稱,該名稱對(duì)應(yīng)于數(shù)據(jù)庫(kù)或命名服務(wù)中的一個(gè)記錄豆瘫,同時(shí)返回資源連接建立所必須的信息珊蟀。
JNDI在JMS中起到查找和訪問(wèn)發(fā)送目標(biāo)或消息來(lái)源的作用。
五外驱、常用消息隊(duì)列
一般商用的容器育灸,比如WebLogic,JBoss昵宇,都支持JMS標(biāo)準(zhǔn)磅崭,開(kāi)發(fā)上很方便。但免費(fèi)的比如Tomcat瓦哎,Jetty等則需要使用第三方的消息中間件砸喻。本部分內(nèi)容介紹常用的消息中間件(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他們的特點(diǎn)蒋譬。
5.1 ActiveMQ
ActiveMQ 是Apache出品割岛,最流行的,能力強(qiáng)勁的開(kāi)源消息總線犯助。ActiveMQ 是一個(gè)完全支持JMS1.1和J2EE 1.4規(guī)范的 JMS Provider實(shí)現(xiàn)癣漆,盡管JMS規(guī)范出臺(tái)已經(jīng)是很久的事情了,但是JMS在當(dāng)今的J2EE應(yīng)用中間仍然扮演著特殊的地位剂买。
ActiveMQ特性如下:
⒈ 多種語(yǔ)言和協(xié)議編寫(xiě)客戶端扑媚。語(yǔ)言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應(yīng)用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP
⒉ 完全支持JMS1.1和J2EE 1.4規(guī)范 (持久化雷恃,XA消息横蜒,事務(wù))
⒊ 對(duì)Spring的支持,ActiveMQ可以很容易內(nèi)嵌到使用Spring的系統(tǒng)里面去氢卡,而且也支持Spring2.0的特性
⒋ 通過(guò)了常見(jiàn)J2EE服務(wù)器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測(cè)試玄帕,其中通過(guò)JCA 1.5 resource adaptors的配置,可以讓ActiveMQ可以自動(dòng)的部署到任何兼容J2EE 1.4 商業(yè)服務(wù)器上
⒌ 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
⒍ 支持通過(guò)JDBC和journal提供高速的消息持久化
⒎ 從設(shè)計(jì)上保證了高性能的集群讨越,客戶端-服務(wù)器两残,點(diǎn)對(duì)點(diǎn)
⒏ 支持Ajax
⒐ 支持與Axis的整合
⒑ 可以很容易得調(diào)用內(nèi)嵌JMS provider,進(jìn)行測(cè)試
5.2 Kafka
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)把跨,它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)人弓。 這種動(dòng)作(網(wǎng)頁(yè)瀏覽,搜索和其他用戶的行動(dòng))是在現(xiàn)代網(wǎng)絡(luò)上的許多社會(huì)功能的一個(gè)關(guān)鍵因素着逐。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過(guò)處理日志和日志聚合來(lái)解決崔赌。 對(duì)于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng)意蛀,但又要求實(shí)時(shí)處理的限制,這是一個(gè)可行的解決方案健芭。Kafka的目的是通過(guò)Hadoop的并行加載機(jī)制來(lái)統(tǒng)一線上和離線的消息處理县钥,也是為了通過(guò)集群機(jī)來(lái)提供實(shí)時(shí)的消費(fèi)。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)慈迈,有如下特性:
通過(guò)O(1)的磁盤(pán)數(shù)據(jù)結(jié)構(gòu)提供消息的持久化若贮,這種結(jié)構(gòu)對(duì)于即使數(shù)以TB的消息存儲(chǔ)也能夠保持長(zhǎng)時(shí)間的穩(wěn)定性能。(文件追加的方式寫(xiě)入數(shù)據(jù)痒留,過(guò)期的數(shù)據(jù)定期刪除)
高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數(shù)百萬(wàn)的消息
支持通過(guò)Kafka服務(wù)器和消費(fèi)機(jī)集群來(lái)分區(qū)消息
支持Hadoop并行數(shù)據(jù)加載
Kafka相關(guān)概念
Broker
Kafka集群包含一個(gè)或多個(gè)服務(wù)器谴麦,這種服務(wù)器被稱為broker[5]
Topic
每條發(fā)布到Kafka集群的消息都有一個(gè)類別,這個(gè)類別被稱為T(mén)opic伸头。(物理上不同Topic的消息分開(kāi)存儲(chǔ)细移,邏輯上一個(gè)Topic的消息雖然保存于一個(gè)或多個(gè)broker上但用戶只需指定消息的Topic即可生產(chǎn)或消費(fèi)數(shù)據(jù)而不必關(guān)心數(shù)據(jù)存于何處)
Partition
Parition是物理上的概念,每個(gè)Topic包含一個(gè)或多個(gè)Partition.
Producer
負(fù)責(zé)發(fā)布消息到Kafka broker
Consumer
消息消費(fèi)者熊锭,向Kafka broker讀取消息的客戶端弧轧。
Consumer Group
每個(gè)Consumer屬于一個(gè)特定的Consumer Group(可為每個(gè)Consumer指定group name,若不指定group name則屬于默認(rèn)的group)碗殷。
一般應(yīng)用在大數(shù)據(jù)日志處理或?qū)?shí)時(shí)性(少量延遲)精绎,可靠性(少量丟數(shù)據(jù))要求稍低的場(chǎng)景使用。