【干貨】Kafka實現(xiàn)淘寶億萬級數(shù)據(jù)統(tǒng)計(上)

在ActiveMQ、RabbitMQ卒废、RocketMQ沛厨、Kafka消息中間件之間,我們?yōu)槭裁匆x擇Kafka?

下面詳細介紹一下摔认,2012年9月份我在支付寶做余額寶研發(fā)逆皮,2013年6月支付寶正式推出余額寶,2013年8月?lián)沃Ц秾毺詫毑势表椖拷?jīng)理帶領(lǐng)兄弟們一起做研發(fā)参袱,期間需要與淘寶和500萬對接競彩接口數(shù)據(jù)电谣。

通過業(yè)余時間與淘寶同事溝通,了解到天貓在電商節(jié)如何處理大數(shù)據(jù)抹蚀?技術(shù)架構(gòu)上采用了哪些策略剿牺?

1、應(yīng)用無狀態(tài)(淘寶session框架)

2环壤、有效使用緩存(Tair)

3晒来、應(yīng)用拆分(HSF)

4、數(shù)據(jù)庫拆分(TDDL)

5郑现、異步通信(Notify)

6湃崩、非結(jié)構(gòu)化數(shù)據(jù)存儲 ( TFS,NOSQL)

7、監(jiān)控懂酱、預(yù)警系統(tǒng)

8竹习、配置統(tǒng)一管理

天貓的同事把大致的架構(gòu)跟我描述了一番,心有感悟列牺。咱們來看一下2018年雙11當天的成交額整陌。

【干貨】Kafka實現(xiàn)淘寶億萬級數(shù)據(jù)統(tǒng)計(上)

二、kafka實現(xiàn)天貓億萬級數(shù)據(jù)統(tǒng)計架構(gòu)

Flume是Cloudera提供的一個高可用的,高可靠的泌辫,分布式的海量日志采集随夸、聚合和傳輸?shù)南到y(tǒng),F(xiàn)lume支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方震放,用于收集數(shù)據(jù)宾毒;同時,F(xiàn)lume提供對數(shù)據(jù)進行簡單處理殿遂,并寫到各種數(shù)據(jù)接受方(可定制)的能力诈铛。

【干貨】Kafka實現(xiàn)淘寶億萬級數(shù)據(jù)統(tǒng)計(上)

Data Access:數(shù)據(jù)通道

Computing:計算

Persistence:執(zhí)行保存方式

spout:表示一個流的源頭,產(chǎn)生tuple

bolt:處理輸入流并產(chǎn)生多個輸出流墨礁,可以做簡單的數(shù)據(jù)轉(zhuǎn)換計算幢竹,復(fù)雜的流處理一般需要經(jīng)過多個bolt進行處理。

為什么不能用分布式文件HDFS集群恩静?

1焕毫、實時性:hdfs的實時性沒有kafka高。

2驶乾、消費量的記錄:hdfs不會記錄你這個塊文件消費到了哪里邑飒,而基于zookeeper的kafka會記錄你消費的點。

3级乐、并發(fā)消費:hdfs不支持并發(fā)消費疙咸,而kafka支持并發(fā)消費,即多個consumer风科。

4罕扎、彈性且有序:當數(shù)據(jù)量會很大,而且處理完之后就可以刪除時丐重,頻繁的讀寫會對hdfs中NameNode造成很大的壓力腔召。而kafka的消費點是記錄在zookeeper的,并且kafka的每條數(shù)據(jù)都是有“坐標”的扮惦,所以消費的時候只要這個“坐標”向后移動就行了臀蛛,而且刪除的時候只要把這個“坐標”之前的數(shù)據(jù)刪掉即可。

三崖蜜、什么是Kafka?

【干貨】Kafka實現(xiàn)淘寶億萬級數(shù)據(jù)統(tǒng)計(上)

通過上圖就可以了解到浊仆,生產(chǎn)者Producers(農(nóng)民和廚師),消費主題top(魚豫领,骨頭抡柿,草,香蕉),消費者Comsumer(貓等恐,狗洲劣,老牛备蚓,猴子),生產(chǎn)者根據(jù)消費主題獲取自己想要的食物囱稽。

四郊尝、Kafka架構(gòu)原理

【干貨】Kafka實現(xiàn)淘寶億萬級數(shù)據(jù)統(tǒng)計(上)

歡迎加入Java進階架構(gòu)交流:加入142019080。

直接點擊鏈接加群战惊。https://jq.qq.com/?_wv=1027&k=5lXBNZ7 獲取最新學(xué)習(xí)資料

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末流昏,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子吞获,更是在濱河造成了極大的恐慌况凉,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,651評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件各拷,死亡現(xiàn)場離奇詭異茎刚,居然都是意外死亡,警方通過查閱死者的電腦和手機撤逢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來粮坞,“玉大人蚊荣,你說我怎么就攤上這事∧荆” “怎么了互例?”我有些...
    開封第一講書人閱讀 162,931評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長筝闹。 經(jīng)常有香客問我媳叨,道長,這世上最難降的妖魔是什么关顷? 我笑而不...
    開封第一講書人閱讀 58,218評論 1 292
  • 正文 為了忘掉前任糊秆,我火速辦了婚禮,結(jié)果婚禮上议双,老公的妹妹穿的比我還像新娘痘番。我一直安慰自己,他們只是感情好平痰,可當我...
    茶點故事閱讀 67,234評論 6 388
  • 文/花漫 我一把揭開白布汞舱。 她就那樣靜靜地躺著,像睡著了一般宗雇。 火紅的嫁衣襯著肌膚如雪昂芜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,198評論 1 299
  • 那天赔蒲,我揣著相機與錄音泌神,去河邊找鬼良漱。 笑死,一個胖子當著我的面吹牛腻扇,可吹牛的內(nèi)容都是我干的债热。 我是一名探鬼主播,決...
    沈念sama閱讀 40,084評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼幼苛,長吁一口氣:“原來是場噩夢啊……” “哼窒篱!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起舶沿,我...
    開封第一講書人閱讀 38,926評論 0 274
  • 序言:老撾萬榮一對情侶失蹤墙杯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后括荡,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體高镐,經(jīng)...
    沈念sama閱讀 45,341評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,563評論 2 333
  • 正文 我和宋清朗相戀三年畸冲,在試婚紗的時候發(fā)現(xiàn)自己被綠了嫉髓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,731評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡邑闲,死狀恐怖算行,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情苫耸,我是刑警寧澤州邢,帶...
    沈念sama閱讀 35,430評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站褪子,受9級特大地震影響量淌,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜嫌褪,卻給世界環(huán)境...
    茶點故事閱讀 41,036評論 3 326
  • 文/蒙蒙 一呀枢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧笼痛,春花似錦硫狞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,676評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至倘核,卻和暖如春泣侮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背紧唱。 一陣腳步聲響...
    開封第一講書人閱讀 32,829評論 1 269
  • 我被黑心中介騙來泰國打工活尊, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留隶校,地道東北人。 一個月前我還...
    沈念sama閱讀 47,743評論 2 368
  • 正文 我出身青樓蛹锰,卻偏偏與公主長得像深胳,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子铜犬,可洞房花燭夜當晚...
    茶點故事閱讀 44,629評論 2 354

推薦閱讀更多精彩內(nèi)容