大數(shù)據(jù)平臺基礎(chǔ)架構(gòu)和常用處理工具

什么是大數(shù)據(jù)批狱?必看》》形象描述大數(shù)據(jù)技術(shù)生態(tài)圈?


一、大數(shù)據(jù)在線分析處理和常用工具

??? 1盐数、大數(shù)據(jù)在線分析和處理特點:

?????? * 數(shù)據(jù)源源不斷到來埂淮;

?????? * 數(shù)據(jù)需要盡快處理姑隅,不能積壓;

?????? * 處理后的數(shù)據(jù)依然是TB或PB級的數(shù)據(jù)量同诫;

?????? * 處理結(jié)果盡快展現(xiàn);

? 總結(jié)為:數(shù)據(jù)的收集-——數(shù)據(jù)傳輸——數(shù)據(jù)處理——數(shù)據(jù)展現(xiàn)(可視化)樟澜,其中误窖,數(shù)據(jù)處理一般涉及數(shù)據(jù)的聚合,數(shù)據(jù)處理和數(shù)據(jù)展現(xiàn)能夠在秒級得到響應(yīng)秩贰。


2霹俺、工具:

(1) flume?? 主要用于數(shù)據(jù)的收集和傳輸。類似的大數(shù)據(jù)開源系統(tǒng)有 Logstash和Fluentd毒费。

?? 三者區(qū)別:

?? * Logstash主要和Elasticsearch丙唧、Kibana結(jié)合使用,即ELK框架觅玻;Logstash主要負責(zé)將數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)換成Elasticsearch認識的索引結(jié)構(gòu)供Kibana查詢想际。

? *? Fluentd逐漸被Flume代替。

? * Flume能夠支持多種數(shù)據(jù)源溪厘,并且輸出到多種輸出源胡本,支持多種格式的數(shù)據(jù)。


Flume的架構(gòu)主要有一下幾個核心概念:

? Event:一個數(shù)據(jù)單元畸悬,帶有一個可選的消息頭

? Flow:Event從源點到達目的點的遷移的抽象

? Client:操作位于源點處的Event侧甫,將其發(fā)送到Flume Agent

? Agent:一個獨立的Flume進程,包含組件Source蹋宦、Channel披粟、Sink

? Source:用來消費傳遞到該組件的Event。連接的輸入源可以有Avro冷冗、Thrift守屉、Exec(Unix command output)、JMS(Java Message Service)蒿辙、Kafka胸梆、NetCat(可以使用nc -lk port 測試)敦捧、Syslog.....

Channel:中轉(zhuǎn)Event的一個臨時存儲,flume內(nèi)部數(shù)據(jù)傳輸通道碰镜,保存有Source組件傳遞過來的Event兢卵。主要包括Memory Channel和File Channel。

Sink:從Channel中讀取并移除Event绪颖,將Event傳遞到Flow Pipeline中的下一個Agent(如果有的話)秽荤。連接的輸出源可以有Hdfs、Hive柠横、Avro窃款、Thrift、File Roll 牍氛、Hbase晨继、Kafka......

?? Flume NG架構(gòu):


多個Agent連接形成Agent鏈:


多個Agent進行數(shù)據(jù)源的合并:


多路Agent:


實現(xiàn)load balance功能:



(2)kafka??? 主要用于前端日志的存儲,用作緩沖


(3)Storm /Spark? 專注于將數(shù)據(jù)按照時間窗口進行聚合處理搬俊,被稱為流式處理框架紊扬。

??????? * Storm提供比Spark更加實時的流式處理;

?????? * Spark提供比Storm更多的服務(wù)唉擂,Spark 已經(jīng)形成類似Hadoop的生態(tài)圈餐屎。

Spark 生態(tài)圈如下所示:


目前,Spark 有三種集群管理模式:

? * Standalone :一種簡單的集群管理玩祟,其包括一個很容易搭建集群的Spark;

? * Apache Mesos:一種通用的集群管理模式腹缩,可以運行Hadoop Mapreduce和服務(wù)應(yīng)用的模式;

? * Hadoop YARN : Hadoop 2.0中的資源管理模式空扎;


(4)Hbase /Redis?? 提供大數(shù)據(jù)存儲和提供查詢藏鹊。類似的大數(shù)據(jù)開源系統(tǒng)有Cassandra.

?? * Cassandra 滿足可用性和分區(qū)容忍性,允許數(shù)據(jù)的不一致(不同的客戶端可能看到不一樣的情況)转锈,提供了類似SQL的CQL查詢語言伙判,查詢方便;

? * Hbase 滿足一致性和分區(qū)容忍性黑忱,擁有強大的記錄一致性宴抚,但是不支持SQL,需要使用第三方服務(wù)來支持SQL(如 Apache Phoenix);


未完待續(xù)甫煞。菇曲。。抚吠。


?????????

二常潮、大數(shù)據(jù)離線處理和常用工具


未完待續(xù)。楷力。喊式。孵户。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市岔留,隨后出現(xiàn)的幾起案子夏哭,更是在濱河造成了極大的恐慌,老刑警劉巖献联,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件竖配,死亡現(xiàn)場離奇詭異,居然都是意外死亡里逆,警方通過查閱死者的電腦和手機进胯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來原押,“玉大人胁镐,你說我怎么就攤上這事≈钕危” “怎么了盯漂?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長署隘。 經(jīng)常有香客問我宠能,道長亚隙,這世上最難降的妖魔是什么磁餐? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮阿弃,結(jié)果婚禮上诊霹,老公的妹妹穿的比我還像新娘。我一直安慰自己渣淳,他們只是感情好脾还,可當我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著入愧,像睡著了一般鄙漏。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上棺蛛,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天怔蚌,我揣著相機與錄音,去河邊找鬼旁赊。 笑死桦踊,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的终畅。 我是一名探鬼主播籍胯,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼竟闪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了杖狼?” 一聲冷哼從身側(cè)響起炼蛤,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎本刽,沒想到半個月后鲸湃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡子寓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了斜友。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡烹看,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出洛史,到底是詐尸還是另有隱情惯殊,我是刑警寧澤,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布土思,位于F島的核電站,受9級特大地震影響己儒,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜捆毫,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一闪湾、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧绩卤,春花似錦途样、人聲如沸濒憋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至遏插,卻和暖如春捂贿,著一層夾襖步出監(jiān)牢的瞬間胳嘲,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工了牛, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人甫窟。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓蛙婴,卻偏偏與公主長得像粗井,于是被迫代替她去往敵國和親街图。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容