批處理、流計(jì)算夺谁、在線查詢(xún)廉赔、即席分析的區(qū)別

計(jì)算能力 數(shù)據(jù)來(lái)源類(lèi)型 數(shù)據(jù)處理方式 底層框架 時(shí)延性
批計(jì)算 歷史已存在數(shù)據(jù) 批處理 MapReduce
spark
要求不高
流計(jì)算 源源不斷的流式數(shù)據(jù) 微批處理&逐條出來(lái) Storm
Flink
Spark Streaming
毫秒
在線查詢(xún) 歷史已存在數(shù)據(jù) 逐條處理/檢索過(guò)濾 Elasticsearch 毫秒
即席分析 歷史已存在數(shù)據(jù) 批處理/聚合 Impala
Kylim
ClickHouse
AnalyticDB
毫秒/秒級(jí)延遲

批計(jì)算

主要用于批量數(shù)據(jù)的高延時(shí)處理場(chǎng)景,如離線數(shù)倉(cāng)的加工匾鸥、大規(guī)模數(shù)據(jù)的清洗和挖掘等。目前大多是利用MapReduce碉纳、Hive勿负、Spark等計(jì)算框架進(jìn)行處理,其特點(diǎn)是數(shù)據(jù)吞吐量大劳曹、延時(shí)高奴愉,適合人機(jī)交互少的場(chǎng)景。

傳統(tǒng)的數(shù)據(jù)處理方式通常是將數(shù)據(jù)導(dǎo)入至專(zhuān)門(mén)的數(shù)據(jù)分析工 具中铁孵,這樣會(huì)面臨兩個(gè)問(wèn)題:

  • 源數(shù)據(jù)非常大時(shí)锭硼,往往數(shù)據(jù)的移動(dòng)就要花費(fèi)較長(zhǎng)時(shí)間。
  • 傳統(tǒng)的數(shù)據(jù)處理工具往往是單機(jī)的蜕劝,或系統(tǒng)架構(gòu)無(wú)法快速擴(kuò)容檀头,面對(duì)海量數(shù)據(jù)時(shí)轰异,數(shù)據(jù)處理的時(shí)間也是一個(gè)很大的問(wèn)題。

相比MapReduce暑始,Spark 在以下幾方面具有優(yōu)勢(shì):

  • 數(shù)據(jù)處理技術(shù):Spark將執(zhí)行模型抽象為通用的有向無(wú)環(huán)圖 (DAG)執(zhí)行計(jì)劃搭独,這可以將多個(gè)Stage串聯(lián)或者并行執(zhí)行,而無(wú)須將 Stage的中間結(jié)果輸出到HDFS中廊镜。
  • 數(shù)據(jù)格式和內(nèi)存布局:Spark RDD能支持粗粒度寫(xiě)操作牙肝,而對(duì)于讀 操作,RDD可以精確到每條記錄嗤朴,這使得RDD可以用來(lái)作為分布式索引
  • 執(zhí)行策略:MapReduce在數(shù)據(jù)Shuffle之前花費(fèi)了大量的時(shí)間來(lái)排 序配椭,Spark支持基于Hash的分布式聚合,調(diào)度中采用更為通用的任務(wù)執(zhí)行DAG雹姊,每一輪的輸出結(jié)果都可以緩存在內(nèi)存中

流計(jì)算

也叫實(shí)時(shí)流計(jì)算股缸,對(duì)于數(shù)據(jù)的加工處理和應(yīng)用有較強(qiáng)的實(shí)效性要 求,常見(jiàn)于監(jiān)控告警場(chǎng)景容为,例如實(shí)時(shí)分析網(wǎng)絡(luò)事件乓序,當(dāng)有異常事件發(fā)生 時(shí)能夠及時(shí)介入處理。例如坎背,阿里巴巴“雙11”的可視化大屏上的數(shù)據(jù)展 現(xiàn)是根據(jù)瀏覽替劈、交易數(shù)據(jù)經(jīng)過(guò)實(shí)時(shí)計(jì)算后展現(xiàn)在可視化大屏上的一種應(yīng) 用。這類(lèi)場(chǎng)景目前應(yīng)用較多的計(jì)算框架主要有Flink得滤、Spark Streaming和 Storm等

流計(jì)算的常見(jiàn)應(yīng)用場(chǎng)景如下:

  • 流式ETL:集成流計(jì)算現(xiàn)有的諸多數(shù)據(jù)通道和SQL靈活的加工能 力陨献,對(duì)流式數(shù)據(jù)進(jìn)行實(shí)時(shí)清洗、歸并懂更、結(jié)構(gòu)化處理眨业。同時(shí),對(duì)離線數(shù)倉(cāng) 進(jìn)行有效補(bǔ)充和優(yōu)化沮协,為數(shù)據(jù)的實(shí)時(shí)傳輸提供可計(jì)算通道龄捡。
  • 流式報(bào)表:實(shí)時(shí)采集、加工流式數(shù)據(jù)慷暂,實(shí)時(shí)監(jiān)控和展現(xiàn)業(yè)務(wù)和客 戶(hù)的各類(lèi)指標(biāo)聘殖,讓數(shù)據(jù)化運(yùn)營(yíng)實(shí)時(shí)化。
  • 監(jiān)控預(yù)警:對(duì)系統(tǒng)和用戶(hù)的行為進(jìn)行實(shí)時(shí)檢測(cè)和分析行瑞,實(shí)時(shí)監(jiān)測(cè) 和發(fā)現(xiàn)危險(xiǎn)行為奸腺。
  • 在線系統(tǒng):實(shí)時(shí)計(jì)算各類(lèi)數(shù)據(jù)指標(biāo),并利用實(shí)時(shí)結(jié)果及時(shí)調(diào)整在 線系統(tǒng)的相關(guān)策略血久,在內(nèi)容投放突照、無(wú)線智能推送等領(lǐng)域有大量的應(yīng)用。

在線查詢(xún)

主要用于數(shù)據(jù)結(jié)果的在線查詢(xún)氧吐、條件過(guò)濾和篩選等讹蘑,如數(shù)據(jù)檢索末盔、 條件過(guò)濾等。根據(jù)不同的場(chǎng)景也會(huì)有多種選擇衔肢,如營(yíng)銷(xiāo)場(chǎng)景對(duì)響應(yīng)延時(shí) 要求高的庄岖,一般會(huì)采集緩存型的存儲(chǔ)計(jì)算,如Redis角骤、Tair等;對(duì)響應(yīng)延 時(shí)要求正常的隅忿,可以選擇HBase和MySQL等;需要進(jìn)行條件過(guò)濾、檢索 的邦尊,可以選擇Elasticsearch等背桐。企業(yè)一般對(duì)在線查詢(xún)的需求比較旺盛, 因此可能會(huì)有多套在線計(jì)算的能力提供服務(wù)

在線查詢(xún)的常見(jiàn)應(yīng)用場(chǎng)景

  • 畫(huà)像服務(wù):根據(jù)對(duì)象標(biāo)識(shí)提供具體的查詢(xún)服務(wù)蝉揍,如通過(guò)Redis可以 提供低延遲链峭、高并發(fā)的查詢(xún)服務(wù)能力;通過(guò)HBase可以提供大規(guī)模數(shù)據(jù) 的查詢(xún)服務(wù)能力,征信查詢(xún)就是類(lèi)似的服務(wù)又沾。
  • 搜索的應(yīng)用場(chǎng)景:提供搜索引擎的能力弊仪,為用戶(hù)提供模糊匹配、 意圖識(shí)別檢索等能力杖刷,快速檢索需要的內(nèi)容励饵,如常見(jiàn)的文檔搜索、商品 搜索等滑燃。
  • 圈人場(chǎng)景:通過(guò)一些特定的條件規(guī)則役听,可以快速篩選出業(yè)務(wù)所需 要的群體,為后續(xù)的運(yùn)營(yíng)表窘、營(yíng)銷(xiāo)等工作的開(kāi)展提供支撐典予。

即席分析

主要用于分析型場(chǎng)景和經(jīng)驗(yàn)統(tǒng)計(jì)。一般而言乐严,企業(yè)80%的數(shù)據(jù)處理 需求是在線查詢(xún)和即席分析瘤袖。針對(duì)不同維度的分析,有多種方式可以提 供昂验,提前固定計(jì)算的維度孽椰、根據(jù)需求任意維度的交叉分析(ad-hoc)等 都是常見(jiàn)的場(chǎng)景。目前也有很多相應(yīng)的產(chǎn)品凛篙、框架來(lái)支撐這方面的應(yīng) 用,如Kylin栏渺、Impala呛梆、ClickHouse、Hawk等

即席分析的常見(jiàn)應(yīng)用場(chǎng)景如下:

  • 交互式數(shù)據(jù)分析:企業(yè)運(yùn)營(yíng)人員在日常工作中經(jīng)常需要通過(guò)SQL 從各個(gè)維度對(duì)當(dāng)前業(yè)務(wù)進(jìn)行分析磕诊,提供分析結(jié)果以便開(kāi)展后續(xù)工作填物。離 線計(jì)算的場(chǎng)景等待時(shí)間較久纹腌,用戶(hù)體驗(yàn)不好,即席分析可以比較好地規(guī) 避這個(gè)問(wèn)題滞磺。
  • 群體對(duì)比分析場(chǎng)景:在業(yè)務(wù)中經(jīng)常會(huì)有A/B測(cè)試場(chǎng)景升薯,針對(duì)不同的 群體,從各個(gè)維度對(duì)比分析也是即席分析經(jīng)常支撐的場(chǎng)景
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末击困,一起剝皮案震驚了整個(gè)濱河市涎劈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌阅茶,老刑警劉巖蛛枚,帶你破解...
    沈念sama閱讀 212,816評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異脸哀,居然都是意外死亡蹦浦,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)撞蜂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)盲镶,“玉大人,你說(shuō)我怎么就攤上這事蝌诡「然撸” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,300評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵送漠,是天一觀的道長(zhǎng)顽照。 經(jīng)常有香客問(wèn)我,道長(zhǎng)闽寡,這世上最難降的妖魔是什么代兵? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,780評(píng)論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮爷狈,結(jié)果婚禮上植影,老公的妹妹穿的比我還像新娘。我一直安慰自己涎永,他們只是感情好思币,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著羡微,像睡著了一般谷饿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上妈倔,一...
    開(kāi)封第一講書(shū)人閱讀 50,084評(píng)論 1 291
  • 那天博投,我揣著相機(jī)與錄音,去河邊找鬼盯蝴。 笑死毅哗,一個(gè)胖子當(dāng)著我的面吹牛听怕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播虑绵,決...
    沈念sama閱讀 39,151評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼尿瞭,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了翅睛?” 一聲冷哼從身側(cè)響起声搁,我...
    開(kāi)封第一講書(shū)人閱讀 37,912評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宏所,沒(méi)想到半個(gè)月后酥艳,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡爬骤,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評(píng)論 2 327
  • 正文 我和宋清朗相戀三年充石,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片霞玄。...
    茶點(diǎn)故事閱讀 38,809評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡骤铃,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出坷剧,到底是詐尸還是另有隱情惰爬,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評(píng)論 4 334
  • 正文 年R本政府宣布惫企,位于F島的核電站撕瞧,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏狞尔。R本人自食惡果不足惜丛版,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望偏序。 院中可真熱鬧页畦,春花似錦、人聲如沸研儒。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)端朵。三九已至好芭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間冲呢,已是汗流浹背栓撞。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,121評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人瓤湘。 一個(gè)月前我還...
    沈念sama閱讀 46,628評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像恩尾,于是被迫代替她去往敵國(guó)和親弛说。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容