Hadoop 和 MPP 的比較【詳細(xì)】

原文鏈接：https://0x0fff.com/hadoop-vs-mpp/
最近，我聽到很多關(guān)于這個(gè)話題的討論吹散。同時(shí)猾瘸，這是一個(gè)非常受歡迎的問題，客戶在“大數(shù)據(jù)”領(lǐng)域沒有太多的經(jīng)驗(yàn)佑颇。事實(shí)上，我不喜歡這個(gè)模糊的流行詞草娜，但這是客戶通常來找我們挑胸，所以我必須使用它。

如果我們回顧5年前會(huì)發(fā)現(xiàn)宰闰，那就是當(dāng)時(shí)Hadoop不是大多數(shù)公司的選擇茬贵，特別是那些要求穩(wěn)定和成熟的平臺(tái)的企業(yè)。在這一刻移袍，選擇非常簡單：當(dāng)您的分析數(shù)據(jù)庫的大小超過5-7 TB時(shí)解藻，您只需啟動(dòng)MPP遷移項(xiàng)目，并轉(zhuǎn)移到經(jīng)過驗(yàn)證的企業(yè)MPP解決方案之一葡盗。沒有人聽說過“非結(jié)構(gòu)化”數(shù)據(jù) - 如果你要分析日志螟左，只需用Perl / Python / Java / C ++解析它們并加載到分析數(shù)據(jù)庫中。沒有人聽說過高速數(shù)據(jù) - 只需使用傳統(tǒng)的OLTP RDBMS進(jìn)行頻繁更新觅够，并將其塊插入到分析DWH(數(shù)據(jù)倉庫)中胶背。
但是隨著時(shí)間的流轉(zhuǎn)，“大數(shù)據(jù)”的流行語開始被廣泛使用喘先，也在大眾媒體和社交網(wǎng)絡(luò)中傳播钳吟。以下是“大數(shù)據(jù)”這個(gè)詞的google趨勢圖：

Paste_Image.png

人們正在討論“三V”(大數(shù)據(jù)的3個(gè)維度)和處理這些巨大數(shù)據(jù)的方法。 Hadoop已經(jīng)從利基技術(shù)發(fā)展成為數(shù)據(jù)處理的一流工具之一窘拯，越來越受到更多的大公司的投入研發(fā)红且，通過啟動(dòng)廣泛的Hadoop實(shí)現(xiàn)坝茎，或通過投資到其中一個(gè)Hadoop供應(yīng)商，或通過自己成為一個(gè)Hadoop供應(yīng)商直焙。隨著Hadoop越來越受歡迎景东，MPP數(shù)據(jù)庫進(jìn)入他們的下降趨勢。您可以看看Teradata股票的例子奔誓，在過去的3年中，他們不斷下滑搔涝，其主要原因是新玩家進(jìn)入市場厨喂，而且是Hadoop。
所以關(guān)于“我是否應(yīng)該選擇MPP解決方案或基于Hadoop的解決方案庄呈？”的問題蜕煌，新來者的問題正在變得非常受歡迎。許多供應(yīng)商正在將Hadoop定位為傳統(tǒng)數(shù)據(jù)倉庫的替代品诬留，這意味著更換MPP解決方案斜纪。當(dāng)Hadoop和MPP彼此離開并且集成在一個(gè)單一的解決方案中時(shí)，其中一些在消息傳遞和推動(dòng)數(shù)據(jù)湖/數(shù)據(jù)中心概念方面更保守文兑。

Paste_Image.png

那么MPP是什么盒刚？ MPP代表大規(guī)模并行處理，這是網(wǎng)格計(jì)算中所有單獨(dú)節(jié)點(diǎn)參與協(xié)調(diào)計(jì)算的方法绿贞。 MPP DBMS是建立在這種方法之上的數(shù)據(jù)庫管理系統(tǒng)因块。在這些系統(tǒng)中，您正在凝視的每個(gè)查詢都會(huì)被分解為由MPP網(wǎng)格的節(jié)點(diǎn)并行執(zhí)行的一組協(xié)調(diào)進(jìn)程籍铁，它們的運(yùn)行時(shí)間比傳統(tǒng)的SMP RDBMS系統(tǒng)快得多涡上。該架構(gòu)提供給您的另一個(gè)優(yōu)點(diǎn)是可擴(kuò)展性，因?yàn)槟梢酝ㄟ^向其中添加新節(jié)點(diǎn)輕松擴(kuò)展網(wǎng)格拒名。為了能夠處理大量的數(shù)據(jù)吩愧，這些解決方案中的數(shù)據(jù)通常在每個(gè)節(jié)點(diǎn)只處理其本地?cái)?shù)據(jù)的方式在節(jié)點(diǎn)（分片）之間分割。這進(jìn)一步加快了數(shù)據(jù)的處理速度增显，因?yàn)闉檫@種設(shè)計(jì)使用共享存儲(chǔ)將是一個(gè)巨大的過度 - 更復(fù)雜雁佳，更昂貴，更少的可擴(kuò)展性甸怕，更高的網(wǎng)絡(luò)利用率甘穿，更少的并行性。這就是為什么大多數(shù)MPP DBMS解決方案是無共享的梢杭，并且可以在DAS存儲(chǔ)上或在小型服務(wù)器之間共享的一組存儲(chǔ)架上工作温兼。這種方法被Teradata，Greenplum武契，Vertica募判，Netezza等類似解決方案所使用荡含。所有這些都有專門為MPP解決方案開發(fā)的復(fù)雜而成熟的SQL優(yōu)化器。所有這些都是可擴(kuò)展的届垫，內(nèi)置語言和這些解決方案的工具集支持幾乎任何客戶的愿望释液，無論是地理空間分析，數(shù)據(jù)挖掘的全文搜索装处。所有這些都是封閉源復(fù)雜的企業(yè)解決方案（但FYI误债，Greenplum將在2015年第四季度開放采購）在這個(gè)行業(yè)多年，它們足夠穩(wěn)定地運(yùn)行其用戶的關(guān)鍵任務(wù)工作負(fù)載妄迁。

Paste_Image.png

Hadoop怎么樣寝蹈？這不是一個(gè)單一的技術(shù)，它是相關(guān)項(xiàng)目的生態(tài)系統(tǒng)登淘，它的優(yōu)缺點(diǎn)箫老。最大的Pro是可擴(kuò)展性 - 許多新組件出現(xiàn)（像Spark之前一樣），并且它們與基礎(chǔ)Hadoop的核心技術(shù)保持集成黔州，這阻止了您的鎖定耍鬓，并允許進(jìn)一步擴(kuò)展集群用例。作為一個(gè)可以理解的事實(shí)流妻，自己構(gòu)建一個(gè)單獨(dú)的技術(shù)的平臺(tái)是一個(gè)很多工作牲蜀，現(xiàn)在沒有人手動(dòng)，大多數(shù)公司都在運(yùn)行像Cloudera提供的預(yù)建平臺(tái)合冀， Hortonworks各薇。

Hadoop存儲(chǔ)技術(shù)基于完全不同的方法。而不是基于某個(gè)鍵對數(shù)據(jù)進(jìn)行分片君躺，它將數(shù)據(jù)塊分解為固定（可配置）大小的塊峭判，并在節(jié)點(diǎn)之間分割數(shù)據(jù)。這些塊是大的棕叫，它們是只讀的以及整體文件系統(tǒng)（HDFS）林螃。為了簡單起見，將小的100行表加載到MPP中將導(dǎo)致引擎根據(jù)表的密鑰來劃分?jǐn)?shù)據(jù)俺泣，這樣在一個(gè)足夠大的集群中疗认，每個(gè)節(jié)點(diǎn)將只存儲(chǔ)一個(gè)行。相比之下伏钠，在HDFS中横漏，整個(gè)小表將被寫入單個(gè)塊中，該塊將被表示為datanode文件系統(tǒng)上的單個(gè)文件熟掂。

Paste_Image.png

接下來缎浇，集群資源管理呢？與MPP設(shè)計(jì)相反赴肚，Hadoop資源管理器（YARN）為您提供了更精細(xì)的資源管理 - 與MPP相比素跺，MapReduce作業(yè)并不需要所有的計(jì)算任務(wù)并行運(yùn)行二蓝，因此您甚至可以處理大量的如果集群的其他部分被完全利用，則在單個(gè)節(jié)點(diǎn)上運(yùn)行的一組任務(wù)中的數(shù)據(jù)指厌。它還具有一系列不錯(cuò)的功能刊愚，如可擴(kuò)展性，支持長容器等踩验。但實(shí)際上它比MPP資源管理器慢鸥诽，有時(shí)管理并發(fā)性好。

Paste_Image.png

接下來是Hadoop的SQL接口箕憾。在這里衙传，您可以選擇各種工具：可能是Hive在MR / Tez / Spark上運(yùn)行，它可能是SparkSQL厕九，它可能是Impala或HAWQ或IBM BigSQL，它可能與Splice Machine完全不同地回。您有廣泛的選擇扁远，很容易迷失在這樣的技術(shù)中。

第一個(gè)選項(xiàng)是Hive刻像，它是將SQL查詢轉(zhuǎn)換為MR / Tez / Spark作業(yè)并在集群上執(zhí)行它們的引擎畅买。所有的工作都建立在相同的MapReduce概念之上，并為您提供了良好的群集利用率選項(xiàng)细睡，并與其他Hadoop堆棧進(jìn)行了良好的集成谷羞。但是這些缺點(diǎn)也是很大的 - 執(zhí)行查詢的延遲很大，特別是對于表連接性能降低溜徙，沒有查詢優(yōu)化器（至少現(xiàn)在）湃缎，所以引擎執(zhí)行你要求的內(nèi)容，即使是最差的選項(xiàng)蠢壹。這張照片涵蓋了過時(shí)的MR1設(shè)計(jì)嗓违，但在我們的上下文中并不重要：

Paste_Image.png

像Impala和HAWQ這樣的解決方案位于這一優(yōu)勢的另一邊，它們是Hadoop之上的MPP執(zhí)行引擎图贸，用于存儲(chǔ)在HDFS中的數(shù)據(jù)蹂季。與其他MPP引擎一樣，它們可以為您提供更低的延遲和更少的處理時(shí)間疏日，而且可以降低可擴(kuò)展性和較低的穩(wěn)定性偿洁。

Paste_Image.png

SparkSQL是坐在MapReduce和MPP-over-Hadoop方法之間的不同的野獸，試圖獲得最好的兩個(gè)世界并有自己的缺點(diǎn)沟优。與MR類似涕滋，它將作業(yè)分成一組獨(dú)立安排的任務(wù)，提供更好的穩(wěn)定性。像MPP一樣窖铡，它嘗試在執(zhí)行階段之間流式傳輸數(shù)據(jù)，以加快處理速度烈菌。此外爱榕，它使用MPP（與其impalad和HAWQ段）熟悉的固定執(zhí)行器概念來減少查詢的延遲瓣喊。但它也結(jié)合了這些解決方案的缺點(diǎn) - 不如MPP那么快，而不是像MapReduce那樣穩(wěn)定和可擴(kuò)展黔酥。

當(dāng)我分開覆蓋所有的技術(shù)時(shí)藻三，在這里把它放在一起：

比較項(xiàng)目 MPP Hadoop
平臺(tái)開放封閉和專有。對于某些技術(shù), 通過互聯(lián)網(wǎng)免費(fèi)提供供應(yīng)商和社區(qū)資源的完全開源
甚至不能為非客戶下載文檔
可擴(kuò)展性平均數(shù)十個(gè)節(jié)點(diǎn)跪者，最大100-200 平均100個(gè)節(jié)點(diǎn)棵帽，可擴(kuò)展至幾千個(gè)節(jié)點(diǎn)
個(gè)節(jié)點(diǎn)
可處理數(shù)據(jù) 平均10TB,最大1PB 平均100TB, 多值1oPB
延遲 10-20毫秒 10-20秒
平均查詢時(shí)間 5-7 秒 10-15 分鐘
最大查詢時(shí)間 1-2小時(shí) 1-2周
查詢優(yōu)化擁有復(fù)雜的企業(yè)級(jí)優(yōu)化器沒有優(yōu)化器或優(yōu)化器功能非常有限，有時(shí)甚至優(yōu)化不是基于成本的
查詢調(diào)試和分析便于查看的查詢執(zhí)行計(jì)劃渣玲、 OOM問題和Java堆轉(zhuǎn)儲(chǔ)分析逗概，GC在群集組件上暫停，每個(gè)任務(wù)的單獨(dú)日志給你很多有趣的時(shí)間
查詢執(zhí)行統(tǒng)計(jì)信息
說明性錯(cuò)誤信息
技術(shù)價(jià)格每個(gè)節(jié)點(diǎn)數(shù)十萬美元每個(gè)節(jié)點(diǎn)免費(fèi)或高達(dá)數(shù)千美元
易用性簡單友好的SQL界面和簡單可編譯 SQL不完全符合ANSI標(biāo)準(zhǔn)忘衍，用戶應(yīng)該關(guān)心執(zhí)行邏輯逾苫，底層數(shù)據(jù)布局。函數(shù)通常需要用Java編寫枚钓，編譯并放在集群上
的數(shù)據(jù)庫內(nèi)功的數(shù)據(jù)庫內(nèi)置函數(shù)
目標(biāo)用戶業(yè)務(wù)分析師 Java開發(fā)人員和經(jīng)驗(yàn)豐富的DBA
單作業(yè)冗余低铅搓，當(dāng)MPP節(jié)點(diǎn)發(fā)生故障時(shí)作業(yè)失敗高，作業(yè)只有當(dāng)節(jié)點(diǎn)管理作業(yè)執(zhí)行失敗時(shí)才會(huì)失敗
最小數(shù)據(jù)集任意 GB
最大并發(fā)性十到數(shù)百個(gè)查詢多達(dá)10-20個(gè)job
技術(shù)可擴(kuò)展性僅使用供應(yīng)商提供的工具混搭
DBA技能等級(jí)要求普通DBA 需要懂Java編程的高級(jí)RDBMSDBA
解決方案實(shí)施復(fù)雜性一般復(fù)雜

通過這些信息搀捷，您可以總結(jié)為什么Hadoop不能用作傳統(tǒng)企業(yè)數(shù)據(jù)倉庫的完全替代品星掰，
但它可以用作以分布式方式處理大量數(shù)據(jù)并從數(shù)據(jù)中獲得重要見解的引擎。 Facebook
擁有一個(gè)300PB的Hadoop嫩舟，并且仍然使用一個(gè)小型的50TB Vertica集群氢烘，LinkedIn
擁有一個(gè)巨大的Hadoop集群，并且仍然使用Aster Data集群（由Teradata購買的MPP）至壤，
您可以繼續(xù)使用此列表威始。

最后編輯于：2017.12.04 22:15:07

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市像街，隨后出現(xiàn)的幾起案子黎棠，更是在濱河造成了極大的恐慌，老刑警劉巖镰绎，帶你破解...
沈念sama閱讀 222,104評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件脓斩，死亡現(xiàn)場離奇詭異，居然都是意外死亡畴栖，警方通過查閱死者的電腦和手機(jī)随静，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,816評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人燎猛，你說我怎么就攤上這事恋捆。” “怎么了重绷？”我有些...
開封第一講書人閱讀 168,697評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵沸停，是天一觀的道長。經(jīng)常有香客問我昭卓，道長愤钾，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 59,836評(píng)論 1贊 298
?港島之戀（遺憾婚禮）
正文為了忘掉前任候醒，我火速辦了婚禮能颁，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘倒淫。我一直安慰自己伙菊，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,851評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布敌土。她就那樣靜靜地躺著占业，像睡著了一般。火紅的嫁衣襯著肌膚如雪纯赎。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,441評(píng)論 1贊 310
城市分裂傳說
那天南蹂，我揣著相機(jī)與錄音犬金，去河邊找鬼。笑死六剥，一個(gè)胖子當(dāng)著我的面吹牛晚顷，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播疗疟，決...
沈念sama閱讀 40,992評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼该默，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了策彤？” 一聲冷哼從身側(cè)響起栓袖，我...
開封第一講書人閱讀 39,899評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎店诗，沒想到半個(gè)月后裹刮，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,457評(píng)論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡庞瘸，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,529評(píng)論 3贊 341
?白月光啟示錄
正文我和宋清朗相戀三年捧弃，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,664評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡违霞，死狀恐怖嘴办，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情买鸽，我是刑警寧澤涧郊，帶...
沈念sama閱讀 36,346評(píng)論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站癞谒，受9級(jí)特大地震影響底燎，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜弹砚，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,025評(píng)論 3贊 334
男人毒藥：我在死后第九天來索命
文/蒙蒙一双仍、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧桌吃，春花似錦朱沃、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,511評(píng)論 0贊 24
一樁弒父案逗物，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至瑟俭，卻和暖如春翎卓，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背摆寄。一陣腳步聲響...
開封第一講書人閱讀 33,611評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工失暴，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人微饥。一個(gè)月前我還...
沈念sama閱讀 49,081評(píng)論 3贊 377
代替公主和親
正文我出身青樓逗扒，卻偏偏與公主長得像，于是被迫代替她去往敵國和親欠橘。傳聞我的和親對象是個(gè)殘疾皇子矩肩，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,675評(píng)論 2贊 359

Hadoop 和 MPP 的比較【詳細(xì)】

推薦閱讀更多精彩內(nèi)容