2017年了還在用MapReduce的公司是不是智障绎晃?

失業(yè)在家,發(fā)點(diǎn)牢騷杂曲。

陸陸續(xù)續(xù)面了一些職位箕昭,跟朋友們也交流過,發(fā)現(xiàn)有些公司面試數(shù)據(jù)工程師確實(shí)挺有意思的解阅,其中一種落竹,就叫“我就是要用mapreduce我不聽我不聽我不聽”。

所以到底為啥一定要用mapreduce?

我唯一的猜測货抄,就是map reduce這種模型對(duì)于程序員們單線程的腦子來說述召,比sql來的簡單朱转,哦還有,schema-less积暖,元數(shù)據(jù)這種事情最討壓了藤为!

所以他們習(xí)慣于從文本文件里把數(shù)據(jù)讀出來,然后若干個(gè)高度優(yōu)化過的map reduce過程之后夺刑,得到了一個(gè)文本文件缅疟,然后再灌進(jìn)mysql,數(shù)據(jù)處理完了。全套Java搞定遍愿,美滋滋存淫。

稍微想一想,全用mapreduce 來處理數(shù)據(jù)有如下幾個(gè)問題:

1.沒有表

沒有表意味著所有關(guān)于數(shù)據(jù)集的信息全部存在java code里沼填,就像mongodb一樣桅咆,不是沒有模式,只是模式存在code里坞笙,別人想用就慢慢猜吧岩饼,所謂走自己的路讓別人無路可走。

2.刻舟求劍的優(yōu)化

有次去某云供應(yīng)鏈公司面試薛夜,負(fù)責(zé)人跟我說他們覺得mapreduce更有控制力籍茧,更容易做優(yōu)化,比如說對(duì)于數(shù)據(jù)傾斜可以預(yù)先把傾斜的key先提出來做處理等等梯澜,這種就叫做刻舟求劍式的優(yōu)化寞冯,根據(jù)某一個(gè)時(shí)刻或者某一時(shí)期數(shù)據(jù)的狀態(tài)來硬編碼一些優(yōu)化策略,等到下個(gè)月數(shù)據(jù)的狀態(tài)變了腊徙,這些優(yōu)化又要重做简十,不得加班加到死啊檬某。

3.事倍功半

考慮一個(gè)企業(yè)數(shù)據(jù)分析的全流程撬腾,mr job 跟用hive相比,只省了建表的工作量恢恼,而且沒有積累民傻,昨天用mr job處理過的數(shù)據(jù),為了和今天的新數(shù)據(jù)交互场斑,還是要用mr job漓踢,once mr,alwayes mr。

hive只要加載到表里漏隐,后續(xù)工作可以用多種工具完成喧半,比如spark,比如impala,比如presto等等,無論哪一種青责,都比mr job工作量少挺据。

如果說2010年之前用mr job處理數(shù)據(jù)而不用hive是因?yàn)閔ive不夠穩(wěn)定不夠好取具,現(xiàn)在還有什么理由?現(xiàn)在hive有tez有orc有l(wèi)lap,還有各種udf和udaf,還有各種分析函數(shù)扁耐,比起手寫map reduce暇检,不知道強(qiáng)大多少倍,到底是為啥不用hive?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末婉称,一起剝皮案震驚了整個(gè)濱河市块仆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌王暗,老刑警劉巖悔据,帶你破解...
    沈念sama閱讀 223,207評(píng)論 6 521
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異瘫筐,居然都是意外死亡蜜暑,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,455評(píng)論 3 400
  • 文/潘曉璐 我一進(jìn)店門策肝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來肛捍,“玉大人,你說我怎么就攤上這事之众∽竞粒” “怎么了?”我有些...
    開封第一講書人閱讀 170,031評(píng)論 0 366
  • 文/不壞的土叔 我叫張陵棺禾,是天一觀的道長缀蹄。 經(jīng)常有香客問我,道長膘婶,這世上最難降的妖魔是什么缺前? 我笑而不...
    開封第一講書人閱讀 60,334評(píng)論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮悬襟,結(jié)果婚禮上衅码,老公的妹妹穿的比我還像新娘。我一直安慰自己脊岳,他們只是感情好逝段,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,322評(píng)論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著割捅,像睡著了一般奶躯。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上亿驾,一...
    開封第一講書人閱讀 52,895評(píng)論 1 314
  • 那天嘹黔,我揣著相機(jī)與錄音,去河邊找鬼莫瞬。 笑死儡蔓,一個(gè)胖子當(dāng)著我的面吹牛醉锄,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播浙值,決...
    沈念sama閱讀 41,300評(píng)論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼恳不,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了开呐?” 一聲冷哼從身側(cè)響起烟勋,我...
    開封第一講書人閱讀 40,264評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎筐付,沒想到半個(gè)月后卵惦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,784評(píng)論 1 321
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瓦戚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,870評(píng)論 3 343
  • 正文 我和宋清朗相戀三年沮尿,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片较解。...
    茶點(diǎn)故事閱讀 40,989評(píng)論 1 354
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡畜疾,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出印衔,到底是詐尸還是另有隱情啡捶,我是刑警寧澤,帶...
    沈念sama閱讀 36,649評(píng)論 5 351
  • 正文 年R本政府宣布奸焙,位于F島的核電站瞎暑,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏与帆。R本人自食惡果不足惜了赌,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,331評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望玄糟。 院中可真熱鬧勿她,春花似錦、人聲如沸茶凳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,814評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽贮喧。三九已至,卻和暖如春猪狈,著一層夾襖步出監(jiān)牢的瞬間箱沦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,940評(píng)論 1 275
  • 我被黑心中介騙來泰國打工雇庙, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谓形,地道東北人灶伊。 一個(gè)月前我還...
    沈念sama閱讀 49,452評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像寒跳,于是被迫代替她去往敵國和親聘萨。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,995評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容