更好Hadoop管理的三步最佳實(shí)踐

基于Yarn的一系列Hadoop應(yīng)用如Spark灌闺、Storm和Presto等的出現(xiàn)再一次降低了企業(yè)步入大數(shù)據(jù)的門檻夹供，大數(shù)據(jù)應(yīng)用安全性得以提高戚炫，企業(yè)的商業(yè)價(jià)值也獲得潛在提升袭厂，大批企業(yè)為之欣喜若狂墨吓。然而，在瘋狂搭建大數(shù)據(jù)應(yīng)用的背后纹磺，作為企業(yè)用戶帖烘，如果無(wú)法成功而高效的管理大數(shù)據(jù)應(yīng)用，確保大數(shù)據(jù)系統(tǒng)的性能和穩(wěn)定性橄杨，反而會(huì)造成用戶流失的苦果秘症，在大數(shù)據(jù)巴士中我看到很多人最終將問(wèn)題歸咎于Hadoop并失去對(duì)它的信任。

Hadoop環(huán)境必須要優(yōu)化運(yùn)行才能滿足最終用戶的期望式矫。我們綜合了無(wú)數(shù)Hadoop平臺(tái)的企業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn)乡摹，匯集成以下三個(gè)最佳實(shí)踐，幫助提高大數(shù)據(jù)應(yīng)用的表現(xiàn)：

1均衡配置工作量

工作量管理是Hadoop環(huán)境的重要因素采转。因?yàn)樵诖髷?shù)據(jù)巴士中我看到企業(yè)中的大數(shù)據(jù)系統(tǒng)被廣泛的用于生產(chǎn)環(huán)境聪廉，業(yè)務(wù)團(tuán)隊(duì)的需求必然會(huì)考驗(yàn)到系統(tǒng)資源的各種組件，新部署的大數(shù)據(jù)應(yīng)用需要與企業(yè)原有的應(yīng)用相互競(jìng)爭(zhēng)并且拿出具有說(shuō)服力的表現(xiàn)。即使Hadoop集群是完全按照供應(yīng)商提供的指導(dǎo)而部署的锄列，企業(yè)也應(yīng)當(dāng)根據(jù)自己的實(shí)際工作量重新配置图云。系統(tǒng)管理員可以使用Yarn的工作量管理功能來(lái)為不同的用戶分配相應(yīng)的系統(tǒng)資源來(lái)確保滿足服務(wù)水平。

工作量管理正確設(shè)置和調(diào)整后邻邮，管理員可以調(diào)度作業(yè)任務(wù)以獲得群集資源的最大利用率竣况，不僅能夠?qū)adoop集群的足跡維持在適當(dāng)大小，也提高了應(yīng)對(duì)不斷變化的業(yè)務(wù)需求的適應(yīng)能力筒严。

2保持業(yè)務(wù)連續(xù)性

企業(yè)中最有價(jià)值的數(shù)據(jù)都被分布安放在Hadoop平臺(tái)中丹泉，此時(shí)系統(tǒng)的持續(xù)可用性和數(shù)據(jù)保護(hù)變得更加重要，然而Hadoop的數(shù)據(jù)復(fù)制能力并不足以在一場(chǎng)災(zāi)難中保護(hù)最重要的數(shù)據(jù)鸭蛙。常規(guī)做法是設(shè)立一個(gè)標(biāo)準(zhǔn)的三路復(fù)制方案用來(lái)保護(hù)各種數(shù)據(jù)對(duì)象以免損壞或丟失摹恨，但這種備份和災(zāi)難恢復(fù)策略在大數(shù)據(jù)巴士的評(píng)論中被說(shuō)明并不足夠。

Hadoop自身的復(fù)制功能可以提供較好的容錯(cuò)性和數(shù)據(jù)局部性處理娶视，但在同一個(gè)機(jī)架保存三個(gè)數(shù)據(jù)副本并不能在出現(xiàn)無(wú)法避免的天災(zāi)人禍時(shí)保護(hù)它晒哄。要徹底解決這個(gè)問(wèn)題，數(shù)據(jù)必須要每天備份到另一個(gè)數(shù)據(jù)中心肪获，需要用到數(shù)據(jù)歸檔工具或云實(shí)例寝凌，這樣做有助于保護(hù)信息免受自然災(zāi)害、網(wǎng)絡(luò)攻擊或其他不可預(yù)見(jiàn)的事件發(fā)生時(shí)遭受損失孝赫。

回到業(yè)務(wù)連續(xù)性较木，別忘了NameNode備份的問(wèn)題。NameNode在Hadoop分布式文件系統(tǒng)（HDFS）的特定目錄中存儲(chǔ)數(shù)據(jù)在集群的保存位置青柄。如果發(fā)生單點(diǎn)故障伐债，從頭開(kāi)始重建NameNode是一個(gè)費(fèi)時(shí)費(fèi)力的工作，并且可能會(huì)有潛在的數(shù)據(jù)丟失致开。這就是為什么隨著生產(chǎn)系統(tǒng)越發(fā)龐大峰锁，備份數(shù)據(jù)和NameNode的任務(wù)就越來(lái)越重要。

搭建在Hadoop中的關(guān)鍵應(yīng)用需要一個(gè)高可用性策略喇喉，這就需要一個(gè)計(jì)劃來(lái)確保生產(chǎn)流程在遇到未知情況時(shí)不受到影響祖今。從原料來(lái)源到離線備份，一定要為那些無(wú)法負(fù)擔(dān)損失的重要數(shù)據(jù)設(shè)計(jì)好一個(gè)完善的重建數(shù)據(jù)的過(guò)程拣技。

3豐富的Hadoop實(shí)戰(zhàn)經(jīng)驗(yàn)

熟悉了解Hadoop架構(gòu)的詳細(xì)文檔千诬、日常監(jiān)測(cè)任務(wù)以及各種標(biāo)準(zhǔn)解決方案當(dāng)然是必不可少的，但更加無(wú)可替代的是實(shí)戰(zhàn)經(jīng)驗(yàn)膏斤。即使應(yīng)用支持文檔準(zhǔn)備的再充分徐绑，也一定會(huì)出現(xiàn)無(wú)法解決的挑戰(zhàn)，這時(shí)就是經(jīng)驗(yàn)展示身手的時(shí)刻莫辨。作為大數(shù)據(jù)平臺(tái)的管理員傲茄，必須掌握管理和開(kāi)發(fā)大數(shù)據(jù)開(kāi)源平臺(tái)的一整套技能集合毅访，所需要的知識(shí)和功底遠(yuǎn)遠(yuǎn)超出培訓(xùn)機(jī)構(gòu)速成而來(lái)的DBA。

除了Hadoop管理經(jīng)驗(yàn)盘榨，大數(shù)據(jù)應(yīng)用支持團(tuán)隊(duì)?wèi)?yīng)該擁有堅(jiān)實(shí)的技術(shù)背景喻粹，能夠應(yīng)對(duì)各種不規(guī)范的問(wèn)題。團(tuán)隊(duì)中應(yīng)該至少有一位高級(jí)技術(shù)人員可以解決特別棘手的挑戰(zhàn)草巡。他應(yīng)該擁有Hadoop自定義應(yīng)用開(kāi)發(fā)的詳細(xì)知識(shí)守呜、強(qiáng)大的Linux技能和解決復(fù)雜問(wèn)題的能力。

即使是最有經(jīng)驗(yàn)的Hadoop管理員也需要合適的工具來(lái)完成他們的工作山憨，例如很多支持和開(kāi)發(fā)團(tuán)隊(duì)正在使用開(kāi)源管理工具如Ambari和Nagios查乒，然而他們最終會(huì)發(fā)現(xiàn)許多工具并不成熟，因此有必要購(gòu)買一些收費(fèi)的監(jiān)控和修復(fù)工具來(lái)應(yīng)對(duì)一些不常見(jiàn)的問(wèn)題郁竟，維持大數(shù)據(jù)系統(tǒng)的高效運(yùn)行并將宕機(jī)時(shí)間降到最低玛迄。

獲得最佳的Hadoop環(huán)境

雖然Hadoop并不是數(shù)據(jù)庫(kù)，但許多數(shù)據(jù)管理的理念和技術(shù)是相同的棚亩，比如優(yōu)先滿足業(yè)務(wù)需求和確保工作量蓖议、保證業(yè)務(wù)連續(xù)性、降低宕機(jī)和丟失信息的風(fēng)險(xiǎn)蔑舞。此外拒担，經(jīng)驗(yàn)在Hadoop管理與分析工作中是非常關(guān)鍵的，畢竟你不可能碰巧就建立起了一個(gè)高度優(yōu)化的環(huán)境攻询，實(shí)際上這些都是一天接一天巧妙的管理工作的結(jié)果，確保大數(shù)據(jù)應(yīng)用的優(yōu)越性能以及良好的用戶滿意度州弟。

最后編輯于：2017.12.04 01:21:14

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末钧栖，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子婆翔，更是在濱河造成了極大的恐慌拯杠，老刑警劉巖，帶你破解...
沈念sama閱讀 219,589評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件啃奴，死亡現(xiàn)場(chǎng)離奇詭異潭陪，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)最蕾，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,615評(píng)論 3贊 396
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門依溯，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人瘟则，你說(shuō)我怎么就攤上這事黎炉。” “怎么了醋拧？”我有些...
開(kāi)封第一講書人閱讀 165,933評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵慷嗜，是天一觀的道長(zhǎng)淀弹。經(jīng)常有香客問(wèn)我，道長(zhǎng)庆械，這世上最難降的妖魔是什么薇溃？我笑而不...
開(kāi)封第一講書人閱讀 58,976評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮缭乘，結(jié)果婚禮上痊焊，老公的妹妹穿的比我還像新娘。我一直安慰自己忿峻，他們只是感情好薄啥，可當(dāng)我...
茶點(diǎn)故事閱讀 67,999評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著逛尚，像睡著了一般垄惧。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上绰寞，一...
開(kāi)封第一講書人閱讀 51,775評(píng)論 1贊 307
城市分裂傳說(shuō)
那天到逊，我揣著相機(jī)與錄音，去河邊找鬼滤钱。笑死觉壶，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的件缸。我是一名探鬼主播铜靶，決...
沈念sama閱讀 40,474評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼他炊！你這毒婦竟也來(lái)了争剿？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書人閱讀 39,359評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤痊末，失蹤者是張志新（化名）和其女友劉穎蚕苇，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體凿叠，經(jīng)...
沈念sama閱讀 45,854評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡涩笤，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,007評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年裕便，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了匈睁。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,146評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡获茬，死狀恐怖履恩，靈堂內(nèi)的尸體忽然破棺而出锰茉，到底是詐尸還是另有隱情，我是刑警寧澤切心，帶...
沈念sama閱讀 35,826評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布飒筑，位于F島的核電站片吊，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏协屡。R本人自食惡果不足惜俏脊，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,484評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望肤晓。院中可真熱鬧爷贫，春花似錦、人聲如沸补憾。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 32,029評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)盈匾。三九已至腾务，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間削饵，已是汗流浹背岩瘦。一陣腳步聲響...
開(kāi)封第一講書人閱讀 33,153評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留窿撬，地道東北人启昧。一個(gè)月前我還...
沈念sama閱讀 48,420評(píng)論 3贊 373
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像劈伴，于是被迫代替她去往敵國(guó)和親密末。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,107評(píng)論 2贊 356

更好Hadoop管理的三步最佳實(shí)踐

推薦閱讀更多精彩內(nèi)容