hadoop rebalance 小計(jì)

image.png

集群新加節(jié)點(diǎn)的目的 一是為了應(yīng)付源源不斷的日志存儲(chǔ)寻拂,而是加快計(jì)算的能力,但是如果hdfs上的數(shù)據(jù)存儲(chǔ)沒(méi)有原則 败京,那 總有一天擴(kuò)容是要崩盤(pán)的兜喻,無(wú)法面對(duì)源源不斷的擴(kuò)容需求,另外 hadoop rebalance 也是有瓶頸的赡麦,有的就是本身的硬件性能影響朴皆,你看到有人說(shuō) 可以做到幾秒 移動(dòng) 幾個(gè)TB 的數(shù)據(jù)塊,你有咩有問(wèn)過(guò)人家的網(wǎng)絡(luò)帶寬是多少泛粹?

比如說(shuō)阿里云 內(nèi)網(wǎng)帶寬就是130MB/S,HDFS 數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)塊rebalance 其實(shí)就是通過(guò)內(nèi)網(wǎng)的網(wǎng)絡(luò)通信 來(lái)傳輸 移動(dòng) 數(shù)據(jù)的遂铡,你如果hadoop使用的是外網(wǎng)連接的,那就更扯了晶姊,除非 外網(wǎng)比內(nèi)網(wǎng)有更快的傳輸速度扒接。

我們的hadoop 部署在阿里云上,阿里云上的虛擬化后的網(wǎng)卡性能 基本就是百兆網(wǎng)卡而已们衙,而且不能調(diào)節(jié)大小钾怔,你撐死傳輸速率打滿網(wǎng)卡,也就130MB/s,我們自己rebalance時(shí) 的測(cè)試 20小時(shí) 傳輸了大概9T左右的數(shù)據(jù)蒙挑,平均下來(lái)宗侦,單臺(tái)新增節(jié)點(diǎn) 接受 數(shù)據(jù)傳輸?shù)哪芰κ? 106MB/S,這個(gè)速度 其實(shí)也是已經(jīng)相當(dāng)可以了忆蚀,比35mb/s要好很多矾利。但是老大還是嫌棄 ,太慢馋袜,是呀男旗,能有什么辦法,誰(shuí)讓這個(gè)網(wǎng)卡的硬件性能的局限欣鳖,當(dāng)然rebalance有幾個(gè)參數(shù) 察皇,比如 多線程 申請(qǐng)更大的網(wǎng)絡(luò)帶寬,其實(shí)都是治標(biāo)不治本泽台,你申請(qǐng)1GB/s 的帶寬什荣,根本就是扯淡 無(wú)法實(shí)現(xiàn) 癡人說(shuō)夢(mèng) 只能是自說(shuō)自話呀忧,有種你自己飛過(guò)來(lái)呀 !

所以這個(gè)rebalance 就給我們很多思考溃睹,1.時(shí)機(jī) 2.硬件 3 業(yè)務(wù) 4 數(shù)據(jù)
1.耗時(shí)長(zhǎng) 所以安排在一定 在業(yè)務(wù)清閑 的周五開(kāi)始 或者周末,hdfs 磁盤(pán)占用在80%左右就應(yīng)該擴(kuò)容 rebalance
2.硬件 胰坟,你必須考慮到網(wǎng)卡 帶寬 硬盤(pán)讀寫(xiě)速度因篇,這個(gè)不是自己摘塊 硬盤(pán)安裝到 另一臺(tái)機(jī)器上,不是可插拔的
3.業(yè)務(wù)上笔横,rebalance 影響都 mapReduce job竞滓,基本上是不可以進(jìn)行的,也會(huì)影響到數(shù)據(jù)流的寫(xiě)入
4.數(shù)據(jù) rebalance時(shí)吹缔, 集群按道理應(yīng)該進(jìn)入安全模式商佑,禁止外界對(duì) 數(shù)據(jù)的操作,萬(wàn)一數(shù)據(jù)丟失重復(fù) 找不到 都是有可能的厢塘,我們對(duì)歷史日志文件 歸檔 壓縮 清洗加刪除 茶没,才能保證集群的萬(wàn)古長(zhǎng)青

參考一些 文獻(xiàn) ,發(fā)現(xiàn)大家 對(duì) hdfs的 rebalance 還是 頗有怨言的晚碾,誰(shuí)讓你窮 抓半,買(mǎi)不起萬(wàn)兆網(wǎng)卡 ,買(mǎi)不 起 MLC SSD 企業(yè)硬盤(pán)

https://www.quora.com/What-are-the-best-practices-for-running-Hadoop-Balancer-in-a-cluster

http://www.informit.com/articles/article.aspx?p=2755708&seqNum=5

http://people.apache.org/~liuml07/2017/05/31/My-HDFS-balancer-is-slow/

https://community.hortonworks.com/questions/8626/what-are-the-best-practices-for-hdfs-rebalancing.html

https://community.hortonworks.com/articles/43615/hdfs-balancer-1-100x-performance-improvement.html

https://community.hortonworks.com/questions/27364/when-should-i-stop-the-balancer.html

https://community.cloudera.com/t5/Storage-Random-Access-HDFS/HDFS-Balancer-slow-in-CDH5-3-2/td-p/33198

https://community.cloudera.com/t5/Cloudera-Manager-Installation/hdfs-balancer-slow-to-move-data-around-in-cdh-5/td-p/17226

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末格嘁,一起剝皮案震驚了整個(gè)濱河市笛求,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌糕簿,老刑警劉巖探入,帶你破解...
    沈念sama閱讀 223,002評(píng)論 6 519
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異懂诗,居然都是意外死亡蜂嗽,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,357評(píng)論 3 400
  • 文/潘曉璐 我一進(jìn)店門(mén)响禽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)徒爹,“玉大人,你說(shuō)我怎么就攤上這事芋类÷⌒幔” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,787評(píng)論 0 365
  • 文/不壞的土叔 我叫張陵侯繁,是天一觀的道長(zhǎng)胖喳。 經(jīng)常有香客問(wèn)我,道長(zhǎng)贮竟,這世上最難降的妖魔是什么丽焊? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,237評(píng)論 1 300
  • 正文 為了忘掉前任较剃,我火速辦了婚禮,結(jié)果婚禮上技健,老公的妹妹穿的比我還像新娘写穴。我一直安慰自己,他們只是感情好雌贱,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,237評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布啊送。 她就那樣靜靜地躺著,像睡著了一般欣孤。 火紅的嫁衣襯著肌膚如雪馋没。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,821評(píng)論 1 314
  • 那天降传,我揣著相機(jī)與錄音篷朵,去河邊找鬼。 笑死婆排,一個(gè)胖子當(dāng)著我的面吹牛声旺,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播泽论,決...
    沈念sama閱讀 41,236評(píng)論 3 424
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼艾少,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了翼悴?” 一聲冷哼從身側(cè)響起缚够,我...
    開(kāi)封第一講書(shū)人閱讀 40,196評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎鹦赎,沒(méi)想到半個(gè)月后谍椅,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,716評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡古话,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,794評(píng)論 3 343
  • 正文 我和宋清朗相戀三年雏吭,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陪踩。...
    茶點(diǎn)故事閱讀 40,928評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡杖们,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出肩狂,到底是詐尸還是另有隱情摘完,我是刑警寧澤,帶...
    沈念sama閱讀 36,583評(píng)論 5 351
  • 正文 年R本政府宣布傻谁,位于F島的核電站孝治,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜谈飒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,264評(píng)論 3 336
  • 文/蒙蒙 一岂座、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧杭措,春花似錦费什、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,755評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至刑桑,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間募舟,已是汗流浹背祠斧。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,869評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留拱礁,地道東北人琢锋。 一個(gè)月前我還...
    沈念sama閱讀 49,378評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像呢灶,于是被迫代替她去往敵國(guó)和親吴超。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,937評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容