第一課作業(yè)

一涩澡、HDFS HA架構(gòu)圖梳理

HDFS_HA.jpg

Hadoop 2.x版本中拧晕,HDFS架構(gòu)引入雙NameNode解決了單點(diǎn)故障問(wèn)題

二十酣、YARN HA架構(gòu)圖梳理

YARN_HA.jpg

三、總結(jié)HDFS YARN HA架構(gòu)區(qū)別

1 ZKFC

  1. HDFS中ZKFC作為單獨(dú)的進(jìn)程
  2. Yarn中ZKFC是RM中的線(xiàn)程

2 從節(jié)點(diǎn)

  1. HDFS中的DataNode 會(huì)向兩個(gè)NameNode同時(shí)發(fā)送心跳蚊丐。
  2. Yarn中NodeManager只會(huì)向activeRM上報(bào)資源

四、HDFS dfs -ls 結(jié)果是哪個(gè)目錄

結(jié)果查出來(lái)是本地目錄

五艳吠、雙寫(xiě)的理解

在生產(chǎn)中麦备,有兩種雙寫(xiě):

1.結(jié)果雙寫(xiě)

spark處理好的數(shù)據(jù),全部存儲(chǔ)在HBase中昭娩,兩個(gè)月的數(shù)據(jù)存放在ES集群上方便快速查詢(xún)凛篙。

2.數(shù)據(jù)同步雙寫(xiě)

架構(gòu)分為A線(xiàn)和B線(xiàn),防止延遲

六栏渺、小文件的理解呛梆。什么是小文件、危害磕诊,如何避免(產(chǎn)生前削彬,產(chǎn)生后)

1全庸、小文件問(wèn)題

????????Hdoop是存儲(chǔ)TB甚至更大級(jí)別的數(shù)據(jù)集的。一個(gè)大的文件存放在HDFS上會(huì)拆分為多個(gè)block融痛,每個(gè)block又會(huì)有多個(gè)副本(默認(rèn)3個(gè))存放在不同的服務(wù)器上壶笼。block存放在DataNode上面,元數(shù)據(jù)信息存放在NameNode上面雁刷,加載在內(nèi)存中覆劈。比如不管是存放一個(gè)大小為1TB的文件還是一個(gè)大小為1KB的文件,都會(huì)各自有一個(gè)元數(shù)據(jù)信息沛励。這種小文件很多的話(huà)责语,對(duì)NN的壓力就會(huì)非常大,就會(huì)有宕機(jī)的風(fēng)險(xiǎn)目派。

2坤候、什么是小文件

????????實(shí)際上并沒(méi)有一個(gè)標(biāo)準(zhǔn)的答案∑蟛洌籠統(tǒng)地說(shuō)小文件就是文件size小于HDFS上block大小的文件白筹。

3、小文件的危害

1)HDFS不適合大量小文件的存儲(chǔ)谅摄,因namenode將文件系統(tǒng)的元數(shù)據(jù)存放在內(nèi)存中徒河,因此存儲(chǔ)的文件數(shù)目受限于 namenode的內(nèi)存大小。HDFS中每個(gè)文件送漠、目錄顽照、數(shù)據(jù)塊占用150Bytes。如果存放的文件數(shù)目過(guò)多的話(huà)會(huì)占用很大的內(nèi)存甚至撐爆內(nèi)存

2)HDFS適用于高吞吐量闽寡,而不適合低時(shí)間延遲的訪(fǎng)問(wèn)代兵。如果同時(shí)存入大量的小文件會(huì)花費(fèi)很長(zhǎng)的時(shí)間

3)流式讀取的方式,不適合多用戶(hù)寫(xiě)入爷狈,以及任意位置寫(xiě)入奢人。如果訪(fǎng)問(wèn)小文件,則必須從一個(gè)datanode跳轉(zhuǎn)到另外一個(gè)datanode淆院,這樣大大降低了讀取性能何乎。

4、小文件是如何產(chǎn)生的

1)集群上的數(shù)據(jù)是通過(guò)某種手段采集過(guò)來(lái)的土辩。如使用Flume支救,使用不當(dāng)?shù)脑?huà)采集到HDFS的數(shù)據(jù)會(huì)有很多小文件

2)使用計(jì)算框架MR/Hive/Spark時(shí),進(jìn)行ETL會(huì)產(chǎn)生很多小文件拷淘,統(tǒng)計(jì)分析時(shí)采用數(shù)據(jù)倉(cāng)庫(kù)各墨,分好幾層,每個(gè)層里面又是一堆小文件

5启涯、如何避免小文件

沒(méi)有一個(gè)標(biāo)準(zhǔn)答案贬堵,都是根據(jù)實(shí)際情況作出處理

七恃轩、主從架構(gòu)的HBase讀寫(xiě)經(jīng)過(guò)master進(jìn)程嗎?

不經(jīng)過(guò)

1黎做、讀請(qǐng)求過(guò)程:

1)客戶(hù)端通過(guò)zookeeper以及root表和meta表找到目標(biāo)數(shù)據(jù)所在的regionserver

2)聯(lián)系regionserver查詢(xún)目標(biāo)數(shù)據(jù)

3)regionserver定位到目標(biāo)數(shù)據(jù)所在的region叉跛,發(fā)出查詢(xún)請(qǐng)求

4)region先在memstore中查找,命中則返回

5)如果在memstore中找不到蒸殿,則在storefile中掃描(可能會(huì)掃描到很多的storefile—-bloomfilter)

2筷厘、寫(xiě)請(qǐng)求過(guò)程:

1)client向region server提交寫(xiě)請(qǐng)求

2)region server找到目標(biāo)region

3)region檢查數(shù)據(jù)是否與schema一致

4)如果客戶(hù)端沒(méi)有指定版本,則獲取當(dāng)前系統(tǒng)時(shí)間作為數(shù)據(jù)版本

5)將更新寫(xiě)入WAL log

6)將更新寫(xiě)入Memstore

7)判斷Memstore的是否需要flush為Store文件宏所。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末酥艳,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子爬骤,更是在濱河造成了極大的恐慌充石,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,525評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件霞玄,死亡現(xiàn)場(chǎng)離奇詭異骤铃,居然都是意外死亡跷乐,警方通過(guò)查閱死者的電腦和手機(jī)子寓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人听隐,你說(shuō)我怎么就攤上這事『遄模” “怎么了雅任?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,862評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)咨跌。 經(jīng)常有香客問(wèn)我沪么,道長(zhǎng),這世上最難降的妖魔是什么锌半? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,728評(píng)論 1 294
  • 正文 為了忘掉前任禽车,我火速辦了婚禮,結(jié)果婚禮上刊殉,老公的妹妹穿的比我還像新娘殉摔。我一直安慰自己,他們只是感情好记焊,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布逸月。 她就那樣靜靜地躺著,像睡著了一般遍膜。 火紅的嫁衣襯著肌膚如雪碗硬。 梳的紋絲不亂的頭發(fā)上瓤湘,一...
    開(kāi)封第一講書(shū)人閱讀 51,590評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音恩尾,去河邊找鬼弛说。 笑死,一個(gè)胖子當(dāng)著我的面吹牛特笋,可吹牛的內(nèi)容都是我干的剃浇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼猎物,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼虎囚!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起蔫磨,我...
    開(kāi)封第一講書(shū)人閱讀 39,244評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤淘讥,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后堤如,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蒲列,經(jīng)...
    沈念sama閱讀 45,693評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評(píng)論 3 336
  • 正文 我和宋清朗相戀三年搀罢,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蝗岖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,001評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡榔至,死狀恐怖抵赢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情唧取,我是刑警寧澤铅鲤,帶...
    沈念sama閱讀 35,723評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站枫弟,受9級(jí)特大地震影響邢享,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜淡诗,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評(píng)論 3 330
  • 文/蒙蒙 一骇塘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧韩容,春花似錦款违、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,919評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至座掘,卻和暖如春递惋,著一層夾襖步出監(jiān)牢的瞬間柔滔,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,042評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工萍虽, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留睛廊,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,191評(píng)論 3 370
  • 正文 我出身青樓杉编,卻偏偏與公主長(zhǎng)得像超全,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子邓馒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容