Hadoop 學(xué)習(xí)筆記整理

大綱：
一. 大數(shù)據(jù)啟蒙認(rèn)識(shí)
二. HDFS
三. Hadoop1.0的非HA模式（SecondaryNameNode）
四. Hadoop2.0或者3.0的HA模式

大數(shù)據(jù)啟蒙認(rèn)識(shí)

假定事件一：

有一個(gè)1TB的文件啃勉，怎么樣找出其中相同的行？因?yàn)槲募容^大双妨，所以一般情況下不能直接把他們讀取到內(nèi)存當(dāng)中淮阐，只能一行一行讀取，并且需要所有的都要讀取兩遍斥难，如下圖：

image.png

時(shí)間復(fù)雜度為 O(n^2) n為文件的行

如果從大數(shù)據(jù)分布式的角度來考慮的話枝嘶，我們可以怎么樣解決上面的問題呢帘饶？

假定我們有2000臺(tái)集群哑诊，把讀入的每一行通過hash算法得到一個(gè)hashcode（hash算法是穩(wěn)定的，只要是相同的字符串及刻，它們得到的hashcode就會(huì)是一樣的）镀裤，然后進(jìn)行取模運(yùn)算竞阐，寫入到相應(yīng)編號(hào)的集群服務(wù)器中。大概我們可以想象成如下的樣子來查找：

image.png

注意: 每一行字符串hash算法之后會(huì)得到一個(gè)hashcode暑劝，且這個(gè)算法是穩(wěn)定的骆莹，只要是相同的行經(jīng)過hash算法之后得到的hashcode一定是一樣的，也就說相同的行一定會(huì)被分配到同一臺(tái)服務(wù)器當(dāng)中担猛。

雖然兩者都要進(jìn)行兩次的I/O操作幕垦，但是因?yàn)榉植际郊海诙蔚腎/O操作分散給了2000集群分別去完成傅联，所以花費(fèi)的時(shí)間明顯會(huì)更快先改。這也是分布式的優(yōu)勢(shì)。

假定事件二：

有一個(gè)這樣的文件蒸走，文件中包含了1~999999的數(shù)字（無序）仇奶，每個(gè)數(shù)字占一行，現(xiàn)在想把這個(gè)文件的數(shù)字按順序進(jìn)行排列比驻。

從文件中讀出一行數(shù)字该溯，然后判斷數(shù)字所屬范圍，并寫入到相應(yīng)的容器中别惦，一次類推狈茉，寫完所有的數(shù)據(jù)之后，每個(gè)容器內(nèi)部進(jìn)行排序運(yùn)算就可以步咪，最后所有的容器的數(shù)據(jù)就是一個(gè)有序的隊(duì)列论皆，大概會(huì)是如下的樣子：

image.png

這就是分布式也就是大數(shù)據(jù)的優(yōu)勢(shì)，把一個(gè)復(fù)雜的過程分解開來猾漫，分散到集群當(dāng)中点晴，讓每一個(gè)單元去完成分解之后的任務(wù)。

后來還會(huì)持續(xù)更新悯周。粒督。。

最后編輯于：2020.01.16 15:51:35

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末禽翼，一起剝皮案震驚了整個(gè)濱河市屠橄，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌闰挡，老刑警劉巖锐墙，帶你破解...
沈念sama閱讀 216,372評(píng)論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異长酗，居然都是意外死亡溪北，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來之拨，“玉大人茉继，你說我怎么就攤上這事∈辞牵” “怎么了烁竭？”我有些...
開封第一講書人閱讀 162,415評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長吉挣。經(jīng)常有香客問我派撕，道長，這世上最難降的妖魔是什么睬魂？我笑而不...
開封第一講書人閱讀 58,157評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任腥刹，我火速辦了婚禮，結(jié)果婚禮上汉买，老公的妹妹穿的比我還像新娘衔峰。我一直安慰自己，他們只是感情好蛙粘，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布垫卤。她就那樣靜靜地躺著，像睡著了一般出牧。火紅的嫁衣襯著肌膚如雪穴肘。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,125評(píng)論 1贊 297
城市分裂傳說
那天舔痕，我揣著相機(jī)與錄音评抚，去河邊找鬼。笑死伯复，一個(gè)胖子當(dāng)著我的面吹牛慨代，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播啸如，決...
沈念sama閱讀 40,028評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼侍匙，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了叮雳？” 一聲冷哼從身側(cè)響起想暗，我...
開封第一講書人閱讀 38,887評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎帘不，沒想到半個(gè)月后说莫，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,310評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡寞焙，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年储狭，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了告唆。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,690評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡晶密，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出模她，到底是詐尸還是另有隱情稻艰，我是刑警寧澤，帶...
沈念sama閱讀 35,411評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布侈净，位于F島的核電站尊勿，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏畜侦。R本人自食惡果不足惜元扔，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評(píng)論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望旋膳。院中可真熱鬧澎语，春花似錦、人聲如沸验懊。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽义图。三九已至减俏，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間碱工，已是汗流浹背娃承。一陣腳步聲響...
開封第一講書人閱讀 32,812評(píng)論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留怕篷，地道東北人历筝。一個(gè)月前我還...
沈念sama閱讀 47,693評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像廊谓，于是被迫代替她去往敵國和親漫谷。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評(píng)論 2贊 353

Hadoop 學(xué)習(xí)筆記整理

大數(shù)據(jù)啟蒙認(rèn)識(shí)

假定事件一：

如果從大數(shù)據(jù)分布式的角度來考慮的話枝嘶，我們可以怎么樣解決上面的問題呢帘饶？

假定事件二：

推薦閱讀更多精彩內(nèi)容