書籍1 實戰(zhàn)大數據(Hadoop+spark+Flink)2

第二章是搭建IDEA開發(fā)環(huán)境和Linux虛擬機

這章的內容較少,但需要花費的時間較長绒疗,畢竟都是實操部分
首先是搭建IDEA開發(fā)環(huán)境
每一個IT開發(fā)人員都得有一個合適的開發(fā)工具日矫,IDEA是大數據開發(fā)的首選,在Windows上安裝IDEA到腥,然后構建Maven項目账锹。

  1. 最首先的還是安裝JDK萌业,因為大數據開發(fā)的很多地方都是得需要用到Java的。
    具體的安裝和環(huán)境配置這里不再說明奸柬。
  2. Maven的安裝與配置
    這是專門用于構建和管理Java相關項目的工具生年。使用它有兩點好處,1是Maven管理的Java項目都有著相同的項目結構廓奕;二是便于統(tǒng)一維護jar包
  3. IDEA的安裝與配置
    全稱Intellij IDEA抱婉,是進行Java編程的集成環(huán)境
  4. 虛擬機的搭建,這個在之前的學習中就已經搭建完畢桌粉,這里不再贅述蒸绩。

第三章基于Hadoop構建大數據平臺

大數據項目得運行在大數據平臺之上,而構建Hadoop集群是構建大數據平臺的核心铃肯。
前文也說過患亿,至少得先安裝部署三個集群,分別是HDFS押逼、YARN步藕、和zookeeper集群惦界。

3.1 Zookeeper分布式協(xié)調服務

編寫單機的應用比較簡單,但是編寫分布式應用就比較困難咙冗,主要是因為會出現部分失敗沾歪。部分失敗就是在網絡節(jié)點中傳輸時,如果網絡錯誤就無法得知消息是否傳遞成功雾消。zookeeper是一個分布式應用的協(xié)調服務灾搏,他可以對部分失敗進行正確處理(不是避免)。
zookeeper提供一些服務給分布式應用仪或,分布式應用可以基于此構建出更高級的服務确镊,比如分布式鎖士骤、配置管理范删、分布式消息隊列、分布式通知與協(xié)調服務等等拷肌。
zookeeper的基本架構
zookeeper服務自身組成了一個集群到旦,其中有兩種角色,主節(jié)點leader和從節(jié)點follower巨缘。前者負責投票的發(fā)起和決議添忘,更新系統(tǒng)狀態(tài);后者接受客戶端請求并向客戶端返回結果若锁。
工作原理
zookeeper就是原子廣播搁骑,就是對zookeeper上的所有主機發(fā)送數據包,由此保證了各個服務器間的數據同步又固。
zookeeper集群工作前的準備工作
首先準備好Hadoop三個節(jié)點仲器,zookeeper是由Java編寫的,運行在JVM上仰冠,所以zookeeper的節(jié)點得先安裝JDK的運行環(huán)境乏冀。

  • 配置hosts文件,方便集群間通過hostname相互通信
  • 時鐘同步
  • SSH免密登錄
  • 安裝JDK

3.2 HDFS分布式文件系統(tǒng)

HDFS是Hadoop的核心子項目
他是分布式計算中數據存儲的基礎洋只,是基于流式數據訪問和處理超大文件需求而開發(fā)的辆沦。
背景:他出現的背景也很簡單,就是數據量太大了识虚,大到一個操作系統(tǒng)管轄的范圍內存儲不下肢扯,所以需要分配到更多的操作系統(tǒng)管理的磁盤中存儲,但是這樣會導致數據的管理和存儲不方便担锤,HDFS應運而生蔚晨。
能力:有4個,分別是能夠存儲大量數據妻献;能夠支持流計算蛛株;數據有一致性团赁,不易修改;硬件故障時能快速應對谨履。
系統(tǒng)架構通常是建立在由網絡連接起來的一組計算機組成的集群上欢摄。不同的計算機(或者叫節(jié)點)都有著不同的分工。比如:
NameNode:主節(jié)點NN
SecondaryNameNode:備用節(jié)點
DataNode:從節(jié)點DN
HDFS客戶端
以上部分是一個HDFS最基本的架構笋粟。一個主節(jié)點怀挠,一個備用節(jié)點,至少一個從節(jié)點害捕,和若干客戶端绿淋。

那么HDFS具體是儲存在哪的呢?

實際上數據文件被切分成數據塊(Block)尝盼,然后均勻的放在DN的節(jié)點當中吞滞,再通過NN來進行管理。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末盾沫,一起剝皮案震驚了整個濱河市裁赠,隨后出現的幾起案子,更是在濱河造成了極大的恐慌赴精,老刑警劉巖佩捞,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異蕾哟,居然都是意外死亡一忱,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門谭确,熙熙樓的掌柜王于貴愁眉苦臉地迎上來帘营,“玉大人,你說我怎么就攤上這事琼富∫前桑” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵鞠眉,是天一觀的道長薯鼠。 經常有香客問我,道長械蹋,這世上最難降的妖魔是什么出皇? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮哗戈,結果婚禮上郊艘,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好纱注,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布畏浆。 她就那樣靜靜地躺著,像睡著了一般狞贱。 火紅的嫁衣襯著肌膚如雪刻获。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天瞎嬉,我揣著相機與錄音蝎毡,去河邊找鬼。 笑死氧枣,一個胖子當著我的面吹牛沐兵,可吹牛的內容都是我干的。 我是一名探鬼主播便监,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼扎谎,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了茬贵?” 一聲冷哼從身側響起簿透,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤移袍,失蹤者是張志新(化名)和其女友劉穎解藻,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體葡盗,經...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡螟左,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了觅够。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片胶背。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖喘先,靈堂內的尸體忽然破棺而出钳吟,到底是詐尸還是另有隱情,我是刑警寧澤窘拯,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布红且,位于F島的核電站,受9級特大地震影響涤姊,放射性物質發(fā)生泄漏暇番。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一思喊、第九天 我趴在偏房一處隱蔽的房頂上張望壁酬。 院中可真熱鬧,春花似錦、人聲如沸舆乔。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽希俩。三九已至派阱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間斜纪,已是汗流浹背贫母。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盒刚,地道東北人腺劣。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像因块,于是被迫代替她去往敵國和親橘原。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內容