hadoop二三事 - 專題

投稿

hadoop二三事

收錄了8篇文章 · 3人關(guān)注

怎樣高效使用spark与境？
[toc] 背景知識(shí): Spark與Hadoop差異 Spark是在借鑒了MapReduce之上發(fā)展而來的值桩，繼承了其分布式并行計(jì)算的優(yōu)點(diǎn)并改進(jìn)了...

0.3 檸樂helen 0 1
通俗理解YARN運(yùn)行原理
導(dǎo)語：工作中常常和Spark on YARN, Hadoop on YARN打交道树枫，經(jīng)常在各種日志中摸爬滾打，為提升效率河胎，總結(jié)一下YARN的知識(shí)...

0.2 檸樂helen 2 13

Spark 2.x+IntelliJ IDEA 2017.3開發(fā)環(huán)境搭建和開發(fā)示例
【原創(chuàng)】Helenykwang 于2018-01-13 18:10:18編寫不用maven，不用sbt，只需三個(gè)庫一推掸、環(huán)境說明集群：Spa...

0.6 檸樂helen 2 13
Spark通信--client、master驻仅、worker間的通信
轉(zhuǎn)載自 http://www.wangsenfeng.com/articles/2016/10/26/1477467509513.html Cl...

檸樂helen 0 0
Hadoop2.0 NameNode HA和Federation簡(jiǎn)明理解
引子為什么需要 NameNode HA 和 Federation 谅畅？ 1. 規(guī)避NameNode單點(diǎn)故障，secondary namenode...

檸樂helen 0 2
MapReduce理解
引子為什么需要MapReduce噪服？因?yàn)镸apReduce可以“分而治之”毡泻，將計(jì)算大數(shù)據(jù)的復(fù)雜任務(wù)分解成若干簡(jiǎn)單小任務(wù)≌秤牛“簡(jiǎn)單”的意思是：計(jì)算...

檸樂helen 0 2
HDFS理解
引子為什么需要HDFS仇味？因?yàn)橐粋€(gè)物理計(jì)算機(jī)的存儲(chǔ)已經(jīng)hold不住我們龐大的數(shù)據(jù)集。 HDFS的特點(diǎn)是什么雹顺？ HDFS以流式數(shù)據(jù)訪問模式來存儲(chǔ)...

檸樂helen 0 4

hadoop學(xué)習(xí)路線
hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu)丹墨，主要功能有存儲(chǔ)+計(jì)算，分別由hdfs和map-reduce模塊實(shí)現(xiàn)嬉愧。 hadoop有單機(jī)部署贩挣、偽分布式部署...

檸樂helen 0 0