5篇文章 · 4556字 · 1人關(guān)注
導(dǎo)語(yǔ):工作中常常和Spark on YARN, Hadoop on YARN打交道毡熏,經(jīng)常在各種日志中摸爬滾打,為提升效率呀忧,總結(jié)一下YARN的知識(shí)...
引子 為什么需要 NameNode HA 和 Federation 蚜点? 1. 規(guī)避NameNode單點(diǎn)故障荆虱,secondary namenode...
引子 為什么需要MapReduce滥壕? 因?yàn)镸apReduce可以“分而治之”纸颜,將計(jì)算大數(shù)據(jù)的復(fù)雜任務(wù)分解成若干簡(jiǎn)單小任務(wù)∫镩伲“簡(jiǎn)單”的意思是:計(jì)算...
引子 為什么需要HDFS胁孙? 因?yàn)橐粋€(gè)物理計(jì)算機(jī)的存儲(chǔ)已經(jīng)hold不住我們龐大的數(shù)據(jù)集。 HDFS的特點(diǎn)是什么称鳞? HDFS以流式數(shù)據(jù)訪問(wèn)模式來(lái)存儲(chǔ)...
hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu)涮较,主要功能有存儲(chǔ)+計(jì)算,分別由hdfs和map-reduce模塊實(shí)現(xiàn)冈止。 hadoop有單機(jī)部署狂票、偽分布式部署...