
1被啼、rdd有哪些算子关筒? 主要分為轉(zhuǎn)換算子和action算子。 transformation:map紊搪、filter贪嫂、flatmap、mappa...
測(cè)試如何使用spark-submit來(lái)執(zhí)行編寫(xiě)的wordcount代碼祠够。 1压汪、先簡(jiǎn)單編寫(xiě)測(cè)試文本。 2古瓤、將文本提交到hdfs上止剖。 指令為:had...
1、rowkey設(shè)計(jì)有哪三原則? ①長(zhǎng)度原則:rowkey是二進(jìn)制碼流落君。10-100個(gè)字節(jié)滴须。 ②散列原則:rowkey是按照字典序存儲(chǔ)的。利...
要理解讀寫(xiě)流程叽奥,先要清除hbase的架構(gòu)圖扔水。以0.96版本以下的三層架構(gòu)為例: hbase是主從架構(gòu),主節(jié)點(diǎn)是HMaster朝氓,從節(jié)點(diǎn)是HRegi...
--基礎(chǔ)設(shè)置 1魔市、資源參數(shù)設(shè)置: --num-executors 配置Executor的數(shù)量 默認(rèn)為2 --driver-memory ...
1、你在工作當(dāng)中有遇到內(nèi)存溢出問(wèn)題嗎赵哲?你是如何解決的待德? 回答思路:先解釋spark的內(nèi)存模型,再分情況介紹不同情況下的解決方案枫夺〗埽總體思想是根...
1、簡(jiǎn)單介紹yarn? yarn是一個(gè)資源管理较坛、任務(wù)調(diào)度的框架印蔗。主要包含三個(gè)模塊:resourceManger、nodeManger丑勤、Appli...
20200405--兩數(shù)之和 給定一個(gè)整數(shù)數(shù)組 nums和一個(gè)目標(biāo)值 target华嘹,請(qǐng)你在該數(shù)組中找出和為目標(biāo)值的那兩個(gè)整數(shù),并返回他們的數(shù)組下...
1法竞、簡(jiǎn)單介紹下hadoop吧耙厚? 廣義上hadoop是指與hadoop相關(guān)的大數(shù)據(jù)生態(tài)圈。包含hive岔霸、spark薛躬、hbase等。 狹義上...