常見正則表達(dá)式 hive 關(guān)鍵字REGEXP https://blog.csdn.net/knqiufan/article/details/80...
sparkCore:算子實(shí)現(xiàn): SparkSql 實(shí)現(xiàn): java 實(shí)現(xiàn):MapReduce mapper reduce driver
Sqoop原理: 將導(dǎo)入導(dǎo)數(shù)命令翻譯成MR程序來(lái)實(shí)現(xiàn),翻譯出的MR主要是針對(duì)InputFormat和OutputFormat進(jìn)行定制的涕侈; sqo...
資源調(diào)度器:(面試重點(diǎn)) 主要有三種:FIFO羹奉,capacityScheduler Fair Scheduler FIFO(先進(jìn)先出調(diào)度器):...
OSI七層模型: 物理層秒旋、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層诀拭、傳輸層迁筛、會(huì)話層、表示層耕挨、應(yīng)用層 TCP/IP四層模型: 網(wǎng)絡(luò)接口層细卧、網(wǎng)絡(luò)層尉桩、傳輸層、應(yīng)用層 物理層...
事務(wù)ACID: 原子性:要求操作要么全部執(zhí)行贪庙,要么全部不執(zhí)行 一致性:事務(wù)提交前后只存在兩個(gè)狀態(tài)蜘犁,提交前的狀態(tài)和提交后的狀態(tài),不會(huì)有中間狀態(tài) 隔...
Hbase特點(diǎn): 海量存儲(chǔ):適合PB級(jí)別的海量數(shù)據(jù)止邮,这橙,hbase有良好的擴(kuò)展性列式存儲(chǔ):根據(jù)列族來(lái)存儲(chǔ)數(shù)據(jù)的極易擴(kuò)展:高并發(fā):稀疏存儲(chǔ):數(shù)據(jù)為空...
MR核心編程思想: MR一般需要分成兩個(gè)階段,Map和reduce导披,map階段屈扎,map task完全并行運(yùn)行,互不干擾撩匕,reduce階段鹰晨,red...
HDFS基礎(chǔ): 分布式文件系統(tǒng),適合一次寫入滑沧,多次讀出的場(chǎng)景并村,適合用來(lái)做數(shù)據(jù)分析 HDFS的組成架構(gòu): Namenode:是master,存儲(chǔ)元...