![240](https://cdn2.jianshu.io/assets/default_avatar/6-fd30f34c8641f6f32f5494df5d6b8f3c.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Java內(nèi)存模型 Java 虛擬機(jī)在執(zhí)行 Java 程序的過(guò)程中會(huì)把它所管理的內(nèi)存劃分為若干個(gè)不同的數(shù)據(jù)區(qū)域。這些區(qū)域都有各自的用途初婆,以及創(chuàng)建和...
在工作中使用hive比較多蓬坡,也寫(xiě)了很多HiveQL。這里從三個(gè)方面對(duì) Hive 常用的一些性能優(yōu)化進(jìn)行了總結(jié)磅叛。 表設(shè)計(jì)層面優(yōu)化 利用分區(qū)表優(yōu)化 ...
什么是RDD屑咳? RDD是Spark中的數(shù)據(jù)抽象,全稱(chēng)彈性分布式數(shù)據(jù)集(Resilient Distributed Datasets)弊琴。RDD可以...
Redis 支持哪幾種數(shù)據(jù)類(lèi)型? string:最基本的數(shù)據(jù)類(lèi)型兆龙,二進(jìn)制安全的字符串,最大512M list:按照添加順序保持順序的 字符串列表...
Zookeeper是什么 Zookeeper是一個(gè)分布式的访雪,開(kāi)源的分布式應(yīng)用程序協(xié)調(diào)服務(wù)详瑞,是Google的Chubby一個(gè)開(kāi)源的實(shí)現(xiàn),是Hado...
實(shí)時(shí)計(jì)算的三種語(yǔ)義 At-most-once:最多一次臣缀。每條數(shù)據(jù)記錄最多被處理一次坝橡,也就是說(shuō)數(shù)據(jù)會(huì)有丟失(沒(méi)被處理掉)的可能。 At-least...
什么是ETL ETL用來(lái)描述對(duì)原始數(shù)據(jù)從抽取精置、清洗轉(zhuǎn)換和加載的過(guò)程计寇。ETL按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價(jià)值,是將數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)(D...
Spark應(yīng)用Yarn-Client模式運(yùn)行架構(gòu)原理解析 Spark Yarn Client向Yarn的ResourceManager申請(qǐng)啟動(dòng)A...