1 分組聚合的原因 SQL中分組函數(shù)和聚合函數(shù)之前的文章已經(jīng)介紹過撼泛,單說這兩個(gè)函數(shù)有可能比較好理解,分組函數(shù)就是group by澡谭,聚合函數(shù)就是C...
HIVE是一個(gè)數(shù)據(jù)倉庫愿题,該倉庫基于hadoop框架,可以將存在hdfs上的結(jié)構(gòu)化數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表蛙奖。HIVE可以使用類SQL語句來處理結(jié)...
窗口函數(shù) 窗口函數(shù)也稱為OLAP(Online Analytical Processing)函數(shù)潘酗,意思是對(duì)數(shù)據(jù)庫數(shù)據(jù)進(jìn)行實(shí)時(shí)分析處理,窗口函數(shù)在...
1 準(zhǔn)備知識(shí) HDFS:hadoop集群分布式文件系統(tǒng)雁仲,用來存儲(chǔ)海量數(shù)據(jù)仔夺。HDFS采用分而治之的設(shè)計(jì)思想,將文件切分為文件塊進(jìn)行存儲(chǔ)攒砖,存儲(chǔ)數(shù)據(jù)的...
1 阿里云服務(wù)器選配 首先附上官網(wǎng)鏈接:阿里云官網(wǎng)[https://www.aliyun.com/] 點(diǎn)擊上邊鏈接缸兔,注冊(cè)后登陸官網(wǎng),選擇產(chǎn)品選項(xiàng)...
1 前言 在講述Hadoop集群搭建之前吹艇,首先要了解Hadoop和集群兩個(gè)名詞惰蜜,Hadoop是由Apache基金會(huì)開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),簡(jiǎn)單...
1 前言 SQL進(jìn)階主要介紹謂詞受神、CASE表達(dá)式抛猖、嵌套子查詢、連接(以列為單位對(duì)表進(jìn)行連接)和UNION運(yùn)算(表為單位)。 SQL進(jìn)階在如下兩個(gè)...
1 前言 SQL函數(shù)主要介紹內(nèi)建函數(shù)财著,其實(shí)跟Excel中的內(nèi)建函數(shù)類似联四,后續(xù)Python中也是類似。有時(shí)候?qū)W習(xí)語言瓢宦,真的沒有那么難碎连,都是相通的,...
1 前言 數(shù)據(jù)庫(DB)是按照數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)的倉庫驮履,數(shù)據(jù)庫管理系統(tǒng)(DBMS)是操縱和管理數(shù)據(jù)庫的一套軟件鱼辙,可分為關(guān)系型的數(shù)據(jù)庫管理系統(tǒng)和非關(guān)...