常見正則表達(dá)式 hive 關(guān)鍵字REGEXP https://blog.csdn.net/knqiufan/article/details/80010287 判斷日期格式是否...
Sqoop原理: 將導(dǎo)入導(dǎo)數(shù)命令翻譯成MR程序來(lái)實(shí)現(xiàn)臂痕,翻譯出的MR主要是針對(duì)InputFormat和OutputFormat進(jìn)行定制的; sqoop的作用: 利用Mapred...
資源調(diào)度器:(面試重點(diǎn)) 主要有三種:FIFO,capacityScheduler Fair Scheduler FIFO(先進(jìn)先出調(diào)度器):按照到達(dá)的時(shí)間排序句葵,先到先服務(wù)...
OSI七層模型: 物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層宫患、會(huì)話層、表示層这弧、應(yīng)用層 TCP/IP四層模型: 網(wǎng)絡(luò)接口層娃闲、網(wǎng)絡(luò)層、傳輸層匾浪、應(yīng)用層 物理層:為上層協(xié)議提供了一個(gè)傳輸數(shù)據(jù)...
事務(wù)ACID: 原子性:要求操作要么全部執(zhí)行皇帮,要么全部不執(zhí)行 一致性:事務(wù)提交前后只存在兩個(gè)狀態(tài),提交前的狀態(tài)和提交后的狀態(tài)户矢,不會(huì)有中間狀態(tài) 隔離性:事務(wù)可以并發(fā)執(zhí)行玲献,但是他...
Hbase特點(diǎn): 海量存儲(chǔ):適合PB級(jí)別的海量數(shù)據(jù),梯浪,hbase有良好的擴(kuò)展性列式存儲(chǔ):根據(jù)列族來(lái)存儲(chǔ)數(shù)據(jù)的極易擴(kuò)展:高并發(fā):稀疏存儲(chǔ):數(shù)據(jù)為空的情況下不占用存儲(chǔ)空間 Hba...
MR核心編程思想: MR一般需要分成兩個(gè)階段,Map和reduce瓢娜,map階段挂洛,map task完全并行運(yùn)行,互不干擾眠砾,reduce階段虏劲,reduce task 完全不互相干...
HDFS基礎(chǔ): 分布式文件系統(tǒng),適合一次寫入褒颈,多次讀出的場(chǎng)景柒巫,適合用來(lái)做數(shù)據(jù)分析 HDFS的組成架構(gòu): Namenode:是master,存儲(chǔ)元數(shù)據(jù)信息谷丸,配置副本策略堡掏,處理客...
SQL的執(zhí)行順序 count(): group by (): 【拓展】如果分析多個(gè)維度的分組結(jié)果時(shí),兩種方案:(1) 多個(gè)group by 的結(jié)果 用union all 合并...
安裝Elasticsearch亭畜、elasticsearch-head 安裝包: 安裝elasticsearch: 解壓elasticsearch扮休; 首先安裝jdk jdk...
數(shù)倉(cāng)表的分類: 實(shí)體表:指的是一個(gè)現(xiàn)實(shí)存在的業(yè)務(wù)對(duì)象,比如商品拴鸵,商家玷坠,用戶。 維度表:指的是對(duì)應(yīng)一些業(yè)務(wù)狀態(tài)劲藐,編號(hào)的解釋表侨糟,也稱為碼表。比如瘩燥,地區(qū)表秕重,訂單狀態(tài)。 事務(wù)性事...
維度建模種類 主要三種模型:星型模型厉膀,雪花模型溶耘,星座模型 三種模型的區(qū)別: 星型模型:圍繞著一個(gè)事實(shí)表,維度只有一層 雪花模型:圍繞著一個(gè)事實(shí)表服鹅,維度有多層凳兵,雪花模型比較...
日期函數(shù): to_date() 從一個(gè)字符串中抽取日期的部分;to_date(‘2019-03-09 wedede’); year(),month()企软,day()庐扫,hour...