240 發(fā)簡(jiǎn)信
IP屬地:浙江
  • 120
    mr執(zhí)行過程及運(yùn)行原理

    split邏輯切分: 這里的分片不是物理分片,輸入分片存儲(chǔ)的并非數(shù)據(jù)本身痹籍,而是一個(gè)分片長(zhǎng)度和一個(gè)記錄數(shù)據(jù)的位置的數(shù)據(jù) 例如10MB文件攻谁,切分10各1MB小文件劫拗,0-1MB位置...

  • 緩慢變化維

    緩慢變化維 slowly changing dimension(SCD) 常見緩慢變化維有三種: 1辜妓、直接覆蓋的方式 2、新加一行數(shù)據(jù):使用代理主鍵+生效失效時(shí)間或者代理主鍵...

  • HIVE數(shù)據(jù)抽樣

    hive 提供數(shù)據(jù)抽樣功能碌宴,根據(jù)一定的規(guī)則進(jìn)行數(shù)據(jù)抽樣杀狡,目前支持三種抽樣: 1、數(shù)據(jù)塊抽樣 tablesample()函數(shù)(hive0.8版本及以上支持) tablesamp...

  • 數(shù)倉分層的優(yōu)缺點(diǎn)

    面試中問到數(shù)倉分層的優(yōu)缺點(diǎn)贰镣,其實(shí)在日常工作中呜象,還真只是知道要這樣做,但是為什么這樣做碑隆,這樣做的目的是什么恭陡,好像我從來沒考慮過,一起來總結(jié)一下吧 數(shù)倉分層的優(yōu)點(diǎn): 1上煤、數(shù)據(jù)的血...

  • 120
    presto架構(gòu)原理介紹

    第一次面試問到了presto的原理休玩,沒引起我的重視,今天第二次面試又問到這個(gè)presto的原理,我答的不是很好哥捕,趕緊回來查一下presto到底是怎么回事,來吧嘉熊,跟我一起深入了...

  • 如何建設(shè)數(shù)倉

    第一步:調(diào)研 1遥赚、業(yè)務(wù)調(diào)研:與業(yè)務(wù)人員座談,梳理業(yè)務(wù)過程阐肤,輸出業(yè)務(wù)流程圖及初步劃分出dwd層的主題域 2凫佛、需求調(diào)研:梳理過去、現(xiàn)在及將來的數(shù)據(jù)需求和BI需求孕惜,輸出數(shù)倉app層...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品