本章主要總結(jié)開發(fā)性能調(diào)優(yōu)及作業(yè)調(diào)度相關(guān)的產(chǎn)品知識,性能調(diào)優(yōu)主要是減少性能消耗和提高ETL作業(yè)時(shí)間,常見的調(diào)優(yōu)就會數(shù)據(jù)傾斜調(diào)優(yōu)、合并小文件、緩存中...
標(biāo)簽數(shù)據(jù)開發(fā)是用戶畫像體系中最重要的一環(huán)撩穿,主要包括離線標(biāo)簽開發(fā)、實(shí)時(shí)標(biāo)簽開發(fā)、用戶特征庫開發(fā)疮跑、人群計(jì)算、打通數(shù)據(jù)服務(wù)層等開發(fā)內(nèi)容凸舵。 一祖娘、統(tǒng)計(jì)類標(biāo)...
用戶畫像的數(shù)據(jù)存儲的技術(shù)選型有多種,不同存儲方式適用于不同場景啊奄。主要有Hive渐苏、MySQL、HBase菇夸、Elasticsearch琼富。 如果將用戶...
數(shù)據(jù)指標(biāo)體系是建立用戶畫像的基礎(chǔ),也是在進(jìn)入開發(fā)前的關(guān)鍵環(huán)節(jié)峻仇,是需要結(jié)合業(yè)務(wù)場景制定的數(shù)據(jù)指標(biāo)公黑。建立用戶畫像一般從2個維度: ①用戶維度(use...
用戶畫像,即用戶信息標(biāo)簽化摄咆,是大數(shù)據(jù)精細(xì)化運(yùn)營和精準(zhǔn)營銷服務(wù)的基礎(chǔ)凡蚜。它是一種勾畫目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具吭从。在大數(shù)據(jù)的時(shí)代下朝蜘,用...
在剛邁入數(shù)據(jù)的大門時(shí),我經(jīng)常對一些數(shù)據(jù)指標(biāo)或者數(shù)據(jù)本身的概念很模糊涩金,尤其是當(dāng)跟運(yùn)營谱醇、數(shù)據(jù)分析師扯需求的時(shí)候,會被這些密密麻麻的指標(biāo)給弄糊涂步做。為了...
說明 ▍ 子查詢:嵌套在其他查詢中的查詢全度; ▍ 組合查詢(復(fù)合查詢 / 并操作):執(zhí)行多次查詢煮剧,多條select語句,并將結(jié)果作為單個查詢結(jié)果返...
一、聚合函數(shù) 對一組值進(jìn)行計(jì)算勉盅,并返回單個值佑颇,也被稱為組函數(shù); 聚合計(jì)算過程:選定分組字段 – 分組 – 計(jì)算:1.選定分組字段:在 selec...
一草娜、字段處理函數(shù) 字符串處理函數(shù):concat(field1,field2 …… )substr(str,pos,len)replace(str...