《大數(shù)據(jù)實(shí)踐之路》這本書榨惠,是由多位數(shù)據(jù)產(chǎn)品和分析師,根據(jù)自己的工作經(jīng)驗(yàn)和個(gè)人總結(jié)盛霎,匯總而來(lái)赠橙。
類似這種合著作品的例子,現(xiàn)在越來(lái)越普遍愤炸,優(yōu)點(diǎn)是可以發(fā)揮所長(zhǎng)期揪、精心雕刻,缺點(diǎn)也較為明顯规个,就是章節(jié)之間割裂感比較嚴(yán)重凤薛,敘述風(fēng)格和筆法習(xí)慣也各有千秋。
所以本書為了統(tǒng)一內(nèi)容诞仓,設(shè)定了一群數(shù)據(jù)工作者在某電商企業(yè)工作的故事背景缤苫,以此為依托,展開(kāi)敘述墅拭。
不可謂不用心活玲。
但是對(duì)故事的把握程度,不敢妄言谍婉。
回到書本內(nèi)容本身舒憾,在副標(biāo)題中已經(jīng)表明內(nèi)容主要分為三塊:
1、數(shù)據(jù)中臺(tái)
數(shù)據(jù)中臺(tái)的主要構(gòu)成有:元數(shù)據(jù)中心穗熬、數(shù)據(jù)指標(biāo)中心镀迂、數(shù)倉(cāng)模型中心、數(shù)據(jù)資產(chǎn)中心以及數(shù)據(jù)服務(wù)中心唤蔗。
對(duì)穿插內(nèi)容進(jìn)行詳細(xì)的解剖和枚舉示例探遵,是這一部分的重點(diǎn)唧瘾,也讓數(shù)據(jù)中臺(tái)部分成為全書的支撐點(diǎn)和核心點(diǎn)。
2别凤、數(shù)據(jù)分析
對(duì)數(shù)據(jù)分析理論進(jìn)行了比較簡(jiǎn)略的介紹饰序。
其亮點(diǎn)在于,在把數(shù)據(jù)分析按照?qǐng)鼍皠澐譃轭A(yù)測(cè)性规哪、描述性和診斷性分析之后求豫,對(duì)每個(gè)場(chǎng)景的分析步驟進(jìn)行了詳細(xì)的拆解。美中不足的是诉稍,尚缺乏策略性分析的場(chǎng)景描述蝠嘉,以及對(duì)各個(gè)場(chǎng)景的層次感把握力略顯乏力。
當(dāng)然杯巨,這些都算是作為讀者的我的個(gè)人見(jiàn)解蚤告。
3、數(shù)據(jù)產(chǎn)品
數(shù)據(jù)產(chǎn)品的主要構(gòu)成有:BI系統(tǒng)服爷、用戶畫像體系杜恰、電商反作弊體系、資訊個(gè)性化推薦和電商個(gè)性化推送仍源。
個(gè)人理解心褐,對(duì)于BI和用戶畫像體系的搭建,是考察一個(gè)數(shù)據(jù)分析師基本產(chǎn)品能力的風(fēng)向標(biāo)笼踩。
通過(guò)書本的篇幅可以看出作者和我的意見(jiàn)不謀而合逗爹,對(duì)畫像搭建感興趣的同學(xué)可以詳細(xì)參考用戶畫像體系部分。
總的來(lái)說(shuō)嚎于,這本“小冊(cè)子”大體框架令人滿意掘而,但是對(duì)于詳略程度的拿捏做得不是很好。
可讀性:優(yōu)于购;實(shí)用性:良袍睡。
最后,引用和總結(jié)書中一些頗為出彩的陳述:
1价涝、數(shù)據(jù)質(zhì)量的衡量涉及數(shù)據(jù)的完整性女蜈、準(zhǔn)確性持舆、一致性色瘩、規(guī)范性和時(shí)效性。
完整性基于業(yè)務(wù)和數(shù)據(jù)采集完整度逸寓,準(zhǔn)確定規(guī)定了數(shù)值與真實(shí)值之間的誤差居兆,一致性要求多方數(shù)據(jù)出口保持一致,規(guī)范性要求統(tǒng)一的數(shù)據(jù)格式以便采集分析竹伸,時(shí)效性要求能在恰當(dāng)時(shí)間范圍內(nèi)出數(shù)泥栖。
2簇宽、針對(duì)不同類型的元數(shù)據(jù),可以把它們組織起來(lái)分為3組:數(shù)據(jù)屬性吧享、數(shù)據(jù)字典魏割、數(shù)據(jù)血緣。
這些數(shù)據(jù)有幾種類型:基礎(chǔ)信息钢颂、標(biāo)簽信息钞它、業(yè)務(wù)信息、技術(shù)信息殊鞭、權(quán)限信息遭垛。
3、指標(biāo)分為原子指標(biāo)與派生指標(biāo):
原子指標(biāo):事實(shí)邏輯表中某個(gè)字段的統(tǒng)計(jì)值(sum操灿、count锯仪、max、min趾盐、avg)庶喜,如下單用戶數(shù)、下單金額等救鲤。
派生指標(biāo):基于原子指標(biāo)溃卡,進(jìn)行維度組合后產(chǎn)生的指標(biāo),如近1天商城下單用戶數(shù)蜒简、本周商城黃金會(huì)員下單金額等瘸羡。
原子指標(biāo)無(wú)業(yè)務(wù)意義,它只是預(yù)定義的代碼片段搓茬。我們?cè)跇I(yè)務(wù)中用到的指標(biāo)基本都是派生指標(biāo)犹赖。
4、數(shù)倉(cāng)模型中心設(shè)計(jì)思路:控制數(shù)據(jù)源卷仑、劃分主題域峻村、構(gòu)建一致性維度、構(gòu)建總線矩陣锡凝、數(shù)倉(cāng)分層建設(shè)粘昨、數(shù)倉(cāng)效果評(píng)估。
數(shù)倉(cāng)一般分為3層:ODS層(操作數(shù)據(jù)存儲(chǔ)層)窜锯、CDM層(公共維度模型層)和ADS層(應(yīng)用數(shù)據(jù)層)张肾。
數(shù)倉(cāng)效果評(píng)估,采用量化的指標(biāo):規(guī)范度锚扎、完善度吞瞪、復(fù)用度。
5驾孔、數(shù)據(jù)賦能業(yè)務(wù)一般會(huì)經(jīng)歷4個(gè)環(huán)節(jié):數(shù)據(jù)表現(xiàn)芍秆、業(yè)務(wù)原因惯疙、業(yè)務(wù)策略和作用方式。
首先妖啥,我們通過(guò)數(shù)據(jù)去評(píng)估業(yè)務(wù)狀態(tài)霉颠,發(fā)現(xiàn)業(yè)務(wù)表現(xiàn)異常;
其次荆虱,我們?nèi)娴胤治鰯?shù)據(jù)掉分,并結(jié)合一線的調(diào)研反饋,反復(fù)地進(jìn)行猜想和數(shù)據(jù)驗(yàn)證克伊,弄清楚數(shù)據(jù)表現(xiàn)背后的業(yè)務(wù)原因酥郭,思考解決問(wèn)題的業(yè)務(wù)策略;
最后愿吹,我們落地執(zhí)行業(yè)務(wù)策略不从,監(jiān)控落地效果并不斷地迭代業(yè)務(wù)策略,直到問(wèn)題被解決犁跪,業(yè)務(wù)發(fā)展進(jìn)入正軌椿息。
6、業(yè)務(wù)策略存在兩個(gè)閉環(huán):邏輯閉環(huán)和業(yè)務(wù)閉環(huán)坷衍。
邏輯閉環(huán):數(shù)據(jù)分析的過(guò)程寝优,在邏輯上要實(shí)現(xiàn)閉環(huán),論據(jù)要能夠支撐結(jié)論枫耳。
業(yè)務(wù)閉環(huán):業(yè)務(wù)策略在業(yè)務(wù)上的落地執(zhí)行要實(shí)現(xiàn)閉環(huán)乏矾,不斷地被調(diào)整和迭代。
7迁杨、數(shù)據(jù)分析五板斧:細(xì)分钻心,對(duì)比,關(guān)聯(lián)铅协,因果捷沸,趨勢(shì)。
8狐史、在取數(shù)之前多思考為什么要取這個(gè)數(shù)據(jù)痒给,分析的框架是什么,分析的目的和接下來(lái)要取的數(shù)據(jù)是否能印證對(duì)應(yīng)上等骏全。
不要把自己的工作內(nèi)容和思想局限在取數(shù)這件事上苍柏。
9、數(shù)據(jù)分析吟温,按照從淺到深分為四個(gè)階段:描述性分析序仙、診斷性分析突颊、預(yù)測(cè)性分析鲁豪、策略性分析(原文無(wú)策略性分析)潘悼。
描述性分析:回答數(shù)據(jù)是什么;
診斷性分析:回答數(shù)據(jù)為什么爬橡;
預(yù)測(cè)性分析:回答數(shù)據(jù)將是什么治唤;
策略性分析:自動(dòng)化制定策略。
10糙申、企業(yè)從兩方面考核數(shù)據(jù)分析師的產(chǎn)出:
專業(yè)產(chǎn)出:拆解的項(xiàng)目年度/月度目標(biāo)宾添、搭建的業(yè)務(wù)評(píng)估指標(biāo)體系和分析的業(yè)務(wù)策略等都屬于數(shù)據(jù)分析師的專業(yè)產(chǎn)出;
業(yè)務(wù)結(jié)果:往往數(shù)據(jù)分析師的績(jī)效與業(yè)務(wù)結(jié)果不會(huì)被強(qiáng)行綁定柜裸,但業(yè)務(wù)結(jié)果差的數(shù)據(jù)分析師一般不會(huì)獲得好的績(jī)效缕陕。
11、要想有好的工作節(jié)奏疙挺,我們就需要想清楚當(dāng)下自己的核心訴求是什么扛邑,要學(xué)會(huì)不斷地根據(jù)客觀環(huán)境調(diào)整自己的狀態(tài),讓自己的工作與核心訴求保持一致铐然,最大地激發(fā)自己的熱情與創(chuàng)造力蔬崩,要經(jīng)常反觀自己是否還位于第一象限。
12搀暑、診斷性分析的一般流程:發(fā)現(xiàn)問(wèn)題—定義問(wèn)題—拆解問(wèn)題—尋找原因—提出解決方案—落地執(zhí)行—反饋迭代沥阳,直到業(yè)務(wù)問(wèn)題被解決。評(píng)估標(biāo)準(zhǔn)一般是關(guān)鍵指標(biāo)的變化符合預(yù)期自点。
13桐罕、在可視化實(shí)踐中,初學(xué)者需要注重積累和總結(jié)桂敛,逐漸形成適合自己的圖表配對(duì)模板和配色風(fēng)格冈绊。
14、精準(zhǔn)營(yíng)銷的4R法則埠啃,即通過(guò)合適的渠道(Right Channel)死宣,在合適的時(shí)間(Right Time),將合適的產(chǎn)品(Right Product)推送給合適的用戶(Right Customer)碴开。
15毅该、好的push應(yīng)該具備4個(gè)要素:效率高、算法準(zhǔn)潦牛、推薦好眶掌、展示靚。