《數(shù)據(jù)化運(yùn)營(yíng)速成手冊(cè)》,作者胡晨川供炼,第三章:數(shù)據(jù)圖表進(jìn)階
這一章作者繼續(xù)了圖表的話(huà)題崇摄,講述了一些稍微高級(jí)的圖表技巧,這里簡(jiǎn)單整理一些我感覺(jué)實(shí)用些的內(nèi)容辈赋。
作者把數(shù)據(jù)分析師比作廚師鲫忍,我想那整個(gè)數(shù)據(jù)行業(yè)就算是廚房了膏燕,工作這些年也算是在廚房中工作了好久,一開(kāi)始做做擺盤(pán)悟民,后來(lái)開(kāi)始洗菜坝辫,再然后開(kāi)始買(mǎi)菜選菜切菜,而今開(kāi)始站在案板面前做一道菜了射亏,認(rèn)認(rèn)真真的做一道菜近忙。
做數(shù)據(jù)分析,做數(shù)據(jù)圖表的第一步是了解拿到的數(shù)據(jù)智润,了解數(shù)據(jù)中有哪些指標(biāo)及舍、哪些維度,數(shù)據(jù)質(zhì)量如何窟绷。
如何選擇圖表锯玛,可以參考下圖(網(wǎng)上找的)
坐標(biāo)軸
關(guān)于坐標(biāo)軸,作者提到了幾個(gè)注意點(diǎn)兼蜈,怎樣判斷一個(gè)坐標(biāo)軸是否合理:
- 是否展現(xiàn)出了足夠的差別
- 它的范圍是否大于數(shù)據(jù)序列的4倍標(biāo)準(zhǔn)差更振。
關(guān)于4倍標(biāo)準(zhǔn)差這個(gè)點(diǎn),我是沒(méi)有注意過(guò)饭尝,這里的為了設(shè)置坐標(biāo)軸范圍肯腕,讓它更合理,使用Excel中的函數(shù)STDEV.P()
網(wǎng)格線
網(wǎng)格線的意義到底是什么钥平?這個(gè)問(wèn)題的確沒(méi)有認(rèn)真思考過(guò)实撒,我想就是為了更方便的找到對(duì)應(yīng)的數(shù)據(jù)值吧,如果已經(jīng)標(biāo)注了數(shù)據(jù)標(biāo)簽涉瘾,就可以不要網(wǎng)格線
輔助線
Excel中可以很方便的插入趨勢(shì)線知态,主要用來(lái)輔助判斷數(shù)據(jù)變動(dòng)趨勢(shì)
還有一些類(lèi)似漲跌線、垂直線立叛、誤差線等负敏,還有標(biāo)注線。
線性趨勢(shì)線實(shí)質(zhì)上就是一條一元一次的線性回歸方程秘蛇,它表示兩組數(shù)據(jù)間的線性關(guān)系其做,即“隨著一個(gè)變量的增長(zhǎng),另一個(gè)變量怎么變赁还?”
不是所有的趨勢(shì)線都是有意義的妖泄,不能單看回歸公式,還要看R方值是否夠大艘策,一般只有在R的平方值大于0.6的時(shí)候蹈胡,才認(rèn)為回歸公式是有意義的,代表了回歸公式對(duì)現(xiàn)實(shí)數(shù)據(jù)的可解釋度。
如:R平方值是0.0184罚渐,表示兩組數(shù)據(jù)間的關(guān)系只有1.8%的信息可以用回歸公式來(lái)解釋却汉。
作者這里提到了一個(gè)例子,我感覺(jué)挺好的荷并,就是增加均值線和均值加減一個(gè)標(biāo)準(zhǔn)差的線病涨,這樣可以看出波動(dòng)的情況是否正常。