4月8日
清明節(jié)前收到了書厢蒜,原計劃清明節(jié)的時候大讀一番烹植,結(jié)果出了一些事情(沉迷R6)。。蛔趴。齐邦。
清明節(jié)前已經(jīng)簡要讀了第一章《統(tǒng)計、數(shù)據(jù)和統(tǒng)計思維》旬昭;
今天8號菌湃,頭天上班,下午抽時間自學了第二章《數(shù)據(jù)集的描述方法》场梆;
1.《統(tǒng)計、數(shù)據(jù)和統(tǒng)計思維》
整個第一章意在告訴我們統(tǒng)計的重要性和統(tǒng)計學在商務層面的應用或油,當然簡單介紹了下統(tǒng)計學內(nèi)涉及的領域,比如:抽樣方法腔彰,過程(過程是個新概念辖佣,和計算機領域的“黑盒”,即不關(guān)注流程中數(shù)據(jù)如何變化杯拐,只關(guān)注輸入和輸出的數(shù)據(jù))等等世蔗。但是,我當然知道統(tǒng)計學的重要性啊喂污淋,要不然我學他干嘛啊喂。所以所謂清明節(jié)前看了第一章其實說白了就是什么功夫都沒下礁鲁,完全在學習tableau和玩R6了赁豆。。歌憨。。
2.《數(shù)據(jù)集的描述方法》
第二章開始甲抖,干貨來了心铃。首先是從小學、中學和大學學到的老生常談的概念:
“定性數(shù)據(jù)的描述方法”——條形圖去扣,樣本頻率等
“定量數(shù)據(jù)的圖形方法”——莖葉圖,直方圖唆铐,點圖
“集中和分散程度的描述方法”——均值,中位數(shù)艾岂,眾數(shù)
“變異性數(shù)據(jù)測度”——方差標準差,切比雪夫不等式
然后是一些新的干貨
“相對位置的數(shù)值測度”——上中下四分位數(shù)
“異常數(shù)據(jù)的檢測”——箱線圖和Z得分
箱線圖和z得分是很有用的概念脆炎,在互聯(lián)網(wǎng)運營過程中氓辣,我們也許可以使用箱線圖來判斷某個數(shù)值是否異常。
需要注意几蜻,箱線圖可以看到一組數(shù)據(jù)的偏移情況(根據(jù)箱線圖的“胡須”長度決定)
z得分主要用于驗證數(shù)據(jù)是否異常爽撒,z得分的結(jié)果代表了該數(shù)據(jù)落在幾個標準差內(nèi)响蓉,如果z得分的絕對值過大 ,那么枫甲,說明該數(shù)據(jù)處在一組數(shù)據(jù)的兩端,是異常數(shù)據(jù)粱栖。
二元關(guān)系的描述——散點圖
散點圖在第二章介紹的很少脏毯,二元關(guān)系的相關(guān)性在當下適用情況也不是特別多,更多的是探討多元變量的相關(guān)性渣淤,這個我們在后面會學到吉嫩。