1.?標準差
標準差定義是總體各單位標準值與其平均數(shù)離差平方的算術(shù)平均數(shù)的平方根端衰。它反映組內(nèi)個體間的離散程度
公式為
need-to-insert-img
簡單來說,標準差是一組數(shù)據(jù)平均值分散程度的一種度量甘改。一個較大的標準差旅东,代表大部分數(shù)值和其平均值之間差異較大;一個較小的標準差十艾,代表這些數(shù)值較接近平均值抵代。
2.協(xié)方差
https://www.zhihu.com/question/20852004
可以通俗的理解為:兩個變量在變化過程中是同方向變化?還是反方向變化忘嫉?同向或反向程度如何荤牍?
Cov(x,y) =E[(x-ux)*(y-yx)]
公式簡單翻譯一下是:如果有X,Y兩個變量,每個時刻的“X值與其均值之差”乘以“Y值與其均值之差”得到一個乘積庆冕,再對這每時刻的乘積求和并求出均值(其實是求“期望”康吵,但就不引申太多新概念了,簡單認為就是求均值了)访递。
3.?相關(guān)系數(shù)
對于相關(guān)系數(shù)晦嵌,我們從它的公式入手。一般情況下拷姿,相關(guān)系數(shù)的公式為:
need-to-insert-img
翻譯一下:就是用X耍铜、Y的協(xié)方差除以X的標準差和Y的標準差。
所以跌前,相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個變量量綱影響、標準化后的特殊協(xié)方差陡舅。
既然是一種特殊的協(xié)方差抵乓,那它
1、也可以反映兩個變量變化時是同向還是反向靶衍,如果同向變化就為正灾炭,反向變化就為負。
2颅眶、由于它是標準化后的協(xié)方差蜈出,因此更重要的特性來了:它消除了兩個變量變化幅度的影響,而
只是單純反應(yīng)兩個變量每單位變化時的相似程度
它只能在+1到-1之間變化
首先涛酗,還是承接上文中的變量X铡原、Y變化的示意圖(X為紅點偷厦,Y為綠點),來看兩種情況: