思維導圖
Q1:用來描述隨機變量的數字特征有哪些感挥?
1.期望E(X):數學期望,用來表示隨機變量X的平均水平
-
將X所對應的隨機試驗重復多次硼瓣,隨著試驗次數的增加置谦,X的均值μ會愈發(fā)趨近于E(X)
-
離散型隨機變量的期望
-
連續(xù)型隨機變量的期望
2.方差D(X)&標準差σ:方差用來刻畫隨機變量X的波動大小,方差也記為Var(X)
-
方差越大霉祸,結果的未知性就會越大
-
方差
定義式
-
標準差
-
標準化變量:數據標準化處理的理論依據,以此統(tǒng)一量綱奔穿,可以進行進一步的分析或建模
3.分位數:用來關注X中某個樣本x在整體分布中的排序情況
-
若滿足下式敏晤,則t為X的α分位數
-
若α為0.5嘴脾,則稱t為隨機變量X的中位數
-
樣本的分位數:通常用來監(jiān)控異常數據译打,設[0.05,0.95]為合理的分位數區(qū)間,若某一樣本值沒有處于歷史樣本的該區(qū)間內乔询,則需要對其重點排查韵洋。如果排查出是異常值,需要進行剔除或修正食拜。
4.協(xié)方差Cov(X,Y)&相關系數ρ(X,Y):用來關注兩個或多個隨機變量之間的關系
-
聯(lián)合分布
-
獨立變量:如果滿足下式监婶,則X,Y為相互獨立的變量
-
協(xié)方差
-
相關系數:用來描述X煮盼、Y之間是否存在線性關系
-
當X僵控、Y相互獨立時报破,協(xié)方差和相關系數均為0千绪,反之不成立
-
相關系數的絕對值接近于1時,說明二者之間的線性關系比較強
-
相關系數的絕對值接近于0時盹靴,則表示二者之間的線性關系比較弱
Q2:隨機變量X+Y瑞妇、XY的期望與X、Y期望的關系改备?
-
對于任意兩個隨機變量X蔓倍、Y柬脸,都滿足
-
對于獨立變量X、Y灾测,滿足
第二個公式是單向的媳搪,即若E(XY)=E(X)E(Y)骤宣,則只能表明X、Y是不相關的等限,不能表明X、Y是相互獨立的形娇〕镂螅可參考Q4進行理解。
Q3:分布的期望和中位數的大小關系哄酝?
-
分布的期望和中位數的大小關系根據分布的不同而變化
-
正偏態(tài):中位數小于期望
正偏態(tài)PDF
-
正態(tài):中位數等于期望
正態(tài)PDF
-
負偏態(tài):中位數大于期望
負偏態(tài)PDF
Q4:簡述變量獨立與變量不相關的區(qū)別
-
不相關:兩者沒有線性關系,但是不排除其他的關系存在
-
獨立:二者互不相干,沒有關聯(lián)
-
例:假設y=ax^2+b,則X抡秆、Y非獨立但不相關儒士。
x^2與y之間呈明顯的線性關系檩坚,但是x與y之間不存在線性關系,相關系數的絕對值接近于0
-
不相關和獨立是一種包含關系
Q5:常見分布的期望和方差是什么?
該問題一般不會在面試中會被直接問到赂乐,但是掌握這部分內容對其他部分的學習有很大的幫助作用
-
常見離散型隨機變量的分布律挨措、期望、方差
-
常見連續(xù)型隨機變量的分布律斩松、期望觉既、方差
參考文獻
1.《拿下Offer 數據分析師求職面試指南》徐麟 著