隨機變量是根據(jù)偶然性取值的變量固惯。我們在談到隨機變量時,通常是以“概率分布”的形式來描述他們洛心。也即:隨機變量落在每一個可能的值上的概率固耘。典型的例子就是擲骰子,它有著同等的概率生成數(shù)字1到6词身。
一般我們會把隨機變量劃分為兩類:
1厅目、離散型隨機變量
2、連續(xù)型隨機變量
處理這兩類隨機變量的方式有所不同偿枕,但他們依據(jù)的原理是相同的璧瞬。我們很容易便能看到基于隨機變量的模型在金融領(lǐng)域是如何派上用場的:金融資產(chǎn)價格的波動(這里指股價)户辫,常常按照“確定模型”和“隨機模型”兩者之一來解讀渐夸。而隨機模型是通過隨機變量來表示。在隨機模型中渔欢,我們在每個時間單位對隨機變量進行采樣墓塌,根據(jù)這些采樣結(jié)果得到隨機模型的參數(shù),從將其作為一種金融工具來預(yù)測股價的變動奥额。使用這種分析模式苫幢,是因為金融資產(chǎn)中的大部分價格波動無法通過確定性模型給出合理的解釋。
隨機變量遵從“概率分布”的垫挨,它是用來描述隨機變量的函數(shù)韩肝。這個概率分布函數(shù)囊括了隨機變量所有可能的取值情況下,所對應(yīng)的概率九榔。對于給定的隨機變量 X 哀峻,我們用符號P(X = x)表示隨機變量 X = x 的概率涡相。對于離散型隨機變量,我們可以進一步簡寫為 p(x) 代替 P(X = x) 剩蟀。這也被稱為概率質(zhì)量函數(shù)(probability mass function催蝗,以下簡稱 PMF )。而對于連續(xù)性隨機變量我們不能使用 PMF 育特,這在后續(xù)章節(jié)會做進一步說明丙号,我們只能使用概率密度函數(shù) probability density function,以下簡稱 PDF )缰冤。概率分布函數(shù)又是 Black - Scholes 定價模型與二項式定價模型(典型的有資本資產(chǎn)定價模型 CAPM )的基礎(chǔ)犬缨。同樣的,如果你需要運算蒙特卡洛模擬棉浸,你也需要理解概率分布函數(shù)遍尺。
對于每個特定的概率分布函數(shù)( PDF ),都有與之對應(yīng)的累計分布函數(shù)( CDF )涮拗,用符號 P(X ≤ x) 表示隨機變量X小于等于某一特定值的概率乾戏,我們同樣進一步簡寫為F(x) 代替 P(X ≤ x)。對于離散型隨機變量三热,我們對所有自變量值 ≤x 時鼓择,對應(yīng)的PDF概率值進行求和,得到 F(x) 的概率值就漾;對于連續(xù)性隨機變量呐能,我們對所有自變量值 ≤x 時,對應(yīng)的PDF曲線進行“積分”抑堡,得到 F(x) 的概率值摆出。
離散型隨機變量
離散型隨機變量,是定義在一個可以窮盡的結(jié)果集中的變量首妖。對于隨機變量可能出現(xiàn)的值偎漫,都有一個單獨的與之對應(yīng)的概率。考慮一下拋硬幣或是擲骰子有缆,它們都是遵循最基本的等概率均勻分布的離散型隨機變量象踊。前者有兩種可能出現(xiàn)的結(jié)果,正面或反面棚壁,對應(yīng)發(fā)生的概率都是1/2杯矩。然而,離散型隨機變量并非總是等概率分布的袖外,而是由變量的概率質(zhì)量函數(shù)p(x)決定的史隆。函數(shù)為概率分布域中的每個點給出其可能出現(xiàn)的概率(質(zhì)量)。
概率函數(shù)有兩個基本屬性:
1曼验、0 ≤ p(x) ≤ 1
2泌射、對于結(jié)果集中的所有情況头镊,它們對應(yīng)的概率之和為1
第一點,對于隨機變量出現(xiàn)的所有可能情況(比如骰子中的點數(shù):1魄幕、2相艇、3、4纯陨、5坛芽、6)觉痛,每種情況對應(yīng)的概率一定介于 0(一定不出現(xiàn))和 1(100%會出現(xiàn))之間炼鞠。
第二點,由于離散型隨機變量結(jié)果集已經(jīng)窮盡了所有可能出現(xiàn)的情況申鱼,因此總體來看阴颖,他們的并集是一個必然事件活喊。(還是拿骰子舉例:骰子每次投擲出現(xiàn)的結(jié)果必然是落在數(shù)字1到6之間,也就是100%會落在1到6中的某個數(shù)字量愧。當數(shù)字1出現(xiàn)的概率為 1/6 時钾菊,意味著可能出現(xiàn)其他5個數(shù)字的概率為 5/6 )
下面我們來看一些比較著名的離散概率分布例子。
離散型隨機變量的均勻分布
均勻分布是概率分布中最基本的類型偎肃。在離散型的均勻分布中煞烫,所有的結(jié)果都被賦予了同等權(quán)重(概率)。好比我們之前說的擲骰子累颂,它有6個面滞详,分別代表了從1到6不等的數(shù)字,每一個面可能出現(xiàn)的機會都是1/6紊馏。PMF就是取固定值的方式來表示:p(x) = 1/6 料饥,對于均勻隨機變量 X 的所有可能出現(xiàn)的情況,均成立朱监。
我們知道每次擲骰子岸啡,各個面出現(xiàn)的機會都是同等的。我們先進行了十次投擲并將結(jié)果繪制成上圖所示赌朋,可以看到每個面出現(xiàn)的次數(shù)并不均勻(數(shù)字6出現(xiàn)了4次凰狞、數(shù)字五出現(xiàn)了2次篇裁,其他均出現(xiàn)了1次)沛慢。然后,我們逐步增加實驗次數(shù)达布。隨著擲骰子次數(shù)不斷增加团甲,各個面出現(xiàn)的次數(shù)將會顯得越來越“均勻”,直到最后幾乎相同黍聂。
在進行了10000次的實驗后躺苦,我們可以很容易的發(fā)現(xiàn):對于隨機變量X可能出現(xiàn)的所有結(jié)果身腻,其對應(yīng)的概率p(x) = 1/6。進一步地匹厘,通過擲骰子實驗嘀趟,我們對其概率分布函數(shù)和累積分布函數(shù)總結(jié)如下:
通過上表,我們驗證了概率分布函數(shù)符合了前文所說的2個基本條件:每一種結(jié)果(骰子點數(shù))出現(xiàn)的概率都落在了 [0,1] 的區(qū)間內(nèi)愈诚;CDF證明了對于結(jié)果集中的所有情況她按,它們對應(yīng)的概率之和為1
這里我們再來具體說一下CDF,其同樣具備兩個屬性:
1. 對于每個可能出現(xiàn)的結(jié)果 X = x炕柔,對應(yīng)的 CDF 取值均落在 [0,1] 之間酌泰。這一點與 PDF 是相同的。
2. 對于每個可能出現(xiàn)的結(jié)果 X = x匕累,對應(yīng)的 CDF 取值呈現(xiàn)非下降趨勢陵刹。也即保持遞增或維持不變。
當嘗試對其他非均勻類型的概率分布進行采樣時欢嘿,我們?nèi)允怯苫诰鶆蚍植嫉那闆r出發(fā)衰琐,按照某種相互組合的方式,獲得合適的樣本炼蹦。由于這樣采樣會非常低效碘耳。我們將使用內(nèi)建的Numpy函數(shù)來簡化采樣過程。
二項式分布
二項式分布被描述為“非成即敗”框弛,在投資領(lǐng)域中往往能派上大用場辛辨。因為我們做出的很多抉擇都是基于此的二元選擇。當我們進行單次的“成/敗”實驗時瑟枫,我們把它叫做伯努利實驗斗搞。對于伯努利實驗中的隨機變量,我們會得到兩個可能的結(jié)果:
我們用Y = 1代表成功慷妙,在單次試驗中成功事件發(fā)生的概率用 p 表示僻焚。因此,“失敗”的概率是 1-p 膝擂。
二項式分布是通過進行 n 次伯努利實驗得到的虑啤,實驗中“成功”的次數(shù)落在 [0,n] 的整數(shù)之間。每一次伯努利實驗中架馋,“成功”的概率(p)是相同的狞山,并且每次實驗都是相互獨立不受影響的。我們可以用 n 和 p 來描述整個二項式隨機變量叉寂,用符號 X ~ B(n, p) 標記萍启,意為:X 是有關(guān)參數(shù) n 和 p 的二項式隨機變量。
為了定義二項式隨機變量的概率函數(shù),我們需要能夠從所有實驗次數(shù)中選出“成功”的那部分勘纯。這個想法運用了組合論中的組合思想局服。這個組合是指從集合中選擇項目的所有可能的方式,而無關(guān)乎選擇的順序驳遵。舉例來說淫奔,如果我們有6個彩球,我們從中挑出2個堤结,我們用$\binom{6}{2}$符號表示所有可能的組合搏讶,通過計算得到:
這里,! 表示階乘霍殴,運算規(guī)則為:n ! = n (n-1) (n-2) ... 1媒惕。由此我們進一步得到了組合的通用計算公式:
我們使用上述符號的目的,是從二項式隨機變量中選出所有可能的“成功”事件組合来庭。選出這個組合的目的妒蔚,是計算有多少種不同的方式可以達到相同的結(jié)果。所得概率函數(shù)為:
關(guān)于方程可以這樣理解月弛,我們先只考進行 n 次獨立的伯努利試驗肴盏,有 x 次成功的概率是:
在此基礎(chǔ)上,我們再考慮要達到規(guī)定的成功次數(shù)帽衙,可能的組合有多少種(比如5次實驗中成功3次菜皂,可以是第1,2,3次成功、第4,5次失敗厉萝,或是1,3,5次成功恍飘、第2,4次失敗等等),然后兩者相乘即為概率結(jié)果谴垫。這里 $X$ 是基于伯努利分布 B(n, p) 的二項隨機變量章母。
我們拿股價變動舉例,無論股價上漲還是下跌翩剪,概率均為 p = 0.5 乳怎。我們把上漲認作“成功”,記作 U前弯,下跌認作“失敗”蚪缀,記作D。這樣恕出,我們就能用二項隨機變量來分析每一次實驗“成功”的概率询枚。考慮以下情況:我們進行 n=5 次“伯努利股價”實驗:實驗的內(nèi)容是觀察股價隨時間推移剃根,股價5個交易日的波動情況哩盲,上漲(“成功”)或是下跌(“失敗”),下表顯示了股價“成功”次數(shù)的概率分布:
觀察表格結(jié)果狈醉,我們發(fā)現(xiàn)在 p = 0.50 時廉油,二項分布 p(x) 是對稱的。這是由于我們將股價上漲/下跌認為是等概率的事件苗傅,這里唯一影響概率大小的就是滿足條件的“組合數(shù)”的多少抒线,可以看到組合數(shù)一列自身也呈現(xiàn)對稱。當我們對 p 值進行微調(diào)渣慕,將得到非對稱的概率分布嘶炭。
現(xiàn)在我們給出基于上述假設(shè)X~B(5, 0.5)的圖形化展現(xiàn)結(jié)果:
再次的,在采樣時逊桦,您所采集的樣本越多(實驗次數(shù)越多)眨猎,得到的結(jié)果分布與理論上的就越一致:
假設(shè)我們修改參數(shù),將概率調(diào)整為$p = 0.25$强经,那么要滿足股價5天全部下跌的事件概率變?yōu)榱耍?/p>
這會使得我們的分布函數(shù)向著“股價上漲次數(shù)較少”的一側(cè)移動睡陪。
將概率從 0.5 調(diào)整為 0.25 ,顯然使得我們的二項分布變得非對稱了匿情。我們可以把這個伴隨有二項式隨機變量 x 的實驗結(jié)果兰迫,進一步擴展到我們稱之為“股價波動的二項式模型”的框架中。這是期權(quán)定價所用到的基礎(chǔ)之一炬称。在二項式模型中汁果,假設(shè)任何給定的時間段內(nèi),股價向上/向下的移動玲躯,是由各自的概率來決定的据德。那么股票價格將轉(zhuǎn)變?yōu)橐粋€關(guān)于二項式隨機變量的函數(shù)、股價上漲/下跌的幅度跷车、以及初始股價的參數(shù)求解問題晋控。我們可以改變這些參數(shù),以便近似模擬不同的“股價分布情況”姓赤。
連續(xù)型隨機變量
連續(xù)型隨機變量不同于離散型隨機變量赡译,它存在無限多的結(jié)果(無限可分),這些結(jié)果無法被窮盡不铆。我們給出某一個結(jié)果對應(yīng)的概率是沒有意義的(因為連續(xù)型隨機變量產(chǎn)生的結(jié)果是無限的蝌焚,落在任何一個“可能的結(jié)果”上的概率幾乎都為0)。
為此誓斥,我們可以變換一種方式——給出落在結(jié)果區(qū)間范圍上的概率只洒,而非給出單個結(jié)果的概率,來解決這個問題劳坑。這個方法運用到了微積分毕谴。當然你無須太過擔心技術(shù)方面的問題,本章介紹中由于我們使用到了采樣技術(shù),實際上并不會真正涉及到微積分的計算涝开。
如前所述循帐,討論連續(xù)型隨機變量為某個“結(jié)果”的概率,類似 P(X = 0)舀武, 是沒有意義的拄养。取而代之的,我們通常是會去給出隨機變量落在某個區(qū)間范圍內(nèi)的概率银舱,類似 P(-1 < X < 1)瘪匿。不同于離散型隨機變量使用概率質(zhì)量函數(shù)來進行描述,對于連續(xù)型隨機變量來說寻馏,我們定義了一個 概率密度函數(shù)(以下簡稱PDF)棋弥,fx(x) ,因此我們可以得到:
之前已經(jīng)提到過诚欠,離散型分布下顽染,隨機變量結(jié)果集對應(yīng)的各自概率之和一定為 1。與之類似聂薪,這里我們要求:
值得注意的是家乘,由于連續(xù)型分布中的每個點所對應(yīng)的概率都為0,所以概率分布函數(shù)在某個區(qū)間范圍邊界點上的概率為0藏澳。因此你也就理解了下面的等式:
并且仁锯,如果 PDF 包含了連續(xù)型隨機變量所有可能結(jié)果,那么對函數(shù)“積分”(對隨機變量所有可能出現(xiàn)的結(jié)果的概率進行加總)得到的值應(yīng)為1翔悠。
連續(xù)型隨機變量的均勻分布
均勻分布也可在連續(xù)型隨機變量的范圍內(nèi)給出定義业崖。我們不妨設(shè)兩個常數(shù) a 和 b,分別代表了隨機變量結(jié)果集范圍中的最大值和最小值蓄愁,那么隨機變量的 PDF 就是:
因為函數(shù)是定義在連續(xù)的區(qū)間內(nèi)双炕,概率密度函數(shù)將會覆蓋隨機變量落在a 和 b之前所有的可能情況。
我們來通過圖形化撮抓,觀察一個連續(xù)型隨機變量基于均勻分布的例子:
通過圖示我們看到妇斤,連續(xù)型隨機變量和離散型隨機變量的均勻分布是相類似的:對于所有“可能的結(jié)果 / 結(jié)果區(qū)間”,概率都是恒定的丹拯。唯一的區(qū)別在于站超,討論連續(xù)型隨機變量在某一點上的概率是沒有意義的。
由恒定值的概率密度函數(shù)出發(fā)乖酬,不難求得均勻分布的連續(xù)型隨機變量死相,其累計密度函數(shù)為:
再次,我們通過圖形化來觀察一下:
連續(xù)型隨機變量的正態(tài)分布
正態(tài)分布是統(tǒng)計學(xué)中最為重要和常見的一種分布咬像。許多經(jīng)典的統(tǒng)計檢驗方法算撮,都是基于正態(tài)為假設(shè)的生宛,這些檢驗方法被廣泛應(yīng)用于金融領(lǐng)域。
正態(tài)分布的背后有著中心極限定理(CLT)作為支撐肮柜,該定理指出陷舅,當獨立試驗的樣本量足夠多時,這些樣本呈現(xiàn)正態(tài)分布素挽。也正因此蔑赘,正態(tài)分布常被用于某些交易算法策略之中狸驳。例如配對交易算法预明,通過搜索配對股票并對其協(xié)整化,并將配對股票之間的價差波動看做是服從正態(tài)分布耙箍,從而預(yù)測股價走勢(配對交易會在后序章節(jié)進行介紹)撰糠。
談到正態(tài)隨機變量,我們一般通過均值和方差(標準差的平方)來進行描述辩昆。具體為阅酪,我們通過符號 X ~ N(μ, σ2) 來標記隨機變量 X 是正態(tài)隨機變量。在現(xiàn)代投資組合理論中汁针,股票的漲跌幅通常被認為是服從正態(tài)分布的术辐。正態(tài)隨機變量的一個主要特性是:由多個正態(tài)隨機變量通過線性關(guān)系疊加后形成的新隨機變量,仍然是正態(tài)隨機變量施无。基于這個特性辉词,如果我們把含有多個股票的投資組合看做一個整體,那么它的收益率無疑是服從正態(tài)分布的(上一講我們已經(jīng)說過猾骡,單個股票的每日收益是服從正態(tài)分布的)瑞躺,計算平均收益和方差將會很有意義。
直到剛才兴想,我們一直在討論的是單個變量的概率分布幢哨。當我們想要一次性地描述多個隨機變量時,就好像剛才談到的投資組合中的多個股票那樣嫂便,我們可以觀察多變量分布(以下簡稱多元分布)捞镰。想要完整的描述多元正態(tài)分布,是通過對其中每一個變量統(tǒng)計均值毙替、方差和顯著相關(guān)性來實現(xiàn)的岸售。多元正態(tài)分布的這些“統(tǒng)計描述”指標,對于確定投資組合的特征是至關(guān)重要的蔚龙,因為整體投資組合的方差取決于其所包含的所有證券的方差及這些證券的相關(guān)性冰评。
正態(tài)隨機變量的概率密度函數(shù)表達式為:
隨機變量的取值范圍定義在:-∞ < x < +∞。當正態(tài)分布的參數(shù)均值μ = 0木羹,并且標準差 σ = 1 時甲雅,我們稱其為標準正態(tài)分布解孙。
下面我們給出正態(tài)分布的圖形化展現(xiàn):
通過觀察可以發(fā)現(xiàn),正態(tài)分布呈現(xiàn)出類似“鐘型”的曲線抛人。通過改變正態(tài)分布的均值與標準差參數(shù)弛姜,我們可以改變鐘型曲線的寬度與高度。隨著標準差變大妖枚,鐘型曲線會變得更扁平廷臼,意味著樣本相對于均值的離散程度更大(圖中綠線)。
在金融領(lǐng)域中绝页,我們并不直接對股價進行正態(tài)分布的建模荠商,而是對股票的日收益率進行建模。這是由于:股價永遠是大于0的正數(shù)续誉,而正態(tài)分布能夠取得實數(shù)軸上的所有值莱没,從這個角度來說,股價日收益率比股價本身更為適合用正態(tài)分布建模酷鸦。在已知正態(tài)分布的均值與方差的前提下饰躲,我們可以得出以下結(jié)論:
當觀測集服從正態(tài)分布時,
1臼隔、68%的觀測值落在均值 ± 1個標準差的范圍區(qū)間 (μ±σ)
2嘹裂、95%的觀測值落在均值 ± 2個標準差的范圍區(qū)間 (μ±2σ)
3、99%的觀測值落在均值 ± 3個標準差的范圍區(qū)間 (μ±3σ)
這些結(jié)論對于后續(xù)理解置信區(qū)間是很重要的摔握,后者與正態(tài)分布密切相關(guān)寄狼。當談到樣本分布的均值和方差時,我們往往會去觀察“以均值為中心盒发,向兩側(cè)延展開”的這些置信區(qū)間例嘱。
運用中心極限定理,我們能夠?qū)Ω鞣N不同的隨機變量進行標準化處理宁舰,將他們轉(zhuǎn)變?yōu)檎龖B(tài)隨機變量拼卵。在統(tǒng)計學(xué)中有一個常用的工具——標準正態(tài)概率表,它能夠根據(jù)給定的隨機變量為某一值時(X = x)蛮艰,檢索到標準正態(tài)累積密度函數(shù)對應(yīng)的值 F(X ≤ x)腋腮。通過標準化轉(zhuǎn)換為“正態(tài)隨機變量”后,我們能夠方便地對照著概率表檢索到概率值壤蚜。
具體操作上即寡,我們對每一個樣本采取“減去樣本均值后,再除以樣本標準差”的方式來實現(xiàn)標準化的過程袜刷,將隨機變量 X 轉(zhuǎn)變?yōu)檎龖B(tài)隨機變量 Z:
現(xiàn)在讓我們先來看一個隨機變量服從二項分布的例子 X ~ B(n, p)聪富。二項式分布的均值 μ = np,方差 σ2 = np(1 - p):
接著我們將二項式隨機變量 X 按照之前介紹的標準化方法轉(zhuǎn)變?yōu)檎龖B(tài)隨機變量 Z:
這個“標準化轉(zhuǎn)換”的方法非常重要著蟹。通過將隨機變量轉(zhuǎn)變?yōu)槲覀兪煜さ姆植?—— 正態(tài)分布墩蔓,我們能夠輕松地回答那些之前圍繞原始變量的任何概率方面的問題梢莽。然而,前提是這依賴于足夠大的樣本量奸披。
我們假定股票日收益率基于正態(tài)分布昏名,不妨用 Y 來代表股價。我們將運用程序函數(shù)模擬股票日收益率阵面,并將其可視化如下:
進一步地轻局,此時我們引入另一個“股票 Z”,同樣模擬出 Z 股票的日收益率(同樣基于正態(tài)分布):
接下來样刷,我們創(chuàng)建一個投資組合 W仑扑,構(gòu)建方法是對股票 Y 和 Z 以加權(quán)平均的方式進行組合:
讓我們把這三只“股票”放在一起對比觀察一下:
注意,我們新構(gòu)建的投資組合日收益率颂斜,也是正態(tài)分布的:
正態(tài)分布被廣泛地應(yīng)用于金融領(lǐng)域夫壁,尤其在風險管理與投資組合理論中拾枣,有大量的文獻介紹了如何運用正態(tài)分布從風險分析到股價建模沃疮。
概率分布擬合
現(xiàn)在我們將嘗試對股票日收益率進行概率分布擬合。我們?nèi)〉锰厮估娜帐找媛蕯?shù)據(jù)梅肤,對其應(yīng)用正態(tài)分布擬合司蔬。首先要檢查的是,日收益率是否真的呈現(xiàn)概率分布的屬性姨蝴。為此俊啼,我們將使用 Jarque-Bera 檢驗,檢驗結(jié)果P值如果大于閾值左医,則服從正態(tài)分布授帕。
從運行結(jié)果來看,過低的P值“拒絕”了正態(tài)分布的假設(shè)浮梢。通過上圖我們可以發(fā)現(xiàn)跛十,拒絕的原因是峰值太大(正態(tài)分布的峰值應(yīng)為3)。
我們假設(shè)收益率是正態(tài)分布的秕硝,以便我們可以繼續(xù)進行分布擬合芥映。接下來我們計算出序列的樣本均值與方差。
現(xiàn)在讓我們來看一下远豺,如何對這些樣本實際值(股價收益率)進行理論上的正態(tài)曲線擬合:
如先前所說奈偏,正因為實際日收益曲線擁有“高峰值” 5.20 (高于正態(tài)分布要求的峰值3),因此并非是正態(tài)分布的躯护。過高的峰值在圖中以曲線的高度來體現(xiàn)惊来。而進行正態(tài)分布擬合后,我們得到的“理論收益曲線”擁有比實際收益曲線低得多的峰值棺滞,這是符合邏輯的裁蚁。
定價模型和收益率模型之所以建模困難内狸,正是由于無法確定它們背后遵循何種概率分布。在金融領(lǐng)域厘擂,許多理論和框架都要求數(shù)據(jù)與正態(tài)分布相關(guān)昆淡,這也是為何正態(tài)分布如此普遍的原因。舉例來說刽严,Black-Scholes期權(quán)定價模型就假設(shè)了股價是基于對數(shù)正態(tài)分布的昂灵。然而在現(xiàn)實世界,尋找那些完美服從正態(tài)分布假設(shè)的真實數(shù)據(jù)舞萄,是非常困難的眨补。在策略的實現(xiàn)上,你不應(yīng)假設(shè)數(shù)據(jù)樣本服從那些它們本不具備的分布規(guī)律倒脓,除非有很充分的理由撑螺。
一般來說,當嘗試對真實數(shù)據(jù)進行概率分布擬合時崎弃,我們已經(jīng)預(yù)先假設(shè)了其遵循某一種特殊的概率分布(或某幾種特殊概率分布中的一種)甘晤。接下來我們會采用一系列的檢測來決定哪一種分布假設(shè)是最合適的。另外饲做,隨著新的樣本數(shù)據(jù)不斷產(chǎn)生并加入進來线婚,需要及時地更新均值與標準差的參數(shù)假設(shè)。甚至當這些新加入的樣本足以影響原有的概率分布假設(shè)時(例如存在一個與原假設(shè)不同的概率分布假設(shè)盆均,更符合新的樣本數(shù)據(jù)時)塞弊,予以替換。
應(yīng)各位朋友建議泪姨,關(guān)注微信公眾號“數(shù)據(jù)夕拾”游沿,后臺回復(fù)“隨機變量”,獲取獨家中英原版PDF文檔肮砾。