想確保成功贫导,你會怎么做?普通人可能會說做好各種預(yù)案蟆盹,排除可能的阻礙孩灯。這固然沒錯,但這只是理想情況逾滥。而現(xiàn)實中成功的發(fā)生峰档,離不開概率。
來看一組數(shù)字:假如有50%的成功可能性寨昙,那至少要嘗試4次讥巡,才能確保成功一次;如果只有5%的成功可能性舔哪,大約需要50次才能確保成功一次欢顷。
這樣的結(jié)論,或許和你對于概率的感知有些不太一樣捉蚤。不用困惑抬驴,下面專門和你說說一說,在概率層面缆巧,為什么理想和現(xiàn)實總存在著偏差布持。
1
扔十次硬幣,會有五次正面嗎
隨機性的規(guī)律性其實和我們直覺想象的不一樣陕悬,以至于在生活中大部分人會誤讀概率题暖。
比如說,我們知道拋硬幣正反兩面朝上的概率各50%墩莫,但你現(xiàn)在去拋十次硬幣芙委,真的有5次正面朝上么?其實這種可能性只有25%左右狂秦,顯然和大多數(shù)人的直覺完全不同了灌侣。
再比如有一個賭局,贏面是10%裂问,你玩十次是否就能保證贏一次呢侧啼?如果不能牛柒,需要多少次才有很高的把握贏一次呢?這個結(jié)果其實是26次痊乾,這可能也顛覆了你的認(rèn)知皮壁。
因此寥掐,我會通過一些例子講清楚隨機性到底意味著什么禀横,我們該如何得到正確的統(tǒng)計規(guī)律,而不是主觀偏見逛拱。
我們都知道湿滓,統(tǒng)計學(xué)的規(guī)律只有經(jīng)過了大量隨機試驗才能得出滴须,也才有意義。但是隨機試驗得到的結(jié)果叽奥,和我們用古典概率算出來的結(jié)論可能是兩回事扔水。
不僅你擲10次硬幣大部分時候不可能得到五次正面朝上的結(jié)果,你做其它隨機試驗也是如此朝氓。比如你擲12次骰子魔市,大約只有30%的情況它正好有兩次六點朝上。這時你是否能講赵哲,有70%的可能性要否定六點朝上的概率是1/6這個結(jié)論呢待德?似乎也不應(yīng)該這么武斷。
這里面到底哪里出了問題誓竿?這其中的關(guān)鍵是磅网,如何解釋真實情況和理想中的概率之間的偏差。
2
現(xiàn)實和理想概率有偏差
幾百年前筷屡,法國數(shù)學(xué)家伯努利等人為了回答這個問題涧偷,就開始做一些最簡單的隨機試驗,這種試驗簡單到只有兩種結(jié)果毙死,非A即B燎潮,沒有第三種狀態(tài),而且在同樣條件下重復(fù)這種試驗扼倘,A和B發(fā)生的概率需要一致确封。
比如拋硬幣,每次正面朝上的概率是1/2再菊;擲骰子爪喘,事件A是“六點朝上”,它出現(xiàn)的概率每次也是1/6纠拔。當(dāng)然事件B就是其它點朝上秉剑,每次的概率是5/6。在一般情況下稠诲,出現(xiàn)A的概率是p侦鹏,B的概率是1-p诡曙。這類試驗后來被稱為伯努利試驗。
好了略水,基本的設(shè)定講清楚了价卤。我們來分析一下擲硬幣的問題。照理講渊涝,我們擲10次硬幣慎璧,正面朝上的次數(shù)應(yīng)該是5次。但是如果你真的拿一個硬幣去試試跨释,你會發(fā)現(xiàn)可能只有三次正面朝上炸卑,也可能四次正面朝上,甚至?xí)霈F(xiàn)沒有一次正面朝上的情況煤傍。
如果我們把從0次正面朝上,也就是說全部是背面朝上嘱蛋,到10次全是正面朝上的可能性都算出來蚯姆,畫成一個折線圖,就是一個中間鼓起的曲線:
從圖中可以看出洒敏,雖然5次正面朝上的可能性最大龄恋,但是只有1/4左右。
造成試驗結(jié)果和理論值不一致的原因凶伙,是試驗十次數(shù)量太少郭毕,統(tǒng)計的規(guī)律性被試驗的隨機性掩蓋了。
如果我們做更多的隨機試驗函荣,規(guī)律性是否會更清晰一點呢显押?
比如我們做100次試驗,這時你會發(fā)現(xiàn)傻挂,80%的情況下乘碑,正面朝上出現(xiàn)了40-60次。如果我們繼續(xù)放大試驗次數(shù)金拒,你會發(fā)現(xiàn)絕大多數(shù)情況正面朝上的次數(shù)在一半左右浮動兽肤,那種正面朝上占比特別少或者特別多的可能性幾乎不會出現(xiàn),而不是像一開始那樣绪抛,什么情況都有可能资铡。
當(dāng)然,如果你做1000次試驗幢码,在99.9%的情況下正面朝上的次數(shù)在400-600之間笤休。即使你把浮動的范圍縮小到450-550,99.7%的情況下正面朝上落在這個范圍內(nèi)蛤育。
在一般情況下宛官,如果進(jìn)行N次這種簡單的伯努利試驗葫松,那么事件A會發(fā)生多少次呢?雖然我們感覺應(yīng)該是總次數(shù)N乘以每次發(fā)生的概率p底洗,但是實際上事件A發(fā)生多少次都是有可能的腋么。當(dāng)然發(fā)生N*p次的可能性最大,接下來發(fā)生N*p+1或者N*p-1次的可能性次之亥揖,然后向兩頭逐漸遞減珊擂。
如果我們將它畫成一條曲線,就是中間高兩頭低的曲線费变。順便說一下摧扇,滿足這種曲線的概率分布,被稱為伯努利分布挚歧,也稱為二項式分布扛稽,因為每一次試驗的結(jié)果有兩種。
我們還看這個實驗滑负,事實上在张,如果試驗次數(shù)N比較大,那中間就是一個大鼓包矮慕,然后快速下降帮匾,兩旁幾乎是零,這也就是說事件A發(fā)生的次數(shù)在N*p左右的可能性極大痴鳄,其它的可能性極小瘟斜。相反,如果總次數(shù)N比較小痪寻,中間的鼓包就比較平緩螺句,兩頭的值雖然小,但不會是零槽华,其實難以判定事件A到底發(fā)生了多少次壹蔓。
于是,我們就得到這樣一個結(jié)論:有關(guān)不確定性的規(guī)律猫态,只有在大量隨機試驗時才顯現(xiàn)出來佣蓉,當(dāng)試驗的次數(shù)不足,它則顯現(xiàn)出偶然性和隨意性亲雪。
3
找出這個偏差的本質(zhì)
當(dāng)然勇凭,在數(shù)學(xué)上我們不能用“曲線比較鼓”,或者“比較平”之類不嚴(yán)格的語言來描述一種規(guī)律义辕。我們需要用兩個非常準(zhǔn)確的概念來定量描述“鼓”和“平”的差別虾标。
第一個概念就是平均值或者叫做數(shù)學(xué)期望值,也就是N*p灌砖,因為概率是p的事件進(jìn)行N次試驗后璧函,平均發(fā)生的次數(shù)傀蚌,也是最可能發(fā)生的次數(shù),好蘸吓,這是N*p善炫。
接下來我們再用平方差(簡稱方差)這個概念來描述曲線的“鼓”與“平”】饧蹋“方差”這個詞你可能并不陌生箩艺,那么什么是方差,它是如何計算的呢宪萄?我們下面就簡單地說一說艺谆。
方差其實是對誤差的一種度量,既然是誤差拜英,就要有可對比的基點静汤,在概率中,這個基準(zhǔn)點就是數(shù)學(xué)期望值(簡稱期望值)居凶,也就是我們通常說的平均值撒妈。比如說,做10次拋硬幣的試驗排监,平均值就是5次正面朝上,5就是基點杰捂。
如果我們做10次試驗只出現(xiàn)4次正面朝上的情況舆床,就有了誤差,誤差是1嫁佳。如果9次正面朝上挨队,那么誤差就大了,就是4蒿往。好了盛垦,接下來我們就把各種誤差,和產(chǎn)生那些誤差的可能性一起考慮瓤漏,做一個加權(quán)平均腾夯,算出來的“誤差”就是平方差。
之所以使用“平方”這個詞蔬充,是因為計算方差這種誤差時用到了平方蝶俱,為了進(jìn)一步方便誤差和平均值的比較,我們通常會對方差開根號一次饥漫,這樣得到的結(jié)果被稱為標(biāo)準(zhǔn)差(嚴(yán)格來講榨呆,方差開根號后和標(biāo)準(zhǔn)差還是略有差別,但是這個差別很小庸队,為了便于理解积蜻,我們就假定標(biāo)準(zhǔn)差是方差開根號的結(jié)果)闯割。
關(guān)于方差和標(biāo)準(zhǔn)差的公式我們就省略了,大家只要記住下面這個結(jié)論就可以了:伯努利試驗或者其它類似的試驗竿拆,試驗的次數(shù)越多宙拉,方差和標(biāo)準(zhǔn)差越小,概率的分布越往平均值N*p的位置集中如输。
顯然鼓黔,在這種情況下,你用A發(fā)生的次數(shù)不见,除以試驗次數(shù)N澳化,當(dāng)作A發(fā)生的概率,就比較準(zhǔn)確稳吮。
反之缎谷,試驗的次數(shù)越少,概率分布的曲線就越平灶似,也就是說A發(fā)生多少次的可能性都存在列林,這時你用A發(fā)生的次數(shù),除以試驗次數(shù)N酪惭,當(dāng)作A發(fā)生的概率希痴,誤差可能會很大。
具體到拋硬幣的試驗春感,進(jìn)行100次試驗砌创,標(biāo)準(zhǔn)差大約是5次,也就是誤差相比平均值50鲫懒,大約是10%嫩实。但是如果我們做10000次試驗,標(biāo)準(zhǔn)差大約只有50窥岩,因此和平均值相比甲献,降到了1%左右。
4
成功需要更多準(zhǔn)備
有了方差的概念颂翼,我們就能定量分析“理想”和現(xiàn)實的差距了晃洒。什么是理想呢?我們進(jìn)行N次伯努利試驗朦乏,每一次事件A發(fā)生的概率為p锥累,N次下來發(fā)生了N*p次,這就是理想集歇。那么什么是現(xiàn)實呢桶略?由于標(biāo)準(zhǔn)差的影響,使得實際發(fā)生的次數(shù)嚴(yán)重偏離N*p,這就是現(xiàn)實际歼。
比如惶翻,在生活中,很多人覺得某件事有1/N發(fā)生的概率鹅心,只要他做N次吕粗,就會有一次發(fā)生,這只是理想旭愧。
事實上颅筋,越是小概率事件,理想和現(xiàn)實的差距越大输枯。
比如說一件事發(fā)生的概率為1%议泵,雖然進(jìn)行100次試驗后它的數(shù)學(xué)期望值達(dá)到了1,但是這時它的標(biāo)準(zhǔn)差大約也是1桃熄,也就是說誤差大約是100%先口,因此試了100次下來,可能一次也沒有成功瞳收。
如果你想確保獲得一次成功怎么辦呢碉京?你大約要做260次左右的試驗,而不是100次螟深。這里面的數(shù)學(xué)細(xì)節(jié)我們就不講了谐宙,大家記住這個結(jié)論就好,就是越是小概率事件界弧,你如果想確保它發(fā)生卧惜,需要試驗的次數(shù)比理想的次數(shù)越要多得多。
比如買彩票這種事情夹纫。你中獎的概率是一百萬分之一,你如果要想確保成功一次设凹,恐怕要買260萬次彩票舰讹。你即使中一回大獎,花的錢要遠(yuǎn)比獲得的多得多闪朱。
因此月匣,了解了標(biāo)準(zhǔn)差,就該懂得人為什么不要去賭奋姿。這算是我們今天在認(rèn)知方面要了解的第一個知識點锄开。
我們要了解的第二個知識點是,提高單次成功率要遠(yuǎn)比多做試驗更重要称诗。
假如你有50%的成功可能性萍悴,你基本上嘗試4次,就能確保成功一次,當(dāng)然理想狀態(tài)是嘗試兩次癣诱。為了保險起見计维,要多做100%的工作。但是如果你只有5%的成功可能性撕予,大約需要50次才能確保成功一次鲫惶,而不是理想狀態(tài)中的20次。為了保險起見实抡,要多做150%的工作欠母。
很多人喜歡賭小概率事件,覺得它成本低吆寨,大不了多來幾次赏淌,其實由于誤差的作用,要確保小概率事件發(fā)生鸟废,成本要比確保大概率事件的發(fā)生高得多猜敢。
關(guān)于概率論和統(tǒng)計學(xué)的規(guī)律,還有很多和大家直覺不相符的地方盒延。比如我們前面所說的各種大量的隨機試驗缩擂,需要在相同條件下進(jìn)行,而且前后各次試驗是彼此不會相互影響的添寺。這兩件事在現(xiàn)實中胯盯,還真不容易滿足。
就拿擲骰子來說吧计露,看似擲N次不過是擲一次的多次重復(fù)博脑,但實際上擲的次數(shù)多了骰子會磨損,桌面也會砸出坑票罐,這些細(xì)微的差異累積下來就會產(chǎn)生不同的結(jié)果叉趣,我們原以為試幾次就能發(fā)生的事情,可能沒有發(fā)生该押,這就要我們事先考慮更多的余量疗杉。
5
小? 結(jié)
我們從概率論上證明了,凡事做好充足的準(zhǔn)備蚕礼,爭取一次性成功烟具,這要遠(yuǎn)比不斷嘗試小概率事件靠譜得多。
同時涉及到隨機性的問題時奠蹬,只有通過大量可重復(fù)性的試驗朝聋,才能看到規(guī)律性,而數(shù)量較少的試驗囤躁,更多地體現(xiàn)出來的是隨意性和偶然性冀痕,而非規(guī)律性荔睹。