《概率統(tǒng)計(jì)超入門》是我在網(wǎng)上淘書時(shí),發(fā)現(xiàn)的已絕版的原版拓印版般码。這本書是2001年日本的兩位教育家寫的妻率,和《給討厭數(shù)學(xué)的人——數(shù)學(xué)的奧妙與生活》一樣,都是在日本教育部進(jìn)行一次大的基礎(chǔ)教育改革板祝,推行“愉快教育”旗號(hào)時(shí)推出的宫静。所不同的是,前者發(fā)揚(yáng)了愉快教育的精神,真的把枯燥難懂的概率學(xué)寫得非常淺顯易懂孤里,而后者則是擔(dān)憂民眾從此失去對(duì)數(shù)理的興趣伏伯,遠(yuǎn)離真知而寫的一本科普書。在此感慨一下日本教育界大家的寫作功底捌袜,和實(shí)踐自己理念的精神说搅。
《概率統(tǒng)計(jì)超入門》除了由淺入深、結(jié)合日常實(shí)例等特點(diǎn)外虏等,給人最大印象的是每一節(jié)內(nèi)容都是兩頁(yè)弄唧。這讓沒(méi)有很大動(dòng)力學(xué)習(xí)的人也能很輕松的持續(xù)看下去,就好比想鍛煉的人應(yīng)該從每天做一個(gè)俯臥撐開始霍衫,而不是上來(lái)就做二三十個(gè)候引。?“循序漸進(jìn)、持之以恒”在大多數(shù)情況下都是一個(gè)好原則敦跌。
書中講的東西都很淺顯澄干,把有關(guān)概念和公示抄錄下來(lái),在筆記本上?也只有6頁(yè)柠傍。把概念都羅列出來(lái)麸俘,分別有重復(fù)隨機(jī)試驗(yàn)的二項(xiàng)式分布公式、期望值惧笛、方差从媚、標(biāo)準(zhǔn)差、散布度徐紧、契貝曉夫定理(又稱切貝雪夫定理静檬,這一節(jié)百度了三天才看懂)、協(xié)方差并级、相關(guān)系數(shù)拂檩、線性回歸、多個(gè)隨機(jī)變量的期望值嘲碧、方差的和差積的計(jì)算稻励,二項(xiàng)式分布的期望值和方差、超幾何分布愈涩。這些名詞看起來(lái)很專業(yè)望抽,其實(shí)平均每一個(gè)都只需要花5分鐘就能理解÷耐瘢看這本書時(shí)和印象中的中學(xué)概率統(tǒng)計(jì)有很多不同煤篙,感覺(jué)這本書的內(nèi)容更側(cè)重實(shí)用,更像是數(shù)據(jù)分析的基礎(chǔ)入門教材毁腿。
其實(shí)如何計(jì)算概率和隨機(jī)變量的屬性及相關(guān)性辑奈,對(duì)不打算從事金融苛茂、商務(wù)分析、人工智能這些行業(yè)的人來(lái)說(shuō)并不重要鸠窗,但是理解概率的概念妓羊,擁有概率統(tǒng)計(jì)的思維卻是非常重要的一件事。萬(wàn)維剛在《萬(wàn)萬(wàn)沒(méi)想到》中甚至說(shuō)稍计,概率論是比萬(wàn)有引力和基因復(fù)制更重要的知識(shí)躁绸,是?現(xiàn)代公民的必備常識(shí),有沒(méi)有這種思維臣嚣,直接決定一個(gè)人的“開化”程度净刮。這個(gè)話雖然聽起來(lái)有些危言聳聽,但事實(shí)確實(shí)如此茧球。概率論的重要性主要體現(xiàn)在經(jīng)濟(jì)學(xué)的相關(guān)領(lǐng)域里庭瑰,說(shuō)白了就是跟錢有很大關(guān)系。相信每一個(gè)從不懂到看懂概率論的人都會(huì)感慨:“要是早點(diǎn)學(xué)就好了”抢埋。概率論的思維最大的用處,就是可以讓我們避開社會(huì)上的一些“坑”督暂,以保護(hù)好自己的財(cái)產(chǎn)揪垄,避免繳納“智商稅”。
簡(jiǎn)單記錄一下《萬(wàn)萬(wàn)沒(méi)想到》中關(guān)于概率的這篇文章《最簡(jiǎn)單概率論的五個(gè)智慧》逻翁。
第一個(gè)智慧:隨機(jī)饥努。概率論最基礎(chǔ)的思想是,有些事是無(wú)緣無(wú)故發(fā)生的八回,這就是隨機(jī)的概念酷愧。我們總是習(xí)慣性的把一件事情的發(fā)生,歸結(jié)為各種原因缠诅∪茉。【現(xiàn)代認(rèn)知科學(xué)發(fā)現(xiàn),因果關(guān)系是人類認(rèn)識(shí)外界的基本機(jī)制管引,失去邏輯人類的認(rèn)知系統(tǒng)就會(huì)崩潰士败。這就為認(rèn)識(shí)隨機(jī)性造成了難度,其實(shí)在隨機(jī)性背后還有一個(gè)更深的哲學(xué)理論褥伴,叫非連續(xù)性谅将。】?比如考試考的好重慢,可以理解為學(xué)習(xí)用功了饥臂;比賽失敗,可以理解為實(shí)力不濟(jì)或者球員不在狀態(tài)似踱。但是并非任何時(shí)候事物都是必然的隅熙,偶然性也會(huì)造成很大影響稽煤。最極端的就是彩票:在同一期里買了相同數(shù)量彩票的人,中獎(jiǎng)的概率是一樣的猛们,無(wú)論你在之前做過(guò)多少努力念脯,比如研究彩票走勢(shì)、沐浴更衣弯淘、燒香拜佛還是積善行德绿店,都不會(huì)影響中獎(jiǎng)的真實(shí)概率。像彩票這樣的叫做獨(dú)立的庐橙、隨機(jī)的事件假勿,它們的發(fā)生沒(méi)有任何緣由,跟任何事物都沒(méi)有因果關(guān)系态鳖。生活中絕大多數(shù)事情是偶然和必然的結(jié)合转培,我們?cè)谂φ莆毡厝恍缘耐瑫r(shí),也應(yīng)該認(rèn)識(shí)到偶然性的存在浆竭,不應(yīng)該把過(guò)多的精力花在尋求偶然因素上面浸须。比較重要的一點(diǎn)啟示是,在評(píng)判一個(gè)人時(shí)邦泄,不應(yīng)該用一時(shí)的好壞或成敗來(lái)給他貼標(biāo)簽(西方社會(huì)直接有“do not judge”不要評(píng)判一個(gè)人的文化)删窒;在尋找成功方法時(shí),更要分清楚別人的成功里存在哪些必然和偶然因素顺囊,避免盲目尊崇和不以為然肌索,更加理性的看待事物。
第二個(gè)智慧:誤差特碳。偶然性永遠(yuǎn)存在诚亚,哪怕在極度嚴(yán)謹(jǐn)?shù)奈锢韺?shí)驗(yàn)中,也無(wú)法保證完全沒(méi)有偶然影響午乓,而只能通過(guò)多次實(shí)驗(yàn)取平均值的方法站宗,用范圍值來(lái)表示實(shí)驗(yàn)結(jié)果,盡量降低偶然因素的影響硅瞧。即便如此份乒,實(shí)驗(yàn)結(jié)果也并不代表真實(shí)的值就一定在標(biāo)明的范圍里面,其實(shí)這個(gè)范圍也只是在概率上的計(jì)算結(jié)果而已腕唧,只能說(shuō)明真實(shí)值落在范圍外面的可能性很小或辖。誤差不可避免,通過(guò)多次試驗(yàn)枣接、或者多組數(shù)據(jù)來(lái)考量必然性與偶然性颂暇,是一個(gè)很重要的科學(xué)思維。比如世界杯預(yù)選賽時(shí)但惶,國(guó)足總是在失敗以后強(qiáng)調(diào)客觀因素耳鸯,這些客觀因素確實(shí)是影響結(jié)果的偶然因素湿蛔,但多次失敗以后,我們還是可以得出國(guó)足是一支弱隊(duì)的結(jié)論县爬。
第三個(gè)智慧:賭徒謬誤阳啥。從這里就開始教大家識(shí)別“坑”了。所謂的賭徒謬誤财喳,就是賭徒在賭博時(shí)察迟,如果多次出現(xiàn)某一種情況,那他就認(rèn)為沒(méi)有出現(xiàn)過(guò)的情況在后面出現(xiàn)的幾率會(huì)更大耳高。比如扔色子時(shí)扎瓶,已經(jīng)好幾次“大”了,那他就認(rèn)為后面應(yīng)該壓“小”泌枪。這種思維是絕大多數(shù)人的習(xí)慣思維概荷,也是人的本能思維。因?yàn)槿四X的機(jī)制就是認(rèn)為萬(wàn)事萬(wàn)物都有聯(lián)系碌燕,(有趣的是误证,小孩子認(rèn)為萬(wàn)物有靈,任何東西都是有生命的修壕,比如汽車要加油了雷厂,他們會(huì)認(rèn)為汽車開的累了要休息。所以人的天性里存在因果關(guān)系叠殷。)?只有通過(guò)習(xí)得抽象概念才能跳出這個(gè)偏誤。賭徒謬誤的錯(cuò)誤在于诈皿,他們認(rèn)為概率是平均分布的林束,前面少的后面就會(huì)補(bǔ)回來(lái)。他們沒(méi)有理解“獨(dú)立”和“隨機(jī)”這兩個(gè)概念稽亏。所謂“獨(dú)立”壶冒,就是前后兩次事件之間沒(méi)有任何關(guān)聯(lián),每一次發(fā)生的概率都是一樣的截歉∨痔冢“隨機(jī)”則是單獨(dú)一次事件發(fā)生的可能性在理論上是等于概率的,但真的會(huì)不會(huì)發(fā)生是沒(méi)法預(yù)測(cè)的瘪松。概率統(tǒng)計(jì)中有一個(gè)“大數(shù)定律”咸作,大數(shù)定律確實(shí)說(shuō)概率是均勻分布的,但有個(gè)前提是實(shí)驗(yàn)次數(shù)要足夠多宵睦。所謂足夠多就是無(wú)限多记罚,幾百幾千幾萬(wàn)次都稱不上足夠多,幾萬(wàn)次以后的結(jié)果也只是“接近概率分布”壳嚎。因此大數(shù)定律是一個(gè)理論情況桐智,它的含義是前面如果已經(jīng)扔出了很多次“大”末早,那再扔很多很多次以后,會(huì)出現(xiàn)非常多的“大”和非常多的“小”说庭,以至于前面出現(xiàn)的幾次“大”被忽略不計(jì)了然磷。
第四個(gè)智慧:不由自主的找規(guī)律(原文是在沒(méi)有規(guī)律的地方發(fā)現(xiàn)規(guī)律)?。概率論的核心在于刊驴,獨(dú)立隨機(jī)事件的發(fā)生是沒(méi)有規(guī)律和不可預(yù)測(cè)的姿搜。我們沒(méi)有必要為偶然發(fā)生的事情過(guò)于在意,也不應(yīng)該試圖在隨機(jī)中尋找規(guī)律缺脉。彩票分析學(xué)大行其道了很多年痪欲,大街小巷的彩票售賣店里都會(huì)有過(guò)去開獎(jiǎng)的趨勢(shì)圖,各大網(wǎng)站也都有所謂的彩票分析專家攻礼,預(yù)測(cè)未來(lái)的彩票走勢(shì)业踢。在有概率思維的人看來(lái),想要預(yù)測(cè)彩票走勢(shì)是一件非辰赴纾可笑的事情知举,這跟預(yù)測(cè)股票走勢(shì)本質(zhì)上是不同的,因?yàn)椴势睕](méi)有任何外界因素可以考量太伊,是一個(gè)純粹的獨(dú)立隨機(jī)事件雇锡。賭徒謬誤的問(wèn)題在于分不清大數(shù)和小數(shù)的區(qū)別,彩票分析學(xué)的問(wèn)題則在于僚焦,人們認(rèn)為彩票存在走勢(shì)锰提,即規(guī)律。其實(shí)芳悲,發(fā)現(xiàn)規(guī)律也是人的一種天性和本能立肘,人無(wú)時(shí)無(wú)刻不在把外界的信息總結(jié)成一些抽象的規(guī)律以便記憶,人腦在這方面的強(qiáng)大名扛,以至于會(huì)讓人只看到自己想看的東西谅年,忽視不想看和不想知道的東西,如果有不符合規(guī)律的情況肮韧,就會(huì)被歸結(jié)為“意外”融蹂,甚至是方法不對(duì)、只可意會(huì)弄企、個(gè)人修行之類玄而又玄的原因超燃,(這是一個(gè)很有用的心理常識(shí)碑宴,比如人永遠(yuǎn)喜歡奉承自己的話志笼,哪怕非常清楚對(duì)方只是在奉承自己扔水,而總是不喜歡聽到反對(duì)自己的意見听隐,哪怕明知道對(duì)方出于好意琼富。)這是主觀上的原因康愤≈绕停客觀的原因是操漠,如果數(shù)據(jù)量足夠多,總是能找出一個(gè)看起來(lái)合理的規(guī)律伙窃,就好比天上飄著的云菩颖,我們總是能找出一片云像某種物體,還越看越逼真为障。
第五個(gè)智慧:小數(shù)定律晦闰。數(shù)據(jù)多的時(shí)候規(guī)律總是會(huì)被找到,而當(dāng)數(shù)據(jù)少的時(shí)候鳍怨,規(guī)律有時(shí)候會(huì)自己“跳出來(lái)”呻右。隨機(jī)現(xiàn)象可以看上去很不隨機(jī),甚至非常整齊鞋喇。這個(gè)很好理解声滥,兩個(gè)點(diǎn)連成一條直線,你可以說(shuō)這兩個(gè)點(diǎn)就在這條直線上侦香;三個(gè)點(diǎn)則必然會(huì)有一個(gè)三角形落塑;四個(gè)點(diǎn)......永遠(yuǎn)都能有一個(gè)自洽的結(jié)論,說(shuō)明幾個(gè)點(diǎn)構(gòu)成一個(gè)圖形罐韩,但實(shí)際上點(diǎn)在不在圖形上憾赁,沒(méi)有相關(guān)性,也就是因果關(guān)系散吵。小數(shù)定律是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)丹尼爾.卡尼曼戲稱的龙考,他認(rèn)為理解小數(shù)定律和理解大數(shù)定律是相輔相成的。這跟前面的賭徒謬誤的意思差不多矾睦,在生活中是最容易被忽視而造成可笑錯(cuò)誤洲愤。比如,你曾經(jīng)被河南人騙過(guò)顷锰,又恰好聽說(shuō)自己的一個(gè)朋友被河南人騙過(guò),如果你進(jìn)一步在網(wǎng)上發(fā)現(xiàn)有人被河南人騙過(guò)亡问,那是否就會(huì)得出河南人騙子特別多的結(jié)論官紫?(以前我就是這么認(rèn)為的,無(wú)知爸菖骸J馈)可是無(wú)論從理論分析,還是從相關(guān)實(shí)驗(yàn)研究來(lái)看床玻,都找不到河南人騙子多的統(tǒng)計(jì)數(shù)據(jù)毁涉,說(shuō)明這只能是一種以訛傳訛的認(rèn)知偏誤。很多網(wǎng)絡(luò)上的經(jīng)濟(jì)锈死、政治評(píng)論員贫堰,經(jīng)常會(huì)從一兩個(gè)事件就總結(jié)出一條博人眼球的規(guī)律來(lái)穆壕,在“開化”人看來(lái),這種行為都是很無(wú)知的其屏。
要理解隨機(jī)分布不等于平均分布喇勋,概率和單個(gè)事件是否發(fā)生沒(méi)有直接聯(lián)系,是需要耐下心來(lái)偎行,學(xué)一點(diǎn)概率知識(shí)的川背。這花不了多長(zhǎng)時(shí)間,也許只要一個(gè)小時(shí)蛤袒,我們就能理解大致的概念熄云,然后在生活中慢慢實(shí)踐,鞏固和深化概率論的思維妙真。這對(duì)我們的生活會(huì)產(chǎn)生非常大的幫助缴允,我最近的就碰到這樣一個(gè)事例。有個(gè)朋友建議我關(guān)注一下分級(jí)基金隐孽,可能是分級(jí)基金在去年這波股市大行情里比較搶眼吧癌椿,肯定有不少私募關(guān)注這個(gè)東西。于是我秉著學(xué)以致用的理念菱阵,在網(wǎng)上百度了分級(jí)基金的概念踢俄,又找了幾篇講解分級(jí)基金套利的文章,結(jié)果發(fā)現(xiàn)并沒(méi)有大家傳言的那么神奇晴及,也絕對(duì)不是一個(gè)容易賺錢的投資品都办。我從兩個(gè)方面得出結(jié)論,一是投資分零和與正和博弈虑稼,如果是零和博弈琳钉,要想賺取利潤(rùn)就是火中取栗,需要比絕大部分競(jìng)爭(zhēng)者更高的信息獲取能力和分析能力蛛倦,還有更低的交易成本和渠道工具歌懒,很明顯我沒(méi)有。而且更有趣的是溯壶,分級(jí)基金的真實(shí)情況是及皂,投資者出于套利的目的會(huì)高頻交易,資管方的主要收入來(lái)源就變成了申購(gòu)和贖回的手續(xù)費(fèi)且改,那就連零和博弈都算不上了验烧,是負(fù)和博弈。另一方面就是從概率角度出發(fā)又跛,思考套利的可能性和幾率大小碍拆,發(fā)現(xiàn)幾篇所謂的教學(xué)文章在風(fēng)險(xiǎn)衡量和計(jì)算母基金倉(cāng)位時(shí),完全是靠猜的,作者很明顯不懂小數(shù)定律感混,也犯了“只看到自己想看”的錯(cuò)誤端幼,認(rèn)為套利成功是大概率事件。這種低級(jí)錯(cuò)誤只能說(shuō)明浩习,作者要么很無(wú)知静暂,要么就是別有用心,鼓動(dòng)賺錢心切的投資者們參與套利谱秽。
在這個(gè)科技迅速發(fā)展洽蛀、信息爆炸的時(shí)代,交點(diǎn)智商稅有時(shí)候在所難免疟赊,就跟以前有人貪便宜買路邊湊上來(lái)的手機(jī)筆記本郊供,結(jié)果發(fā)現(xiàn)是個(gè)模型的道理是一樣的。但是現(xiàn)在的“坑”的技術(shù)也在進(jìn)步近哟,像分級(jí)基金這樣套了幾層外衣的韭菜收割工具驮审,以后肯定還會(huì)層出不窮。這就需要我們好好補(bǔ)習(xí)一些基礎(chǔ)學(xué)科吉执,配得上一個(gè)現(xiàn)代化公民的稱號(hào)疯淫。?