本章作者主要講述了高斯分布和曼德爾布羅特分布的區(qū)別邑退。
1. 模型描述
高斯曲線分布常見于概率統(tǒng)計(jì),兩頭低熬苍,中間高稍走,左右對稱袁翁。在相互獨(dú)立的因素柴底,每個因素對整體影響較小時,總體呈現(xiàn)正態(tài)分布粱胜。
曼德爾布羅特分布則是變化劇烈的曲線柄驻,沒有盡頭,一般呈指數(shù)級變化焙压。
2.事實(shí)可能并不符合模型
比如鸿脓,如果說人的身高服從正態(tài)分布。但是身高沒有無限趨近于零的情況涯曲,下限在哪里野哭?可能要翻閱吉尼斯記錄來做參考。上限也一樣幻件。那么上下限是否和平均值能對稱拨黔,這是個問題。
再比如绰沥,收入的分配是德爾布羅特分布篱蝇,我們可以認(rèn)為下限是0贺待,上限是世界首富。
這樣的話零截,是否對于每一個點(diǎn)來講麸塞,收入增加一倍,概率下降1/4涧衙?
顯然不是哪工。作者也只是采取符合該規(guī)律的某一段數(shù)據(jù)(假設(shè)數(shù)據(jù)可靠)。
3.模型重疊
既然只是截取了某一段數(shù)據(jù)绍撞,那么正勒,對于任意一段鐘形曲線,我們在它的上升沿或者下降沿傻铣,也能夠找到接近指數(shù)變化的一段章贞。
4.選擇性提取
所以,嚴(yán)格按照作者的說法非洲,這兩者的運(yùn)行上一般也是被柏拉圖化鸭限。
實(shí)際的模型并不重要,重要的是變化的規(guī)律是怎樣两踏,我們需要關(guān)注的是哪一段數(shù)據(jù)败京,以便我們了解和預(yù)估。
拋開完整的曲線梦染,只取我們需要關(guān)注有效的數(shù)據(jù)區(qū)域赡麦。
例如,測試東海的海岸線長度帕识,我們并不需要精確到分米厘米泛粹,更不需要去對細(xì)微的沙灘進(jìn)行分形,精確到分子原子肮疗。
5.為何需要模型
需要模型是為了較為準(zhǔn)確的評估數(shù)據(jù)及其變化趨勢晶姊。
我們將其簡單化,不管是三角形伪货,圓形们衙,還是拋物線寇窑,直線哎媚,或者正弦波。
這并不意味著颖系,有從幾何上完美滿足這些模型的事物愚臀。而是通過它們忆蚀,選擇性地提取足夠準(zhǔn)確有效的結(jié)果。
6.問題在哪里
問題產(chǎn)生于選擇了錯誤的模型。
我們并不選擇符合精確實(shí)際的模型蜓谋,而是在數(shù)據(jù)段上最有效率的模型梦皮。
比如計(jì)算一個圓的周長,將它作為理想圓便是有效的桃焕。但是計(jì)算這個圓的某一小段邊沿的長度剑肯,我們可能并不把它當(dāng)圓的邊沿計(jì)算,而可能是直線測量观堂。
研究原子的能級躍遷让网,我們使用物理學(xué)模型。我們并不直接使用物理定律來計(jì)算化學(xué)反應(yīng)师痕,更加不會使用物理來計(jì)算“當(dāng)你打我一拳時溃睹,我會不會還手”這類問題。
因此胰坟,不管是正態(tài)分布因篇,還是曼德爾布羅特,模型本身是否完美并不重要笔横。重要的是竞滓,我們怎樣選擇適合的模型。