??查找了一些關(guān)于概率論與數(shù)理統(tǒng)計(jì)的歷史警检,感興趣的朋友不要錯(cuò)過钝凶!Favorite it ~ 會持續(xù)更新??????
統(tǒng)計(jì)學(xué)是一門年輕的科學(xué)娜庇。人類的統(tǒng)計(jì)實(shí)踐是隨著計(jì)數(shù)活動(dòng)而產(chǎn)生的炫贤,因此,統(tǒng)計(jì)發(fā)展史可以追溯到遠(yuǎn)古的原始社會疤估,也就是距今有5000多年的漫長歲月灾常。但是霎冯,能使人類的統(tǒng)計(jì)實(shí)踐上升到理論上予以概括總結(jié)的程度,即開始成為一門系統(tǒng)的科學(xué)統(tǒng)計(jì)學(xué)钞瀑,卻是近代的事情沈撞,距今只有300余年的短暫歷史。統(tǒng)計(jì)學(xué)發(fā)展的概貌雕什,大致可劃分為古典記錄統(tǒng)計(jì)學(xué)缠俺、近代描述統(tǒng)計(jì)學(xué)和現(xiàn)代推斷統(tǒng)計(jì)學(xué)三種形態(tài)。
20世紀(jì)初以來贷岸,科學(xué)技術(shù)迅猛發(fā)展壹士,社會發(fā)生了巨大變化,統(tǒng)計(jì)學(xué)進(jìn)入了快速發(fā)展時(shí)期偿警。甚至有的科學(xué)家還把我們的時(shí)代叫做“統(tǒng)計(jì)時(shí)代”躏救。顯然,20世紀(jì)統(tǒng)計(jì)科學(xué)的發(fā)展及其未來螟蒸,已經(jīng)被賦予了劃時(shí)代的意義盒使。
發(fā)展史
16世紀(jì)
16世紀(jì)? 意大利學(xué)者吉羅拉莫·卡爾達(dá)諾(Girolamo Cardano,1501.9.24-1576.9.21)開始研究擲骰子等賭博中的一些簡單問題。他是「古典概率論」的創(chuàng)始人七嫌。
17世紀(jì)
1646年 法國數(shù)學(xué)家布萊斯·帕斯卡(Blaise Pascal,1623.6.19-1662.8.19)與法國數(shù)學(xué)家費(fèi)馬(Pierre de Fermat,1601.8.17-1665.1.12)通信少办,他們一起解決某一個(gè)上流社會的賭徒兼業(yè)余哲學(xué)家送來的一個(gè)問題,他弄不清楚擲3個(gè)骰子出現(xiàn)某種組合時(shí)為什么老是輸錢诵原。在解決這個(gè)問題的過程中英妓,建立了概率論和組合論的基礎(chǔ),得出了關(guān)于概率論問題的一系列解法绍赛,奠定了近代概率論的基礎(chǔ)蔓纠。
18世紀(jì)
1713年 瑞士數(shù)學(xué)家雅各布·伯努利(Jakob Bernoulli,1654.12.27-1705.8.16)的遺著《猜度術(shù)》出版了,其中他提出了概率論中的第一個(gè)極限定理吗蚌,即「伯努利大數(shù)定律」贺纲,他第一個(gè)對經(jīng)驗(yàn)頻率的穩(wěn)定性進(jìn)行了嚴(yán)格地理論證明。他是使概率論成為數(shù)學(xué)的一個(gè)分支的奠基人褪测。之后,俄國數(shù)學(xué)家潦刃、力學(xué)家切比雪夫(Пафну?тий Льво?вич Чебышёв,1821.5.26-1894.12.8)在一般條件下推導(dǎo)出了大數(shù)定律侮措,稱為「切比雪夫大數(shù)定律」。
1733年 德國數(shù)學(xué)家和天文學(xué)家棣莫弗(Abraham De Moivre,1667.5.26-1754.11.27)研究伯努利大數(shù)定律中的情形乖杠,他導(dǎo)出了的漸進(jìn)公式(又稱「斯特林公式」)分扎,在求二項(xiàng)分布的漸進(jìn)分布中發(fā)現(xiàn)了「正態(tài)分布」的密度函數(shù),標(biāo)志著他首次提出了正態(tài)分布胧洒。后來這一結(jié)果被皮拔废牛·西蒙·拉普拉斯推廣到一般的情形墨状,后世稱之為「棣莫弗-拉普拉斯中心極限定理」,這是概率論歷史上的第二個(gè)極限定理菲饼,是第一個(gè)中心極限定理肾砂。
1763年 英國數(shù)理統(tǒng)計(jì)學(xué)家托馬斯·貝葉斯(Thomas Bayes,1702-1761)發(fā)表了貝葉斯統(tǒng)計(jì)理論。同年宏悦,Richard Price整理發(fā)表了貝葉斯的成果镐确,提出「貝葉斯公式」。貝葉斯是對概率論與數(shù)理統(tǒng)計(jì)的早期發(fā)展有重要影響的兩位人物之一(另一位是布萊斯·帕斯卡)饼煞。
19世紀(jì)
1809年 德國數(shù)學(xué)家約翰·卡爾·弗里德里显春·高斯(Johann Carl Friedrich Gau?,1777.4.30-1855.2.23)發(fā)表了《繞日天體運(yùn)動(dòng)的理論》,這本書中包含一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”的問題砖瞧,在這一節(jié)中他討論了誤差分布理論息堂,并且在此過程中獨(dú)立導(dǎo)出了「正態(tài)分布」,推廣了正態(tài)分布的應(yīng)用块促,因此正態(tài)分布也被稱為「高斯分布」荣堰。同年,高斯提出「最小二乘法」褂乍。
1812年 法國著名的天文學(xué)家和數(shù)學(xué)家皮俺炙恚·西蒙·拉普拉斯侯爵(Pierre-Simon marquis de Laplace,1749.3.23-1827.3.5)發(fā)表了《概率的分析理論》。在這一著作中逃片,他首次明確規(guī)定了概率的古典定義(通常稱為「古典概率」)屡拨,并在概率論中引入了更有力的分析工具,如「差分方程」褥实、「母函數(shù)」等呀狼,從而實(shí)現(xiàn)了概率論由單純的組合運(yùn)算到分析方法的過渡,將概率論推向了一個(gè)新的發(fā)展階段损离。
1821年 德國數(shù)學(xué)家高斯針對正態(tài)分布提出「最大似然估計(jì)」哥艇。
19世紀(jì)20年代 芬蘭數(shù)學(xué)家賈爾·瓦爾德馬·林德伯格(Jarl Waldemar Lindeberg,1876.8.4-1932.12.12)和法國數(shù)學(xué)家萊維(Paul Pierre Lévy,1886-1971)證明了在任意分布的總體中抽取樣本,其樣本均值的極限分布為正態(tài)分布僻澎,被稱為「林德伯格-萊維(Lindeberg-Lévy)中心極限定理」貌踏。
1837年 法國數(shù)學(xué)家西莫恩·德尼·泊松(Siméon-Denis Poisson,1781.6.21-1840.4.25)首次提出「泊松分布」。這個(gè)分布在更早些時(shí)候由伯努利家族的一個(gè)人描述過窟勃。
1863年 阿貝(Abbe)首先提出χ2分布祖乳,后來由海爾墨特(Hermert)和現(xiàn)代統(tǒng)計(jì)學(xué)的奠基人之一的卡爾·皮爾遜分別于1875年和1900年推導(dǎo)出來。
1875年?英國科學(xué)家和探險(xiǎn)家弗朗西斯·高爾頓(Francis Galton,1822.2.16-1911.1.17)在朋友的幫助下作了有關(guān)香豌豆的實(shí)驗(yàn)秉氧,通過對所得數(shù)據(jù)的分析眷昆,他終于發(fā)現(xiàn)子代性狀有向母代平均回歸的現(xiàn)象,并通過自然采集人體指標(biāo)數(shù)據(jù)驗(yàn)證了所得結(jié)論,首次提出“回歸”的概念亚斋。
1888年?弗朗西斯·高爾頓提出了“相關(guān)指數(shù)”的概念作媚,并在此概念的基礎(chǔ)上發(fā)展了一種用圖形估計(jì)相關(guān)系數(shù)的方法,同年帅刊,他在一篇論文中給出了第一個(gè)正式的關(guān)于“相關(guān)系數(shù)”的數(shù)字纸泡,從數(shù)量的角度刻畫了兩個(gè)變量之間的相關(guān)程度。
19世紀(jì)下半葉 俄羅斯的彼得堡學(xué)派引入「隨機(jī)變量」厚掷。這標(biāo)志著概率論由古典概率時(shí)期進(jìn)入到近代概率弟灼。
1895年?統(tǒng)計(jì)學(xué)家卡爾·皮爾遜(Karl Pearson,1857.3.27-1936.4.27)首次提出「偏態(tài)(skewness)」。
20世紀(jì)
1900年 德國數(shù)學(xué)家戴維·希爾伯特(David Hilbert,1862-1943)提出要建立概率的公理化定義以解決適合一切隨機(jī)現(xiàn)象的概率的最一般的定義冒黑。
1900年 英國數(shù)學(xué)家田绑、生物統(tǒng)計(jì)學(xué)家卡爾·皮爾遜(Karl Pearson,1857.3.27-1936.4.27)提出了一個(gè)替換原理,利用這個(gè)原理而獲得的估計(jì)量成為「矩估計(jì)」抡爹。同年掩驱,他引進(jìn)了著名的「χ2擬合優(yōu)度檢驗(yàn)」《梗卡爾·皮爾遜是20世紀(jì)統(tǒng)計(jì)學(xué)的偉大奠基人欧穴,被稱為20世紀(jì)統(tǒng)計(jì)學(xué)之父。他的工作在描述統(tǒng)計(jì)學(xué)向推斷統(tǒng)計(jì)學(xué)發(fā)展的歷史舞臺上起到了承前啟后的作用泵殴,為統(tǒng)計(jì)學(xué)隨后的飛速發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)涮帘。
1901年?卡爾·皮爾遜提出「主成分分析」(多元統(tǒng)計(jì)分析的經(jīng)典方法),但只是針對非隨機(jī)變量笑诅。1933年由美國公認(rèn)的統(tǒng)計(jì)學(xué)界调缨、經(jīng)濟(jì)學(xué)界、數(shù)學(xué)界公認(rèn)大師哈羅德·霍特林(Harold Hotelling,1895—1973)推廣到隨機(jī)變量吆你。
1905年?統(tǒng)計(jì)學(xué)家卡爾·皮爾遜(Karl Pearson,1857.3.27-1936.4.27)首次提出「峰態(tài)(kurtosis)」弦叶。(S:不知道聰明的你有沒有發(fā)現(xiàn)。皮爾遜在10年前首次提出偏態(tài)妇多,又在提出矩估計(jì)伤哺、χ2擬合優(yōu)度檢驗(yàn)、主成分分析后提出峰態(tài)者祖。是什么啟發(fā)皮爾遜想到偏態(tài)呢立莉?值得深思。)
20世紀(jì)初 卡爾·皮爾遜(K.Pearson)提出「假設(shè)檢驗(yàn)」七问,之后費(fèi)希爾進(jìn)行細(xì)化桃序,并最終由奈曼(Neyman)和E.Pearson提出了較完整的假設(shè)檢驗(yàn)理論。
1908年 英國統(tǒng)計(jì)學(xué)家哥賽特(Gosset)在Biometrics雜志上以筆名Student發(fā)表了使他名垂統(tǒng)計(jì)史冊的論文:均值的或然誤差烂瘫。在這篇文章中,提出了「t分布」。t分布的發(fā)現(xiàn)在統(tǒng)計(jì)學(xué)史上具有劃時(shí)代的意義坟比,打破了正態(tài)分布一統(tǒng)天下的局面芦鳍,開創(chuàng)了小樣本統(tǒng)計(jì)推斷的新紀(jì)元。后來葛账,費(fèi)希爾注意到他證明中的漏洞柠衅,并于1922年給出了此問題的完整證明,并編制了t分布的分位數(shù)表籍琳。
1909年-1920年 丹麥數(shù)學(xué)家菲宴、電氣工程師A.K.Erlang用概率論方法研究電話通話問題,開創(chuàng)了「排隊(duì)論」趋急。
1920年 為了更準(zhǔn)確地估計(jì)隨機(jī)序列發(fā)展變化的規(guī)律喝峦,從20世紀(jì)20年代開始,學(xué)術(shù)界利用數(shù)理統(tǒng)計(jì)學(xué)原理分析時(shí)間序列呜达。研究的重心從總結(jié)表面現(xiàn)象轉(zhuǎn)移到分析序列值內(nèi)在的關(guān)系上谣蠢,由此開辟了一門應(yīng)用統(tǒng)計(jì)學(xué)科——「時(shí)間序列分析」。
1922年 R.A.Fisher費(fèi)希爾正式提出「充分統(tǒng)計(jì)量」查近,而其思想源于他與天文學(xué)家愛丁頓的有關(guān)估計(jì)標(biāo)準(zhǔn)差的爭論中眉踱。同年,他在1821年高斯的基礎(chǔ)上再次提出「最大似然估計(jì)」的想法并證明了它的一些性質(zhì)而使得最大似然法得到了廣泛的應(yīng)用霜威。
1924年 美國貝爾實(shí)驗(yàn)室的沃特·阿曼德·休哈特(Walter A. Shewhart)博士在備忘錄中向上級提出了使用“控制圖”(Control Chart) 的建議谈喳,「質(zhì)量控制圖」是將統(tǒng)計(jì)學(xué)原理應(yīng)用于控制產(chǎn)品質(zhì)量的圖形方法。他是統(tǒng)計(jì)質(zhì)量控制 (SQC) 之父戈泼。
1924年?英國統(tǒng)計(jì)與遺傳學(xué)家婿禽、現(xiàn)代統(tǒng)計(jì)科學(xué)的奠基人之費(fèi)希爾(Ronald Aylmer Fisher,1890-1962)提出「F分布」,并以其姓氏的第一個(gè)字母命名的矮冬。之后谈宛,他又提出「方差分析」(Analysis of Variance,簡稱ANOVA)胎署。
1924年 費(fèi)希爾(Ronald Aylmer Fisher,1890-1962)補(bǔ)充了卡爾·皮爾遜(K.Pearson)引進(jìn)的擬合優(yōu)度檢驗(yàn)?吆录。即在實(shí)際問題中,有時(shí)諸還依賴于k個(gè)未知參數(shù)琼牧,這時(shí)皮爾遜建立的定理則再成立恢筝。費(fèi)希爾證明了,在同樣的條件下巨坊,可以先用MLE方法估計(jì)出這k個(gè)位置參數(shù)撬槽,然后在計(jì)算出的估計(jì)值。這時(shí)類似的統(tǒng)計(jì)量當(dāng)時(shí)趾撵,還是漸進(jìn)服從卡方分布侄柔,不過自由度為r-k-1共啃。
1928年 奈曼(Neyman)和皮爾遜(E.Pearson)提出了「似然比檢驗(yàn)」,它是一種應(yīng)用較廣的檢驗(yàn)方法暂题,在假設(shè)檢驗(yàn)中的地位有如MLE在點(diǎn)估計(jì)中的地位移剪。
1929年 蘇聯(lián)數(shù)學(xué)家亞歷山大·雅科夫列維奇·辛欽(Алекса?ндр Я?ковлевич Хи?нчин,1894.7.19-1959.11.18)在同分布的條件下推廣了切比雪夫大數(shù)定律,稱為「辛欽大數(shù)定律」薪者。
1929年 貝倫斯從實(shí)際問題中提出若對沒有什么信息,m言津,n也不很大攻人,求的精確置信區(qū)間。這是歷史上著名的「貝倫斯-費(fèi)希爾(Behrens-Fisher)問題」悬槽。
1933年 蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫(Kolmogorov,1903.4.25-1987.10.20)建立了測度論基礎(chǔ)上的嚴(yán)格「概率論公理化體系」怀吻。使之成為和微積分一樣的嚴(yán)格話數(shù)學(xué)體系,同時(shí)在這個(gè)體系中包含了經(jīng)典和統(tǒng)計(jì)兩種意義下的定義陷谱,因而不僅滿足了數(shù)學(xué)本身的需求烙博,也適應(yīng)了自然科學(xué)乃至工程技術(shù)的要求。
1933年?美國數(shù)理統(tǒng)計(jì)學(xué)家烟逊、數(shù)理經(jīng)濟(jì)學(xué)家哈羅德·霍特林(Harold Hotelling,1895—1973)首先提出「主成分分析」渣窜。這是一種降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)利用正交旋轉(zhuǎn)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)分析方法宪躯。
1934年 美國統(tǒng)計(jì)學(xué)家J.奈曼(Jerzy Neyman,1894–1981)所創(chuàng)立了一種嚴(yán)格的區(qū)間估計(jì)理論——「置信區(qū)間」乔宿。置信系數(shù)是這個(gè)理論中最為基本的概念。通過從總體中抽取的樣本访雪,根據(jù)一定的正確度與精確度的要求详瑞,構(gòu)造出適當(dāng)?shù)膮^(qū)間,以作為總體的分布參數(shù)(或參數(shù)的函數(shù))的真值所在范圍的估計(jì)臣缀。
1936年 印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯(Mahalanobis,1893-1972)提出了「馬氏距離」坝橡。
1938年 H. Wold在他的博士論文“A Study in the Analysis of Stationary Time Serious”中提出了著名的「Wold分解定理」,即對于任何一個(gè)離散平穩(wěn)過程{}精置,它都可以分解為兩個(gè)不相關(guān)的平穩(wěn)序列之和计寇,其中一個(gè)為確定性的,另一個(gè)為隨機(jī)性的脂倦。這個(gè)定理是現(xiàn)代時(shí)間序列分析理論的靈魂番宁。Cramer在1961年證明這種分解思路同樣可以用于非平穩(wěn)序列。Cramer分解定理說明任何一個(gè)序列的波動(dòng)都可以視為同時(shí)受到了確定性影響和隨機(jī)性影響的作用赖阻。
1945年 威爾科克森(F·Wilcoxin)建立「秩統(tǒng)計(jì)量」蝶押。秩和檢驗(yàn)(rank sum test)又稱順序和檢驗(yàn),它是一種非參數(shù)檢驗(yàn)(nonparametric test)火欧。它不依賴于總體分布的具體形式棋电,應(yīng)用時(shí)可以不考慮被研究對象為何種分布以及分布是否以知茎截,因而實(shí)用性較強(qiáng)。
1950年 E.L. Lehmann和H. Scheff提出「完全統(tǒng)計(jì)量」的概念离陶,并給出了尋找可估函數(shù)(即參數(shù)函數(shù)的無偏估計(jì)存在)的UMVUE的充分完全統(tǒng)計(jì)量法稼虎,即「Lehmann-Scheff定理」。
1955年 斯泰因(Stein)證明了當(dāng)維數(shù)p大于2時(shí)招刨,正態(tài)均值向量最小二乘估計(jì)的不可容性,即能夠找到另一個(gè)估計(jì)在某種意義上一致優(yōu)于最小二乘估計(jì)哀军。
1960年 Lindley等指出:當(dāng)樣本量足夠大時(shí)沉眶,可以趨于1,而接近于0杉适,即利用值檢驗(yàn)和貝葉斯檢驗(yàn)得到的結(jié)論相悖谎倔,因此也被稱做Lindley悖論。
1965年 馬西(W.F.Massy)根據(jù)多元統(tǒng)計(jì)分析中的主成分分析(Principal Components Analysis,PCA)提出了「主成分回歸」猿推。
1977年?哈佛大學(xué)數(shù)學(xué)家A.P.Dempster等人提出「EM算法」片习,用于含有隱變量的概率模型參數(shù)的極大似然估計(jì)。
1995年 新西蘭奧克蘭大學(xué)的Ross Ihaka和Robert Gentleman在S語言(S語言是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的一種用來進(jìn)行數(shù)據(jù)探索蹬叭、統(tǒng)計(jì)分析藕咏、作圖的解釋型語言)的基礎(chǔ)上開發(fā)了一個(gè)新系統(tǒng),由于這兩位科學(xué)家的名字首字母都是R秽五,所以該系統(tǒng)軟件被取名為“R”孽查。
畢業(yè)院校
英國
劍橋大學(xué):卡爾·皮爾遜、費(fèi)希爾坦喘、弗朗西斯·高爾頓盲再、馬哈拉諾比斯
愛丁堡大學(xué):托馬斯·貝葉斯
法國
巴黎綜合理工大學(xué):莫恩·德尼·泊松、萊維
卡昂大學(xué):皮鞍晗常·西蒙·拉普拉斯
德國
柯尼斯堡大學(xué)(現(xiàn)為康德波羅的海聯(lián)邦大學(xué)):戴維·希爾伯特
哥廷根大學(xué):約翰·卡爾·弗里德里洗鹋螅·高斯(18歲起)
布倫瑞克工業(yè)大學(xué):約翰·卡爾·弗里德里希·高斯(14歲起)
瑞士
巴塞爾大學(xué):雅各布·伯努利
俄國
莫斯科大學(xué):柯爾莫哥洛夫棠笑、切比雪夫梦碗、亞歷山大·雅科夫列維奇·辛欽
美國
加州大學(xué)伯克萊分校:沃特·阿曼德·休哈特
華盛頓大學(xué):哈羅德·霍特林
人物關(guān)系
師生
1、卡爾·皮爾遜(K.Pearson)是哥賽特的老師腐晾,哥賽特于1906年到1907年到卡爾·皮爾遜那里學(xué)習(xí)統(tǒng)計(jì)學(xué)叉弦,并著重研究少量數(shù)據(jù)的統(tǒng)計(jì)分析問題。
2藻糖、F.高爾頓是卡爾·皮爾遜(K.Pearson)的老師淹冰。
參考資料:
[1]百度百科
[2]現(xiàn)代統(tǒng)計(jì)學(xué)發(fā)展的一條主線——karl pearson的生平、思想及其成就