簡(jiǎn)介:
高斯分布(Gaussian Distribution) 又名正態(tài)分布(Normal Distribution) ,數(shù)學(xué)模型類似于一個(gè)大鐘系瓢,扣在地上。
高斯分布概率密度函數(shù):
exp指的是自然數(shù)e的多少次冪的概念(e是無(wú)限不循環(huán)的小數(shù)約等于 2.171828)寺酪。這個(gè)函數(shù)在x =?μ的位置,此時(shí)對(duì)應(yīng)的函數(shù)值y = 1 /?,這里的樣本數(shù)量的計(jì)算用的是定積分的費(fèi)你定義埂淮,即整個(gè)函數(shù)曲線在其下方圍住的與y = 0 所圍成的面積占比,他在 x =?左右對(duì)稱的熏纯,x在-?和??+??的樣本數(shù)量占真?zhèn)€數(shù)量樣本的 68.2% 同诫,x在???- 2?和??之間的樣本數(shù)量占整個(gè)樣本數(shù)量的百分之95.4,x 在?的數(shù)量占總樣本的百分之99.6樟澜。
? ? 高斯分布作為分布特性的一種误窖,首先是用來(lái)描述統(tǒng)計(jì)對(duì)象的,如果統(tǒng)計(jì)對(duì)象的分布性符合高斯分布秩贰,那么所有針對(duì)高斯分布的定理和經(jīng)驗(yàn)值就能夠直接套用霹俺,高斯分布在自然界的應(yīng)用是非常廣的,用一句話概括就是“常見(jiàn)的一般的很多毒费,極端的很少”丙唧。
高斯分布密度函數(shù)曲線:
舉個(gè)例子:
? ? 假如對(duì)某一地區(qū)的男性身高做個(gè)隨機(jī)抽樣,一共1000人觅玻,結(jié)果發(fā)現(xiàn)他們身高是一個(gè)??= 175的高斯分布想际,?= 10cm,根據(jù)密度函數(shù)就可以求出大概的身高以及對(duì)應(yīng)的人數(shù)溪厘。
身高 165 ~ 175 人數(shù)大約= 1000 * 34.1% = 341
身高 175 ~ 185 人數(shù)大約= 1000 * 34.1% = 341
身高 155 ~ 165 人數(shù)大約= 1000 * 13.6% = 136
身高 185 ~ 195 人數(shù)大約= 1000 * 13.6% = 136
身高 145 ~ 155 人數(shù)大約= 1000 * 2.1% = 21
身高 195 ~ 205 人數(shù)大約= 1000 * 2.1% = 21
結(jié)論:
越大則函數(shù)圖像的最大值就越靠右胡本。
越大則圖像越顯得扁,坡度顯著緩畸悬。
參考:《白話大數(shù)據(jù)和機(jī)器學(xué)習(xí)》