機器學(xué)習(xí)200小時計劃-001-統(tǒng)計學(xué)基礎(chǔ)

? ? 最近有幸和木東居士組建的學(xué)習(xí)小組一起學(xué)習(xí)機器學(xué)習(xí)北救,在此十分感謝居士提供的學(xué)習(xí)機會柄错,也希望大家有機會加入居士的學(xué)習(xí)小組一塊學(xué)習(xí)(可添加居士個人微信:mdjs91)凯力。

圖1.1 這不是機器學(xué)習(xí)

????來自Coursera經(jīng)典機器學(xué)習(xí)課程的定義為"Machine learning is the science of getting computers to act without being explicitly programmed." 也就是說機器學(xué)習(xí)是一個不用明確告訴它干啥旅挤,計算機可以自行工作的科學(xué)。廣義上來說,機器學(xué)習(xí)是包括了傳統(tǒng)的數(shù)據(jù)分析還包括了現(xiàn)在比較火的深度學(xué)習(xí)等钝腺。

圖1.2 機器學(xué)習(xí)三要素:數(shù)學(xué)抛姑,計算機和專業(yè)知識

????機器學(xué)習(xí)的基礎(chǔ)是統(tǒng)計(數(shù)學(xué))和編程(計算機科學(xué))赞厕,在掌握一門編程語言之前艳狐,我們首先要熟悉一些統(tǒng)計學(xué)的概念和方法原理。


圖1.3 統(tǒng)計理論基礎(chǔ)框架皿桑,配圖來自于《人人都會數(shù)據(jù)分析:從生活實例學(xué)統(tǒng)計》??

????集中趨勢的描述指標(biāo)的匯總?cè)缦卤恚?/p>

表1.1 集中趨勢的描述指標(biāo)

????離散趨勢的描述指標(biāo)匯總?cè)缦拢?/p>

表1.2 離散趨勢的描述指標(biāo)

????根據(jù)數(shù)據(jù)連續(xù)性的不同毫目,數(shù)據(jù)可以分為離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)。同樣诲侮,事件發(fā)生結(jié)果的對應(yīng)數(shù)據(jù)既可能是離散型數(shù)據(jù)镀虐,也可能是連續(xù)型數(shù)據(jù)。因此沟绪,事件結(jié)果所對應(yīng)的概率分布因為結(jié)果對應(yīng)數(shù)據(jù)的不同也被分為連續(xù)型概率分布和離散型概率分布刮便。

????離散型概率分布的種類有很多,比較常見的有二項分布绽慈、多項分布恨旱、超幾何分布和泊松分布。

表1.3 離散型概率分布

連續(xù)型概率分布對應(yīng)的函數(shù)被稱為概率密度函數(shù)坝疼。常用的連續(xù)型概率分布有指數(shù)分布搜贤、均勻分布和正態(tài)分布。

表1.4 連續(xù)性概率分布

正態(tài)分布曲線的形態(tài)是一個倒置的鐘形钝凶,中間是單峰仪芒,兩邊逐漸平緩,但不是所有的單峰分布都是正態(tài)分布耕陷,這些分布與正態(tài)分布的差異在于峰度與偏度的差異掂名。峰度系數(shù)和單峰分布形態(tài)之間的關(guān)系為:當(dāng)峰度系數(shù)等于 3 時,代表分布曲線是扁平程度適中的常峰態(tài)哟沫;當(dāng)峰度系數(shù)小于3時铆隘,代表分布曲線是低峰態(tài);當(dāng)峰度系數(shù)大于3時南用,代表分布曲線是尖峰態(tài)膀钠。正態(tài)分布的峰形是模板峰形,也就是常峰態(tài)裹虫,它的峰度系數(shù)等于3肿嘲,其他分布都是與正態(tài)分布進行比較的。描述分布狀態(tài)的另一個指標(biāo)是偏度系數(shù)筑公。偏度系數(shù)又被稱為偏斜系數(shù)雳窟,它能夠幫助分析者判斷數(shù)據(jù)集合的分布形態(tài)是否對稱。如果數(shù)據(jù)集合是對稱分布的(例如正態(tài)分布),那么它的均值封救、中位數(shù)和眾數(shù)將會重合拇涤,且在這三個數(shù)值的兩側(cè),其他所有的數(shù)值完全以對稱的方式左右分布誉结。如果數(shù)據(jù)集合的分布不對稱鹅士,那么均值、中位數(shù)和眾數(shù)必定分處在不同的位置惩坑,此時掉盅,若以均值為參照點,如圖2-23所示以舒,要么位于均值左側(cè)的數(shù)據(jù)較多趾痘,長尾拖在右側(cè),稱之為右偏分布蔓钟;要么位于均值右側(cè)的數(shù)據(jù)較多永票,長尾拖在左側(cè),稱之為左偏分布滥沫÷录考慮到所有數(shù)據(jù)與均值之間的離差和總是等于零,因此佣谐,當(dāng)均值左側(cè)的數(shù)據(jù)較多時肚吏,均值的右側(cè)必定存在數(shù)值較大的“離群”(極端)數(shù)值;同理狭魂,當(dāng)均值右側(cè)的數(shù)據(jù)較多時罚攀,均值的左側(cè)必定存在數(shù)值較小的“離群”(極端)數(shù)值。偏度系數(shù)與分布形態(tài)的關(guān)系可以表述為:當(dāng)偏度系數(shù)等于0時雌澄,稱之為對稱分布斋泄;當(dāng)偏度系數(shù)小于0時,為之為左偏分布镐牺,長尾拖在左邊炫掐;當(dāng)偏度系數(shù)大于0時,稱之為右偏分布睬涧,長尾拖在右邊募胃。

表1.5 峰度和偏度
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市畦浓,隨后出現(xiàn)的幾起案子痹束,更是在濱河造成了極大的恐慌,老刑警劉巖讶请,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件祷嘶,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機论巍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門烛谊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嘉汰,你說我怎么就攤上這事丹禀。” “怎么了郑现?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵湃崩,是天一觀的道長荧降。 經(jīng)常有香客問我接箫,道長,這世上最難降的妖魔是什么朵诫? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任辛友,我火速辦了婚禮,結(jié)果婚禮上剪返,老公的妹妹穿的比我還像新娘废累。我一直安慰自己,他們只是感情好脱盲,可當(dāng)我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布邑滨。 她就那樣靜靜地躺著,像睡著了一般钱反。 火紅的嫁衣襯著肌膚如雪掖看。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天面哥,我揣著相機與錄音哎壳,去河邊找鬼。 笑死尚卫,一個胖子當(dāng)著我的面吹牛归榕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吱涉,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼刹泄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了怎爵?” 一聲冷哼從身側(cè)響起特石,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疙咸,沒想到半個月后县匠,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年乞旦,在試婚紗的時候發(fā)現(xiàn)自己被綠了贼穆。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡兰粉,死狀恐怖故痊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情玖姑,我是刑警寧澤愕秫,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站焰络,受9級特大地震影響戴甩,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜闪彼,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一甜孤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧畏腕,春花似錦缴川、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至铭污,卻和暖如春恋日,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背况凉。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工谚鄙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人刁绒。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓闷营,卻偏偏與公主長得像,于是被迫代替她去往敵國和親知市。 傳聞我的和親對象是個殘疾皇子傻盟,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容