? ? 最近有幸和木東居士組建的學(xué)習(xí)小組一起學(xué)習(xí)機器學(xué)習(xí)北救,在此十分感謝居士提供的學(xué)習(xí)機會柄错,也希望大家有機會加入居士的學(xué)習(xí)小組一塊學(xué)習(xí)(可添加居士個人微信:mdjs91)凯力。
????來自Coursera經(jīng)典機器學(xué)習(xí)課程的定義為"Machine learning is the science of getting computers to act without being explicitly programmed." 也就是說機器學(xué)習(xí)是一個不用明確告訴它干啥旅挤,計算機可以自行工作的科學(xué)。廣義上來說,機器學(xué)習(xí)是包括了傳統(tǒng)的數(shù)據(jù)分析還包括了現(xiàn)在比較火的深度學(xué)習(xí)等钝腺。
????機器學(xué)習(xí)的基礎(chǔ)是統(tǒng)計(數(shù)學(xué))和編程(計算機科學(xué))赞厕,在掌握一門編程語言之前艳狐,我們首先要熟悉一些統(tǒng)計學(xué)的概念和方法原理。
????集中趨勢的描述指標(biāo)的匯總?cè)缦卤恚?/p>
????離散趨勢的描述指標(biāo)匯總?cè)缦拢?/p>
????根據(jù)數(shù)據(jù)連續(xù)性的不同毫目,數(shù)據(jù)可以分為離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)。同樣诲侮,事件發(fā)生結(jié)果的對應(yīng)數(shù)據(jù)既可能是離散型數(shù)據(jù)镀虐,也可能是連續(xù)型數(shù)據(jù)。因此沟绪,事件結(jié)果所對應(yīng)的概率分布因為結(jié)果對應(yīng)數(shù)據(jù)的不同也被分為連續(xù)型概率分布和離散型概率分布刮便。
????離散型概率分布的種類有很多,比較常見的有二項分布绽慈、多項分布恨旱、超幾何分布和泊松分布。
連續(xù)型概率分布對應(yīng)的函數(shù)被稱為概率密度函數(shù)坝疼。常用的連續(xù)型概率分布有指數(shù)分布搜贤、均勻分布和正態(tài)分布。
正態(tài)分布曲線的形態(tài)是一個倒置的鐘形钝凶,中間是單峰仪芒,兩邊逐漸平緩,但不是所有的單峰分布都是正態(tài)分布耕陷,這些分布與正態(tài)分布的差異在于峰度與偏度的差異掂名。峰度系數(shù)和單峰分布形態(tài)之間的關(guān)系為:當(dāng)峰度系數(shù)等于 3 時,代表分布曲線是扁平程度適中的常峰態(tài)哟沫;當(dāng)峰度系數(shù)小于3時铆隘,代表分布曲線是低峰態(tài);當(dāng)峰度系數(shù)大于3時南用,代表分布曲線是尖峰態(tài)膀钠。正態(tài)分布的峰形是模板峰形,也就是常峰態(tài)裹虫,它的峰度系數(shù)等于3肿嘲,其他分布都是與正態(tài)分布進行比較的。描述分布狀態(tài)的另一個指標(biāo)是偏度系數(shù)筑公。偏度系數(shù)又被稱為偏斜系數(shù)雳窟,它能夠幫助分析者判斷數(shù)據(jù)集合的分布形態(tài)是否對稱。如果數(shù)據(jù)集合是對稱分布的(例如正態(tài)分布),那么它的均值封救、中位數(shù)和眾數(shù)將會重合拇涤,且在這三個數(shù)值的兩側(cè),其他所有的數(shù)值完全以對稱的方式左右分布誉结。如果數(shù)據(jù)集合的分布不對稱鹅士,那么均值、中位數(shù)和眾數(shù)必定分處在不同的位置惩坑,此時掉盅,若以均值為參照點,如圖2-23所示以舒,要么位于均值左側(cè)的數(shù)據(jù)較多趾痘,長尾拖在右側(cè),稱之為右偏分布蔓钟;要么位于均值右側(cè)的數(shù)據(jù)較多永票,長尾拖在左側(cè),稱之為左偏分布滥沫÷录考慮到所有數(shù)據(jù)與均值之間的離差和總是等于零,因此佣谐,當(dāng)均值左側(cè)的數(shù)據(jù)較多時肚吏,均值的右側(cè)必定存在數(shù)值較大的“離群”(極端)數(shù)值;同理狭魂,當(dāng)均值右側(cè)的數(shù)據(jù)較多時罚攀,均值的左側(cè)必定存在數(shù)值較小的“離群”(極端)數(shù)值。偏度系數(shù)與分布形態(tài)的關(guān)系可以表述為:當(dāng)偏度系數(shù)等于0時雌澄,稱之為對稱分布斋泄;當(dāng)偏度系數(shù)小于0時,為之為左偏分布镐牺,長尾拖在左邊炫掐;當(dāng)偏度系數(shù)大于0時,稱之為右偏分布睬涧,長尾拖在右邊募胃。