AI學(xué)習(xí)筆記之機(jī)器學(xué)習(xí)基礎(chǔ)一

機(jī)器學(xué)習(xí)的基礎(chǔ)知識

相關(guān)概念

人類學(xué)習(xí)知識機(jī)制:從大量現(xiàn)象中提取反復(fù)出現(xiàn)的規(guī)律與模式。
  • 機(jī)器學(xué)習(xí)是計算機(jī)基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型并運(yùn)用模型對數(shù)據(jù)進(jìn)行預(yù)測與分析的學(xué)科婶恼。
  • 機(jī)器學(xué)習(xí)是從數(shù)據(jù)中來偶妖,到數(shù)據(jù)中去宰僧。
特征空間:數(shù)據(jù)的不同屬性之間可以視為相互獨(dú)立茅坛,每個屬性都代表了一個不同的維度案怯,這些維度共同張成了特征空間。
特征向量:每一組屬性值的集合都是這個空間中的一個點(diǎn)江场,因而每個實(shí)例都可以視為特征空間中的一個向量
根據(jù)輸入輸出類型的不同纺酸,預(yù)測問題可以分為以下三類:
  • 分類問題:輸出變量為有限個離散變量,當(dāng)個數(shù)為 2 時即為最簡單的二分類問題址否;
  • 回歸問題:輸入變量和輸出變量均為連續(xù)變量餐蔬;
  • 標(biāo)注問題:輸入變量和輸出變量均為變量序列。
誤差:學(xué)習(xí)器的實(shí)際預(yù)測輸出與樣本真實(shí)輸出之間的差異佑附。
  • 訓(xùn)練誤差:學(xué)習(xí)器在訓(xùn)練數(shù)據(jù)集上的誤差用含,也稱經(jīng)驗(yàn)誤差
    輸入屬性與輸出分類之間的相關(guān)性,能夠判定給定的問題是不是一個容易學(xué)習(xí)的問題帮匾。
  • 測試誤差:學(xué)習(xí)器在新樣本上的誤差,也稱泛化誤差
    反映了學(xué)習(xí)器對未知的測試數(shù)據(jù)集的預(yù)測能力痴鳄,是機(jī)器學(xué)習(xí)中的重要概念瘟斜。
    測試誤差與模型復(fù)雜度之間呈現(xiàn)的是拋物線的關(guān)系。
    當(dāng)模型復(fù)雜度較低時,測試誤差較高螺句;
    隨著模型復(fù)雜度的增加虽惭,測試誤差將逐漸下降并達(dá)到最小值;
    之后當(dāng)模型復(fù)雜度繼續(xù)上升時蛇尚,測試誤差會隨之增加芽唇,對應(yīng)著過擬合的發(fā)生。
    過擬合出現(xiàn)的原因:學(xué)習(xí)時模型包含的參數(shù)過多取劫,從而導(dǎo)致訓(xùn)練誤差較低但測試誤差較高匆笤。
交叉驗(yàn)證:數(shù)據(jù)分成訓(xùn)練集與測試集,并在此基礎(chǔ)上反復(fù)進(jìn)行訓(xùn)練谱邪、測試和模型選擇炮捧,達(dá)到最優(yōu)效果。
機(jī)器學(xué)習(xí)分類:
  • 監(jiān)督學(xué)習(xí):基于已知類別的訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)惦银;
  • 生成方法:根據(jù)輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的聯(lián)合概率分布確定條件概率分布 P(Y|X)咆课,這種方法表示了輸入 X 與輸出 Y 之間的生成關(guān)系
  • 判別方法:直接學(xué)習(xí)條件概率分布 P(Y|X)P(Y|X) 或決策函數(shù) f(X)f(X),這種方法表示了根據(jù)輸入 X 得出輸出 Y 的預(yù)測方法扯俱。
    生成方法具有更快的收斂速度和更廣的應(yīng)用范圍书蚪,判別方法則具有更高的準(zhǔn)確率和更簡單的使用方式。
  • 無監(jiān)督學(xué)習(xí):基于未知類別的訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)迅栅;
  • 半監(jiān)督學(xué)習(xí):同時使用已知類別和未知類別的訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)殊校。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市库继,隨后出現(xiàn)的幾起案子箩艺,更是在濱河造成了極大的恐慌,老刑警劉巖宪萄,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件艺谆,死亡現(xiàn)場離奇詭異,居然都是意外死亡拜英,警方通過查閱死者的電腦和手機(jī)静汤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來居凶,“玉大人虫给,你說我怎么就攤上這事∠辣蹋” “怎么了抹估?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長弄兜。 經(jīng)常有香客問我药蜻,道長瓷式,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任语泽,我火速辦了婚禮贸典,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘踱卵。我一直安慰自己廊驼,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布惋砂。 她就那樣靜靜地躺著妒挎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪班利。 梳的紋絲不亂的頭發(fā)上饥漫,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機(jī)與錄音罗标,去河邊找鬼庸队。 笑死,一個胖子當(dāng)著我的面吹牛闯割,可吹牛的內(nèi)容都是我干的彻消。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼宙拉,長吁一口氣:“原來是場噩夢啊……” “哼宾尚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起谢澈,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤煌贴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后锥忿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牛郑,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年敬鬓,在試婚紗的時候發(fā)現(xiàn)自己被綠了淹朋。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡钉答,死狀恐怖础芍,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情数尿,我是刑警寧澤仑性,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站右蹦,受9級特大地震影響诊杆,放射性物質(zhì)發(fā)生泄漏鲫懒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一刽辙、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧甲献,春花似錦宰缤、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至球及,卻和暖如春氧骤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背吃引。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工筹陵, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人镊尺。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓朦佩,卻偏偏與公主長得像,于是被迫代替她去往敵國和親庐氮。 傳聞我的和親對象是個殘疾皇子语稠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容