2018-01-01

緒論

基本術(shù)語

  1. 數(shù)據(jù)集(data set):示例(instance)或樣本(sample)的集合欲虚。樣本由反映時間或?qū)ο笤谀撤矫娴谋憩F(xiàn)或性質(zhì)的屬性(attribute)或特征(feature)構(gòu)成狮斗。屬性上的取值為屬性值(attribute value),屬性張成的空間成為屬性空間(attribute space)补疑、樣本空間(sample space)歧沪。把每一個實稱為一個特征向量(feature vector)莲组。擁有標記信息的示例稱為樣例(example)诊胞。所有標記構(gòu)成標記空間(label space)。
  2. 學(xué)習(xí)(learning)或訓(xùn)練(training):通過執(zhí)行某個學(xué)習(xí)算法來完成锹杈。學(xué)得模型對應(yīng)了關(guān)于數(shù)據(jù)的某種潛在的規(guī)律厢钧,稱為假設(shè)(hypothesis),學(xué)習(xí)過程就是為了找出或者逼近真相嬉橙。
  3. 分類(classification)、回歸(regression):欲預(yù)測的是離散值寥假,此時學(xué)習(xí)任務(wù)為分類市框;欲預(yù)測的是連續(xù)值,此學(xué)習(xí)任務(wù)為回歸糕韧。一般地枫振,預(yù)測任務(wù)是希望通過對訓(xùn)練集${(x_1,y_1)(x_2,y_2),.....,(x_m,y_m)}$進行學(xué)習(xí),建立一個從輸入空間$X到輸出空間Y的映射f:X\rightarrowY萤彩。對于二分類任務(wù)粪滤,通常令$Y={-1,+1}或{0,1};對于多分為任務(wù),|Y|>2$;對于回歸任務(wù)雀扶,Y=R$杖小。學(xué)得模型后,使用其進行預(yù)測的過程稱為測試(testing)愚墓,被測試的樣本成為測試樣本(testing sample)予权。
  4. 聚類(clustering):將訓(xùn)練集中的示例分為若干組,每組成為一個簇(cluster)浪册。這些自動形成的簇可能對應(yīng)一些潛在的概念劃分扫腺,這樣的學(xué)習(xí)過程有助于我們了解數(shù)據(jù)內(nèi)在的規(guī)律,能為更深入地分析數(shù)據(jù)建立基礎(chǔ)村象。
  5. 監(jiān)督學(xué)習(xí)(supervised learning)和無監(jiān)督學(xué)習(xí)(unsupervised learning):監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)擁有標記信息笆环,分類和回歸是代表攒至;無監(jiān)督學(xué)習(xí)不擁有標記信息,聚類是代表躁劣。
  6. 泛化(generalization):機器學(xué)習(xí)的目的是使得學(xué)得的模型更好的適用于新樣本迫吐,而不是僅僅在訓(xùn)練樣本上工作的很好。具有強泛化能力的模型能很好地適用于整個樣本空間习绢。盡管訓(xùn)練集通常只是樣本空間的一個很小的采樣渠抹,我們?nèi)韵M芎芎玫胤从吵稣麄€樣本空間的特性,否者就要很難期望哎訓(xùn)練集上學(xué)得的模型在整個樣本空間都工作得很好闪萄。一般假設(shè)樣本空間全體服從一個未知分布(distribution)$D$梧却,我們獲得的每個樣本都是獨立地從這個分布上采樣獲得的,即獨立同分布(independent and identically distribution)败去。#假設(shè)空間
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末放航,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子圆裕,更是在濱河造成了極大的恐慌广鳍,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,907評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吓妆,死亡現(xiàn)場離奇詭異赊时,居然都是意外死亡,警方通過查閱死者的電腦和手機行拢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評論 3 395
  • 文/潘曉璐 我一進店門祖秒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人舟奠,你說我怎么就攤上這事竭缝。” “怎么了沼瘫?”我有些...
    開封第一講書人閱讀 164,298評論 0 354
  • 文/不壞的土叔 我叫張陵抬纸,是天一觀的道長。 經(jīng)常有香客問我耿戚,道長湿故,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,586評論 1 293
  • 正文 為了忘掉前任溅话,我火速辦了婚禮晓锻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘飞几。我一直安慰自己砚哆,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,633評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著躁锁,像睡著了一般纷铣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上战转,一...
    開封第一講書人閱讀 51,488評論 1 302
  • 那天搜立,我揣著相機與錄音,去河邊找鬼槐秧。 笑死啄踊,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的刁标。 我是一名探鬼主播颠通,決...
    沈念sama閱讀 40,275評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼膀懈!你這毒婦竟也來了顿锰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,176評論 0 276
  • 序言:老撾萬榮一對情侶失蹤启搂,失蹤者是張志新(化名)和其女友劉穎硼控,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胳赌,經(jīng)...
    沈念sama閱讀 45,619評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡牢撼,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,819評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了疑苫。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浪默。...
    茶點故事閱讀 39,932評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖缀匕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碰逸,我是刑警寧澤乡小,帶...
    沈念sama閱讀 35,655評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站饵史,受9級特大地震影響满钟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜胳喷,卻給世界環(huán)境...
    茶點故事閱讀 41,265評論 3 329
  • 文/蒙蒙 一湃番、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧吭露,春花似錦吠撮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽弄屡。三九已至,卻和暖如春鞋诗,著一層夾襖步出監(jiān)牢的瞬間膀捷,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評論 1 269
  • 我被黑心中介騙來泰國打工削彬, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留全庸,地道東北人。 一個月前我還...
    沈念sama閱讀 48,095評論 3 370
  • 正文 我出身青樓融痛,卻偏偏與公主長得像壶笼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子酌心,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,884評論 2 354

推薦閱讀更多精彩內(nèi)容