我的機器學習筆記(一) - 監(jiān)督學習vs 無監(jiān)督學習


  • 監(jiān)督學習(Supervised Learning)

在監(jiān)督學習中,給定一組數(shù)據(jù),我們知道正確的輸出結果應該是什么樣子短条,并且知道在輸入和輸出之間有著一個特定的關系涂圆。這么說可能理解起來不是很清晰宵统,沒關系蜒犯,后面有具體的例子絮供。

  • 監(jiān)督學習的分類

監(jiān)督學習可分為“回歸”和“分類”問題子巾。

監(jiān)督學習分類

在回歸問題中帆赢,我們會預測一個連續(xù)值小压。也就是說我們試圖將輸入變量和輸出用一個連續(xù)函數(shù)對應起來;而在分類問題中椰于,我們會預測一個離散值怠益,我們試圖將輸入變量與離散的類別對應起來。

下面舉兩個例子瘾婿,就會非常清楚這幾個概念了蜻牢。

  • 監(jiān)督學習舉例

  • 回歸

通過房地產(chǎn)市場的數(shù)據(jù),預測一個給定面積的房屋的價格就是一個回歸問題偏陪。這里我們可以把價格看成是面積的函數(shù)抢呆,它是一個連續(xù)的輸出值。 但是竹挡,當把上面的問題改為“預測一個給定面積的房屋的價格是否比一個特定的價格高或者低”的時候镀娶,這就變成了一個分類問題, 因為此時的輸出是‘高’或者‘低’兩個離散的值。

  • 分類

給定醫(yī)學數(shù)據(jù)揪罕,通過腫瘤的大小來預測該腫瘤是惡性瘤還是良性瘤(課程中給的是乳腺癌的例子)梯码,這就是一個分類問題,它的輸出是0或者1兩個離散的值好啰。(0代表良性轩娶,1代表惡性)。

分類問題的輸出可以多于兩個框往,比如在該例子中可以有{0,1,2,3}四種輸出鳄抒,分別對應{良性, 第一類腫瘤, 第二類腫瘤, 第三類腫瘤}。

下圖中上下兩個圖只是兩種畫法椰弊。第一個是有兩個軸许溅,Y軸表示是否是惡性瘤,X軸表示瘤的大小; 第二個是只用一個軸秉版,但是用了不同的標記贤重,用O表示良性瘤,X表示惡性瘤清焕。

在這個例子中特征只有一個并蝗,那就是瘤的大小。 有時候也有兩個或者多個特征, 例如下圖秸妥, 有“年齡”和“腫瘤大小”兩個特征滚停。(還可以有其他許多特征,如下圖右側所示)

  • 無監(jiān)督學習

在無監(jiān)督學習中粥惧,我們基本上不知道結果會是什么樣子键畴,但我們可以通過聚類的方式從數(shù)據(jù)中提取一個特殊的結構。在無監(jiān)督學習中給定的數(shù)據(jù)是和監(jiān)督學習中給定的數(shù)據(jù)是不一樣的影晓。在無監(jiān)督學習中給定的數(shù)據(jù)沒有任何標簽或者說只有同一種標簽镰吵。如下圖所示:

如下圖所示檩禾,在無監(jiān)督學習中,我們只是給定了一組數(shù)據(jù)疤祭,我們的目標是發(fā)現(xiàn)這組數(shù)據(jù)中的特殊結構盼产。例如我們使用無監(jiān)督學習算法會將這組數(shù)據(jù)分成兩個不同的簇,,這樣的算法就叫聚類算法勺馆。

  • 無監(jiān)督學習舉例

  • 新聞分類

第一個例子舉的是Google News的例子戏售。Google News搜集網(wǎng)上的新聞,并且根據(jù)新聞的主題將新聞分成許多簇, 然后將在同一個簇的新聞放在一起草穆。如圖中紅圈部分都是關于BP Oil Well各種新聞的鏈接灌灾,當打開各個新聞鏈接的時候,展現(xiàn)的都是關于BP Oil Well的新聞悲柱。

  • 根據(jù)給定基因將人群分類

如圖是DNA數(shù)據(jù)锋喜,對于一組不同的人我們測量他們DNA中對于一個特定基因的表達程度。然后根據(jù)測量結果可以用聚類算法將他們分成不同的類型豌鸡。這就是一種無監(jiān)督學習, 因為我們只是給定了一些數(shù)據(jù)嘿般,而并不知道哪些是第一種類型的人,哪些是第二種類型的人等等涯冠。

  • 雞尾酒派對效應

詳見課程: [Unsupervised Learning](https://www.coursera.org/learn/machine-learning/lecture/olRZo/unsupervised-learning" target="_blank">Unsupervised Learning)

  • 其他

這里又舉了其他幾個例子炉奴,有組織計算機集群,社交網(wǎng)絡分析蛇更,市場劃分瞻赶,天文數(shù)據(jù)分析等。具體可以看一下視頻:[Unsupervised Learning](https://www.coursera.org/learn/machine-learning/lecture/olRZo/unsupervised-learning" target="_blank">Unsupervised Learning)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末派任,一起剝皮案震驚了整個濱河市砸逊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌掌逛,老刑警劉巖痹兜,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異颤诀,居然都是意外死亡,警方通過查閱死者的電腦和手機对湃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門崖叫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人拍柒,你說我怎么就攤上這事心傀。” “怎么了拆讯?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵脂男,是天一觀的道長养叛。 經(jīng)常有香客問我,道長宰翅,這世上最難降的妖魔是什么弃甥? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮汁讼,結果婚禮上淆攻,老公的妹妹穿的比我還像新娘。我一直安慰自己嘿架,他們只是感情好瓶珊,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著耸彪,像睡著了一般伞芹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蝉娜,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天唱较,我揣著相機與錄音,去河邊找鬼蜀肘。 笑死绊汹,一個胖子當著我的面吹牛,可吹牛的內容都是我干的扮宠。 我是一名探鬼主播西乖,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼坛增!你這毒婦竟也來了获雕?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤收捣,失蹤者是張志新(化名)和其女友劉穎届案,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罢艾,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡楣颠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了咐蚯。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片童漩。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖春锋,靈堂內的尸體忽然破棺而出矫膨,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布侧馅,位于F島的核電站危尿,受9級特大地震影響,放射性物質發(fā)生泄漏馁痴。R本人自食惡果不足惜谊娇,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望弥搞。 院中可真熱鬧邮绿,春花似錦、人聲如沸攀例。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽粤铭。三九已至挖胃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間梆惯,已是汗流浹背酱鸭。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留垛吗,地道東北人凹髓。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像怯屉,于是被迫代替她去往敵國和親蔚舀。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內容