[Week 1] Machine-learning Notes 1——Stanford University Coursera Lesson

What is Machine Learning?

什么是機器學習?

Two definitions of Machine Learning are offered. Arthur Samuel described it as: "the field of study that gives computers the ability to learn without being explicitly programmed." This is an older, informal definition.

現(xiàn)在有兩種解釋婆廊,一種是Arthur Samuel的過時并且非官方的定義: “無需通過精確的編程而提供給計算機學習能力的一種研究領(lǐng)域”

Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."

Tom Mitchell 提供了一種更先進的定義"一種從任務T的經(jīng)驗E中改善性能P的程序鸟蜡。"

Example: playing checkers.
E = the experience of playing many games of checkers
T = the task of playing checkers.
P = the probability that the program will win the next game.

In general, any machine learning problem can be assigned to one of two broad classifications:
Supervised learning and Unsupervised learning.

通常來講担映,機器學習分為兩大類:監(jiān)督學習和無監(jiān)督學習

Supervised Learning

In supervised learning, we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input and the output.
Supervised learning problems are categorized into "regression" and "classification" problems. In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some continuous function. In a classification problem, we are instead trying to predict results in a discrete output. In other words, we are trying to map input variables into discrete categories.
Example 1:
Given data about the size of houses on the real estate market, try to predict their price. Price as a function of size is a continuous output, so this is a regression problem.
We could turn this example into a classification problem by instead making our output about whether the house "sells for more or less than the asking price." Here we are classifying the houses based on price into two discrete categories.
Example 2:
(a) Regression - Given a picture of a person, we have to predict their age on the basis of the given picture
(b) Classification - Given a patient with a tumor, we have to predict whether the tumor is malignant or benign.

監(jiān)督學習(Supervised Learning),意指給定一個算法恤磷,需要部分數(shù)據(jù)集已經(jīng)有正確的答案。比如給定房價數(shù)據(jù)集今野。對于里面每個數(shù)據(jù)免钻,算法都知道對應的正確房價,即這房子實際賣出的價格汗侵。算法的結(jié)果就是算出更多正確的價格幸缕,比如那個新房子,你朋友想賣的那個晃择。用更術(shù)語的方式來定義冀值, 監(jiān)督學習又叫回歸(Regression)問題,(應該是回歸屬于監(jiān)督學習中的一種)宫屠,意指要預測一個連續(xù)值的輸出,比如房價滑蚯。再比如分類問題浪蹂。分類(Classification)是要根據(jù)1個或者多個特征(features)抵栈,預測一個離散值輸出,也是一種監(jiān)督學習坤次,指的是之前已經(jīng)了一部分正確的答案古劲,根據(jù)這個答案來學習從而預測新數(shù)據(jù)的結(jié)果。

有趣的學習算法能夠處理無窮多個特征缰猴。不是3個5個這么少产艾,要用到無數(shù)多個特征,非常多的屬性(Attributes)滑绒,那么闷堡,如何處理無限多的特征,甚至如何存儲無數(shù)的東西到你的電腦里而又要避免內(nèi)存空間的不足疑故,這就是一種叫做“支持向量機(Support Vector)的算法”的功勞了杠览。

總結(jié):監(jiān)督學習中,對于數(shù)據(jù)集中的每個數(shù)據(jù)纵势,都有相應的正確答案(訓練集)踱阿,算法就是基于這些來做出預測∏仗回歸和分類問題都是監(jiān)督學習的一種软舌,前者通過回歸來預測連續(xù)值輸出。后者是通過分類來預測離散值輸出牛曹。

Unsupervised Learning

Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don't necessarily know the effect of the variables.
We can derive this structure by clustering the data based on relationships among the variables in the data.
With unsupervised learning there is no feedback based on the prediction results.
Example:
Clustering: Take a collection of 1,000,000 different genes, and find a way to automatically group these genes into groups that are somehow similar or related by different variables, such as lifespan, location, roles, and so on.
Non-clustering: The "Cocktail Party Algorithm", allows you to find structure in a chaotic environment. (i.e. identifying individual voices and music from a mesh of sounds at a cocktail party).

無監(jiān)督學習(Unsupervised Learning)佛点,在無監(jiān)督學習中,沒有屬性或者標簽這一概念躏仇,所有數(shù)據(jù)都是一樣的恋脚,沒有區(qū)別,它只是告訴我們焰手,“現(xiàn)在有一個數(shù)據(jù)集糟描,你能在其中找到某種結(jié)構(gòu)嗎?"例如聚類算法(Clustering algorithm),對于給定的數(shù)據(jù)集书妻,無監(jiān)督學習算法可能判定該數(shù)據(jù)集包含兩個不同的聚類船响。無監(jiān)督學習算法會把這些數(shù)據(jù)分成兩個不同的聚類,這是用了聚類算法.我們沒有給算法一個正確答案躲履,但是他卻能自己分好類见间,所以,這就是無監(jiān)督學習工猜。

Q: Is there a prerequisite for this course?
A: Students are expected to have the following background:

0 . 使用Octave的話米诉,會學的更快。
1 . 了解基本計算機理論并且能夠?qū)懸恍┎凰銖碗s的代碼
2 . 熟悉基本的概率論知識
3 . 熟悉基本的線性代數(shù)知識

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末篷帅,一起剝皮案震驚了整個濱河市史侣,隨后出現(xiàn)的幾起案子拴泌,更是在濱河造成了極大的恐慌,老刑警劉巖惊橱,帶你破解...
    沈念sama閱讀 221,430評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蚪腐,死亡現(xiàn)場離奇詭異,居然都是意外死亡税朴,警方通過查閱死者的電腦和手機回季,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評論 3 398
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來正林,“玉大人泡一,你說我怎么就攤上這事∽壳簦” “怎么了瘾杭?”我有些...
    開封第一講書人閱讀 167,834評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長哪亿。 經(jīng)常有香客問我粥烁,道長,這世上最難降的妖魔是什么蝇棉? 我笑而不...
    開封第一講書人閱讀 59,543評論 1 296
  • 正文 為了忘掉前任讨阻,我火速辦了婚禮,結(jié)果婚禮上篡殷,老公的妹妹穿的比我還像新娘钝吮。我一直安慰自己,他們只是感情好板辽,可當我...
    茶點故事閱讀 68,547評論 6 397
  • 文/花漫 我一把揭開白布奇瘦。 她就那樣靜靜地躺著,像睡著了一般劲弦。 火紅的嫁衣襯著肌膚如雪耳标。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,196評論 1 308
  • 那天邑跪,我揣著相機與錄音次坡,去河邊找鬼。 笑死画畅,一個胖子當著我的面吹牛砸琅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播轴踱,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼症脂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起摊腋,我...
    開封第一講書人閱讀 39,671評論 0 276
  • 序言:老撾萬榮一對情侶失蹤沸版,失蹤者是張志新(化名)和其女友劉穎嘁傀,沒想到半個月后兴蒸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,221評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡细办,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,303評論 3 340
  • 正文 我和宋清朗相戀三年橙凳,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片笑撞。...
    茶點故事閱讀 40,444評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡岛啸,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出茴肥,到底是詐尸還是另有隱情坚踩,我是刑警寧澤,帶...
    沈念sama閱讀 36,134評論 5 350
  • 正文 年R本政府宣布瓤狐,位于F島的核電站瞬铸,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏础锐。R本人自食惡果不足惜嗓节,卻給世界環(huán)境...
    茶點故事閱讀 41,810評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望皆警。 院中可真熱鬧拦宣,春花似錦、人聲如沸信姓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽意推。三九已至豆瘫,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間左痢,已是汗流浹背靡羡。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留俊性,地道東北人略步。 一個月前我還...
    沈念sama閱讀 48,837評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像定页,于是被迫代替她去往敵國和親趟薄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,455評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 屏幕的尺寸說的是對角線典徊;5.2英寸=5.2*2.54cm=13.208cm如果說的是5.2英寸屏幕就是指的屏幕斜對...
    俊鵬被鳳梨酥噎到閱讀 1,908評論 0 0
  • 每日推薦: 每日一歌――孫燕姿《我也很想他》 每日一影――梁樂民&陸劍青《寒戰(zhàn)》 開始記錄的第一百零三天杭煎。 ...
    薩拉芯雪閱讀 204評論 0 1
  • 一個人恩够,一座城 此人無能,此城無門 一場夢羡铲,連一生 此夢無痕蜂桶,此生遺恨 一段情,落紅塵 此情無緣也切,此緣無分 一盅酒...
    竹影齋主人閱讀 137評論 0 2
  • 非常感謝我的項目經(jīng)理給我上了非常有價值的一課雷恃,整理出來疆股,決定分享給大家,給還在管理上需要養(yǎng)料的讀者: 首先要明確一...
    劉書亞的天堂之路閱讀 419評論 1 1