機器學(xué)習(xí)學(xué)習(xí)筆記1(Ng吳恩達cs229)

什么是機器學(xué)習(xí)

作為機器學(xué)習(xí)領(lǐng)域的先驅(qū)卢鹦,Arthur Samuel在 IBM Journal of Research and Development期刊上發(fā)表了一篇名為《Some Studies in Machine Learning Using the Game of Checkers》的論文中,將機器學(xué)習(xí)非正式定義為:”在不直接針對問題進行編程的情況下劝堪,賦予計算機學(xué)習(xí)能力的一個研究領(lǐng)域冀自。”

Tom Mitchell在他的《Machine Learning(中文版:計算機科學(xué)叢書:機器學(xué)習(xí) )》一書的序言開場白中給出了一個定義:

“機器學(xué)習(xí)這門學(xué)科所關(guān)注的問題是:計算機程序如何隨著經(jīng)驗積累自動提高性能秒啦“敬郑”

“對于某類任務(wù)T和性能度量P,如果一個計算機程序在T上以P衡量的性能隨著經(jīng)驗E而自我完善余境,那么我們稱這個計算機程序在從經(jīng)驗E學(xué)習(xí)驻呐。”

他沒有告訴機器應(yīng)該怎么下棋芳来,機器可以自己不斷學(xué)習(xí)如何下棋含末,因此把這一過程帶入到定義中,我們知道:

E:機器不斷下棋的經(jīng)歷 T:下棋 P:下棋的勝率

機器學(xué)習(xí)分類

1.監(jiān)督學(xué)習(xí)(Supervised Learning):有標準答案(有標簽)

regression 回歸問題(連續(xù)) 例:房價變化

classification 分類問題(離散) 例:字符識別

learning theory 學(xué)習(xí)理論

2.非監(jiān)督學(xué)習(xí)(Unsupervised Learning):沒有標準答案(無標簽)

K-means聚類

PCA

3.強化學(xué)習(xí)/反饋學(xué)習(xí)(Reinforcement Learning)

你在訓(xùn)練一只狗即舌,每次狗做了一些你滿意的事情佣盒,你就說一聲“Good boy” 然后獎勵它。每次狗做了something bad 你就說 "bad dog "顽聂,漸漸的肥惭,狗學(xué)會了做正確的事情來獲取獎勵。

強化學(xué)習(xí)與其他機器學(xué)習(xí)不同之處為:

  1. 沒有教師信號芜飘,也沒有l(wèi)abel务豺。只有reward,其實reward就相當于label嗦明。
  2. 反饋有延時笼沥,不是能立即返回。
  3. 相當于輸入數(shù)據(jù)是序列數(shù)據(jù)娶牌。
  4. agent執(zhí)行的動作會影響之后的數(shù)據(jù)奔浅。

常用的字母表示

m => training examples 訓(xùn)練數(shù)據(jù)數(shù)目

x => input variables/features 輸入變量

y => output/target variable

(x,y) => training example

theta => parameters

            training set

                    |

        learning algorithm

                    |

input ->  h(hypothesis)  -> output

一元線性回歸

回歸分析(Regression Analysis)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。在回歸分析中诗良,只包括一個自變量和一個因變量汹桦,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析鉴裹。

舉個例子:可以根據(jù)房子的平米數(shù)來估算房價

一元線性方程公式:

舞骆,可以用作擬合函數(shù)

如何求解擬合函數(shù)可以使用最小二乘法钥弯,所謂最小二乘,其實也可以叫做最小平方和督禽。就是讓目標對象和擬合對象的誤差最小脆霎。即通過最小化誤差的平方和,使得擬合對象無限接近目標對象狈惫,這就是最小二乘的核心思想睛蛛。所以把擬合值和實際值的差求平方和,可以得到損失函數(shù)胧谈,最小化損失函數(shù)可以得到

求解方法

方法一:梯度下降

步長選擇:步長過小—收斂太慢 步長過大—無法收斂

批量梯度下降(Batch gradient descent )

全局最優(yōu)忆肾,數(shù)據(jù)量太大無法計算

隨機梯度下降(Stochastic gradient descent)

適合于低精度的任務(wù)

方法二:正規(guī)方程組

兩種方法比較:

欠擬合和過擬合

首先我們來看一個線性回歸的問題,在下面的例子中菱肖,我們選取不同維度的特征來對我們的數(shù)據(jù)進行擬合客冈。

對于上面三個圖像做如下解釋:

選取一個特征

來擬合數(shù)據(jù)蔑滓,可以看出來擬合情況并不是很好郊酒,有些數(shù)據(jù)誤差還是比較大。

針對第一個键袱,我們增加了額外的特征

摹闽,這時我們可以看出情況就好了很多蹄咖。

這個時候可能有疑問,是不是特征選取的越多越好付鹿,維度越高越好呢澜汤?所以針對這個疑問,如最右邊圖舵匾,我們用5揭多項式使得數(shù)據(jù)點都在同一條曲線上俊抵,為

。此時它對于訓(xùn)練集來說做到了很好的擬合效果坐梯,但是徽诲,我們不認為它是一個好的假設(shè),因為它不能夠做到更好的預(yù)測吵血。

針對上面的分析谎替,我們認為第二個是一個很好的假設(shè),而第一個圖我們稱之為欠擬合(underfitting)蹋辅,而最右邊的情況我們稱之為過擬合(overfitting)

局部加權(quán)線性回歸

對于線性回歸算法钱贯,一旦擬合出適合訓(xùn)練數(shù)據(jù)的參數(shù)θi’s,保存這些參數(shù)θi’s侦另,對于之后的預(yù)測秩命,不需要再使用原始訓(xùn)練數(shù)據(jù)集尉共,所以是參數(shù)學(xué)習(xí)算法。

對于局部加權(quán)線性回歸算法弃锐,每次進行預(yù)測都需要全部的訓(xùn)練數(shù)據(jù)(每次進行的預(yù)測得到不同的參數(shù)θi’s)爸邢,沒有固定的參數(shù)θi’s,所以是非參數(shù)算法拿愧。

    對于上述公式的理解是這樣的:x為某個預(yù)測點杠河,x^((i))為樣本點,樣本點距離預(yù)測點越近浇辜,貢獻的誤差越大(權(quán)值越大)券敌,越遠則貢獻的誤差越小(權(quán)值越辛蟆)待诅。關(guān)于預(yù)測點的選取,在我的代碼中取的是樣本點熊镣。其中k是帶寬參數(shù)卑雁,控制w(鐘形函數(shù))的寬窄程度,類似于高斯函數(shù)的標準差绪囱。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末测蹲,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子鬼吵,更是在濱河造成了極大的恐慌扣甲,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件齿椅,死亡現(xiàn)場離奇詭異琉挖,居然都是意外死亡,警方通過查閱死者的電腦和手機涣脚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評論 3 392
  • 文/潘曉璐 我一進店門示辈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人遣蚀,你說我怎么就攤上這事矾麻。” “怎么了妙同?”我有些...
    開封第一講書人閱讀 162,483評論 0 353
  • 文/不壞的土叔 我叫張陵射富,是天一觀的道長。 經(jīng)常有香客問我粥帚,道長胰耗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評論 1 292
  • 正文 為了忘掉前任芒涡,我火速辦了婚禮柴灯,結(jié)果婚禮上卖漫,老公的妹妹穿的比我還像新娘。我一直安慰自己赠群,他們只是感情好羊始,可當我...
    茶點故事閱讀 67,176評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著查描,像睡著了一般突委。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上冬三,一...
    開封第一講書人閱讀 51,146評論 1 297
  • 那天匀油,我揣著相機與錄音,去河邊找鬼勾笆。 笑死敌蚜,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的窝爪。 我是一名探鬼主播弛车,決...
    沈念sama閱讀 40,032評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蒲每!你這毒婦竟也來了纷跛?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,896評論 0 274
  • 序言:老撾萬榮一對情侶失蹤啃勉,失蹤者是張志新(化名)和其女友劉穎忽舟,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體淮阐,經(jīng)...
    沈念sama閱讀 45,311評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,536評論 2 332
  • 正文 我和宋清朗相戀三年刁品,在試婚紗的時候發(fā)現(xiàn)自己被綠了泣特。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,696評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡挑随,死狀恐怖状您,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情兜挨,我是刑警寧澤膏孟,帶...
    沈念sama閱讀 35,413評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站拌汇,受9級特大地震影響柒桑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜噪舀,卻給世界環(huán)境...
    茶點故事閱讀 41,008評論 3 325
  • 文/蒙蒙 一魁淳、第九天 我趴在偏房一處隱蔽的房頂上張望飘诗。 院中可真熱鬧,春花似錦界逛、人聲如沸昆稿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽溉潭。三九已至,卻和暖如春少欺,著一層夾襖步出監(jiān)牢的瞬間喳瓣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評論 1 269
  • 我被黑心中介騙來泰國打工狈茉, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留夫椭,地道東北人。 一個月前我還...
    沈念sama閱讀 47,698評論 2 368
  • 正文 我出身青樓氯庆,卻偏偏與公主長得像蹭秋,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子堤撵,可洞房花燭夜當晚...
    茶點故事閱讀 44,592評論 2 353

推薦閱讀更多精彩內(nèi)容