機器學(xué)習(xí)學(xué)習(xí)筆記1（Ng吳恩達cs229）

什么是機器學(xué)習(xí)

作為機器學(xué)習(xí)領(lǐng)域的先驅(qū)卢鹦，Arthur Samuel在 IBM Journal of Research and Development期刊上發(fā)表了一篇名為《Some Studies in Machine Learning Using the Game of Checkers》的論文中，將機器學(xué)習(xí)非正式定義為：”在不直接針對問題進行編程的情況下劝堪，賦予計算機學(xué)習(xí)能力的一個研究領(lǐng)域冀自。”

Tom Mitchell在他的《Machine Learning（中文版：計算機科學(xué)叢書:機器學(xué)習(xí) ）》一書的序言開場白中給出了一個定義：

“機器學(xué)習(xí)這門學(xué)科所關(guān)注的問題是：計算機程序如何隨著經(jīng)驗積累自動提高性能秒啦“敬郑”

“對于某類任務(wù)T和性能度量P，如果一個計算機程序在T上以P衡量的性能隨著經(jīng)驗E而自我完善余境，那么我們稱這個計算機程序在從經(jīng)驗E學(xué)習(xí)驻呐。”

他沒有告訴機器應(yīng)該怎么下棋芳来，機器可以自己不斷學(xué)習(xí)如何下棋含末，因此把這一過程帶入到定義中，我們知道：

E：機器不斷下棋的經(jīng)歷 T：下棋 P：下棋的勝率

機器學(xué)習(xí)分類

1.監(jiān)督學(xué)習(xí)（Supervised Learning）：有標準答案（有標簽）

regression 回歸問題（連續(xù)）例：房價變化

classification 分類問題（離散）例：字符識別

learning theory 學(xué)習(xí)理論

2.非監(jiān)督學(xué)習(xí)（Unsupervised Learning）：沒有標準答案（無標簽）

K-means聚類

PCA

3.強化學(xué)習(xí)/反饋學(xué)習(xí)（Reinforcement Learning）

你在訓(xùn)練一只狗即舌，每次狗做了一些你滿意的事情佣盒，你就說一聲“Good boy” 然后獎勵它。每次狗做了something bad 你就說 "bad dog "顽聂，漸漸的肥惭，狗學(xué)會了做正確的事情來獲取獎勵。

強化學(xué)習(xí)與其他機器學(xué)習(xí)不同之處為：

沒有教師信號芜飘，也沒有l(wèi)abel务豺。只有reward，其實reward就相當于label嗦明。
反饋有延時笼沥，不是能立即返回。
相當于輸入數(shù)據(jù)是序列數(shù)據(jù)娶牌。
agent執(zhí)行的動作會影響之后的數(shù)據(jù)奔浅。

常用的字母表示

m => training examples 訓(xùn)練數(shù)據(jù)數(shù)目

x => input variables/features 輸入變量

y => output/target variable

(x,y) => training example

theta => parameters

            training set

                    |

        learning algorithm

                    |

input ->  h(hypothesis)  -> output

一元線性回歸

回歸分析（Regression Analysis)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。在回歸分析中诗良，只包括一個自變量和一個因變量汹桦，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析鉴裹。

舉個例子：可以根據(jù)房子的平米數(shù)來估算房價

一元線性方程公式：

舞骆，可以用作擬合函數(shù)

如何求解擬合函數(shù)可以使用最小二乘法钥弯，所謂最小二乘，其實也可以叫做最小平方和督禽。就是讓目標對象和擬合對象的誤差最小脆霎。即通過最小化誤差的平方和，使得擬合對象無限接近目標對象狈惫，這就是最小二乘的核心思想睛蛛。所以把擬合值和實際值的差求平方和，可以得到損失函數(shù)胧谈，最小化損失函數(shù)可以得到

求解方法

方法一：梯度下降

步長選擇：步長過小—收斂太慢步長過大—無法收斂

批量梯度下降（Batch gradient descent ）

全局最優(yōu)忆肾，數(shù)據(jù)量太大無法計算

隨機梯度下降（Stochastic gradient descent）

適合于低精度的任務(wù)

方法二：正規(guī)方程組

兩種方法比較：

欠擬合和過擬合

首先我們來看一個線性回歸的問題，在下面的例子中菱肖，我們選取不同維度的特征來對我們的數(shù)據(jù)進行擬合客冈。

對于上面三個圖像做如下解釋：

選取一個特征

，

來擬合數(shù)據(jù)蔑滓，可以看出來擬合情況并不是很好郊酒，有些數(shù)據(jù)誤差還是比較大。

針對第一個键袱，我們增加了額外的特征

，

摹闽，這時我們可以看出情況就好了很多蹄咖。

這個時候可能有疑問，是不是特征選取的越多越好付鹿，維度越高越好呢澜汤？所以針對這個疑問，如最右邊圖舵匾，我們用5揭多項式使得數(shù)據(jù)點都在同一條曲線上俊抵，為

。此時它對于訓(xùn)練集來說做到了很好的擬合效果坐梯，但是徽诲，我們不認為它是一個好的假設(shè)，因為它不能夠做到更好的預(yù)測吵血。

針對上面的分析谎替，我們認為第二個是一個很好的假設(shè)，而第一個圖我們稱之為欠擬合（underfitting）蹋辅，而最右邊的情況我們稱之為過擬合（overfitting）

局部加權(quán)線性回歸

對于線性回歸算法钱贯，一旦擬合出適合訓(xùn)練數(shù)據(jù)的參數(shù)θi’s，保存這些參數(shù)θi’s侦另，對于之后的預(yù)測秩命，不需要再使用原始訓(xùn)練數(shù)據(jù)集尉共，所以是參數(shù)學(xué)習(xí)算法。

對于局部加權(quán)線性回歸算法弃锐，每次進行預(yù)測都需要全部的訓(xùn)練數(shù)據(jù)（每次進行的預(yù)測得到不同的參數(shù)θi’s）爸邢，沒有固定的參數(shù)θi’s，所以是非參數(shù)算法拿愧。

    對于上述公式的理解是這樣的：x為某個預(yù)測點杠河，x^((i))為樣本點，樣本點距離預(yù)測點越近浇辜，貢獻的誤差越大（權(quán)值越大）券敌，越遠則貢獻的誤差越小（權(quán)值越辛蟆）待诅。關(guān)于預(yù)測點的選取，在我的代碼中取的是樣本點熊镣。其中k是帶寬參數(shù)卑雁，控制w（鐘形函數(shù)）的寬窄程度，類似于高斯函數(shù)的標準差绪囱。

最后編輯于：2019.03.29 17:33:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末测蹲，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子鬼吵，更是在濱河造成了極大的恐慌扣甲，老刑警劉巖，帶你破解...
沈念sama閱讀 216,402評論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件齿椅，死亡現(xiàn)場離奇詭異琉挖，居然都是意外死亡，警方通過查閱死者的電腦和手機涣脚，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,377評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門示辈，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人遣蚀，你說我怎么就攤上這事矾麻。” “怎么了妙同？”我有些...
開封第一講書人閱讀 162,483評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵射富，是天一觀的道長。經(jīng)常有香客問我粥帚，道長胰耗，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,165評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任芒涡，我火速辦了婚禮柴灯，結(jié)果婚禮上卖漫，老公的妹妹穿的比我還像新娘。我一直安慰自己赠群，他們只是感情好羊始，可當我...
茶點故事閱讀 67,176評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著查描，像睡著了一般突委。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上冬三，一...
開封第一講書人閱讀 51,146評論 1贊 297
城市分裂傳說
那天匀油，我揣著相機與錄音，去河邊找鬼勾笆。笑死敌蚜，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的窝爪。我是一名探鬼主播弛车，決...
沈念sama閱讀 40,032評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼蒲每！你這毒婦竟也來了纷跛？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,896評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤啃勉，失蹤者是張志新（化名）和其女友劉穎忽舟，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體淮阐，經(jīng)...
沈念sama閱讀 45,311評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,536評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年刁品，在試婚紗的時候發(fā)現(xiàn)自己被綠了泣特。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,696評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挑随，死狀恐怖状您，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情兜挨，我是刑警寧澤膏孟，帶...
沈念sama閱讀 35,413評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站拌汇，受9級特大地震影響柒桑，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜噪舀，卻給世界環(huán)境...
茶點故事閱讀 41,008評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一魁淳、第九天我趴在偏房一處隱蔽的房頂上張望飘诗。院中可真熱鬧，春花似錦界逛、人聲如沸昆稿。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案息拜，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽溉潭。三九已至，卻和暖如春少欺，著一層夾襖步出監(jiān)牢的瞬間喳瓣，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,815評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工狈茉，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留夫椭，地道東北人。一個月前我還...
沈念sama閱讀 47,698評論 2贊 368
代替公主和親
正文我出身青樓氯庆，卻偏偏與公主長得像蹭秋，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子堤撵，可洞房花燭夜當晚...
茶點故事閱讀 44,592評論 2贊 353