前言
機(jī)器學(xué)習(xí)(machine learning)想必早有耳聞,但是在大家心中感覺其實(shí)還一直是個(gè)高深莫測(cè)的學(xué)問。固然想學(xué)好它要有不少的數(shù)學(xué)知識(shí)儲(chǔ)備特纤,但是對(duì)于初學(xué)者來講,我們不應(yīng)該被那些大佬們一個(gè)個(gè)的術(shù)語嚇到伟墙,想窺探到機(jī)器學(xué)習(xí)的門鏡其實(shí)沒有那么的困難,只要你能沉下心來去理解。
我開始的顧慮也有許多,但是最后還是決定嘗試一下這門學(xué)科有送,就跟著吳恩達(dá)教授的視頻進(jìn)行學(xué)習(xí)。這里挺推薦吳恩達(dá)教授的視頻的僧家,非常適合入門者雀摘,對(duì)于數(shù)學(xué)的知識(shí)你不用太過擔(dān)心,視頻里都會(huì)講解該如何計(jì)算啸臀,只要你還沒把大學(xué)的高數(shù)線代基本的東西忘光届宠,都是能很快理解的烁落。coursera-機(jī)器學(xué)習(xí)-吳恩達(dá)教授
現(xiàn)階段我也只是沒看多久乘粒,記錄下學(xué)習(xí)的過程以及自己的一些理解,有不對(duì)的地方還望大佬指正伤塌。
簡(jiǎn)介
什么是機(jī)器學(xué)習(xí)灯萍,你去百度百科或者在維基百科上看到的一長(zhǎng)串的解釋一定會(huì)覺得眼花繚亂又難以理解。簡(jiǎn)單來說每聪,其實(shí)就是你編寫一段代碼旦棉,再足夠多的數(shù)據(jù)量的條件下,讓機(jī)器自己“學(xué)習(xí)”找到其中的規(guī)律药薯,一旦你的這個(gè)學(xué)習(xí)模型成熟了绑洛,那么對(duì)于新的數(shù)據(jù)那它也能進(jìn)行判斷預(yù)測(cè)。最為經(jīng)典以及簡(jiǎn)單的例子就是預(yù)測(cè)房?jī)r(jià)了童本。為了簡(jiǎn)便說明真屯,假設(shè)影響房子價(jià)格的因素只有房子的面積。你需要進(jìn)行編碼通過房子的面積來判斷房子價(jià)值多少穷娱。
首先你已經(jīng)擁有了近幾個(gè)月的房子成交價(jià)格和該房子的面積绑蔫,你就需要利用這些已有的數(shù)據(jù)來訓(xùn)練你的學(xué)習(xí)模型运沦,直到它誤差足夠小,它就可以幫你成功預(yù)測(cè)房子的價(jià)格了配深。
如果你對(duì)機(jī)器學(xué)習(xí)一無所知携添,你可能會(huì)做如下編碼:
int price=0;
if(size==100){? //如果面積是100平
price=2000000; //房?jī)r(jià)是200萬
}else if(size==60){
price==1000000;
}
......
如果你這樣忙活了大半天,或許會(huì)有那么一點(diǎn)點(diǎn)的效果篓叶,但是你的這個(gè)預(yù)測(cè)模型涵蓋不了全部的可能烈掠,價(jià)格變化時(shí),你要把你的程序從頭到尾改一遍澜共,簡(jiǎn)直是噩夢(mèng)啊向叉。
如果能讓程序自己找出一個(gè)函數(shù)能求出房?jī)r(jià),誰會(huì)在乎這個(gè)函數(shù)具體干了什么嗦董。實(shí)際上母谎,如果能計(jì)算出面積對(duì)房?jī)r(jià)有多大影響,或者如果有更多因素京革,加上房子的位置等因素奇唤,那么這些因素所占的成分混合起來就能形成最終的價(jià)格比例。
例如:
price=0.4*size+0.6*position;
那么這個(gè)函數(shù)對(duì)于新來的房子就能進(jìn)行正確的預(yù)測(cè)匹摇,而這些比例值是通過我們的學(xué)習(xí)算法得出來的而不是我們計(jì)算得出來的咬扇。我們可以稱這些比例為權(quán)重,只要能找出對(duì)所有房子都合適的權(quán)重廊勃,那我們的模型就可正確預(yù)測(cè)新的房?jī)r(jià)了懈贺。所以這就需要比較大量的數(shù)據(jù),以及數(shù)據(jù)需要有一定的普遍性坡垫。
每個(gè)模型都有其適用的范圍梭灿,比如這個(gè)預(yù)測(cè)房?jī)r(jià)的模型,如果你是通過中國(guó)房?jī)r(jià)的數(shù)據(jù)訓(xùn)練出來的冰悠,那么你只能用來預(yù)測(cè)中國(guó)房?jī)r(jià)堡妒,對(duì)于美國(guó)房?jī)r(jià),它就會(huì)顯得不適用溉卓。但是它能幫助你解決你需要的問題就足夠了皮迟。
對(duì)于如何通過給定的數(shù)據(jù)集訓(xùn)練自己的房?jī)r(jià)預(yù)測(cè)模型,不是這次的內(nèi)容桑寨,但是它絕不是你想象的那么難伏尼。這篇文章只是希望對(duì)機(jī)器學(xué)習(xí)有個(gè)初步的認(rèn)識(shí),也幫助自己鞏固一下機(jī)器學(xué)習(xí)的一些基本思想尉尾。對(duì)于更深層次的內(nèi)容爆阶,我也母雞啊,大佬不要來虐我。
機(jī)器學(xué)習(xí)那么厲害么
正如我上面說的關(guān)于美國(guó)房?jī)r(jià)和中國(guó)房?jī)r(jià)扰她,你的這套模型只能適用于你的訓(xùn)練數(shù)據(jù)集的范圍兽掰,對(duì)于不符合你訓(xùn)練數(shù)據(jù)集規(guī)律的數(shù)據(jù),它完全可能得到錯(cuò)誤的結(jié)果徒役。
初步學(xué)習(xí)的話孽尽,就推薦觀看吳恩達(dá)教授的機(jī)器學(xué)習(xí)課程,里面還有配套作業(yè)忧勿,對(duì)你理解這些算法十分有幫助杉女。我現(xiàn)在也正在觀看,覺得是真的很好的資源鸳吸。希望與大家一起學(xué)習(xí)熏挎,共同努力。
這里再給出課程地址吳恩達(dá)-機(jī)器學(xué)習(xí)
初次寫文章晌砾,希望大家能收藏以及喜歡坎拐。謝謝了(手動(dòng)滑稽)QAQ