NO8《技巧》·中·Why-落日蕭峰
【R】P104鍛煉你的大腦·機(jī)器學(xué)習(xí):模型+數(shù)據(jù)量
機(jī)器學(xué)習(xí)主要有兩個(gè)東西粱哼,一個(gè)是模型,另一個(gè)是數(shù)據(jù)量妥衣。當(dāng)你選對了足夠的語料皂吮、足夠的數(shù)據(jù)量的時(shí)候,這個(gè)模型會越來越好税手。
我一直在想我們的大腦一個(gè)什么東西蜂筹。大腦其實(shí)是一個(gè)反饋的流程,大腦接受了一定的數(shù)據(jù)芦倒、一定的訓(xùn)練艺挪,形成了一定的理論,然后不斷的去驗(yàn)證這些理論對不對兵扬。一個(gè)聰明的人大腦結(jié)構(gòu)應(yīng)該非常地清晰麻裳。
為了學(xué)英語練聽力,我開始聽一些Podcast器钟,一開始我發(fā)現(xiàn)我聽得不太懂津坑,但是由于是自己領(lǐng)域內(nèi)的東西,后來我都能聽得懂傲霸;于是我開始聽一些經(jīng)濟(jì)學(xué)的東西疆瑰,發(fā)現(xiàn)一個(gè)有十幾個(gè)字母的詞我也能夠聽懂,我到現(xiàn)在都不知道那些詞怎么寫昙啄,但是我就是能夠得懂穆役。
現(xiàn)在我驗(yàn)證了大腦是一個(gè)有無窮力量的機(jī)器,那我怎么去訓(xùn)練它呢梳凛?我覺得聽力有一定水平了耿币,那我能不能夠說英語呢?于是我就去參加上海老外的聚會韧拒,從一句話不會說到能夠和老外爭論宗教的問題淹接。
我始終覺得我的詞匯量是一個(gè)問題,那我又開始讀英文書叛溢,現(xiàn)在我可以看哲學(xué)等比較艱澀的書籍了塑悼。那后來我發(fā)現(xiàn)我要練口語的一種方法,原來一開始我要培養(yǎng)即使看不懂也能讀下去的一種感覺雇初,現(xiàn)在我遇到每一個(gè)不會的單詞都要查拢肆,于是我感覺我的口語又在慢慢進(jìn)步。
【I】重述知識
[What]什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是一門人工智能的科學(xué)郭怪,是研究如何使用機(jī)器來模擬人類學(xué)習(xí)活動的一門學(xué)科支示。本質(zhì)上機(jī)器學(xué)習(xí)和人類學(xué)習(xí)非常像。
在討論機(jī)器學(xué)習(xí)之前鄙才,我們來先看看人類是如何學(xué)習(xí)的颂鸿。如下圖的上半部分所示,人類通過閱讀攒庵、查閱資料嘴纺、觀察得到信息,這些信息經(jīng)過人腦學(xué)習(xí)浓冒,最后習(xí)得了某種技能栽渴。機(jī)器學(xué)習(xí)和人類學(xué)習(xí)類似,只不過機(jī)器學(xué)習(xí)的輸入是數(shù)據(jù)(Data)稳懒,輸出的結(jié)果叫模型(Model)闲擦。從數(shù)據(jù)中學(xué)得模型這個(gè)過程通過執(zhí)行某個(gè)學(xué)習(xí)算法(Learning Algorithm)來完成。
- 數(shù)據(jù)(Data)
- 學(xué)習(xí)算法(Learning Algorithm)
- 模型(Model)
是機(jī)器學(xué)習(xí)的三個(gè)要素场梆。
[圖片上傳中墅冷。。或油。(1)]
機(jī)器學(xué)習(xí)的原理
先說說人類學(xué)習(xí)的例子寞忿,我們小時(shí)候?qū)W數(shù)學(xué),剛開始用課本上的例題顶岸,老師通過演示演繹的方式腔彰,讓我們知道加減乘除大概是怎么回事,然后給我們一本習(xí)題集蜕琴,不斷的去演算萍桌,對照標(biāo)準(zhǔn)答案宵溅,最終學(xué)得四則運(yùn)算的技能凌简。
剛開始寫字的時(shí)候也是,叫我們簡單的筆畫和簡單漢字恃逻,讓我們不斷的練習(xí)寫雏搂,知道點(diǎn)橫豎撇捺折彎鉤,不斷的練習(xí)寇损,老師修正凸郑,最后學(xué)會寫字的基本功,再碰到不認(rèn)識的字的時(shí)候也知道如何寫矛市。
在這個(gè)過程中芙沥,例題和練習(xí)就是訓(xùn)練樣本,通過訓(xùn)練樣本獲得標(biāo)準(zhǔn)答案和符合規(guī)范的字的過程,就是“訓(xùn)練”而昨。訓(xùn)練的目的就是找到一個(gè)“目標(biāo)函數(shù)”或者書寫規(guī)則救氯。有訓(xùn)練樣本,通過訓(xùn)練找到目標(biāo)函數(shù)和書寫規(guī)則歌憨,這就是機(jī)器“學(xué)習(xí)”的方式着憨,它和人類學(xué)習(xí)是非常相似的。
[How]怎么運(yùn)用機(jī)器學(xué)習(xí)务嫡?
機(jī)器學(xué)習(xí)其實(shí)是在模擬人類學(xué)習(xí)的過程甲抖,是在不斷輸入數(shù)據(jù)過程中迭代學(xué)習(xí)算法并不斷調(diào)整數(shù)據(jù)模型,機(jī)器學(xué)習(xí)的速度之所以快是因?yàn)閿?shù)據(jù)量足夠心铃,從剛開始單一的學(xué)習(xí)算法會進(jìn)化迭代出不斷優(yōu)化到準(zhǔn)確的算法准谚,而生成模型;
作者舉了自己學(xué)習(xí)英語的例子去扣,我回想自己學(xué)習(xí)英語到現(xiàn)在的狀態(tài)氛魁,其實(shí)就是數(shù)據(jù)量不夠,訓(xùn)練的不夠厅篓;我們把優(yōu)秀人的算法和模型拿過來秀存,但是給大腦輸入的數(shù)據(jù)量不夠,訓(xùn)練的樣本不足羽氮,沒有在實(shí)踐過程中去優(yōu)化算法或链,也就沒有形成自己的模型。
英語不會說就是說的太少了档押,英語讀不懂就是讀的太少了澳盐,拆書RIA便簽學(xué)不會就是拆的太少了,有了拆書的R便簽令宿、I便簽叼耙、A便簽的標(biāo)準(zhǔn)還是寫不好就是拆的太少了,積累了一定的數(shù)據(jù)量粒没,結(jié)合拆書家的指點(diǎn)反饋筛婉,及時(shí)調(diào)整優(yōu)化改進(jìn),再持續(xù)練習(xí)癞松,就學(xué)會了拆書法爽撒,學(xué)以致用。
大腦是個(gè)反饋流响蓉,在過程中的及時(shí)反饋會給大腦的神經(jīng)回路留下痕跡硕勿,反饋的越多越及時(shí),大腦留下的回路就越粗枫甲,鏈接越緊密源武,大周期的重復(fù)練習(xí)扼褪,給大腦足夠的數(shù)據(jù),不斷的及時(shí)反饋粱栖,給大腦及時(shí)優(yōu)化的算法迎捺,最終就能形成自己的模型。
[Why]為什么要用機(jī)器學(xué)習(xí)查排?
1凳枝、機(jī)器學(xué)習(xí)是模擬人類學(xué)習(xí)活動,但人類沒有讓自己的大腦這個(gè)無窮力量的機(jī)器得到足夠的數(shù)據(jù)量跋核,沒有給大腦及時(shí)有效的反饋信息岖瑰,自然就算是學(xué)到思維模型,缺乏大周期的重復(fù)練習(xí)和刻意練習(xí)砂代,也沒有用蹋订;
2、機(jī)器學(xué)習(xí)和人類學(xué)習(xí)本質(zhì)的區(qū)別就在于數(shù)據(jù)量的多少刻伊、學(xué)習(xí)算法的迭代速度露戒,給自己的啟示是逐步增加數(shù)據(jù)量,盡可能的迭代速度
【A1】內(nèi)化知識
①成功案例:
回想起當(dāng)年高中背英語單詞的時(shí)候捶箱,那時(shí)候我的詞匯量就已經(jīng)達(dá)到六級詞匯量智什,以至于大學(xué)都沒有怎么背單詞,那時(shí)背單詞就是背的多丁屎,用各種方法背荠锭,后來就背字典,都是給大腦輸入了大量的數(shù)據(jù)晨川,大腦自動的會進(jìn)行分類证九,詞根匯總,直到現(xiàn)在很多的詞匯我都還能知道什么意思共虑;
自己在大學(xué)時(shí)是記憶與思維協(xié)會的會長愧怜,后來開始記憶訓(xùn)練,數(shù)字訓(xùn)練和撲克牌訓(xùn)練妈拌,通過大量的數(shù)據(jù)輸入拥坛,自己就不斷的優(yōu)化了記憶方法和記憶組塊,用的編碼更簡單而翻譯出來的信息更多供炎,這就是學(xué)習(xí)算法的優(yōu)化迭代渴逻;
自己跑步能跑到半馬疾党,也都是前期積累了足夠多的跑量音诫,不斷的讓自己的身體適應(yīng),是有了大量的跑量輸入雪位,身體開始不斷調(diào)整適應(yīng)竭钝,知道如何跑才能跑的更舒服更持久;
②失敗案例:
自己的英語口語一直是我不想提及的,沒有認(rèn)真的學(xué)香罐,沒有堅(jiān)持的學(xué)卧波,也沒有足夠多的訓(xùn)練,所以就荒廢了庇茫,不是自己的智力有問題港粱,而是自己缺乏了大周期的重復(fù)的練習(xí)和訓(xùn)練;
2014年就開始寫微信公眾號旦签,其實(shí)如果堅(jiān)持寫下來查坪,自己現(xiàn)在也能有很多的粉絲,也還是輸入的數(shù)據(jù)量不夠宁炫,輸入的練習(xí)量不夠偿曙,也沒有找到迭代優(yōu)化的算法,自然也沒有提煉出來的結(jié)構(gòu)模型羔巢、思維套路
【A2】應(yīng)用知識
1望忆、對于閱讀,自己現(xiàn)在基本平均一天能輸入2本左右“每天聽本書”的精華信息竿秆,自己的很多的觀念思路都得益于自己從高中启摄、大學(xué)一直到現(xiàn)在的大量輸入量,還要持續(xù)的做這件事幽钢,自己在進(jìn)行關(guān)鍵字搜索鞋仍、主題搜索、信息鏈接的時(shí)候搅吁,都能讓自己快速的和大腦中的網(wǎng)絡(luò)進(jìn)行匹配威创,雖然這個(gè)網(wǎng)絡(luò)之間的連接有些薄弱,網(wǎng)架有些松散谎懦,但不重要肚豺,這些松散的網(wǎng)架里已經(jīng)逐步開始內(nèi)化核心知識網(wǎng)絡(luò)結(jié)構(gòu),每天聽本書+檢視閱讀+主題閱讀+拆書法RIA界拦,這件事還是會始終貫穿終身學(xué)習(xí)過程中吸申;
2、對于RIA便簽拆書法享甸,自己一定要拆到足夠多的數(shù)量截碴,先完成這30拆,每天一拆蛉威,下次還要訓(xùn)練營還要繼續(xù)參加日丹;