機(jī)器學(xué)習(xí)方法本質(zhì)上是人類認(rèn)知方式的新世界妙同,是人類的未來斧抱。
工業(yè)革命解放了人類的體力,以機(jī)器學(xué)習(xí)技術(shù)逐步解鎖的人工智能革命將解放人類的腦力渐溶。
這不是技術(shù)層面上的進(jìn)步辉浦,而是從根本上改變?nèi)祟愓J(rèn)知世界的方式。
長久以來茎辐,人類對(duì)事物的認(rèn)知經(jīng)由三個(gè)步驟:原始數(shù)據(jù)——專業(yè)知識(shí)/經(jīng)驗(yàn)常識(shí)——認(rèn)知宪郊。
這里的原始數(shù)據(jù)指得是可被人類感知到的一切客觀存在之總體,既包括理工范疇內(nèi)的計(jì)量數(shù)據(jù)拖陆,亦包括文史范疇內(nèi)的事件與現(xiàn)象弛槐。
面對(duì)同樣的原始數(shù)據(jù)(股市數(shù)據(jù),儀表指數(shù)依啰,社會(huì)現(xiàn)象等)乎串,擁有不同知識(shí)的人將得出不同的認(rèn)知;同樣速警,擁有相同知識(shí)的人叹誉,面對(duì)沒有數(shù)據(jù)、有少量數(shù)據(jù)闷旧、有大量數(shù)據(jù)以及有充分?jǐn)?shù)據(jù)等不同情況時(shí)长豁,也將得出不同的認(rèn)知(信息均等博弈,信息不對(duì)稱博弈)忙灼。
那么究竟是知識(shí)重要還是數(shù)據(jù)重要匠襟?
在人類歷史很長一段時(shí)間內(nèi)钝侠,無疑是知識(shí)的擁有者占據(jù)了上風(fēng)。
而機(jī)器學(xué)習(xí)方法的出現(xiàn)酸舍,則將這個(gè)趨勢(shì)徹底扭轉(zhuǎn)帅韧。
或許,“知識(shí)”未來將一文不值啃勉,而“數(shù)據(jù)”忽舟,才是價(jià)值連城。
機(jī)器學(xué)習(xí)的本質(zhì)璧亮,就在于建立了(原始數(shù)據(jù)——認(rèn)知)之間的直接映射,跳出了“知識(shí)”的束縛斥难。
從此枝嘶,人類的認(rèn)知方式改天換地。
因?yàn)檠普铮瑥拇宋覀兓蛟S再也不需要那冗桎的“知識(shí)”群扶。
一,什么是“知識(shí)”:
事實(shí)上镀裤,“知識(shí)”也產(chǎn)生于“數(shù)據(jù)”竞阐。
因?yàn)槿祟惾俊爸R(shí)”的產(chǎn)生過程如下:
1)最初的人類不具備任何“知識(shí)”。
2)人類所取得的任何“新的知識(shí)”暑劝,都是靈感來源于“數(shù)據(jù)”骆莹、推導(dǎo)基于“已有知識(shí)”、驗(yàn)證于“數(shù)據(jù)”担猛。
所以幕垦,所謂“知識(shí)”,只是對(duì)數(shù)據(jù)之間客觀聯(lián)系全部總體的系統(tǒng)化傅联、邏輯化先改、因果化了的描述方式,正如“系統(tǒng)”蒸走、“邏輯”仇奶、“因果”這三個(gè)詞背后所代表的哲學(xué)意義一樣,都是客觀上并不存在比驻,只是被我們?nèi)祟惾藶榈貏?chuàng)造出來用于認(rèn)知的工具而已该溯。
用以憑借人腦這一低效的處理器與存儲(chǔ)器去理解這無限復(fù)雜的世界而不得不妥協(xié)的產(chǎn)物。
更直接地說别惦,“知識(shí)”其實(shí)并不是客觀存在朗伶,只不過因?yàn)槿四X無法存儲(chǔ)處理這世間所有的(“數(shù)據(jù)”——“認(rèn)知”)關(guān)系,而妥協(xié)生成的一種中介機(jī)制步咪、一種簡化機(jī)制论皆,以便于人類去理解相關(guān)“數(shù)據(jù)——認(rèn)知”關(guān)系對(duì)的模塊化的橋梁。例如“標(biāo)簽化”,正因?yàn)槿四X無法存儲(chǔ)也無法分析所有“河南人”“廣東人”的數(shù)據(jù)点晴,所以我們生成了類如“河南小偷多”“廣東人吃福建人”這樣的標(biāo)簽用于簡化我們對(duì)河南人與廣東人的認(rèn)知感凤。拋開這兩個(gè)玩笑性質(zhì)的“標(biāo)簽”不談,事實(shí)上現(xiàn)實(shí)生活中我們對(duì)特定職業(yè)粒督、特定階層陪竿、特定民族所貼上的一些“標(biāo)簽”,本質(zhì)上往往是基于最大似然估計(jì)的屠橄,這樣當(dāng)我們?cè)跊]有更多后驗(yàn)信息的條件下與一個(gè)完全陌生的人打交道時(shí)族跛,我們通過這些標(biāo)簽?zāi)軌蚋咝У匾宰畲蟾怕实墨@取對(duì)此人的最近似的認(rèn)知。
其實(shí)锐墙,人類的一切“知識(shí)”都只不過是各種形式的“標(biāo)簽”而已礁哄,從而通過對(duì)某一特定族類數(shù)據(jù)的特殊化處理,實(shí)現(xiàn)高效理解能力的一種簡化方式溪北。
當(dāng)然桐绒,這種簡化背后所損失掉的,是精確性之拨。因?yàn)閷?duì)事物的本質(zhì)最好的解釋依然是事物本身茉继,或者說,是人類可以感知到的有關(guān)該事物的全部數(shù)據(jù)本身蚀乔。就好比烁竭,要解釋什么是蘋果,最好的方法就是遞過去一個(gè)蘋果說:“諾吉挣,這是個(gè)蘋果颖变。”听想。而其它的類似于“蘋果就是圓圓的腥刹,一般為紅色的,酸甜多汁的一種水果”這樣的“知識(shí)”無論多么精確汉买,都只是人類面對(duì)自己有限的認(rèn)知能力條件下的一種只好挑選出一些“簡化特征”的妥協(xié)而已衔峰。
二,什么是機(jī)器學(xué)習(xí)
人腦處理能力不足因而需要“知識(shí)”來簡化運(yùn)算蛙粘,但電腦不需要垫卤,相比于人腦,電腦的運(yùn)算能力幾乎是無限的出牧。
所以穴肘,電腦足以也必須擔(dān)負(fù)起拋開“知識(shí)”的束縛,直接建立(“數(shù)據(jù)”——“認(rèn)知”)關(guān)系庫舔痕,從而以更加深邃评抚、更加貼近世界本來面貌的視角去認(rèn)知世界的重任豹缀。
這便是機(jī)器學(xué)習(xí)的本質(zhì)。
說完了本質(zhì)慨代,那么邢笙,機(jī)器學(xué)習(xí)具體究竟是怎么樣的一種方法呢?
這是一種全新的思維方式侍匙。
機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)范式可以表達(dá)如下:
對(duì)于一個(gè)Task及其Performance的度量方法氮惯,給出特定的Algorithm,能夠通過利用Experience Data不斷提高在該Task上的Performance的方法想暗,就稱為機(jī)器學(xué)習(xí)妇汗。
其實(shí)這個(gè)定義就是“學(xué)習(xí)”的全部含義,這個(gè)事情按照機(jī)器的思路來做说莫,就是機(jī)器學(xué)習(xí)杨箭。
舉現(xiàn)在最火的Alpha:GO(也就是計(jì)算機(jī)圍棋學(xué))的例子,不妨設(shè)此處的“Task”就是一步棋路唬滑,“Performance”就是最后的勝率告唆,“Experience Data”就是以往的棋譜棺弊。然后設(shè)計(jì)出一個(gè)Algorithm晶密,使得構(gòu)建出的“這步棋我該走到哪里呢——模型”能通過利用過往數(shù)據(jù)而取得“Performance:勝率”的提高。
為了實(shí)現(xiàn)每次利用Experience data對(duì)Performance的提升模她,當(dāng)前最主流的方法就是“誤差反向傳播法”稻艰。這種方法的核心思想就是:讓機(jī)器自由去試錯(cuò),然后根據(jù)嘗試的結(jié)果與樣本的真實(shí)結(jié)果之間的誤差反向調(diào)整試錯(cuò)策略侈净。誤差較小的嘗試要獎(jiǎng)勵(lì)尊勿,誤差較大的嘗試給予懲罰,然后將這個(gè)嘗試過程一直循環(huán)進(jìn)行下去畜侦,直到多學(xué)習(xí)到的結(jié)果在所有樣本上的表現(xiàn)達(dá)到我們所定義的最優(yōu)元扔。通俗來說,這與訓(xùn)練一條狗去服從我們的指令或是訓(xùn)練自己完成題集上的全部習(xí)題等過程并沒有什么區(qū)別旋膳。
有了“誤差反向傳播”算法澎语,Alpha:GO們就可以通過每次利用“Experience data:棋譜”使得自己下棋的勝率提高一點(diǎn)點(diǎn)。這便是一個(gè)機(jī)器學(xué)習(xí)方法的實(shí)例验懊。
因?yàn)檫@個(gè)“下棋機(jī)器”從歷史的數(shù)據(jù)中確實(shí)學(xué)到了點(diǎn)什么擅羞。
講到這里,可能有人會(huì)感覺义图,似乎機(jī)器學(xué)習(xí)很弱雞啊减俏,隨便一個(gè)棋手看看以前的棋譜也都可以學(xué)到點(diǎn)什么啊。
幸運(yùn)的是或者(對(duì)于柯潔們來說)不幸的是碱工,對(duì)于機(jī)器而言娃承,“學(xué)到點(diǎn)什么”就等價(jià)于“學(xué)到了全部”奏夫。
因?yàn)樗梢浴耙恢睂W(xué)”。
只要有了:
1)合理的算法保證每次對(duì)Experience Data的學(xué)習(xí)都能使Performance提高一點(diǎn)點(diǎn)草慧,
2)足夠的運(yùn)算能力桶蛔。
這兩點(diǎn)設(shè)計(jì),機(jī)器的能力必將達(dá)到極值漫谷,在可獲取的Experience Data約束范圍內(nèi)的極值仔雷。因?yàn)闄C(jī)器可以一夜之間學(xué)遍所有棋譜,包括古譜舔示、網(wǎng)絡(luò)棋譜碟婆、以及自己和自己下的棋譜。而且還能神tm能保證每次進(jìn)步一點(diǎn)點(diǎn)惕稻。
而人類棋手窮極一生可能做到這點(diǎn)嗎竖共?
所以人類棋手進(jìn)步的通道更多的轉(zhuǎn)向了聽取前輩的教誨,鉆研棋理俺祠,總結(jié)技巧公给,或者說,轉(zhuǎn)向了“知識(shí)”蜘渣,人類各行各業(yè)的佼佼者歸根結(jié)底都是知識(shí)的“富有者”淌铐。
其實(shí),在人類的學(xué)習(xí)中蔫缸,也有類似于機(jī)器學(xué)習(xí)的學(xué)習(xí)過程腿准,那便是基于千百次嘗試中通過“懲惡揚(yáng)善”所積累出的個(gè)人經(jīng)驗(yàn)或直覺本能。只可惜拾碌,對(duì)于人類來說吐葱,這部分“學(xué)習(xí)結(jié)果”是無法共享的,一個(gè)老司機(jī)的開車能力是一個(gè)新手通過怎樣的言傳身教都無法企及的校翔。
而對(duì)機(jī)器而言弟跑,第一不依賴于知識(shí),只要有足夠多的病例數(shù)據(jù)防症,在完全沒有任何醫(yī)學(xué)基礎(chǔ)的條件下也可以通過合理的算法對(duì)疾病進(jìn)行診斷孟辑,且準(zhǔn)群度媲美甚至遠(yuǎn)超一眾經(jīng)驗(yàn)豐富的“老中醫(yī)”;第二告希,學(xué)習(xí)結(jié)果在機(jī)器間可以共享扑浸,一臺(tái)機(jī)器(或者說一套算法)達(dá)到了某一高度,所有的機(jī)器便都可以達(dá)到這樣的高度燕偶。(沒錢買不起設(shè)備喝噪?沒錢買不起數(shù)據(jù)?沒錢買不起程序指么?)酝惧。
三榴鼎,人類學(xué)習(xí)與機(jī)器學(xué)習(xí)
正因?yàn)橛?jì)算與處理能力的差別,導(dǎo)致了人類與機(jī)器在學(xué)習(xí)方法上的差異晚唇。
機(jī)器計(jì)算能力無窮無盡巫财,所以機(jī)器學(xué)習(xí)很粗暴,有多少哩陕,學(xué)多少平项。其最終能達(dá)到的高度只取決于數(shù)據(jù)量。
當(dāng)數(shù)據(jù)量充足時(shí)悍及,機(jī)器學(xué)習(xí)方法所能得到的結(jié)果闽瓢,可無限逼近于事物的本質(zhì)面貌。
不需要理論心赶,不需要知識(shí)扣讼。
或者說,機(jī)器通過對(duì)海量數(shù)據(jù)進(jìn)行學(xué)習(xí)所得到的結(jié)果缨叫,就是該問題最終極最權(quán)威的“理論”與“知識(shí)”椭符。只是,“不足為外人道哉”耻姥,這是一種隱式的(知其然不知其所以然)“知識(shí)”销钝。
就好比,Alpha:GO并不懂棋理咏闪,也說不出什么理論基礎(chǔ)曙搬,它只知道怎么下能贏摔吏,至于為什么要這么下鸽嫂,它自己無法解釋,誰也無法解釋征讲。
但這并不妨礙我們認(rèn)可Alpha:GO已掌握了圍棋的真諦据某。
而人類計(jì)算能力有限,不可能做到對(duì)全部數(shù)據(jù)的充分學(xué)習(xí)诗箍。因而人類轉(zhuǎn)向了一種“分布式”的處理方式癣籽,將每個(gè)人做為一個(gè)獨(dú)立的處理單元各自做出一點(diǎn)微不足道的小貢獻(xiàn),同時(shí)建立起“知識(shí)”這一顯式的(可閱讀滤祖,可解釋的)抽象表示事物關(guān)系的體系作為各個(gè)分布單元人之間傳輸信息的接口筷狼。
因此,人類盡管個(gè)體能力有限匠童,但人類這個(gè)群體卻是飛速發(fā)展埂材;同時(shí),作為無數(shù)個(gè)體“知識(shí)”的匯總而構(gòu)成的“科學(xué)”汤求,幫助著我們每個(gè)人類依靠著自身非常低效的處理能力俏险,也能對(duì)客觀事物給出相當(dāng)靠譜的解釋严拒。
這真是“我為人人,人人為我”的境界啊竖独。
從這個(gè)意義上裤唠,雖然人類的自身能力有限,但實(shí)際上人類卻發(fā)明了一種更為先進(jìn)的認(rèn)知系統(tǒng)莹痢。
用于突破造物主施加于人類之上的桎梏种蘸。
體能上的桎梏我們已經(jīng)通過工業(yè)革命突破,智力上的桎梏則要交給人工智能來突破竞膳。
四劈彪,最后
不要小看機(jī)器學(xué)習(xí),這必將成為人類世界的一種新的思維方式顶猜,滲透入各行各業(yè)沧奴。
更不要小看人類,因?yàn)槭侨祟愒斐隽藱C(jī)器长窄,這是人類“善假于物”特性在當(dāng)代最完美的演繹滔吠。
人類,永遠(yuǎn)能在自己有限的能力范圍內(nèi)挠日,做出驚天動(dòng)地的偉業(yè)疮绷!