機(jī)器學(xué)習(xí)方法的本質(zhì)是什么?

機(jī)器學(xué)習(xí)方法本質(zhì)上是人類認(rèn)知方式的新世界妙同,是人類的未來斧抱。

工業(yè)革命解放了人類的體力,以機(jī)器學(xué)習(xí)技術(shù)逐步解鎖的人工智能革命將解放人類的腦力渐溶。

這不是技術(shù)層面上的進(jìn)步辉浦,而是從根本上改變?nèi)祟愓J(rèn)知世界的方式。

長久以來茎辐,人類對(duì)事物的認(rèn)知經(jīng)由三個(gè)步驟:原始數(shù)據(jù)——專業(yè)知識(shí)/經(jīng)驗(yàn)常識(shí)——認(rèn)知宪郊。

這里的原始數(shù)據(jù)指得是可被人類感知到的一切客觀存在之總體,既包括理工范疇內(nèi)的計(jì)量數(shù)據(jù)拖陆,亦包括文史范疇內(nèi)的事件與現(xiàn)象弛槐。

面對(duì)同樣的原始數(shù)據(jù)(股市數(shù)據(jù),儀表指數(shù)依啰,社會(huì)現(xiàn)象等)乎串,擁有不同知識(shí)的人將得出不同的認(rèn)知;同樣速警,擁有相同知識(shí)的人叹誉,面對(duì)沒有數(shù)據(jù)、有少量數(shù)據(jù)闷旧、有大量數(shù)據(jù)以及有充分?jǐn)?shù)據(jù)等不同情況時(shí)长豁,也將得出不同的認(rèn)知(信息均等博弈,信息不對(duì)稱博弈)忙灼。

那么究竟是知識(shí)重要還是數(shù)據(jù)重要匠襟?

在人類歷史很長一段時(shí)間內(nèi)钝侠,無疑是知識(shí)的擁有者占據(jù)了上風(fēng)。

而機(jī)器學(xué)習(xí)方法的出現(xiàn)酸舍,則將這個(gè)趨勢(shì)徹底扭轉(zhuǎn)帅韧。

或許,“知識(shí)”未來將一文不值啃勉,而“數(shù)據(jù)”忽舟,才是價(jià)值連城。

機(jī)器學(xué)習(xí)的本質(zhì)璧亮,就在于建立了(原始數(shù)據(jù)——認(rèn)知)之間的直接映射,跳出了“知識(shí)”的束縛斥难。

從此枝嘶,人類的認(rèn)知方式改天換地。

因?yàn)檠普铮瑥拇宋覀兓蛟S再也不需要那冗桎的“知識(shí)”群扶。

一,什么是“知識(shí)”:

事實(shí)上镀裤,“知識(shí)”也產(chǎn)生于“數(shù)據(jù)”竞阐。

因?yàn)槿祟惾俊爸R(shí)”的產(chǎn)生過程如下:

1)最初的人類不具備任何“知識(shí)”。

2)人類所取得的任何“新的知識(shí)”暑劝,都是靈感來源于“數(shù)據(jù)”骆莹、推導(dǎo)基于“已有知識(shí)”、驗(yàn)證于“數(shù)據(jù)”担猛。

所以幕垦,所謂“知識(shí)”,只是對(duì)數(shù)據(jù)之間客觀聯(lián)系全部總體的系統(tǒng)化傅联、邏輯化先改、因果化了的描述方式,正如“系統(tǒng)”蒸走、“邏輯”仇奶、“因果”這三個(gè)詞背后所代表的哲學(xué)意義一樣,都是客觀上并不存在比驻,只是被我們?nèi)祟惾藶榈貏?chuàng)造出來用于認(rèn)知的工具而已该溯。

用以憑借人腦這一低效的處理器與存儲(chǔ)器去理解這無限復(fù)雜的世界而不得不妥協(xié)的產(chǎn)物。

更直接地說别惦,“知識(shí)”其實(shí)并不是客觀存在朗伶,只不過因?yàn)槿四X無法存儲(chǔ)處理這世間所有的(“數(shù)據(jù)”——“認(rèn)知”)關(guān)系,而妥協(xié)生成的一種中介機(jī)制步咪、一種簡化機(jī)制论皆,以便于人類去理解相關(guān)“數(shù)據(jù)——認(rèn)知”關(guān)系對(duì)的模塊化的橋梁。例如“標(biāo)簽化”,正因?yàn)槿四X無法存儲(chǔ)也無法分析所有“河南人”“廣東人”的數(shù)據(jù)点晴,所以我們生成了類如“河南小偷多”“廣東人吃福建人”這樣的標(biāo)簽用于簡化我們對(duì)河南人與廣東人的認(rèn)知感凤。拋開這兩個(gè)玩笑性質(zhì)的“標(biāo)簽”不談,事實(shí)上現(xiàn)實(shí)生活中我們對(duì)特定職業(yè)粒督、特定階層陪竿、特定民族所貼上的一些“標(biāo)簽”,本質(zhì)上往往是基于最大似然估計(jì)的屠橄,這樣當(dāng)我們?cè)跊]有更多后驗(yàn)信息的條件下與一個(gè)完全陌生的人打交道時(shí)族跛,我們通過這些標(biāo)簽?zāi)軌蚋咝У匾宰畲蟾怕实墨@取對(duì)此人的最近似的認(rèn)知。

其實(shí)锐墙,人類的一切“知識(shí)”都只不過是各種形式的“標(biāo)簽”而已礁哄,從而通過對(duì)某一特定族類數(shù)據(jù)的特殊化處理,實(shí)現(xiàn)高效理解能力的一種簡化方式溪北。

當(dāng)然桐绒,這種簡化背后所損失掉的,是精確性之拨。因?yàn)閷?duì)事物的本質(zhì)最好的解釋依然是事物本身茉继,或者說,是人類可以感知到的有關(guān)該事物的全部數(shù)據(jù)本身蚀乔。就好比烁竭,要解釋什么是蘋果,最好的方法就是遞過去一個(gè)蘋果說:“諾吉挣,這是個(gè)蘋果颖变。”听想。而其它的類似于“蘋果就是圓圓的腥刹,一般為紅色的,酸甜多汁的一種水果”這樣的“知識(shí)”無論多么精確汉买,都只是人類面對(duì)自己有限的認(rèn)知能力條件下的一種只好挑選出一些“簡化特征”的妥協(xié)而已衔峰。

二,什么是機(jī)器學(xué)習(xí)

人腦處理能力不足因而需要“知識(shí)”來簡化運(yùn)算蛙粘,但電腦不需要垫卤,相比于人腦,電腦的運(yùn)算能力幾乎是無限的出牧。

所以穴肘,電腦足以也必須擔(dān)負(fù)起拋開“知識(shí)”的束縛,直接建立(“數(shù)據(jù)”——“認(rèn)知”)關(guān)系庫舔痕,從而以更加深邃评抚、更加貼近世界本來面貌的視角去認(rèn)知世界的重任豹缀。

這便是機(jī)器學(xué)習(xí)的本質(zhì)。

說完了本質(zhì)慨代,那么邢笙,機(jī)器學(xué)習(xí)具體究竟是怎么樣的一種方法呢?

這是一種全新的思維方式侍匙。

機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)范式可以表達(dá)如下:

對(duì)于一個(gè)Task及其Performance的度量方法氮惯,給出特定的Algorithm,能夠通過利用Experience Data不斷提高在該Task上的Performance的方法想暗,就稱為機(jī)器學(xué)習(xí)妇汗。

其實(shí)這個(gè)定義就是“學(xué)習(xí)”的全部含義,這個(gè)事情按照機(jī)器的思路來做说莫,就是機(jī)器學(xué)習(xí)杨箭。

舉現(xiàn)在最火的Alpha:GO(也就是計(jì)算機(jī)圍棋學(xué))的例子,不妨設(shè)此處的“Task”就是一步棋路唬滑,“Performance”就是最后的勝率告唆,“Experience Data”就是以往的棋譜棺弊。然后設(shè)計(jì)出一個(gè)Algorithm晶密,使得構(gòu)建出的“這步棋我該走到哪里呢——模型”能通過利用過往數(shù)據(jù)而取得“Performance:勝率”的提高。

為了實(shí)現(xiàn)每次利用Experience data對(duì)Performance的提升模她,當(dāng)前最主流的方法就是“誤差反向傳播法”稻艰。這種方法的核心思想就是:讓機(jī)器自由去試錯(cuò),然后根據(jù)嘗試的結(jié)果與樣本的真實(shí)結(jié)果之間的誤差反向調(diào)整試錯(cuò)策略侈净。誤差較小的嘗試要獎(jiǎng)勵(lì)尊勿,誤差較大的嘗試給予懲罰,然后將這個(gè)嘗試過程一直循環(huán)進(jìn)行下去畜侦,直到多學(xué)習(xí)到的結(jié)果在所有樣本上的表現(xiàn)達(dá)到我們所定義的最優(yōu)元扔。通俗來說,這與訓(xùn)練一條狗去服從我們的指令或是訓(xùn)練自己完成題集上的全部習(xí)題等過程并沒有什么區(qū)別旋膳。

有了“誤差反向傳播”算法澎语,Alpha:GO們就可以通過每次利用“Experience data:棋譜”使得自己下棋的勝率提高一點(diǎn)點(diǎn)。這便是一個(gè)機(jī)器學(xué)習(xí)方法的實(shí)例验懊。

因?yàn)檫@個(gè)“下棋機(jī)器”從歷史的數(shù)據(jù)中確實(shí)學(xué)到了點(diǎn)什么擅羞。

講到這里,可能有人會(huì)感覺义图,似乎機(jī)器學(xué)習(xí)很弱雞啊减俏,隨便一個(gè)棋手看看以前的棋譜也都可以學(xué)到點(diǎn)什么啊。

幸運(yùn)的是或者(對(duì)于柯潔們來說)不幸的是碱工,對(duì)于機(jī)器而言娃承,“學(xué)到點(diǎn)什么”就等價(jià)于“學(xué)到了全部”奏夫。

因?yàn)樗梢浴耙恢睂W(xué)”。

只要有了:

1)合理的算法保證每次對(duì)Experience Data的學(xué)習(xí)都能使Performance提高一點(diǎn)點(diǎn)草慧,

2)足夠的運(yùn)算能力桶蛔。

這兩點(diǎn)設(shè)計(jì),機(jī)器的能力必將達(dá)到極值漫谷,在可獲取的Experience Data約束范圍內(nèi)的極值仔雷。因?yàn)闄C(jī)器可以一夜之間學(xué)遍所有棋譜,包括古譜舔示、網(wǎng)絡(luò)棋譜碟婆、以及自己和自己下的棋譜。而且還能神tm能保證每次進(jìn)步一點(diǎn)點(diǎn)惕稻。

而人類棋手窮極一生可能做到這點(diǎn)嗎竖共?

所以人類棋手進(jìn)步的通道更多的轉(zhuǎn)向了聽取前輩的教誨,鉆研棋理俺祠,總結(jié)技巧公给,或者說,轉(zhuǎn)向了“知識(shí)”蜘渣,人類各行各業(yè)的佼佼者歸根結(jié)底都是知識(shí)的“富有者”淌铐。

其實(shí),在人類的學(xué)習(xí)中蔫缸,也有類似于機(jī)器學(xué)習(xí)的學(xué)習(xí)過程腿准,那便是基于千百次嘗試中通過“懲惡揚(yáng)善”所積累出的個(gè)人經(jīng)驗(yàn)或直覺本能。只可惜拾碌,對(duì)于人類來說吐葱,這部分“學(xué)習(xí)結(jié)果”是無法共享的,一個(gè)老司機(jī)的開車能力是一個(gè)新手通過怎樣的言傳身教都無法企及的校翔。

而對(duì)機(jī)器而言弟跑,第一不依賴于知識(shí),只要有足夠多的病例數(shù)據(jù)防症,在完全沒有任何醫(yī)學(xué)基礎(chǔ)的條件下也可以通過合理的算法對(duì)疾病進(jìn)行診斷孟辑,且準(zhǔn)群度媲美甚至遠(yuǎn)超一眾經(jīng)驗(yàn)豐富的“老中醫(yī)”;第二告希,學(xué)習(xí)結(jié)果在機(jī)器間可以共享扑浸,一臺(tái)機(jī)器(或者說一套算法)達(dá)到了某一高度,所有的機(jī)器便都可以達(dá)到這樣的高度燕偶。(沒錢買不起設(shè)備喝噪?沒錢買不起數(shù)據(jù)?沒錢買不起程序指么?)酝惧。

三榴鼎,人類學(xué)習(xí)與機(jī)器學(xué)習(xí)

正因?yàn)橛?jì)算與處理能力的差別,導(dǎo)致了人類與機(jī)器在學(xué)習(xí)方法上的差異晚唇。

機(jī)器計(jì)算能力無窮無盡巫财,所以機(jī)器學(xué)習(xí)很粗暴,有多少哩陕,學(xué)多少平项。其最終能達(dá)到的高度只取決于數(shù)據(jù)量。

當(dāng)數(shù)據(jù)量充足時(shí)悍及,機(jī)器學(xué)習(xí)方法所能得到的結(jié)果闽瓢,可無限逼近于事物的本質(zhì)面貌。

不需要理論心赶,不需要知識(shí)扣讼。

或者說,機(jī)器通過對(duì)海量數(shù)據(jù)進(jìn)行學(xué)習(xí)所得到的結(jié)果缨叫,就是該問題最終極最權(quán)威的“理論”與“知識(shí)”椭符。只是,“不足為外人道哉”耻姥,這是一種隱式的(知其然不知其所以然)“知識(shí)”销钝。

就好比,Alpha:GO并不懂棋理咏闪,也說不出什么理論基礎(chǔ)曙搬,它只知道怎么下能贏摔吏,至于為什么要這么下鸽嫂,它自己無法解釋,誰也無法解釋征讲。

但這并不妨礙我們認(rèn)可Alpha:GO已掌握了圍棋的真諦据某。

而人類計(jì)算能力有限,不可能做到對(duì)全部數(shù)據(jù)的充分學(xué)習(xí)诗箍。因而人類轉(zhuǎn)向了一種“分布式”的處理方式癣籽,將每個(gè)人做為一個(gè)獨(dú)立的處理單元各自做出一點(diǎn)微不足道的小貢獻(xiàn),同時(shí)建立起“知識(shí)”這一顯式的(可閱讀滤祖,可解釋的)抽象表示事物關(guān)系的體系作為各個(gè)分布單元人之間傳輸信息的接口筷狼。

因此,人類盡管個(gè)體能力有限匠童,但人類這個(gè)群體卻是飛速發(fā)展埂材;同時(shí),作為無數(shù)個(gè)體“知識(shí)”的匯總而構(gòu)成的“科學(xué)”汤求,幫助著我們每個(gè)人類依靠著自身非常低效的處理能力俏险,也能對(duì)客觀事物給出相當(dāng)靠譜的解釋严拒。

這真是“我為人人,人人為我”的境界啊竖独。

從這個(gè)意義上裤唠,雖然人類的自身能力有限,但實(shí)際上人類卻發(fā)明了一種更為先進(jìn)的認(rèn)知系統(tǒng)莹痢。

用于突破造物主施加于人類之上的桎梏种蘸。

體能上的桎梏我們已經(jīng)通過工業(yè)革命突破,智力上的桎梏則要交給人工智能來突破竞膳。

四劈彪,最后

不要小看機(jī)器學(xué)習(xí),這必將成為人類世界的一種新的思維方式顶猜,滲透入各行各業(yè)沧奴。

更不要小看人類,因?yàn)槭侨祟愒斐隽藱C(jī)器长窄,這是人類“善假于物”特性在當(dāng)代最完美的演繹滔吠。

人類,永遠(yuǎn)能在自己有限的能力范圍內(nèi)挠日,做出驚天動(dòng)地的偉業(yè)疮绷!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市嚣潜,隨后出現(xiàn)的幾起案子冬骚,更是在濱河造成了極大的恐慌,老刑警劉巖懂算,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件只冻,死亡現(xiàn)場離奇詭異,居然都是意外死亡计技,警方通過查閱死者的電腦和手機(jī)喜德,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來垮媒,“玉大人舍悯,你說我怎么就攤上這事∷停” “怎么了萌衬?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長它抱。 經(jīng)常有香客問我秕豫,道長,這世上最難降的妖魔是什么抗愁? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任馁蒂,我火速辦了婚禮呵晚,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘沫屡。我一直安慰自己饵隙,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布沮脖。 她就那樣靜靜地躺著金矛,像睡著了一般。 火紅的嫁衣襯著肌膚如雪勺届。 梳的紋絲不亂的頭發(fā)上驶俊,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音免姿,去河邊找鬼饼酿。 笑死,一個(gè)胖子當(dāng)著我的面吹牛胚膊,可吹牛的內(nèi)容都是我干的故俐。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼紊婉,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼药版!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起喻犁,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤槽片,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后肢础,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體还栓,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年乔妈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蝙云。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片氓皱。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡路召,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出波材,到底是詐尸還是另有隱情股淡,我是刑警寧澤,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布廷区,位于F島的核電站唯灵,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏隙轻。R本人自食惡果不足惜埠帕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一垢揩、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧敛瓷,春花似錦叁巨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至狡蝶,卻和暖如春庶橱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背贪惹。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國打工苏章, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人奏瞬。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓布近,卻偏偏與公主長得像,于是被迫代替她去往敵國和親丝格。 傳聞我的和親對(duì)象是個(gè)殘疾皇子撑瞧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容