透過現(xiàn)象看本質(zhì),通過洞悉事物的本質(zhì)匙隔,達到預(yù)測未來疑苫。最近在看《認(rèn)知科學(xué)與廣義進化論》,系統(tǒng)科學(xué)的闡述了如何預(yù)測未來的建模方法纷责,滿滿的干貨捍掺,與大家分享。
一再膳、
所謂分析的本質(zhì)就是對比分析挺勿,沒有對比,分析無從談起喂柒。辨別事物之間的差別是認(rèn)知的基礎(chǔ)不瓶,只有將A和B、C灾杰、D……區(qū)分開來蚊丐,才對A進行分析、研究艳吠。
世界上任何兩樣?xùn)|西都是不同的麦备,“世界上沒有兩片樹葉是完全一樣的”。但我們認(rèn)識事物不可能從一片片樹葉開始昭娩,這樣效率太低凛篙。取過你手邊任意一本書,這幾百頁紙栏渺,沒有任何兩張是完全一樣的呛梆,但你不可能去一張一張地分別研究。
一開始磕诊,我們大腦中并不存在“紙”的概念填物,碰到這樣一個東西,對我們來說是全新的秀仲,我們對它充滿好奇融痛,把它拿過來,看它神僵、抓它雁刷、揉它、撕碎它保礼、聞它沛励、舔它、摸它炮障、把它點著目派、扔出去……又遇到一個這樣的東西,我們繼續(xù)把玩胁赢。直到我們再也找不出新的玩法來企蹭。慢慢,我們發(fā)現(xiàn),有些東西很像谅摄。它們看起來樣子很像徒河,摸起來手感很像,拿起來重量差不多……
我們覺得送漠,這些很像的東西不必一個個都調(diào)動我們所有的感官知覺細(xì)細(xì)研究了顽照。我們可以將它們歸成一類。由此闽寡,分類產(chǎn)生了代兵。這標(biāo)志著我們認(rèn)知效率有了質(zhì)的飛躍。
世界上的紙張不計其數(shù)爷狈,一張張把玩的話植影,窮極我們一生也無法做到。現(xiàn)在涎永,我們只要拿幾張何乎,琢磨透。下回再遇到一個新東西土辩,我們只要認(rèn)為它屬于“紙”這個分類支救。那么,我們就會“預(yù)測”它擁有跟這個分類所具有的同樣的外觀(尺寸拷淘、反光度各墨、薄厚…)、手感启涯、密度……
二贬堵、
我們說要“透過現(xiàn)象看本質(zhì)”,實際上是有三個步驟:
分類——建立類別结洼,并且命名黎做;
歸類——透過現(xiàn)象判定事物所屬的分類;
預(yù)測——通過已有分類的模型松忍,進行預(yù)測蒸殿。
拿電腦來打個比方,三個步驟:
分類——建一個文件夾鸣峭,命名為“我的音樂文件”宏所;
歸類——遇到一個文件,觀察它的特征摊溶,比如文件名后綴爬骤、圖標(biāo)。如果有“音樂文件”的特征莫换,將其放入這個文件夾霞玄;
預(yù)測——文件夾中的所有文件都可以用音樂播放器打開等等
三骤铃、
分類——建立類別的過程,就是特征抽取的過程坷剧,也是建立模型的過程劲厌。
我們把一個具體的事物變成一個抽象的模型,就是抽取出其中的關(guān)鍵特征听隐,以及分析特征之間的相互關(guān)系,得出的結(jié)果就是一個模型哄啄。在對紙張的接觸中雅任,我們不斷學(xué)習(xí)關(guān)于它的特征,這些特征慢慢地都成為被模型的一部分:重量較輕咨跌、可撕碎沪么、不防水、可塑性(折紙)……最后锌半,我們還給這個模型取了個名字禽车,叫作“紙張”。
模型刊殉,是我們以后用來“看本質(zhì)”的預(yù)備知識殉摔。模型,是我們觀察世界的眼睛记焊。沒有眼睛(模型)逸月,我們什么都看不見。準(zhǔn)確來說遍膜,是:沒有模型碗硬,我們看世界,只是停留在很低的分辨率上瓢颅。就像一般人看星空恩尾,只會看到滿天繁星——如果是連“星星”模型都還沒建立的嬰孩,連“滿天繁星”的概念都得不出挽懦,只會覺得好多東西在閃閃發(fā)光翰意。
但是,如果我們建立了星座信柿、銀河猎物、恒星、行星的模型角塑,同樣是肉眼蔫磨,我們就能夜空中觀察到更多信息,也就說圃伶,我們觀察世界的分辨率提升了堤如。獲取更多的模型蒲列,我們能看到更寬廣的世界。我們不是生活在客觀世界中搀罢,我們是生活在思想家們給我們建立的世界中蝗岖。
歸類——任何現(xiàn)象都有著紛繁復(fù)雜的表象。
歸類時榔至,我們就像一個偵探來到亂糟糟的犯罪現(xiàn)場抵赢,所作的第一步就是判斷哪些是可以用來偵破的線索,哪些不是唧取。有時候可能一個關(guān)鍵線索就能做出判斷铅鲤,但更多時候需要找到好幾塊線索才能拼出一個完整的拼圖。
在人工智能技術(shù)中枫弟,把這步驟叫做特征抽取邢享。特征抽取的目的是為了類別判定(斷案)。同樣的特征淡诗,在不同模式中有著不同的含義骇塘。如下圖中箭頭所指向的點,若整幅圖被判定為兩張相對的人臉韩容,這個點就被視作鼻尖款违;若被判定為一個花瓶,這個點就被視為凹進去的瓶頸群凶。
當(dāng)然奠货,如果這個模型已經(jīng)被熟練掌握,甚至達到了自動化的程度座掘。那整個特征抽取和類別判定的速度是極快的递惋。就像上述案例中的花瓶模型和人臉模型,已經(jīng)成為我們潛意識中的一部分溢陪。我們對它們的識別萍虽,也就在電光火石之間完成了。
預(yù)測——這是我們學(xué)習(xí)模型形真、掌握模型的目的所在杉编。
如果一個模型沒有預(yù)測能力,那是沒有意義的模型咆霜。就像在上述文件夾的例子中邓馒,如果我們不是只把音樂文件放入其中,而是胡亂分類蛾坯,那我們就無法預(yù)測其中的文件有什么特征光酣。
回到紙張的案例上來。當(dāng)我們?nèi)松械谝淮斡龅郊垙埖臅r候脉课,充滿了好奇救军。我們把玩财异、好奇、探索紙張的各種性質(zhì)唱遭,直到厭倦——這意味著再也難從紙張中挖掘出新的屬性了戳寸,也意味著“紙張”這個模型也在我們腦中建立起來了。當(dāng)我們再“看到”一個東西拷泽,如果被我們歸類為“紙張”疫鹊,我們不用去摸、去揉司致、去折拆吆,也能預(yù)測這個物體一定也具備紙張的其他特征:重量較輕、可撕碎蚌吸、不防水、可塑性(折紙)……
透過現(xiàn)象看本質(zhì)(第一性)砌庄「耄看本質(zhì)的目的,是為了更好的預(yù)測娄昆。而預(yù)測的目的佩微,是為了能夠更有效地操作。
在Elon musk對電池成本分析所建立的模型中萌焰,決定電池成本的哺眯,是組成電池的各種物理成分的成本。由此扒俯,他“預(yù)測”鋰電池的價格還有巨大的下降空間奶卓。這個預(yù)測成為他整個商業(yè)戰(zhàn)略的基石假設(shè)。無疑撼玄,他建立的這個模型是非常成功的未巫,所以電池成本的下降速度也在他的預(yù)測范圍之內(nèi)兜辞。
四、
剛剛,我們談到了建立模型追城。模型,聽起來很高大上霞揉。而且現(xiàn)在還有種輿論在助長這種傾向有额,把“模型”提升到了一個很神秘的高度。但如果你看完上文所述的那些例子慕蔚,會覺得其實模型也不過如此丐黄。其實的確也是這樣的。建模是我們智人與生俱來的本事孔飒。人人都會孵稽,并不神秘许起。而我們在日常生活中就在不斷建模,不斷預(yù)測菩鲜。
一個人哪怕電視看多了园细,也能建立一些劇情的模型。比如看武俠片多了接校,我們都能總結(jié)出:“跳崖升級模型”:
當(dāng)主人公被逼到懸崖邊上時猛频,一定會“被迫”跌下去。墜崖以后肯定非但是重傷不死蛛勉,還會因此遇到“傳說中”的前輩教他某某絕技鹿寻,或者得到什么仙草妙藥,再不濟也能撿到一本傳說中的武功秘籍然后發(fā)揮小強精神苦練成為高手高手高高手诽凌≌毖總而言之,不墜崖則已侣诵,一墜則是成為頂尖高手的人生轉(zhuǎn)折痢法!
而且這種模型的建立,大部分時候無需意識的參與杜顺,“唯手熟爾”财搁。人的記憶分為故事型和模型型兩種,但這并不是截然對立的兩種類型躬络,而更像一個連續(xù)光譜的兩端尖奔。故事在反復(fù)使用的過程中,那些被頻繁提取的特征和各故事共同的特征被加強穷当,而多余的信息則被忘卻提茁,逐步被精煉成能在適當(dāng)時機調(diào)用,而且預(yù)測能力很強的模型馁菜。
模型并不高大上甘凭。老農(nóng)使用諺語(模型)來預(yù)測未來“晚霞不出門,朝霞行千里”火邓。雖然聽起來很土丹弱,但從預(yù)測效力來說,比之于現(xiàn)代的天氣預(yù)報差距并不是太遠铲咨。
那么躲胳,聽起來好像這種建立模型,使用模型的能力纤勒,人人都有坯苹,人人都會。但是摇天,為什么有些人的人認(rèn)知能力更強粹湃,看問題更深刻呢恐仑?今天太晚了,后續(xù)分享为鳄。