一晨仑、分類模型
1.舉例胖喳,幾十年前歇终,如果你是華爾街投資人洒嗤,對于Amazon公司利朵,你覺得它是否有投資價值煌妈?
a坤塞,有投資價值焕济,因為他是info公司慢味,所以有投資價值(信息公司則不然)
b场梆,沒有投資價值,因為他不過是delivery纯路,所以沒有投資價值(因為現(xiàn)在已經(jīng)有了很多運(yùn)輸公司UPS或油,EPX,而且這個行業(yè)的利潤非常背刍!)
2.你看顶岸,不同的分類,造成了對不同公司的分類叫编,從而也導(dǎo)致了你是否會投資成功辖佣,所以,怎么進(jìn)行分類是關(guān)鍵搓逾!
我們可以把a(bǔ)和b看成兩個盒子卷谈,其實盒子就是我們對社會的認(rèn)知和框架,所以選擇哪個盒子(a或b或其他)反映出你怎樣對事物分類的霞篡,也將會影響你對這些事物的思考世蔗,還會影響你所做出的決定端逼。
3.Lump to live——為了生活,必須把東西捏成團(tuán)凸郑。其隱喻就是裳食,為了理解世界,我們創(chuàng)造了這些團(tuán)塊芙沥、盒子诲祸、各種分類,我們看到一輛車而昨,我們不會說那是幾幾年的什么款式的車(除非你是專業(yè)人士)救氯,而是會說那是一輛卡車、跑車等歌憨。我不會把事物分得一清二楚着憨,我只會將事物分門別類 這些都是為了便捷 它們幫助我們理解世界 再想想我們建立模型的原因。原因之一就是用模型幫助我們 做出決定务嫡、制定策略甲抖、進(jìn)行設(shè)計 所以把東西混在一起 有助于我們更快作出決定 我們將事物分類 說這一件我喜歡 這一件我不喜歡 這一件有風(fēng)險 這一件沒風(fēng)險
4.我們會用方差來表示物體的差值,因為平方之后不僅讓數(shù)值變成了正數(shù)好比較心铃,而且會讓數(shù)據(jù)之間細(xì)微的差異顯得明顯很多准谚,這也方便我們觀察。
步驟:
①我們會先算整體的mean(平均值)
②然后通過每個值與平均值的比較去扣,得出結(jié)果柱衔,然后平方,最終得到方差愉棱。
③然后我們加起來得到總的方差和唆铐,英文詩total variations(總方差)
R squared-R平方:表示通過那個簡單的分類,解釋的方差的百分比奔滑。(即為方差/總方差的百分?jǐn)?shù))
R的公式.png
0-------------R--------------1(R 距離0和1的值艾岂,取決于數(shù)據(jù)的準(zhǔn)確性)
!E笃洹王浴!專家與非專家之間的一個區(qū)別就是:專家傾向于more boxes,也就是更多的分類令宿,也就是在某個領(lǐng)域叼耙,分得越來越細(xì)腕窥,也就是越來越接近分子成面粒没,就是我們可能是看到森林,而他已經(jīng)看到了數(shù)目簇爆,這就是專家和普通之間的區(qū)別癞松。
K觥!响蓉!記住硕勿,correlation≠causation(相關(guān)性≠因果關(guān)系)
eg:就像一般有很好的馬術(shù)場的學(xué)校其學(xué)校的排名就會高很多,但是你不能說學(xué)校排名高是因為擁有好的馬術(shù)場枫甲,我們是只能說統(tǒng)計數(shù)據(jù)顯示有相關(guān)性源武,而不能推導(dǎo)出因果性,這點要注意想幻。
我們還可以這么想粱栖,這個世界有一個總的total variations,我們的創(chuàng)造各種不同的盒子脏毯,目的就是為了讓R的值接近100%闹究,這樣我們就能夠更好的理解這個世界,對世界的理解和預(yù)測可以更包容和準(zhǔn)確食店。
more 方差(R)→分類越好 ? more boxes →more 方差(R)
互逆過程渣淤。