2018年5月31日 Lee公子 文 于杭州
自己的工作內(nèi)容與數(shù)字的交集算是比較多——在商業(yè)項(xiàng)目中淳蔼,往往需要大量的數(shù)字證明來提供給各類人士決策(上級(jí)領(lǐng)導(dǎo)、集團(tuán)管理層裁眯、外部投資人鹉梨、政府部門等),結(jié)合長期量化分析的工作體會(huì)穿稳,談?wù)勛约簩?duì)“數(shù)字”和“量化”的局限性理解存皂。
第一,任何數(shù)字拿出來說事兒逢艘,必須要有充分的前提假設(shè)旦袋,不說前提,只說數(shù)字結(jié)論的它改,除非是溝通雙方早已經(jīng)明確了前提假設(shè)條件疤孕,否則統(tǒng)統(tǒng)是胡說八道。
第二央拖,任何數(shù)字的意義祭阀,都來源于比較,因此一定有一個(gè)潛在的比較標(biāo)準(zhǔn)物或者標(biāo)準(zhǔn)值鲜戒,不說這個(gè)比較值的专控,統(tǒng)統(tǒng)沒有意義。而這個(gè)比較值的選擇遏餐,卻絕不是客觀的和唯一的伦腐,出于各種目的或者立場,可以主觀選擇各種值作為比較值失都,完全可以讓數(shù)字的意義變得千差萬別柏蘑,公說公有理,婆說婆有理粹庞。
第三咳焚,任何數(shù)字,都有其測定數(shù)據(jù)的時(shí)空范圍——超過測定數(shù)據(jù)空間范圍和時(shí)間范圍的東西信粮,數(shù)字就沒有意義了黔攒。不說清楚數(shù)字背后涵蓋的時(shí)間周期和空間范圍,數(shù)字就是胡說八道。
第四督惰,數(shù)字的意義存在于變化和比較中不傅,沒有變化,靜態(tài)的數(shù)字其實(shí)根本沒有什么用赏胚。
第五访娶,數(shù)字測量一定要有算法,而算法實(shí)際上是非常主觀的東西觉阅。
算法這種東西崖疤,完全取決于計(jì)算者的立場,要給什么人看典勇,以及要達(dá)到的目的劫哼,其實(shí)相當(dāng)主觀,而且是越復(fù)雜的算法越主觀割笙,我甚至還有一個(gè)體會(huì)权烧,越是高段位的專業(yè)人士,其算法越主觀伤溉,越是體現(xiàn)其個(gè)人意志般码。
加減乘除是最簡單直接的算法,也是相對(duì)來說最客觀的算法乱顾,但是對(duì)于一個(gè)大項(xiàng)目的財(cái)務(wù)模型或者投資模型板祝,就需要一套非常復(fù)雜的算法,這個(gè)算法中走净,要向閱讀者表達(dá)和突出哪些數(shù)字券时,要給內(nèi)部人看還是給外部人看,要讓這個(gè)項(xiàng)目成立還是不成立温技,都是計(jì)算者可以有足夠余地“操之在我”的事情革为。
由于“設(shè)計(jì)算法”屬于有較高專業(yè)門檻的工作,一般人能夠接觸到復(fù)雜算法的機(jī)會(huì)不多舵鳞,未必能夠真正理解我說的“算法的主觀性”。我沒有進(jìn)入過編程或者物理等領(lǐng)域琢蛤,僅僅是從商業(yè)領(lǐng)域來理解蜓堕,“算法的主觀性”絕對(duì)是“客觀”存在的。
第六博其,數(shù)字的測量需要依靠各種儀器套才、設(shè)備、技術(shù)手段來獲取慕淡,而這些東西的精準(zhǔn)度和測量方法卻不見得客觀背伴。
舉幾個(gè)例子:
- 我給家里父母買了智能測血壓的手環(huán),手環(huán)從來顯示我父親的血壓都是正常的,但是我父親根據(jù)其他血壓計(jì)測量結(jié)果和自身感受傻寂,血壓是偏高的息尺;
- 我買了激光測距儀,和傳統(tǒng)的工程卷尺測出來的結(jié)果比較疾掰,還是有一定的差異搂誉,我并不清楚是我的激光測距儀不準(zhǔn),還是卷尺不準(zhǔn)静檬,還是測試時(shí)候方法產(chǎn)生的誤差炭懊。
- 兩塊手表,如果時(shí)間對(duì)不上拂檩,你就會(huì)完全搞不清楚所謂的“準(zhǔn)確時(shí)間”到底是什么侮腹。
- 我還聽說這種段子,某北方高污染城市稻励,為了不讓PM2.5數(shù)值爆表凯旋,減少政府的輿論壓力,安排在采集數(shù)據(jù)的幾個(gè)區(qū)域的街道上钉迷,頻繁灑水——市民看到的PM2.5數(shù)據(jù)怎么可能有客觀性至非?
第七,數(shù)字的解讀其實(shí)是非常主觀的東西糠聪。
數(shù)字的解讀完全看解讀者的目的荒椭,除了更換標(biāo)準(zhǔn)參照物可以完全改變數(shù)字的意義之外,還可以用很多帶有感情或者渲染色彩的形容詞賦予數(shù)字某種意義舰蟆。
第八趣惠,數(shù)字的呈現(xiàn)方式其實(shí)是需要精心設(shè)計(jì)的味悄,包含了表達(dá)者的主觀意圖塌鸯。
無論是在宣講的PPT中還是宣傳廣告中侍瑟,數(shù)字的呈現(xiàn)方式都是需要精心設(shè)計(jì)的,其中一定傳遞了表達(dá)者的意圖涨颜。
例如庭瑰,一組數(shù)據(jù)為了突出市場巨大督暂,可能要用對(duì)比強(qiáng)烈的柱狀圖來表現(xiàn)逻翁,而不用餅圖或者列表來表現(xiàn);一個(gè)數(shù)據(jù)為了突出其特殊意義辽社,讓觀眾看到,可能會(huì)被特意加粗汉匙、變紅噩翠、放大、居中……
第九屯援,量化是一種對(duì)于被描述的客體的“降維”過程,客體的豐富屬性在量化或者數(shù)字化的過程中被剝奪和極端簡化吉懊,被量化的東西其實(shí)都是被降維簡化的東西,并不真實(shí)。
要真正理解這一點(diǎn)不太容易甲锡,不過我可以舉一個(gè)例子:一個(gè)梨和一個(gè)蘋果其實(shí)無法直接相加或者相減,因?yàn)樗麄冇小袄妗焙汀疤O果”這樣的具體自然屬性(或者個(gè)性)相互區(qū)別缸废;但是如果把“梨”和“蘋果”降維簡化為“水果”,那么他們就可以相加變成兩個(gè)“水果”届巩,個(gè)性被消除了,你理解和記住他們變得容易了,但是這樣的量化結(jié)果卻離真實(shí)很遠(yuǎn)缺谴。
再比如,錢就是一些量化的數(shù)字,但是做投資的人苫纤,最重要的思維就是要還原這些量化數(shù)字背后的屬性祝高,必須把錢分出結(jié)構(gòu)乍赫,分出屬性惋增,分出輕重緩急,分出好壞善惡改鲫,分出貴賤诈皿,分出長短期……你只有把抽象成一維的這些資金的數(shù)字稽亏,還原為具體的時(shí)空?qǐng)鼍跋碌膶?duì)應(yīng)事物讲弄,你才能夠真正理解資金瓶摆,才能進(jìn)一步掌握它书斜。
只會(huì)看數(shù)字這種低維信息的人焙糟,理解力也會(huì)被“降維打擊”。
區(qū)分投資高手和庸手之間的區(qū)別样屠,關(guān)鍵就在于是否能夠?qū)?shù)字進(jìn)行正確的“升維還原”穿撮,看清真相,掌控現(xiàn)實(shí)业踢,而不是唯“數(shù)字論”栗柒,用各種“率”各種“值”各種“百分比”來理解現(xiàn)實(shí)。
要提醒一點(diǎn)知举,越是復(fù)雜度高的領(lǐng)域傍衡,其被強(qiáng)行量化后得出的結(jié)論的可信度越低深员,因?yàn)樵诹炕^程中被“降維”抽象掉的屬性會(huì)越多——復(fù)雜的東西被量化后只是方便人理解和記憶负蠕,方便觀點(diǎn)的傳播蛙埂,但是這種東西根本不是真相,甚至遠(yuǎn)離真相遮糖。例如绣的,把一個(gè)國家的經(jīng)濟(jì)發(fā)展水平簡化為GDP,把一個(gè)城市的房地產(chǎn)市場簡化為房價(jià)指標(biāo)欲账,把國際經(jīng)濟(jì)趨勢簡化為看美元指數(shù)屡江,把國際貿(mào)易興衰簡化為看一個(gè)波羅的海干散貨指數(shù)等等,根本都不靠譜赛不。
第十惩嘉,數(shù)據(jù)統(tǒng)計(jì)不能做因果判斷,只能提供相關(guān)性證明踢故。
在醫(yī)學(xué)和生物學(xué)領(lǐng)域文黎,最為搞笑的科學(xué)統(tǒng)計(jì)便是日均食鹽攝入量與高血壓發(fā)病率的關(guān)系。"科學(xué)"的"統(tǒng)計(jì)數(shù)據(jù)"除了能揭示這兩者間存在相關(guān)性殿较,再不能說明任何實(shí)質(zhì)問題耸峭。借助于統(tǒng)計(jì)學(xué),我們確實(shí)可以將食鹽攝入過多解釋為高血壓的致病原因淋纲。但是同樣根據(jù)統(tǒng)計(jì)學(xué)劳闹,中醫(yī)們也可以說因?yàn)槟承┪麽t(yī)們不懂的原因,比如"腎虛"洽瞬,人們會(huì)出于生理本能而在不知不覺當(dāng)中加大了食鹽的日常攝入本涕,并且最終會(huì)因?yàn)?腎虛"而非鹽分過多才導(dǎo)致血壓增高。這種中西醫(yī)基礎(chǔ)觀念的有趣博弈教育了我們:千萬別迷信統(tǒng)計(jì)學(xué)的種種因果判斷伙窃,統(tǒng)計(jì)學(xué)僅提供相關(guān)性的證明菩颖。