如果你是個數(shù)據(jù)分析師或者數(shù)據(jù)產(chǎn)品,大概率在面試過程中拆撼,會遇到過這樣令你崩潰的問題:
“如果開一家沙縣小吃容劳,估算下月收入流水大概多少丹泉?”
“估算深圳有多少個產(chǎn)品經(jīng)理?”
“估算此時此刻的世界上鸭蛙,有多少人正在挖鼻孔摹恨?”
......
這種看似無厘頭的問題,其實在數(shù)據(jù)面試中經(jīng)常會遇到娶视,如果面試者沒有一定的數(shù)學(xué)思維晒哄,第一反應(yīng)一定是...
如果你這么回答,或者胡亂瞎蒙一個數(shù)字肪获,那么恭喜你寝凌,可以準(zhǔn)備下一場面試了
但其實這個在考驗?zāi)愕臄?shù)據(jù)思維能力,如何在信息量有限條件下完成復(fù)雜問題的拆解孝赫,利用一些假設(shè)和經(jīng)驗估算出較精準(zhǔn)的答案较木。
這個也就是我今天要介紹的一種數(shù)據(jù)分析思維---費(fèi)米估算
它堪稱裝逼界的“愛馬仕”,熟練掌握青柄,可以裝逼于無形伐债,升職加薪,指日可待致开,是職場打拼峰锁、吹牛畫餅的必備工具。
一双戳、關(guān)于費(fèi)米問題(Fermi problem)
其實恩利克·費(fèi)米是美籍意大利著名物理學(xué)家虹蒋、學(xué)者,美國芝加哥大學(xué)物理學(xué)教授飒货,1938年諾貝爾物理學(xué)獎得主魄衅,有著“原子能之父”的稱呼。費(fèi)米建立了人類第一臺可控核反應(yīng)堆塘辅,讓人類從此進(jìn)入原子能時代晃虫,在這方面有著突出貢獻(xiàn)。
但是費(fèi)米也是一位善于啟發(fā)人的教育家莫辨,相比物理上的成就更著名的是他在芝加哥大學(xué)課堂上傲茄,提出的一個問題,這個問題造就了著名的“費(fèi)米估算”沮榜。
“芝加哥有多少個鋼琴調(diào)音師盘榨?”
初次聽到這個問題的學(xué)生們應(yīng)該跟大家反應(yīng)是一樣的懵逼,要解決這樣龐大復(fù)雜的問題蟆融,需要先了解解決費(fèi)米問題的第一個思想核心:邏輯拆解
其實費(fèi)米估算的方法就是把一個復(fù)雜的問題進(jìn)行拆解草巡,拆解到盡可能小的、可假設(shè)和計算的部分型酥,最后再把這些小問題的答案反推出費(fèi)米問題的結(jié)果山憨,只要在這個拆解和反推的過程中查乒,保證了一定的邏輯關(guān)系,那么最終的估算答案也會非常接近實際情況郁竟。
那我們現(xiàn)在來看下費(fèi)米是怎么計算調(diào)音師數(shù)量的
首先玛迄,費(fèi)米先把"有多少個鋼琴調(diào)音師"拆解成兩個問題:
為什么要拆解成這兩個問題呢?按照費(fèi)米估算的原則棚亩,在拆解的過程中需要保證一定的邏輯關(guān)系蓖议,且這個邏輯關(guān)系必須要保證能完全覆蓋估算費(fèi)米問題的所有范圍。當(dāng)然讥蟆,這個拆解的方式也不是唯一的勒虾,遵循以上的原則即可。
接下來對于問題①:“每年芝加哥全部調(diào)音師的工作時長”我們還是沒有辦法直接給出答案瘸彤,所以我們還需要繼續(xù)拆解:
同樣道理修然,我們對問題②:“每一位調(diào)音師每年的工作時間”再進(jìn)行一次拆解:
到這里后,我們拆解出了問題③~⑦质况,很顯然已經(jīng)不太適合繼續(xù)拆解了愕宋,像這類沒有必要再繼續(xù)拆解的問題我們稱為“費(fèi)米問題的基本問題”,而要想繼續(xù)完成接下來的工作拯杠,就需要用到費(fèi)米問題的另一個核心思想:問題估算
二掏婶、費(fèi)米估算方法
對于基本問題的估算方法啃奴,費(fèi)米給出了這樣的一個估算方法:
對于小問題的估算潭陪,不要估算其本身,而是先估算其上下界最蕾,然后在10倍的范圍內(nèi)估算出數(shù)值依溯,這種方法竟然能保證極高的準(zhǔn)確率。
問題③:芝加哥有多少架鋼琴瘟则?
費(fèi)米先估算了芝加哥總居民數(shù)是300萬(這個不用估算也基本能知道)黎炉,平均每個家庭有4個人(美國四人家庭居多),那么芝加哥估計會有75萬個家庭醋拧。這些家庭中有多少有鋼琴呢慷嗜?在當(dāng)時的美國,鋼琴屬于半稀缺物品丹壕,擁有鋼琴的家庭應(yīng)該不會超過1/2庆械,也不會低于1/10,因此費(fèi)米估算為1/3菌赖,那么全市大概會有25萬架鋼琴缭乘。
問題④:每架鋼琴每年調(diào)幾次音?
調(diào)音師不是常見的崗位琉用,調(diào)音次數(shù)應(yīng)該不會超過1年3次堕绩,也不會低于10年1次策幼,因此費(fèi)米估算為3年1次,也就是每架鋼琴每年平均需要調(diào)音0.33次奴紧。
問題⑤:每位調(diào)音師每次調(diào)多久特姐?
根據(jù)不同鋼琴調(diào)音工作的實際情況來看,每次調(diào)音不會超過10小時黍氮,也不會低于1小時到逊,因此費(fèi)米估算為3小時。
那么第一個問題滤钱,每年芝加哥全部調(diào)音師的工作時長就算出來了:
接下來我們估算下每位調(diào)音師每年的工作時間:
假設(shè)調(diào)音師一年工作250天觉壶,每天的工作時長算上往返路程估算是24h*0.6,那么他一年的工作時間:
這樣所有的問題都已經(jīng)估算出了結(jié)果件缸,最終調(diào)音師數(shù)量=249000/3600=69位
那么實際上有多少人呢铜靶?經(jīng)過費(fèi)米和學(xué)生們事后進(jìn)行電話號碼驗證,大概芝加哥市有80位調(diào)音師他炊,除去一些號碼重復(fù)的争剿,其結(jié)果竟然跟費(fèi)米估算的相差無幾!
三痊末、暗中幫忙的:平均律
以上的估算過程肯定有人會產(chǎn)生質(zhì)疑蚕苇,如果將費(fèi)米估算任意一個估算條件進(jìn)行改變,最終得到的結(jié)果不就會改變了么凿叠?確實我們沒有辦法保證每一次假設(shè)和估算都是完全準(zhǔn)確的涩笤,那么這里就涉及到費(fèi)米估算中用到的一個數(shù)據(jù)概念:平均律
他的原理是在任何一組計算中,估算帶來的錯誤都可以相互抵消盒件,所做的假設(shè)越多蹬碧,被抵消的概率就會越大。
換成數(shù)據(jù)分析的語言就是炒刁,你在假設(shè)或者猜測某一個小事件的時候恩沽,你的推測假設(shè)有可能有的過高,有可能有的過低翔始,如果這些“點”的數(shù)量足夠罗心,最終誤差就會被相互抵消,整體結(jié)果最終會呈現(xiàn)為一個平均值城瞎,這就是平均律理論渤闷。
其實就類似于上圖,我們確定一個估算上邊界全谤,以及一個估算下邊界(還記得前面我們做估算的時候在合理的1倍到10倍之間做的估算吧)肤晓,落在這個范圍里面的點都會趨向于平均值,落在平均值上的點和平均值下的點就會相互抵消消除,其結(jié)果也就趨于一個準(zhǔn)確值了补憾。
四漫萄、另一種思路:Top-down&bottom-up法則
除了上面介紹的將復(fù)雜問題按邏輯關(guān)系拆解成基本問題然后進(jìn)行估算和反推,解決費(fèi)米問題還有另一種思路盈匾,那就是Top-down&bottom-up法則
這個法則的中心思想:
這個聽起來比較抽象腾务,我們舉個栗子:
假如需估算深圳市豐田汽車的數(shù)量?
先top-down分析:
假設(shè)已知深圳市全市共有機(jī)動車300萬輛
在深圳市幾個車流密集區(qū)域采樣削饵,記錄每100輛車中豐田車的占比岩瘦,取平均占比。假如為25%
300萬×25%=75萬輛
再bottom-up分析:
假設(shè)已知深圳全市有8萬輛特斯拉
在某地多點采樣得出窿撬,在每100輛汽車車中启昧,特斯拉的占比為2%,豐田車的占比為20%
從豐田數(shù)量是特斯拉數(shù)量的10倍關(guān)系劈伴,我們可以估算出深圳市有豐田車8*10=80萬輛
前者從宏觀往下密末,取得平均占比后,乘以總數(shù)跛璧,得到豐田車的數(shù)量严里。
后者從微觀往上,以另一款汽車「特斯拉」作為切入追城,反推豐田車的數(shù)量刹碾。
得到75萬,80萬的這兩個數(shù)字座柱,差距在一定的范圍內(nèi)迷帜,則認(rèn)為這個數(shù)據(jù)是可以取信的。
最后辆布,我們還可以進(jìn)行一些誤差分析:
1瞬矩、在對豐田汽車采樣的時候,若只取了口岸附近的車流密集區(qū)锋玲,則占比有可能偏高(香港牌的保姆車絕大多數(shù)是豐田埃爾法,也算是深圳特色之一吧)
2涵叮、在對特斯拉進(jìn)行采樣時惭蹂,若取樣地點是「特斯拉充電樁」附近,同樣也會造成數(shù)據(jù)偏高的情況割粮。
3盾碗、當(dāng)然還有更多的維度可以進(jìn)行誤差分析,比如特斯拉降價促銷舀瓢、采樣時間是否工作日等等...
五廷雅、我是總結(jié):費(fèi)米估算與數(shù)據(jù)分析
費(fèi)米估算其實是一種對結(jié)果的數(shù)量級準(zhǔn)確性估算的方法,其估算思想的本質(zhì)是結(jié)構(gòu)化思維+計算模型。
首先模型的準(zhǔn)確性是基礎(chǔ)航缀,無論是物理定律還是生活經(jīng)驗上都需要經(jīng)受得起檢驗商架;其次是對各組變量的假設(shè)和估計準(zhǔn)確,基于前面的平均律理論芥玉,我們可以會發(fā)現(xiàn)對一個變量組蛇摸,如果變量越豐富、取得的估算值也在合理的最大灿巧、最小值區(qū)間之間赶袄,那么在概率意義上會得到相對準(zhǔn)確、穩(wěn)定的結(jié)果抠藕。
所以說饿肺,費(fèi)米處理問題的方式是將復(fù)雜、困難的問題分解成小的盾似、可以解決的部分唬格,從而以最直接的方法迅速解決問題。
六颜说、留個作業(yè):常見Market size面試問題
如果你是個產(chǎn)品經(jīng)理购岗、分析師或者商業(yè)方向的崗位,在面試中门粪,會經(jīng)常遇到讓你做市場容量估算類的問題喊积,這里就考察你費(fèi)米估算的理解和應(yīng)用能力了。
市場容量估算(Market Size)玄妈,又稱市場規(guī)模估算乾吻,通常是研究「目標(biāo)行業(yè)或者目標(biāo)產(chǎn)品的整體市場規(guī)模」的問題拟蜻。
對于互聯(lián)網(wǎng)行業(yè)而言绎签,在挖掘相應(yīng)的需求后,決策是否選擇和開創(chuàng)一個目標(biāo)行業(yè)/產(chǎn)品酝锅,判斷是否需要投入資源產(chǎn)生解決方案的時候诡必。估算市場容量是一個非常重要提供信息的方式,也是行業(yè)分析和市場調(diào)研中經(jīng)常遇到的問題搔扁。
請你估算一下一家商場在促銷時一天的營業(yè)額爸舒?
胡同口的煎餅攤一年賣多少個煎餅?
預(yù)測國內(nèi)資訊類APP的DAU天花板稿蹲?
試估算中國K12課外英語輔導(dǎo)的市場扭勉?
北京有多少個加油站?
北京有多少輛出租車苛聘?
美國飛機(jī)的乘客數(shù)有多少涂炎?
估算杭州每年奶茶店的規(guī)模大兄揖邸?
“i的i次方”回復(fù)“費(fèi)米答案”唱捣,可查看解題思路~