知識儲備少的一個可能的好處是“不落窠臼”,大白話就是:套路少么库。
為什么能套路少傻丝?主要是因為懂得套路少。換句話說:大部分的知識都基于范式诉儒。學(xué)的多了葡缰,會發(fā)現(xiàn)教書先生的觀點各有不同,然而教材里的內(nèi)容是相似的忱反。那還要繼續(xù)學(xué)習(xí)嗎泛释?不耽誤。想學(xué)就繼續(xù)温算,套路雖然俗氣怜校,但認(rèn)識的過程里也會有些樂趣。不想學(xué)也不錯注竿,守著有限的認(rèn)識茄茁,過日子或者哲思魂贬。都很美好。
這些跟預(yù)測有什么關(guān)系呢裙顽?預(yù)測是有方法的付燥,熟練掌握某種或某些方法后,就容易喪降低“空想”的意愿愈犹,養(yǎng)成一些依著套路走的習(xí)慣键科。這樣對預(yù)測并不利。
太陽底下沒有新鮮事漩怎。目之所及勋颖,預(yù)測問題都是常見場景。非典型的預(yù)測扬卷,則被稱為冒險牙言。尤其是量化預(yù)測領(lǐng)域。統(tǒng)計學(xué)家也費盡苦心怪得,建立假設(shè)和約束條件咱枉,又尋求條件的放寬、轉(zhuǎn)換徒恋,甚至廢棄一組方法蒲凶,重裝出另一套方法揭朝,生生不息。
正統(tǒng)的方法自然有一大堆理論證明,還是聊一場樸素自然地隨心暢想萍膛。
測一測玩哪個游戲
之前搜集過一份電競職業(yè)選手的年齡樣本,具體涉及到144位電競職業(yè)選手的出生日期漏峰∏橹瘢基于這份數(shù)據(jù),是不是能解決一些個相關(guān)的預(yù)測問題呢滋恬?比如:根據(jù)某人的出生日期聊训,預(yù)測該人玩的哪個游戲。這個預(yù)測問題一拋出來恢氯,即使是一個對預(yù)測方法完全不懂的人带斑,可以想的方面和方向就不少。這的確是一個很有意思的問題勋拟。
出生日期跟玩哪個游戲勋磕,有關(guān)系嗎?怎么看有沒有關(guān)系敢靡?如果有挂滓,是不是就承認(rèn)了屬相、星座哪一套說法醋安?如果沒有杂彭,是不是就是尊重客觀事實墓毒?這樣一想,兩者應(yīng)該是沒有關(guān)系的亲怠。但還是可以主觀上假設(shè)有所计,然后繼續(xù)討論。
如果有關(guān)系团秽,那是前者影響了后者主胧,還是后者影響了前者?是有因果關(guān)系习勤,還是其他什么復(fù)雜的關(guān)系踪栋?因為本來就是假設(shè)的,所以不好具體討論下去图毕,于是就再假設(shè)一番夷都。比方說,兩者可能是一種同時出現(xiàn)或者不出現(xiàn)的關(guān)系予颤,不一定是線性的囤官,應(yīng)該是一種概率問題,接著故事從啤酒和尿布開始了蛤虐。再比分說党饮,兩者可能是一種類規(guī)則的關(guān)系,就是能設(shè)計一個機器貓驳庭,能準(zhǔn)確預(yù)測出答案來的那種刑顺。
同一天生日的那些家伙,在預(yù)測問題里可能是個麻煩了饲常。同年同月同日生蹲堂,但玩著不一樣的游戲,這種情況該怎么處理贝淤?簡單粗暴的剔除即可贯城。于心不忍的話,那就放到測試集里霹娄。實際上,有些同一天出生的職業(yè)選手玩的是一款游戲鲫骗,有些個是玩著不同的游戲犬耻,所以等預(yù)測方法想出來了,拿那幾天測試一下执泰,應(yīng)該會很好玩枕磁。
異常值不僅僅是表面上的異常,可能是數(shù)據(jù)處理過程帶來的术吝。比方說计济,144個樣本中茸苇,其中有一份顯示是1994年1月1日出生的職業(yè)選手,但是實際上沦寂,當(dāng)初只是拿到了1994年這個年份數(shù)據(jù)学密,在處理過程中自動補全成了1月1日。不知道影響大不大传藏?如果有影響的話腻暮,對最后的預(yù)測結(jié)果到底有多大的影響?
就算預(yù)測結(jié)果出來了毯侦,還是放心不下哭靖。是只有一個結(jié)果,還是有多個呢侈离?每個結(jié)果可靠嗎试幽?可不可靠怎么比較呢?可不能像人民公園里面相親的那樣走馬觀花了卦碾。
預(yù)測NBA球員的第一次傷情
還有一種預(yù)測問題也很有意思铺坞,就是成功預(yù)言第一次出現(xiàn)。這類問題跟冒險的區(qū)別在于蔗坯,冒險問題是沒有類似的歷史信息可以參考康震,包括自身時間序列、普世的橫截面等宾濒,但NBA球員的傷情不是一個陌生的話題腿短。
雖然,NBA球員的傷情很常見绘梦,但是橘忱,針對某個具體的球員,尤其是他/她還從來沒有被報道過傷停卸奉,那怎么預(yù)測該名球員第一次受傷事件在什么時候發(fā)生呢钝诚?
文/良宵聽雨。授權(quán)“游戲夜讀”發(fā)表榄棵。