16
置信度可以幫你衡量一個信息到底是否可靠
怎么提高置信度辙纬?通常辦法就是要增加所統(tǒng)計的樣本數(shù)量
人們對待信息通常犯的一個錯誤,就是忽視它的置信度叭喜,以至于我們把完全隨機的事情贺拣,當成必然的事情。
世界上有很多到底其實都很難驗證捂蕴,大到歷史事件譬涡,由于很難多次重復,總結經(jīng)驗其實是非常難的啥辨。
對于能夠重復的事情涡匀,要被檢驗足夠多次之后,置信度才高溉知。
17
KL散度
如果你的猜測和真實情況完全一致陨瘩,你不損失任何東西,但是只要猜測和真實情況不一致级乍,或多或少會有損失舌劳。
你猜測和真實情況相差越大,損失越大卡者。
自大的人非常容易遺漏很多原本應該考慮的事情蒿囤。
過分防范各種情況,患得患失崇决,是有損失的材诽。
信息論中,任何硬性的決定都要損失信息恒傻。
18
刻意要引起你注意的人脸侥,常常會用聳人聽聞的信息打動你
1)放在更大的時空來考量
2)要看信息的一致性
3)從一大堆信息中抽取的信息,要看它們的失真率
誤導人的信息第二個特征是沒有出處盈厘,或者只有一個無法驗證的出處睁枕。
誤導人的信息第三個特征是缺乏上下文。
五個原則
1)最好、最重要的資源要用于那些出現(xiàn)最頻繁的事情外遇,這樣分配資源最有效注簿,其背后的原理是香農(nóng)第一定律和霍夫曼編碼。
2)不要將相關性當成因果關系
3)直接獲取某種信息是很困難的跳仿,因此獲得等價信息诡渴,得同樣的效果。
4)日常大部分事情菲语,都是漸變的妄辩,通過增量改進,要比推倒重來效率高山上。
5)信息矢量化:將很多維度的信息映射到我們關心的幾個維度眼耀。
19
先拋出一個顛覆你認知的觀點
正確的歷史觀比歷史細節(jié)更為重要
只要歷史的信噪比足夠高,就能還原出歷史的大脈絡
我們要考察的不是一條信息的準確性佩憾,而是大量數(shù)據(jù)中哮伟,有多少是準確的信息,有多少是噪音。
20
能夠找到噪音來源的和不清楚來源的。
有規(guī)律的噪音和隨機的噪音谷市,固定頻率的噪音和白噪音
第一個常用方法就是利用信息的冗余
換一個角度看問題
1)通過信息的冗余和比對绰垂,過濾噪音
2)將有噪音的信息分解到不同的維度過濾噪音