這是一個系列的思考,因為篇幅較長湾趾,分為上下兩篇芭商。
上篇會介紹關(guān)于如何獲得群體智慧和算法的4種方法,下篇會介紹現(xiàn)在區(qū)塊鏈中的4個預(yù)測市場項目搀缠。4種方法的整理來源于王爍的一篇文章铛楣,讀完之后真是受益良多。 其總結(jié)與歸納理也理清楚了自己之前在這方面的一些困惑艺普。 本來想自己寫簸州,但王爍真的已經(jīng)把一個概念闡述的足夠簡潔鉴竭,足夠精確。作為財新總編岸浑,文筆真不是吹的搏存。已經(jīng)難有可再提高之處,不如就直接引用了矢洲。
把這4個方法排列下來璧眠,也加深了我對于區(qū)塊鏈在“預(yù)測市場”這個獨特方向上的思考與理解。?
《怎樣用邏輯和算法读虏,撬動群體智慧》 --王爍
如果你正確地向群體智慧借力责静,你能戰(zhàn)勝所有對手。
因為盖桥,在絕大多數(shù)時候灾螃,一群人合起來都會比一個人更有智慧。問題是每個人天生都知道怎么運(yùn)用自己的智慧揩徊,但群體是個人的集合腰鬼,匯聚許多人的智慧,需要方法靴拱。我今天講四種層層遞進(jìn)的方法垃喊, 簡單平均、貝葉斯推理袜炕、動態(tài)加權(quán)本谜、極化 。
第一種方法:簡單平均
前一段豆瓣上出現(xiàn)了一部兩分電影偎窘。導(dǎo)演很生氣乌助,說毀了他12年的心血。沒人同情他陌知。
豆瓣評分五星制他托,五星就是十分,一星就是兩分仆葡,這位的得分99%以上是一星赏参。
人們相信豆瓣評分,不相信導(dǎo)演自評沿盅。這是對的把篓。我上次去看評分的時候,有17022人打分腰涧。你相信17022人韧掩,還是相信一個人?
評分可以不只是評分窖铡,可以大得多疗锐》凰可以是對已發(fā)生事件的評價,比如給電影打分滑臊;可以是對將發(fā)生事件的預(yù)測口芍,比如民意調(diào)查;也可以是決策的扳機(jī)简珠,比如你得分超過某個閾值就采取相應(yīng)行動阶界。
評價、預(yù)測聋庵、決策,三位一體芙粱,來自對群體智慧的聚合祭玉。找到正確的聚合方法,你就找到了撬動群體智慧的杠桿春畔,能夠撬動一切脱货。
回到豆瓣的評分機(jī)制,也就是我們今天要講的第一種算法律姨,平均聚合振峻。
豆瓣聚合的方法,創(chuàng)始人阿北曾經(jīng)自己解釋過择份,原則上就是一人一票扣孟,簡單平均。簡單歸簡單荣赶,這辦法很靠譜凤价。如果投票者數(shù)量足夠多,投票相對獨立拔创,那么簡單平均值的準(zhǔn)確度會系統(tǒng)性地超越個體判斷利诺。
類似的實驗已經(jīng)做過無數(shù)次。把一頭牛牽到集市剩燥,讓趕集的農(nóng)夫目測其體重慢逾。最后下來會發(fā)現(xiàn),沒有哪個農(nóng)夫的判斷灭红,能夠超過把所有農(nóng)夫的判斷加總再平均侣滩。原因在于,每個人各自掌握一些信息比伏,各有判斷胜卤,哪怕只是用平均這樣簡單粗暴的方法聚合起來,也比單個人掌握的信息要完整赁项,形成的判斷更準(zhǔn)確葛躏。這就是群體智慧的原意澈段。它已經(jīng)足以戰(zhàn)勝絕大多數(shù)有專家頭銜的評委。
第二種方法:貝葉斯推理
豆瓣的簡單平均法簡潔但遠(yuǎn)不完美舰攒。假設(shè)一部電影只有兩個人打分五星败富,另一部電影一百萬人打分平均4.9星。哪部電影更好摩窃?簡單平均法識別不了兽叮。
這時候就需要另一種算法,貝葉斯推理猾愿。電影評價類網(wǎng)站的始祖和霸主IMDB用的就是這種算法鹦聪,它能夠解決極少數(shù)用戶打極高分或者極低分的時候,對一部電影的評價出現(xiàn)不準(zhǔn)確或不公平的問題蒂秘。在這一點上泽本,它是一個比豆瓣更優(yōu)化的評價機(jī)制。
那什么是貝葉斯推理呢姻僧?貝葉斯推理是一種更新既有判斷的方法规丽,有兩個要:首先你有一個既有判斷;其次獲得新信息撇贺,不斷調(diào)整更新赌莺。這么說有點抽象,其實我們每個人在生活中都在用松嘶,我來舉個例子你就知道了艘狭。
比如,我第一次跟你見面喘蟆,我不了解你缓升,對你一無所知,但是我對人類有點了解蕴轨。我先入為主的看法就是好人和壞人三七開港谊,七分好三分壞。那我跟你打交道橙弱,我就假設(shè)你也是三七開歧寺,我們在一起聊了一個小時的天,我給你多打一分棘脐,就變成二八開了斜筐;我們共事的一年,我覺得你特別棒蛀缝,就變成一九開了顷链。
這就是我們用貝葉斯推理對人進(jìn)行的評價和判斷。那貝葉斯推理在IMDB電影評分機(jī)制上是怎樣運(yùn)用的呢屈梁?貝葉斯推理總是從預(yù)先的假設(shè)開始。既然事先不知道一部電影得分會是多少,那就給它一個基準(zhǔn)分沪伙,對應(yīng)一個基準(zhǔn)的投票數(shù)。IMDb給的基準(zhǔn)分是網(wǎng)站上所有電影的平均分霜大,比如6.5,對應(yīng)基準(zhǔn)的打分人數(shù)革答,比如是3000人战坤。不管是什么電影,在獲得第一個用戶打分之前残拐,默認(rèn)都是得6.5分途茫,對應(yīng)著3000張投票。你看了電影溪食,開始打分慈省,新信息進(jìn)來了。貝葉斯推理會用這些新信息修正得分眠菇,隨著每個用戶的打分變化。算法我就不列了袱衷。大體上是這樣的情境:如果只有一個用戶打分捎废,那么電影得分無限接近于網(wǎng)站平均分;如果有3000真實用戶打分致燥,跟基準(zhǔn)數(shù)一樣登疗,那么得分正好是3000名真實用戶實際打分,與網(wǎng)站平均分兩個分值之間的平均分嫌蚤;如果打分用戶數(shù)量極大辐益,那么得分會極度逼近這些用戶的實際打分。
投票人數(shù)的問題處理好了脱吱,但問題沒完智政。電影 A,十個人看過箱蝠,全部評分均為 10 分续捂;電影 B,十萬個人看過宦搬,評分平均值為 9.8 分牙瓢。?? 請問你愿意相信哪部電影更加優(yōu)秀?貝葉斯算法的核心思想就是避免讓電影 A 的最終得分超過B间校。? 如此看來矾克,各大平臺的評分制度都有優(yōu)有劣。而無論批評還是贊美憔足、權(quán)威還是業(yè)余胁附,電影評分始終難以繞開主觀因素的影響酒繁。喜歡小清新的觀眾可能會給《行尸走肉》打低分,而熱愛商業(yè)大片的影迷可能也無法理解《路邊野餐》中的長鏡頭汉嗽。但你能因為這些“差評”就認(rèn)定這些是“爛片”嗎欲逃??
第三種方法:動態(tài)加權(quán)
一人一票足夠好嗎?
一人一票是平等的饼暑,但看電影這件事有許多好理由支持搞不平等:水軍跟觀眾不應(yīng)該平等稳析,掏錢買票看的跟白看的不應(yīng)該平等,高水平觀眾跟普通觀眾不應(yīng)該平等弓叛。一人一票反映不出每一票中包含的獨特信息彰居,而這些信息是有價值的。怎么把信息解放出來撰筷?答案就是我們今天要講的第三種聚合的方法:動態(tài)加權(quán)陈惰。
希弗(Nate Silver)是個年輕人,近年來在選舉預(yù)測領(lǐng)域大火毕籽。他的選舉預(yù)測網(wǎng)站在2008年美國總統(tǒng)大選及國會選舉一戰(zhàn)成名抬闯,準(zhǔn)確率超過所有民調(diào),然后持續(xù)保持高精度預(yù)測紀(jì)錄关筒。選舉民調(diào)是對選民意見的聚合溶握。希弗并不直接做預(yù)測,美國的選舉民調(diào)已經(jīng)太多了蒸播。他做的是對這些民調(diào)的聚合睡榆,等于是選民意見聚合的聚合。他根據(jù)每個民調(diào)機(jī)構(gòu)準(zhǔn)確率的歷史記錄和當(dāng)下表現(xiàn)袍榆,動態(tài)調(diào)整其權(quán)重胀屿,表現(xiàn)好的權(quán)重高,表現(xiàn)差的權(quán)重低包雀,聚合起來宿崭,生成預(yù)測。
這個預(yù)測有多準(zhǔn)確馏艾?2012年美國總統(tǒng)大選改選劳曹,希弗預(yù)測對了奧巴馬戰(zhàn)勝羅姆尼,這不稀奇琅摩。稀奇的是希弗還預(yù)測對了所有50個州兩人的勝負(fù)結(jié)果铁孵。全中。這種算法就是動態(tài)加權(quán)房资,根據(jù)民調(diào)機(jī)構(gòu)不同的準(zhǔn)確率蜕劝,分別加上不同的權(quán)重,根據(jù)接下來表現(xiàn)隨時調(diào)整權(quán)重,再重新聚合起來岖沛。類似的算法對投資也非常有用暑始。
對沖基金管理人達(dá)里奧(Ray Dalio)也用了類似算法聚合群體智慧。他的公司橋水資本管理著1600億美元資金婴削,是過去十年最成功的對沖基金廊镜。達(dá)里奧用一種極端的原則管理公司,他把這套管理原則擴(kuò)展成自傳唉俗,變成新書《原則》嗤朴,有興趣的建議去看。
達(dá)里奧的決策方法叫作believability-weighted idea meritocracy虫溜,直譯過來是“可信度加權(quán)的想法惟賢是舉體制”雹姊。說起來一大串,用中文講很簡單衡楞,就是話份吱雏。人人都有話份,在決策流程中都能發(fā)言參與瘾境,在發(fā)言資格的意義上大家是平等的歧杏,但彼此的話份就有差等。有人水平高迷守,決策效果的歷史表現(xiàn)好得滤,他們話份就大,反之話份就小盒犹。決策如果有意見分歧,則按“不同意見×話份”來解決分歧眨业。 每次決策都有記錄急膀,根據(jù)決策效果反饋,隨時更新每個人的話份龄捡。
達(dá)里奧決策跟希弗預(yù)測選舉卓嫂,方法是一模一樣的。這想法談不上多新聘殖,都是貝葉斯推理的簡單運(yùn)用晨雳,獨特之處在于實實在在用于管理決策,為此搭建技術(shù)奸腺,重組管理餐禁,做實做到底,革命性在這里突照。
這里我再多加上一些補(bǔ)充帮非,很多人看雷.達(dá)里奧的《原則》這本書都看到了對于自身的原則這方面。 但這本書加上之前達(dá)里奧TED上演講,可以看出來他對于公司的管理末盔,群體決策上面有著非常獨到的見解筑舅。因為這個方法實在精彩,非常值得回味陨舱,所以我再多加上一些知乎上面陳達(dá)的分析翠拣。
關(guān)于群體性決策(變態(tài)的來了)- 知乎 陳達(dá)
大家都知道民主好,一人一票游盲;但其實民主只是壞制度里的比較不壞的制度误墓,就如那句雖然不是丘吉爾原創(chuàng)卻被他發(fā)揚(yáng)光大的話一樣。對于很多問題背桐,你的決策其實不能搞這種單細(xì)胞的民主优烧。比如大英帝國決定要不要脫歐。政治正確的說法是:人人平等是普世價值链峭,那當(dāng)然應(yīng)該一人一票畦娄,人人同權(quán);但是我們?nèi)绻麅H僅考慮決策的正確性弊仪,為了加大決策正確的概率熙卡,一人一票、同票同權(quán)其實是不合理的励饵。很多人哪里搞得清楚脫歐的真實意義驳癌,某個在街上賣茶葉蛋的大爺投個贊成票就能把首相卡梅倫的反對票給咔嚓掉,你只需要兩個賣茶葉蛋的大爺役听,就能徹底淹沒掉卡梅隆的意見颓鲜。
但是沒辦法,同票同權(quán)是政治正確典予;不過你在經(jīng)營公司的時候就沒必要搞這種單細(xì)胞的民主甜滨。比如橋水用的制度是“創(chuàng)見上的賢人政治”(idea meritocracy)。用達(dá)叔自己的語言來組織瘤袖,就是將一幫冰雪聰明衣摩、獨立思考的 人拉攏起來讓他們互相不同意,搞出各種創(chuàng)見捂敌,然后最后通過靠譜度加權(quán)( believability-weighted)的方式進(jìn)行表決艾扮。追求的是“極端真相”(radical truth)和“極端透明”(radical transparency)。
我對著電腦鱉了很久要如何翻譯 believability-weighted占婉,最后想想還是翻譯成“靠譜度加權(quán)”最靠譜泡嘴。
靠譜度加權(quán),簡單點說就是你這個人如果靠譜逆济,那么你說的話你的意見分量就重一點磕诊;如果你這人不靠譜填物,那就人飄言輕。你會說這看起來不是理所當(dāng)然的事情么霎终?但是人類歷史上其實很少實踐這個理念滞磺,因為要執(zhí)行很困難。而最容易執(zhí)行的就是每人一票的民主或者沒人有票的dictatorship(這詞出于某些原因我實在沒法翻譯)莱褒。當(dāng)然击困,達(dá)里奧覺得這些都太粗暴。
執(zhí)行困難顯而易見广凸。怎么來決定一個人的靠譜程度阅茶?這里就是橋水開始搞邪教的地方了。
1. 所有的會議錄像下來谅海,由專(機(jī)器)人進(jìn)行分析脸哀,人機(jī)對打;
2. 開會的時候每個人端著個iPad 扭吁,用一個叫點點(dots)的 app 互相評分撞蜂,人人對打。
講一下點點侥袜。點點是橋水眾多階級斗爭app工具里的一個典型 —— 其實不止是在開會時蝌诡,在任何時候任何場合,只要你感覺來了感覺對了枫吧,你就可以通過點點對你的同事進(jìn)行鐵面無私的大眾點評浦旱。點評的個人特質(zhì)多達(dá)100項以上,比如strategic thinking(策略化思考)啊九杂、dealing with ambiguity(對模糊化情況的處理能力)啊颁湖,不同工種所對應(yīng)的特質(zhì)也不同。一般是1到10分你給他/她打分例隆,7分就是個平均水平爷狈,然后你還可以追加一點文字評語。
所有的點評裳擎,比如打分人的ID(所以是實名制的)、分?jǐn)?shù)思币、追加的附言評語都會被永久保存鹿响。每一個點評被稱為一個dot,某個人身上可能掛滿了dot——比如橋水的聯(lián)席CIO 身上就掛了約有11000多個點谷饿。然后這些點會和你的KPI啊惶我、你的360度無死角表現(xiàn)評估啊、你的測試成績啊等等結(jié)合起來博投,最終形成你的究極戰(zhàn)力——你的“靠譜度”(believability)绸贡。玩過足球游戲FIFA的人都知道所有的球員都有各種數(shù)據(jù)評分:速度啊射門啊對抗啊種種方面;而橋水這就是等于在現(xiàn)實中把人給徹底數(shù)據(jù)化了。
靠譜度不是目標(biāo)听怕,而是甬道捧挺;有了靠譜度,就可以為決策過程進(jìn)行加權(quán)了尿瞭。開會的時候大家投票闽烙,投票結(jié)果根據(jù)靠譜度一加權(quán),就能最終形成決策結(jié)果声搁『诰海靠譜的人投票的分量就要重,不靠譜的人投票就輕于鴻毛疏旨。除了決策以外很魂,由于點點是個動態(tài)即時的打分系統(tǒng),所以你就比較容易監(jiān)控你的員工的近況檐涝,你可以看看數(shù)據(jù)然后跑去說:小張啊遏匆,最近你狀態(tài)下垂得有點厲害啊。
我們用圖解來看看整個決策過程骤铃。(所有圖片與數(shù)據(jù)皆來自于達(dá)叔的TED演講)
1. 通過一個叫Dots app拉岁,你可以看到每個人對應(yīng)的特質(zhì),并為其打分惰爬。
(Dots是Bridgewater專門自己開發(fā)的一個安裝在iPad上面的實時反饋工具喊暖。比如說,你在跟一群人開會撕瞧,你問了個問題陵叽,有人覺得你的問題很Low,他就可以實時給你在“high-levelthinking”這一項上打個3分(滿分10分)丛版,還可以附帶說一句:你剛才問的問題太Low巩掺。Dots這個工具可以收集你身邊所有人對你各個維度的評價然后所有人都可以看到這個評價。這個工具是為了收集所有的數(shù)據(jù)點页畦,再合成為一個關(guān)于你的畫像胖替。)
2. 我們能看到不同人對于某個人的表現(xiàn)其實有很大的主觀性,但是我們要接受這種主觀性豫缨,并相信大數(shù)據(jù)以及crowdsourcing(眾包)的力量独令。
3. 所有人彼此間的互評會形成一張數(shù)據(jù)網(wǎng)。
4.最后所有的這些數(shù)據(jù)進(jìn)入算法好芭,總結(jié)出每個人的靠譜度燃箭,形成一張計算機(jī)看到的“你的臉”。
5. 然后舍败,通過靠譜度做決策招狸。比如在表決“你認(rèn)為對于美聯(lián)儲削減購債計劃的預(yù)期落后于債市熊市嗎敬拓?”,如果用一人一票的民主裙戏,表決結(jié)果是77%的人(13個人)說“是”乘凸,23%的人(4個人)說“否”。
6.如果用靠譜度加權(quán)挽懦,我們發(fā)現(xiàn)投否定票的四個人翰意,人雖少但是言不微,因為他們的靠譜度非常高信柿。所以如果加權(quán)后冀偶,19%的表決為“是”,81%的表決為“否”渔嚷。形式發(fā)生了大逆轉(zhuǎn)进鸠。
第四種方法:極化
憑借徹底運(yùn)用話份邏輯聚合群體智慧,希弗和達(dá)里奧做到了他們各自那個行業(yè)的頂峰形病。能不能再往前走一步客年,做得更好?泰特羅克(Philip Tetlock)認(rèn)為可以漠吻。這就是我們今天要講的第四種聚合方法:極化量瓜。
泰特羅克是美國著名政治學(xué)者,領(lǐng)導(dǎo)預(yù)測項目“善斷計劃”(Good Judgement Project)途乃。計劃的資助者是直屬美國全國情報總監(jiān)的高級情報研究局绍傲,旨在為整個情報界提供革命性的創(chuàng)新能力。幾年間耍共,兩萬多人在善斷計劃網(wǎng)站上就美國情報界拋出來的五百個問題作持續(xù)預(yù)測烫饼,實時檢驗。
泰特羅克把每個預(yù)測者的每次預(yù)測都打分试读,匯總成個人總分杠纵,有2%的人脫穎而出,攀到最優(yōu)秀一級钩骇,成為“超級預(yù)測者”比藻。善斷計劃則根據(jù)每個人的得分調(diào)整其在整體預(yù)測中的權(quán)重分配,生成預(yù)測倘屹。到這一步银亲,泰特羅克的方法與達(dá)里奧和希弗相似。下一步則是泰特羅克的創(chuàng)舉唐瀑,其實也很簡單:對加權(quán)平均后形成的預(yù)測結(jié)果,再做一道加工:極化(extremize)插爹,將預(yù)測結(jié)果往100%或者0的方向推哄辣。舉個例子请梢,特朗普能否連任美國總統(tǒng)?如果預(yù)測者加權(quán)平均后的預(yù)測概率是70%力穗,那就把它上調(diào)到比如85%毅弧;相反,如果預(yù)測值是30%当窗,那就把它下調(diào)到15%够坐。
極化的理由是這樣的:假設(shè)群體中的每個人都獲得了群體的全部信息,他們作預(yù)測時一定會更為自信崖面。從群體簡單平均值到加權(quán)平均的過程元咙,事實上已經(jīng)聚合了所有人的信息,但沒有完全反映出與此對應(yīng)的自信巫员。極化就是要捕捉這個自信:如果是樂觀預(yù)測庶香,極化會輸出一個更樂觀的預(yù)測;如果是悲觀預(yù)測简识,極化會輸出一個更悲觀的預(yù)測赶掖。
善斷計劃(The Good Judgement)的預(yù)測準(zhǔn)確率高得驚人。參與者不過是群普通人七扰,智商還可以但不特殊奢赂,教育背景參差不齊,也沒有內(nèi)幕信息颈走,借助相當(dāng)簡單的算法膳灶,但他們的預(yù)測擊敗了全部現(xiàn)有的預(yù)測系統(tǒng),甚至戰(zhàn)勝了專業(yè)情報分析師疫鹊。了解如何成為超級預(yù)測者袖瞻,推薦讀泰特羅克的書《超預(yù)測》( Superforcastering: The Art and Science of Prediction )。我把他許為當(dāng)年最佳圖書拆吆。
正確地聚合群體智慧聋迎,就獲得了這個時代最接近于千里眼的工具。不難觸類旁通:只要是測試永不停歇枣耀,參與者足夠多霉晕,檢驗和反饋足夠明確的領(lǐng)域,無論經(jīng)濟(jì)捞奕、政治牺堰、金融還是其他,都可以用“加權(quán)平均+動態(tài)調(diào)整權(quán)重+極化算法”來撬動群體智慧颅围,應(yīng)用空間極大伟葫。
我身邊就有位人肉聚合群體智慧的模范。她的信息來源主要是一流媒體和人際見聞院促,觀點則形成于交流筏养,特點一是人數(shù)多斧抱,二是看法雜,三是水平高渐溶。在這個過程中辉浦,她會反復(fù)搖擺,形成很多前后不盡一致的看法茎辐;然后宪郊,行動力又強(qiáng),每有看法必決策拖陆,每決策必行動弛槐,于是整個過程來回翻燒餅。老實說慕蔚,我曾經(jīng)覺得這樣做事自相矛盾丐黄,空耗精力,怎么行孔飒?灌闺!慢慢的,我懂得了坏瞄,觀點搖擺桂对,是因為在聚合中要漸進(jìn)校正;行動搖擺鸠匀,是在實施中要迅速獲得反饋并相應(yīng)作調(diào)整蕉斜。能夠做到我們這個行業(yè)的巔峰,沒有幸運(yùn)缀棍。她無師自通宅此,找到了聚合并使用群體智慧的實踐算法。光追求前后一致不空耗能量爬范,美則美矣父腕,但缺少信息忽視反饋在閉環(huán)里打轉(zhuǎn),又有什么用青瀑。掌握泰特羅克的方法璧亮,我們能比她做得更好。
以上介紹了關(guān)于獲得群體智慧的4種方法, 背后都是深深的博弈論啊斥难。
接下來的一篇枝嘶,會為大家介紹Gnosis,Augur哑诊,天算Delphy群扶,菩提Bodhi這四個利用區(qū)塊鏈技術(shù)來做預(yù)測市場的項目。
引用:
1.《怎樣用邏輯和算法,撬動群體智慧》 - 王爍?
2. 《橋水是一家什么樣的公司》作者:陳達(dá) 竞阐,知乎
3. 善斷計劃提茁, The good judgement https://www.goodjudgment.com/