一邊是枯燥的數(shù)據(jù)標(biāo)注工作淤齐,一邊是游戲股囊,你選哪個?很多人會毫不猶豫地選擇后者更啄。游戲?qū)τ谌祟悂碚f毁涉,帶來了樂趣,同時也耗費(fèi)了大量時間锈死。如果將游戲機(jī)制運(yùn)用到訓(xùn)練機(jī)器智能上又有怎樣的效果呢贫堰?
對于機(jī)器來說直接認(rèn)識圖像、知識這類內(nèi)容是個巨大挑戰(zhàn)待牵,但對于人類來說卻是微不足道的小事兒其屏,利用人類對這些內(nèi)容進(jìn)行識別并標(biāo)注成為機(jī)器能認(rèn)知的知識圖譜將大大提升機(jī)器的認(rèn)知能力。但龐大的知識標(biāo)注畢竟是個浩大的工程缨该,即使是人類也會因其枯燥繁瑣而望而卻步偎行。
《設(shè)計(jì)有目的的游戲》是LUIS? AHN和LAURA DABBISH在《ACM通訊》的投稿文章。本文通過對游戲賦能知識轉(zhuǎn)化為知識圖譜的解讀贰拿,讓數(shù)據(jù)標(biāo)注有了游戲化的解決方案蛤袒。此文重點(diǎn)講述了以下幾個核心觀點(diǎn):
1、人類用大量的時間來玩游戲膨更,而游戲可以運(yùn)用到數(shù)據(jù)標(biāo)注這件事情中來妙真,并以ESP等三個游戲作為模板進(jìn)行研究。
2荚守、利用人類能力訓(xùn)練機(jī)器智能實(shí)踐已有很多珍德,包括網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作练般、開放性思維計(jì)劃、交互式機(jī)器學(xué)習(xí)锈候。
3薄料、如何系統(tǒng)地實(shí)現(xiàn)借助人類能力實(shí)現(xiàn)游戲化數(shù)據(jù)標(biāo)注訓(xùn)練機(jī)器智能。
事實(shí)上泵琳,EpiK 推出了游戲化數(shù)據(jù)標(biāo)注產(chǎn)品-知識大陸就是此文研究結(jié)論的實(shí)踐摄职。為了更深刻了解作者對游戲化的解讀,現(xiàn)轉(zhuǎn)載全文如下:
對于人類來說获列,許多任務(wù)是微不足道的谷市,但對于計(jì)算機(jī)程序,即便是最復(fù)雜精細(xì)的計(jì)算機(jī)程序蛛倦,要完成這些任務(wù)仍舊面臨挑戰(zhàn)。傳統(tǒng)算法更專注于通過改進(jìn)人工智能算法來解決此類難題啦桌,因此溯壶,在這里提出一種不同的方法:利用游戲建設(shè)性地模仿人的腦力,訓(xùn)練計(jì)算機(jī)AI算法甫男。
為了實(shí)現(xiàn)這個目標(biāo)且改,我們提出了開發(fā)和評估這類游戲(我們稱之為“有目的的游戲”或GWAPS)的一般性設(shè)計(jì)原則:在GWAP中,玩家游戲的副產(chǎn)物能夠執(zhí)行計(jì)算機(jī)無法執(zhí)行的任務(wù)板驳。
據(jù)娛樂軟件協(xié)會報道又跛,美國人每天用于玩電腦和視頻游戲的時間高達(dá)2億個小時;一個21歲的美國人若治,平均花了1萬個小時在玩游戲慨蓝,這相當(dāng)于一個全職工作者工作5年所花費(fèi)的時間(以每周40小時計(jì)算)。
如果這種娛樂所消耗的時間和精力也被引導(dǎo)到解決計(jì)算機(jī)問題和訓(xùn)練人工智能算法上來端幼,又會是一種怎樣的體驗(yàn)?zāi)兀?/b>
事實(shí)上礼烈,在游戲過程中,玩家能夠執(zhí)行一些計(jì)算機(jī)無法自動執(zhí)行的基本任務(wù)婆跑。ESP游戲又叫做谷歌圖像標(biāo)注工具(images.google.com/ imagelabeler/)此熬,就是一種GWAP。玩家在玩游戲時為網(wǎng)頁上的圖像添加有意義的滑进、準(zhǔn)確的標(biāo)簽犀忱,即玩家游戲的副產(chǎn)物。例如扶关,將一個人和狗的圖像標(biāo)記為“狗”阴汇、“人”和“寵物”。截至2008年7月节槐,共有20萬名玩家貢獻(xiàn)了超過5000萬個標(biāo)簽鲫寄。這些標(biāo)簽用于優(yōu)化基于web的圖像搜索吉执,而這樣的搜索通常涉及干擾信息(如文件名和相鄰文本)。比起使用效果不夠好的計(jì)算機(jī)視覺技術(shù)地来,ESP游戲建設(shè)性地引導(dǎo)玩家以一種娛樂的方式給圖像添加標(biāo)簽戳玫,并呈現(xiàn)出了節(jié)奏快、有趣未斑、競技性強(qiáng)等特點(diǎn)咕宿。
其他的GWAP包括Peekaboom,用于定位圖像中的物體(玩家已經(jīng)貢獻(xiàn)超過50萬小時的人力時間)蜡秽;Phetch府阀,用描述性段落給圖像注釋;以及Verbosity芽突,收集用于訓(xùn)練推理算法的常識性事實(shí)试浙。在每一種GWAP中,玩家游戲的目的并不是出于他們個人對解決計(jì)算問題感興趣寞蚌,而是希望從游戲中獲得樂趣田巴。
ESP游戲(于2003年推出)和其后繼游戲代表了游戲玩法和計(jì)算的首次無縫融合。
既然游戲副產(chǎn)物具有如此大的能量挟秤,如何對這種方法進(jìn)行推廣呢壹哺?
與成千上萬的玩家一起構(gòu)建和測試GWAP的經(jīng)驗(yàn)幫助我們對GWAP開發(fā)的一般性指導(dǎo)方針進(jìn)行詳細(xì)說明。在這里艘刚,我們介紹三個GWAP游戲“模板”管宵,它們代表了我們迄今為止所創(chuàng)造的所有GWAP的三種一般性游戲類型。它們可以應(yīng)用于任何構(gòu)建游戲的計(jì)算機(jī)問題攀甚,從而鼓勵玩家?guī)椭鉀Q計(jì)算機(jī)無法完成的任務(wù)箩朴。每個模板都以滿足玩家最大利益的方式來確定游戲的基本規(guī)則和獲勝條件,從而執(zhí)行預(yù)期的計(jì)算方法秋度。另外隧饼,我們還介紹了一組設(shè)計(jì)原則,該原則對基本游戲模板進(jìn)行補(bǔ)充静陈。
雖然每個模板都規(guī)定了一類游戲的基本結(jié)構(gòu)燕雁,但一般性設(shè)計(jì)原則使游戲更有趣,同時提高了玩家輸出成果的質(zhì)量鲸拥。最后拐格,我們提出了一組評估GWAP成功的指標(biāo),以最大限度地利用從玩家貢獻(xiàn)的每小時的人力時間中獲得的效用角度來表示刑赶。
利用人類能力訓(xùn)練機(jī)器智能實(shí)踐
相關(guān)工作
盡管人們在之前的研究中認(rèn)識到了人力循環(huán)的效用和類游戲界面的激勵力量捏浊,但還沒有人成功地將這些原理結(jié)合成一種通用方法,即通過電腦游戲的方式來利用人類技能解決對計(jì)算機(jī)無法完成的任務(wù)撞叨。
網(wǎng)絡(luò)化節(jié)點(diǎn)協(xié)作
最早的網(wǎng)絡(luò)化節(jié)點(diǎn)協(xié)作的例子是開放源碼軟件開發(fā)項(xiàng)目金踪,可以追溯到20世紀(jì)60年代浊洞。這些工作通常包括來自世界各地數(shù)百甚至數(shù)千名程序員貢獻(xiàn)的努力,這其中包括網(wǎng)絡(luò)分布式協(xié)作的項(xiàng)目維基百科胡岔,從某些衡量標(biāo)準(zhǔn)來說法希,它的質(zhì)量不亞于一部《大英百科全書》。
大量網(wǎng)絡(luò)化節(jié)點(diǎn)通過協(xié)同工作可能完成那些難度更大靶瘸、耗時更長的任務(wù)苫亦,甚至是在某些情況下個人或一小群人幾乎不可能獨(dú)自完成的任務(wù)。Amazon Mechanical Turk系統(tǒng)(開發(fā)于2005年怨咪,www.mturk.com/mturk/welcome)就是一個很好的例證:在這個系統(tǒng)中屋剑,大型計(jì)算任務(wù)被分成更小的組塊,并分配給愿意通過完成少量工作來換取微薄收入的人诗眨。
開放性思維計(jì)劃
開放性思維計(jì)劃(Open Mind initiative)是一項(xiàng)全球性的研究實(shí)踐唉匾,通過利用人類技能來訓(xùn)練電腦,開發(fā)“智能”軟件匠楚。它從普通互聯(lián)網(wǎng)用戶(或網(wǎng)民)那里收集信息巍膘,并將信息提供給機(jī)器學(xué)習(xí)算法。志愿者參與其中油啤,回答電腦無法回答的問題(如“這幅圖中有什么典徘?”)蟀苛,旨在教電腦程序一些常識益咬。
然而,Open Mind的方法涉及到兩個弊端:依賴于志愿者愿意無償貢獻(xiàn)他們的時間帜平,并且不能保證他們輸入的信息是正確的幽告。GWAP與Open Mind的不同之處在于,GWAP的設(shè)計(jì)初衷是為了讓用戶感到愉悅裆甩,同時確保收集到的數(shù)據(jù)準(zhǔn)確冗锁。
交互式機(jī)器學(xué)習(xí)
另一個利用人類能力來訓(xùn)練計(jì)算機(jī)的領(lǐng)域是“交互式機(jī)器學(xué)習(xí)”,用戶向機(jī)器學(xué)習(xí)系統(tǒng)提供示例嗤栓,并得到關(guān)于算法學(xué)習(xí)效果的實(shí)時反饋冻河。根據(jù)反饋,用戶可以確定應(yīng)該向程序提供哪些新的示例茉帅。這種方法利用了人類的感知技能來訓(xùn)練計(jì)算機(jī)視覺算法叨叙,從而識別特定的物體。
如何系統(tǒng)實(shí)現(xiàn)游戲化堪澎?
讓工作有趣
在過去的幾十年里擂错,人機(jī)交互研究人員已經(jīng)認(rèn)識到用戶界面具有樂趣的重要性,并撰寫了相關(guān)文章樱蛤。例如钮呀,系統(tǒng)(如StyleCam)的目標(biāo)是使用類游戲交互來增加使用軟件的樂趣和參與度剑鞍。許多研究人員認(rèn)為,將類游戲的元素融入用戶界面可以提高用戶的積極性和工作活動的趣味性爽醋。有些項(xiàng)目更進(jìn)一步采取這種方法蚁署,將用戶界面本身變成了游戲風(fēng)格。例如子房,PSDoom將系統(tǒng)管理員相關(guān)的任務(wù)界面設(shè)計(jì)成第一人稱射擊游戲的風(fēng)格形用。將工作任務(wù)轉(zhuǎn)化為游戲的理念正越來越多地應(yīng)用于兒童的學(xué)習(xí)活動中。研究人員注意到证杭,正如我們此時所做的田度,不能僅是將一個類游戲的界面強(qiáng)制施行在工作活動上,而是要將所需的工作活動整合到游戲本身解愤,游戲互動和要求完成的工作之間必須有緊密的交互镇饺。
對娛樂的渴望
GWAP的做法有三個激勵因素:世界上能夠使用互聯(lián)網(wǎng)的人口比例越來越高;對計(jì)算機(jī)來說送讲,某些任務(wù)是無法完成的奸笤,但對人類來說卻很容易;人們花很多時間在電腦上玩游戲哼鬓。
與其他試圖使用個體的分布式集合來執(zhí)行任務(wù)的工作不同监右,我們在這里描述的范型并不依賴于利他主義的動機(jī)或金錢激勵來引誘人們執(zhí)行某些操作;相反异希,它們依賴于人類對娛樂的渴望健盒。因此,GWAP是一種游戲称簿,在這種游戲中扣癣,玩家游戲的副產(chǎn)品能夠執(zhí)行有用的計(jì)算。每個GWAP都應(yīng)該與一個計(jì)算機(jī)問題相關(guān)聯(lián)憨降,從而產(chǎn)生輸入-輸出行為父虑。
通過設(shè)計(jì)玩家努力實(shí)現(xiàn)的目標(biāo)(獲勝條件)和一套決定玩家在游戲過程中可以做什么和不能做什么的規(guī)則,就完全能夠指定一個游戲授药。GWAP規(guī)則應(yīng)該鼓勵玩家正確地執(zhí)行必要的步驟來解決計(jì)算機(jī)問題士嚎,如果可能的話,還應(yīng)該包含一個有關(guān)游戲輸出的正確性的概率保證悔叽,即使玩家不希望游戲輸出是正確的莱衩。
游戲的關(guān)鍵性能是讓人們想玩兒。如果玩家投入足夠的時間玩游戲骄蝇,我們會因此回避任何關(guān)于“有趣”和“令人愉快”的哲學(xué)討論膳殷,而將游戲定義為“成功的”游戲。
我們提出一個轉(zhuǎn)化的過程,可以將一個問題轉(zhuǎn)變?yōu)镚WAP赚窃。對于一個對人類來說很容易但對計(jì)算機(jī)來說很難或不可能解決的問題册招,將其轉(zhuǎn)化為GWAP的過程包括:首先創(chuàng)造一個游戲,使得其結(jié)構(gòu)(如規(guī)則和獲勝條件)鼓勵計(jì)算和正確輸出勒极。
我們已經(jīng)創(chuàng)建了許多GWAP是掰,包括ESP游戲、Peekaboom辱匿、Phetch和Verbosity键痛,之后探索了三種游戲結(jié)構(gòu)模板,它們使人類計(jì)算游戲的成功實(shí)例得以推廣:輸出協(xié)議游戲匾七、反演問題游戲和輸入?yún)f(xié)議游戲絮短。
增加玩家的樂趣
也許GWAP最重要的方面是,將輸出的過程設(shè)計(jì)得充滿樂趣昨忆。在如前所述的ESP游戲中丁频,并不是指導(dǎo)玩家直接輸入給定圖像的關(guān)鍵字。相反邑贴,告訴他們輸入他們的伙伴可能正在輸入的內(nèi)容席里。人們享受游戲的過程促使他們想要繼續(xù)玩下去,從而產(chǎn)生更多有用的輸出拢驾。
留意到之前定義的三個基本模板描述GWAP的基本結(jié)構(gòu)是非常重要的;必須添加額外的游戲機(jī)制奖磁,以增加玩家的樂趣。例如繁疤,之前許多描述游戲設(shè)計(jì)原則的工作都將挑戰(zhàn)視為一個游戲成功的關(guān)鍵元素咖为。挑戰(zhàn)可以轉(zhuǎn)化為游戲特性,如限時反應(yīng)嵌洼、分?jǐn)?shù)保持案疲、玩家技能等級封恰、高分列表和隨機(jī)性麻养。
1)限時反應(yīng)。為游戲環(huán)節(jié)設(shè)定時間限制的設(shè)計(jì)會以限時反應(yīng)的形式將挑戰(zhàn)引入游戲中诺舔。告知玩家在指定的時間內(nèi)完成指定數(shù)量的問題實(shí)例鳖昌。如果完成了,他們可以因表現(xiàn)好得到額外的分?jǐn)?shù)低飒。時限反應(yīng)是引入挑戰(zhàn)的有效方法许昨,因?yàn)槠浣⒘嗣鞔_的目標(biāo),如果妥善地校準(zhǔn)游戲褥赊,實(shí)現(xiàn)這些目標(biāo)對玩家來說很重要糕档。
從關(guān)于心理學(xué)和組織行為的動機(jī)的文獻(xiàn)中,我們了解到拌喉,與過于簡單或模糊的目標(biāo)相比速那,明確規(guī)定且具有挑戰(zhàn)性的目標(biāo)會能夠使玩家更努力完成任務(wù)和產(chǎn)生高水平表現(xiàn)俐银。玩家在給定時間內(nèi)需要完成的任務(wù)數(shù)量必須經(jīng)過校準(zhǔn),才能引入挑戰(zhàn)端仰,并且必須在整個游戲中顯示時間限制和剩余時間捶惜。
2)分?jǐn)?shù)保持。激勵玩家的最直接方法之一是對游戲中產(chǎn)生的每個成功輸出實(shí)例分配分?jǐn)?shù)荔烧。在ESP游戲中吱七,如果成對的玩家為圖片選擇的單詞成功地達(dá)成一致(這個單詞就成為了圖片的標(biāo)簽),就能得到分?jǐn)?shù)鹤竭。通過設(shè)定游戲中的努力踊餐、表現(xiàn)(達(dá)到獲勝條件)和結(jié)果(分?jǐn)?shù))之間明確的關(guān)聯(lián),使用分?jǐn)?shù)能夠提高玩家玩游戲的積極性臀稚。每場比賽后的得分匯總也將表現(xiàn)反饋給玩家市袖,從而促進(jìn)評估有關(guān)得分目標(biāo)的進(jìn)步(例如超過上一場比賽的得分以及在設(shè)定的時間限制內(nèi)完成所有任務(wù)實(shí)例)。
3)玩家技能等級烁涌。玩家技能等級苍碟,或者說排位,是游戲開發(fā)者將基于目標(biāo)的激勵納入GWAP設(shè)計(jì)的另一種方式撮执。例如微峰,ESP游戲和Peekaboom都有五個技能等級,玩家可以通過他們積累的分?jǐn)?shù)達(dá)到這些等級抒钱。新玩家一開始是沒有分?jǐn)?shù)的蜓肆,會被指定為最低等級(“新手”),然后必須獲得一定分?jǐn)?shù)才能升至下一級別谋币。
在每個游戲環(huán)節(jié)之后仗扬,玩家會看到他們當(dāng)前的技能水平和達(dá)到下一個級別所需的分?jǐn)?shù)。來自ESP游戲的數(shù)據(jù)表明蕾额,這種呈現(xiàn)技能等級信息的方式強(qiáng)烈地影響了玩家的積極性和行為早芭。截至2008年7月,在20萬名擁有ESP游戲賬戶的玩家中诅蝶,42%的玩家都在5000分的排名截斷點(diǎn)以內(nèi)退个。鑒于這些技能等級的分?jǐn)?shù)區(qū)間只占可能累積分?jǐn)?shù)范圍的不到2%,數(shù)據(jù)表明許多玩家繼續(xù)玩游戲只是為了達(dá)到一個新的排名调炬。
4)高分列表语盈。激勵玩家玩GWAP游戲的另一種方法是使用高分列表,顯示特定時間內(nèi)得分最高的玩家的登錄名和分?jǐn)?shù)缰泡。根據(jù)列表時限劃分的難度刀荒,玩家登上高分列表需要的分?jǐn)?shù)因難度不同而變化,從在過去一個小時或一周的游戲環(huán)節(jié)中獲得的最高分?jǐn)?shù)到歷史最高分都有。
例如缠借,按小時顯示的高分列表會給玩家提供能夠進(jìn)入列表的一個明確的目標(biāo)總分资溃,并且能夠在一小時內(nèi)獲得關(guān)于他們朝著目標(biāo)進(jìn)步的快速反饋。每日高分列表和歷來的高分列表定義了增加難度的目標(biāo)烈炭。這些多級目標(biāo)因難度進(jìn)行區(qū)分溶锭,為擴(kuò)展游戲玩法和相關(guān)數(shù)據(jù)生成提供了強(qiáng)大而正面的激勵。
5)隨機(jī)性符隙。GWAP也應(yīng)該包含隨機(jī)性趴捅。例如,特定游戲環(huán)節(jié)的輸入通常是從所有可能的輸入集合中隨機(jī)選擇的霹疫,為了防止作弊拱绑,玩家會被隨機(jī)配對。
因?yàn)檩斎胧请S機(jī)選擇的丽蝎,所以它們的難度也會有所不同猎拨,對資深玩家和新手一視同仁,從而保持游戲的趣味性和吸引力屠阻。這也意味著每個游戲環(huán)節(jié)都存在不確定性红省,不確定所有輸入是否都能在限定時間內(nèi)完成,這就為玩家增加了挑戰(zhàn)国觉。
隨機(jī)的搭檔分配也確保每個游戲環(huán)節(jié)的唯一性吧恃。ESP游戲的軼事證據(jù)表明,在每個游戲環(huán)節(jié)中麻诀,玩家會對他們的搭檔的相對技能產(chǎn)生一種感覺痕寓,這種感知會影響他們的聯(lián)合表現(xiàn)。玩家能夠從這些游戲中獲得聯(lián)系感蝇闭,這是激勵他們重復(fù)玩游戲的因素之一呻率。
輸出精確性
在基本模板結(jié)構(gòu)之外,GWAP必須添加額外的機(jī)制呻引,以確保輸出的正確性和防范玩家串通舞弊礼仗。例如,ESP游戲的玩家可能會試圖繞過游戲內(nèi)置的驗(yàn)證機(jī)制苞七,在游戲開始前共謀每次都對圖像輸入字母“a”; 在這種情況下藐守,它們總能相互匹配挪丢,而將不正確的數(shù)據(jù)輸入系統(tǒng)蹂风。我們將在下面的章節(jié)中描述普遍適用的機(jī)制,已證實(shí)這些機(jī)制成功地防止玩家串通乾蓬,并保證在所有游戲模板中計(jì)算的正確性惠啄。
1)隨機(jī)匹配。GWAP的目的是同時面向成百上千的玩家,并且大多數(shù)玩家都是分布在不同的地點(diǎn)撵渡。隨機(jī)配對或分組的玩家不可能知道搭檔的身份融柬,所以無法提前串通舞弊。因此趋距,在隨機(jī)匹配的規(guī)則下粒氧,兩個或兩個以上使用相同策略的作弊者配對的概率應(yīng)該很低。
2)玩家測試节腐。游戲可能會隨機(jī)地呈現(xiàn)玩家的輸入外盯,對輸入的所有可能的正確輸出已經(jīng)為人知曉。對于他們來說翼雀,如果某個特定玩家的輸出與已知的正確輸出不匹配饱苟,那么這些玩家就會被認(rèn)為可疑,他們的結(jié)果都不具有可信度狼渊。根據(jù)呈現(xiàn)給玩家的“測試”輸入的數(shù)量箱熬,這種策略能夠以很高的概率保證輸出是正確的。為了說明這一點(diǎn)狈邑,假設(shè)提供給玩家的輸入中一半是測試輸入城须,那么,玩家新的輸出可能是正確的米苹,當(dāng)然前提是玩家在所有測試輸入中至少有50%的時間內(nèi)的新輸出是正確的酿傍,這種可能性可以通過重復(fù)測試來提高。
3)重復(fù)驱入。游戲應(yīng)該設(shè)計(jì)成只有一定數(shù)量的玩家完成輸出赤炒,才考慮輸出的正確性。這種確定正確性的策略使任何GWAP能夠以任意的高概率保證正確的輸出亏较。例如莺褒,思考一下輸出協(xié)議游戲;如果對于給定的輸入雪情,僅在n對玩家完成輸出后遵岩,游戲才承認(rèn)輸出是正確,并且游戲本身知道這n對玩家中的每一對以至少50%的概率(作為玩家測試的結(jié)果)完成了正確的輸出巡通,則該輸出在至少(I–? n)的概率上是正確的尘执。
4)禁忌輸出。為了解決許多不同的輸出可以與同一個輸入相關(guān)聯(lián)的情況下存在的問題(例如用單詞標(biāo)記圖像)宴凉,確保輸出空間的充分覆蓋是一個重要的考慮因素誊锭。使用“禁忌”或禁止,輸出可以保證所有玩家都能完成全部可能的輸出中的大部分輸出弥锄。禁忌輸出是指在不允許玩家進(jìn)入的游戲環(huán)節(jié)期間屏幕上顯示的正確輸出丧靡。
禁忌輸出可以取自前幾輪游戲中生成的正確輸出倒慧。為了考慮潛在的輸出啟動效應(yīng)(在這種效應(yīng)中拿愧,特定禁忌輸出會影響他們完成的猜測),并確保給定輸入的所有潛在輸出都得到廣泛覆蓋,游戲設(shè)計(jì)師必須隨機(jī)指定所要呈現(xiàn)的禁忌輸出掠河。
GWAP評估
如何判斷一個游戲的表現(xiàn)是否成功烦衣?如果兩個不同的GWAP解決同一個問題讥此,哪一個是最好的呢兔甘?我們介紹一組決定GWAP成功的指標(biāo),包括產(chǎn)量卤恳、游戲時間和預(yù)期貢獻(xiàn)捏顺。
游戲效率與預(yù)期貢獻(xiàn)。如果我們將游戲視為算法纬黎,那么效率便自然是一種評估指標(biāo)幅骄。對于任何給定的問題,都有許多可能的算法本今,有些算法比其他算法更有效拆座。同樣,對于任何給定的問題冠息,都有許多可能的GWAP可以解決挪凑。為了選擇解決問題的最佳方案,我們需要借由一種方法從效率上比較備選方案逛艰。標(biāo)準(zhǔn)算法的效率通過計(jì)算原子步驟來衡量躏碳。例如,快速排序(QuickSort)的運(yùn)行時間是O(n log n)散怖,這意味著它以大約n log n個計(jì)算步驟對包含n個元素的列表進(jìn)行排序菇绵。就GWAP來說,構(gòu)成計(jì)算步驟的因素在概念上還不太清楚镇眷。因此咬最,我們必須能夠通過其他方法來確定效率。
首先欠动,我們將GWAP的產(chǎn)量定義為每小時人力時間所解決的問題實(shí)例的平均數(shù)永乌,或所執(zhí)行的輸入輸出映射的平均數(shù)。例如具伍,ESP游戲的產(chǎn)量約為每小時人力時間產(chǎn)生233個標(biāo)簽翅雏。這是通過測驗(yàn)在一段時間內(nèi)單個輸入(或圖像)與輸出(或標(biāo)簽)完成匹配的數(shù)量來計(jì)算的。
在計(jì)算產(chǎn)量時人芽,必須考慮學(xué)習(xí)曲線和玩家技能的變化望几。大多數(shù)游戲都需要玩家參與特定類型的學(xué)習(xí),這意味著利用重復(fù)的游戲環(huán)節(jié)進(jìn)行學(xué)習(xí)啼肩,久而久之橄妆,玩家會對游戲操作更加熟練衙伶。對于我們之前介紹的游戲模板祈坠,隨著時間的推移害碾,這種學(xué)習(xí)方式可以讓玩家操作游戲的速度更快。為了解釋玩家技能和玩家速度隨時間的推移發(fā)生的變化赦拘,我們將產(chǎn)量定義為每小時人力時間解決問題的平均數(shù)量慌随。這個平均值是在相當(dāng)長的一段時間內(nèi)綜合所有游戲環(huán)節(jié)以及所有玩家的表現(xiàn)得出的。
比起那些低產(chǎn)量的游戲躺同,應(yīng)該優(yōu)先考慮高產(chǎn)量的游戲阁猜,但是產(chǎn)量并不是唯一的衡量標(biāo)準(zhǔn),因?yàn)镚WAP是一種游戲蹋艺,所以“趣味性”也必須考慮在內(nèi)剃袍。如果沒有人想玩游戲,那么給定的游戲能夠解決多少問題實(shí)例就無關(guān)緊要了捎谨。因此民效,對GWAP效用的真正衡量標(biāo)準(zhǔn)是綜合游戲產(chǎn)量和樂趣。
樂趣很難量化涛救,取決于每款游戲的精確設(shè)計(jì)與實(shí)現(xiàn)畏邢。即使是對游戲用戶界面或得分系統(tǒng)看似微不足道的修改也會顯著影響產(chǎn)生樂趣的程度。我們對這一難以捉摸的衡量標(biāo)準(zhǔn)進(jìn)行量化的方法是計(jì)算并使用游戲的“平均游戲時間”(ALP)作為代理標(biāo)準(zhǔn)检吆。ALP是指某一游戲所有玩家中平均每個玩家玩此游戲所花費(fèi)的總時間舒萎。例如,在ESP游戲中蹭沛,每個玩家平均總共玩了91分鐘臂寝。
“預(yù)期貢獻(xiàn)”是我們對GWAP質(zhì)量的總結(jié)性的衡量標(biāo)準(zhǔn)。只要游戲開發(fā)者了解在游戲中每花一個小時人力時間平均解決的問題(產(chǎn)量)以及每個玩家在游戲中預(yù)期需要花費(fèi)的時間(ALP)摊灭,便能夠綜合這些指標(biāo)評估每個玩家的預(yù)期貢獻(xiàn)交煞。預(yù)期貢獻(xiàn)指的是單個玩家通過玩特定游戲能夠解決的問題實(shí)例的平均數(shù)量。然后斟或,開發(fā)人員可以使用這個衡量標(biāo)準(zhǔn)作為評估GWAP的一般方法素征。我們對三個GWAP指標(biāo)定義如下:
產(chǎn)量=每小時解決的問題實(shí)例的平均數(shù)量;
ALP =某個游戲的玩家在這個游戲上平均(所有游戲玩家)花費(fèi)的總時間;
預(yù)期貢獻(xiàn)=產(chǎn)量×ALP。
雖然這種方法無法捕捉到游戲的某些方面(如“受歡迎程度”和感染力萝挤,或口碑)御毅,但它是一個相當(dāng)穩(wěn)定的對游戲可行性的衡量標(biāo)準(zhǔn)。
之前對測量樂趣和游戲樂趣的可用性慣例的研究表明怜珍,自我報告問卷調(diào)查是比較有用的方法端蛆。然而,行為性衡量標(biāo)準(zhǔn)(如產(chǎn)量)是一個更準(zhǔn)確直接的評估方法酥泛,可以評估人們玩游戲的次數(shù)今豆,轉(zhuǎn)而評估游戲?qū)?shí)現(xiàn)計(jì)算目的的幫助有多大嫌拣。
最后,GWAP的開發(fā)者必須驗(yàn)證游戲的設(shè)計(jì)確實(shí)是正確的呆躲。也就是說异逐,游戲的輸出正確地映射到向它供給的特定的輸入中。有一種驗(yàn)證方法(如ESP游戲插掂,Peekaboom灰瞻,Phetch和Verbosity)是在人類志愿者的幫助下對輸出進(jìn)行分析。我們使用了兩種方法來驗(yàn)證這種輸出:將游戲產(chǎn)生的輸出與有償參與者(而非游戲玩家)的輸出進(jìn)行比較辅甥,并讓自由“評估人”評估游戲中產(chǎn)生的輸出的質(zhì)量酝润。GWAP的輸出應(yīng)與有償參與者的輸出質(zhì)量相當(dāng)。
結(jié)論
我們所闡述的構(gòu)建GWAP的一套指導(dǎo)方針代表了用于無縫融合計(jì)算和游戲的第一個通用方法璃弄,盡管仍有許多工作要做要销。事實(shí)上,我們希望研究人員能夠?qū)@里描述的方法和衡量指標(biāo)進(jìn)行改進(jìn)夏块。
除了我們介紹的三個模板之外疏咐,可能還有其他的GWAP模板,希望在未來的工作中能鑒定出其他的GWAP模板拨扶。我們也希望更好地理解問題模板的適用性凳鬓,即對于某些類型的計(jì)算問題,某些模板是否比其他模板更適合患民。
到目前為止缩举,我們開發(fā)的游戲模板主要將相似性視為確保輸出的正確性的一種方法;玩家會因?yàn)榕c其他玩家的思考方式相似而得到獎勵匹颤。但對于解決某些類型的問題仅孩,這可能并非是最佳方法;尤其是對于需要創(chuàng)造力的任務(wù)而言印蓖,多樣化的觀點(diǎn)和視角對產(chǎn)生最廣泛的輸出集來說是最佳方法辽慕。為這些任務(wù)開發(fā)新的模板可能是一個值得探討的領(lǐng)域,另外赦肃,我們還想了解哪些問題(如果有的話)不屬于GWAP方法的范疇溅蛉。
到目前為止,我們所設(shè)計(jì)的游戲旨在解決的問題都很容易被劃分成子任務(wù)他宛。這些游戲的“小而美”特性提高了它們的受歡迎程度船侧,對休閑玩家特別有吸引力,因?yàn)檫@類玩家通常會選擇那些無需投入太多時間就可以“再玩一次”的游戲厅各。
GWAP方法象征一個很有前途的機(jī)會镜撩,即每個人都可以為人工智能的進(jìn)步做出貢獻(xiàn)。通過利用人們在線玩游戲的時間队塘,GWAP游戲開發(fā)者能夠捕獲大量表達(dá)人類獨(dú)特感知能力的訓(xùn)練數(shù)據(jù)集袁梗,這些數(shù)據(jù)有助于開發(fā)具有高級感知或智力技能的計(jì)算機(jī)程序和自動系統(tǒng)宜鸯。
EpiK?Protocol?銘識協(xié)議
EpiK Protocol 致力于去中心化的超大規(guī)模知識圖譜構(gòu)建,通過去中心化存儲技術(shù)(IPFS)遮怜、去中心化自治組織(DAO)和通證經(jīng)濟(jì)模型(Token Economy)淋袖,組織并激勵全球社區(qū)成員將人類各領(lǐng)域知識梳理成知識圖譜,共建共享并持續(xù)更新這一人類永恒知識庫奈泪,從而將人工智能(AI)的視野拓展到更智能的未來适贸。