可用性測(cè)試：任務(wù)評(píng)估模型與計(jì)量方式

文章來(lái)源：http://www.woshipm.com/user-research/751870.html

在可用性測(cè)試中，如何去評(píng)估測(cè)試的場(chǎng)景或流程呢？應(yīng)該包含哪些維度女轿？每個(gè)維度要如何測(cè)量缸血？怎樣在不同的任務(wù)間做橫向?qū)Ρ任矧勘疚木痛艘灰恢v述。

公司的產(chǎn)品最近發(fā)布了一個(gè)版本蚜迅，上線了比較多的新功能舵匾。所以需要針對(duì)這些新功能做一輪可用性測(cè)試。

可用性測(cè)試算是用研的一個(gè)入門級(jí)技能谁不，即使是從業(yè)年限不多的我也已經(jīng)做過(guò)多次坐梯，基本的方法和流程都比較熟悉了。但是之前做過(guò)的可用性測(cè)試有個(gè)缺陷：沒有建立一個(gè)嚴(yán)謹(jǐn)刹帕、科學(xué)的任務(wù)評(píng)估模型吵血。在可用性測(cè)試中如何去評(píng)估測(cè)試的場(chǎng)景或流程呢？應(yīng)該包含哪些維度偷溺？每個(gè)維度要如何測(cè)量蹋辅？怎樣在不同的任務(wù)間做橫向?qū)Ρ龋?/p>

評(píng)估模型

ISO9241中對(duì)“可用性”的定義是：特定用戶在特定的使用場(chǎng)景中，為了達(dá)到特定目標(biāo)而使用某產(chǎn)品時(shí)亡蓉，所感受到的有效性晕翠、效率和滿意度。

也就是說(shuō)，在定義好了用戶淋肾、場(chǎng)景和目標(biāo)的前提下硫麻，可用性包含了下面三個(gè)維度：

有效性（Effectiveness）：用戶完成特定目標(biāo)的正確和完整程度。

效率（Efficiency）：用戶完成特定目標(biāo)的效率樊卓，與消耗的資源（如時(shí)間）成反比拿愧。

滿意度（Satisfaction）：用戶使用產(chǎn)品時(shí)感受到的主觀滿意程度。

良好的可用性必須能夠同時(shí)滿足有效性碌尔、效率和滿意度三個(gè)條件浇辜；但是這三個(gè)維度也有層次之分，一般來(lái)說(shuō)唾戚，有效性問(wèn)題>效率問(wèn)題>滿意度問(wèn)題柳洋。

在可用性測(cè)試中，僅僅了解每個(gè)功能的可用性水平還不夠叹坦。即使兩個(gè)功能的可用性水平一樣熊镣，若一個(gè)是產(chǎn)品的基本功能、一個(gè)是價(jià)值不大的邊緣功能募书，我們還是需要優(yōu)先去優(yōu)化價(jià)值更高的功能绪囱。也就是說(shuō)，在評(píng)估一個(gè)任務(wù)時(shí)莹捡，除了可用性之外我們還需要考慮功能本身的價(jià)值鬼吵。尤其是在上線了新功能，或者我們對(duì)待測(cè)功能的價(jià)值還不太確信的時(shí)候篮赢。

功能的價(jià)值可以簡(jiǎn)單分為兩部分：用戶價(jià)值和商業(yè)價(jià)值齿椅。盡管有時(shí)候需要在商業(yè)價(jià)值和用戶價(jià)值之間權(quán)衡，但是作為一個(gè)體驗(yàn)導(dǎo)向的產(chǎn)品荷逞，還是應(yīng)該將用戶價(jià)值放在第一位媒咳。在用戶價(jià)值之上，若能夠滿足商業(yè)價(jià)值种远，則是更令人滿意的結(jié)果涩澡。

所以，在可用性測(cè)試中可以用下面這個(gè)模型來(lái)對(duì)測(cè)試的任務(wù)進(jìn)行評(píng)估：

測(cè)量方法

在上述模型中坠敷，有效性妙同、效率、滿意度都是常見的評(píng)估維度膝迎，有一些經(jīng)驗(yàn)方法可以參考粥帚；用戶價(jià)值也可以通過(guò)用戶評(píng)價(jià)獲得。而商業(yè)價(jià)值則需要根據(jù)產(chǎn)品的實(shí)際情況進(jìn)行評(píng)估限次，并且這一般是既有的知識(shí)芒涡，不需要在可用性測(cè)試過(guò)程中收集這個(gè)數(shù)據(jù)柴灯。因此在可用性測(cè)試中我們需要收集的數(shù)據(jù)就只包含四個(gè)維度：有效性、效率费尽、滿意度和用戶價(jià)值赠群。

有效性

可以用任務(wù)的完成情況來(lái)評(píng)估有效性，這個(gè)數(shù)據(jù)通過(guò)觀察用戶的操作過(guò)程即可獲得旱幼。

任務(wù)完成情況的測(cè)量主要參考NNG的建議查描，將每個(gè)用戶的操作結(jié)果標(biāo)記為失敗、部分完成或全部完成柏卤。

失敹：如果用戶認(rèn)為自己完成不了而放棄了任務(wù)，或者超過(guò)了限定時(shí)間仍然無(wú)法完成任務(wù)缘缚，則標(biāo)記為失敗勾笆。

需要對(duì)每個(gè)任務(wù)都設(shè)置一個(gè)限定時(shí)間。要求對(duì)功能非常熟悉的人（相關(guān)的產(chǎn)品桥滨、設(shè)計(jì)師都可以）按照任務(wù)提示進(jìn)行操作匠襟，記錄完成操作所需的時(shí)間，稱為熟練用時(shí)该园。如果想要提高熟練用時(shí)的測(cè)量準(zhǔn)確度，可以多找?guī)讉€(gè)熟手操作然后取其用時(shí)平均值帅韧。任務(wù)的限定時(shí)間根據(jù)熟練用時(shí)確定里初，一般是熟練用時(shí)的3-10倍，但是最高也不要超過(guò)10分鐘（沒有用戶會(huì)有耐心花10分鐘完成一個(gè)任務(wù)忽舟，如果真的需要這么久双妨，說(shuō)明任務(wù)設(shè)計(jì)得太復(fù)雜了）。

可以根據(jù)任務(wù)的難度確定倍數(shù)叮阅，如果任務(wù)對(duì)于小白用戶來(lái)說(shuō)確實(shí)很有難度刁品，那么可以適當(dāng)延長(zhǎng)任務(wù)限時(shí)；如果任務(wù)很簡(jiǎn)單浩姥，或者其中包含一些輸入的操作挑随，那么可以適當(dāng)減少任務(wù)限時(shí)（因?yàn)榇蜃滞容^費(fèi)時(shí)，而且對(duì)功能熟悉的人打字未必比用戶快）勒叠。

部分完成：用戶只完成了一部分的任務(wù)兜挨，沒有完成任務(wù)卡上的所有要求。比如眯分，你希望用戶創(chuàng)建一個(gè)日程并邀請(qǐng)小王加入拌汇，用戶成功創(chuàng)建了日程但是卻不知道如何（或者忘了）邀請(qǐng)小王，這就是部分完成弊决。之所以要區(qū)分“部分完成”這個(gè)類別噪舀，是因?yàn)樗?00%完成有差距，但是又不能與失敗混為一談。

完成：這個(gè)很容易理解与倡，就是在限定時(shí)間內(nèi)完成了任務(wù)卡上的所有要求界逛。

最后，我們需要根據(jù)這些數(shù)據(jù)計(jì)算每個(gè)任務(wù)的成功率蒸走。NNG的建議算法是：任務(wù)成功率=(完全完成的用戶數(shù)+部分完成的用戶數(shù)*0.5)/用戶總數(shù)仇奶，即完全完成率+部分完成率的一半。

除了用完成比驻、部分完成和失敗來(lái)評(píng)價(jià)任務(wù)完成情況外该溯，還可以考慮另一種方式：順利完成、遇到障礙后完成别惦、失敗狈茉。這是我之前使用的計(jì)分方式。這種方式下掸掸，以上所述的部分完成會(huì)被歸于失敗的類別（但如果用戶犯的是無(wú)傷大雅的錯(cuò)誤氯庆，比如輸入錯(cuò)誤，可以視為完成）扰付。而成功完成的用戶會(huì)被細(xì)分為順利完成的和遇到障礙后完成的堤撵。之所以這樣區(qū)分是因?yàn)檫@兩種情況揭示了不同的可用水平——能讓用戶輕松地完成的功能可以說(shuō)是相當(dāng)易用的。

效率

效率可以用時(shí)間測(cè)量羽莺，對(duì)用戶的操作過(guò)程計(jì)時(shí)实昨。

可以從用戶拿到任務(wù)卡開始計(jì)時(shí)，在用戶宣布自己已經(jīng)完成盐固、或者限定時(shí)間到了的時(shí)候即結(jié)束計(jì)時(shí)荒给。不要等到用戶讀完任務(wù)卡、開始操作時(shí)才計(jì)時(shí)刁卜，因?yàn)橛械挠脩袅?xí)慣讀完再操作志电，有的卻喜歡一邊讀一邊做。也不要在看到用戶完成了就結(jié)束計(jì)時(shí)蛔趴，而要等用戶自己認(rèn)為他已經(jīng)完成了挑辆，因?yàn)橛脩粲袝r(shí)候會(huì)在做完操作之后去檢查自己的操作是否成功了，這也應(yīng)該算作任務(wù)用時(shí)的一部分夺脾。

計(jì)時(shí)不需要太精確之拨。手動(dòng)計(jì)時(shí)存在幾秒鐘的誤差都算是正常的，而且用戶在操作過(guò)程中多說(shuō)了句話咧叭、或者應(yīng)用響應(yīng)速度慢了些蚀乔，這些都會(huì)影響任務(wù)的完成時(shí)間（并且很多影響因素跟可用性并沒有關(guān)系）。所以計(jì)時(shí)只要精確到秒就好了菲茬，提高記錄的精確度也沒有意義吉挣。

在計(jì)算每個(gè)任務(wù)的效率水平的時(shí)候派撕，可以用用戶的平均用時(shí)除以熟練用時(shí)所得的倍數(shù)表示（數(shù)值越大表示效率越低）。

這是為了便于任務(wù)間的橫向比較睬魂，因?yàn)椴煌蝿?wù)的復(fù)雜度不同终吼，A任務(wù)平均用時(shí)1分鐘、B任務(wù)平均用時(shí)4分鐘氯哮，也不能說(shuō)明A的操作效率比B高际跪。通過(guò)平均用時(shí)/熟練用時(shí)的比值，可以知道新手與熟手之間的差距喉钢，從而了解因?yàn)橄到y(tǒng)的可用性及學(xué)習(xí)成本給用戶帶來(lái)的操作時(shí)間損耗姆打。

滿意度

滿意度涉及到用戶的主觀評(píng)價(jià)，因此需要通過(guò)用戶自評(píng)量表來(lái)收集肠虽。

這里參考的是Jakob Nielsen使用的一個(gè)單題項(xiàng)七點(diǎn)量表幔戏，并根據(jù)需要對(duì)題目進(jìn)行了修正：

用戶價(jià)值

用戶價(jià)值是指用戶感知到的功能價(jià)值，也需要通過(guò)用戶的評(píng)價(jià)獲得税课。

因?yàn)槲覀冏龅氖且豢钷k公軟件闲延，所以通過(guò)詢問(wèn)功能對(duì)工作的幫助來(lái)了解用戶價(jià)值：

滿意度和用戶價(jià)值都需要用戶評(píng)分，因此用戶在完成每個(gè)任務(wù)之后都會(huì)拿到同樣的兩個(gè)題目韩玩，要求對(duì)該任務(wù)做出評(píng)價(jià)垒玲。我會(huì)把不同任務(wù)的題目打印在同一張紙上，這樣用戶在評(píng)價(jià)時(shí)可以參考自己對(duì)前面的任務(wù)的評(píng)價(jià)來(lái)調(diào)整分?jǐn)?shù)找颓。

任務(wù)橫向?qū)Ρ?/p>

用有效性侍匙、效率、滿意度叮雳、用戶價(jià)值四個(gè)維度對(duì)任務(wù)進(jìn)行評(píng)價(jià)后，我們可以根據(jù)這些數(shù)據(jù)對(duì)不同的任務(wù)做橫向?qū)Ρ雀竞梗梢酝ㄟ^(guò)類似下方這樣的折線圖對(duì)比不同任務(wù)的情況帘不。

比如從上面這個(gè)示例圖中，我們可以看到任務(wù)2的可用性水平是比較低的（有效性水平低杨箭、完成時(shí)間長(zhǎng)寞焙、用戶滿意度低），但是它的用戶價(jià)值處于相對(duì)較高的水平互婿；而任務(wù)3的用戶價(jià)值最高捣郊，可用性水平居中。

有效性慈参、效率和滿意度都是用來(lái)評(píng)估可用性水平的呛牲。如果根據(jù)這三個(gè)數(shù)值計(jì)算出可用性水平，直接用可用性去做橫向?qū)Ρ韧耘洌欠窀奖隳啬锢壳拔奶岬皆诳捎眯灾凶湃祝行詥?wèn)題>效率問(wèn)題>滿意度問(wèn)題，所以在計(jì)算可用性水平時(shí)它們應(yīng)該有不同的權(quán)重琐旁；并且由于度量方式的不同涮阔，它們的量綱有較大差異（從上圖可以看出），需要做標(biāo)準(zhǔn)化處理灰殴。

因此敬特，我們需要對(duì)有效性、效率牺陶、滿意度分別做標(biāo)準(zhǔn)化處理伟阔，然后按照5:3:2的權(quán)重計(jì)分（或者其他權(quán)重，按需調(diào)整）：

可用性水平=Z(有效性)*0.5-Z(效率)*0.3+Z(滿意度)*0.2

（效率處用減號(hào)是因?yàn)槠溆脮r(shí)間測(cè)量义图，數(shù)值越大效率越低）

這樣我們得以在同個(gè)量綱上比較不同任務(wù)的可用性水平减俏，結(jié)合對(duì)功能價(jià)值的評(píng)估，可以得出類似這樣的四象限圖：

這樣的象限圖不僅可以幫助我們比較測(cè)試的各個(gè)功能的情況碱工，還能幫助確定體驗(yàn)優(yōu)化的優(yōu)先級(jí)娃承。功能價(jià)值高、可用性差的功能應(yīng)該列入最高優(yōu)先級(jí)怕篷，其次是功能價(jià)值較低历筝、可用性差的功能。

問(wèn)題優(yōu)先級(jí)

除了上述的評(píng)估模型外廊谓，在可用性測(cè)試中我們還會(huì)發(fā)現(xiàn)很多可用性問(wèn)題梳猪，這些問(wèn)題大概是可用性測(cè)試產(chǎn)生的最重要的數(shù)據(jù)了。那么蒸痹，這些可用性問(wèn)題是否需要進(jìn)行優(yōu)先級(jí)評(píng)估呢春弥？

可用性問(wèn)題當(dāng)然是有優(yōu)先級(jí)之分的，一個(gè)問(wèn)題是影響了功能的有效性叠荠、效率還是滿意度匿沛，就決定了這個(gè)問(wèn)題的優(yōu)先級(jí)如何。我認(rèn)為可以在每個(gè)任務(wù)之內(nèi)按照這個(gè)標(biāo)準(zhǔn)對(duì)發(fā)現(xiàn)的可用性問(wèn)題進(jìn)行排序榛鼎，但是不需要把所有任務(wù)發(fā)現(xiàn)的所有問(wèn)題羅列出來(lái)去排列優(yōu)先級(jí)逃呼。

優(yōu)化可用性問(wèn)題時(shí)應(yīng)該以功能（即可用性測(cè)試中的任務(wù)）為單位，而不是以問(wèn)題為單位——以問(wèn)題為單位容易只見樹木不見森林者娱，可能在修改了很多細(xì)節(jié)后仍然算不上好用抡笼。所以排列問(wèn)題優(yōu)先級(jí)時(shí)，也建議根據(jù)上面的四象限圖先確定功能的優(yōu)先級(jí)黄鳍，然后再去查看每個(gè)功能具體的可用性問(wèn)題的優(yōu)先級(jí)推姻。

作者：鄭少娜，云之家里一只特立獨(dú)行的用戶研究員框沟。想把生活踩在腳下拾碌，說(shuō)：“叫你搞事情吐葱！叫你搞事情！”

本文來(lái)源于人人都是產(chǎn)品經(jīng)理合作媒體@金蝶云之家體驗(yàn)中心（微信ID：UXD-Cloudhub）校翔，作者@鄭少娜

題圖來(lái)自 Pexels弟跑，基于 CC0 協(xié)議

最后編輯于：2017.12.11 03:50:51

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市防症，隨后出現(xiàn)的幾起案子孟辑，更是在濱河造成了極大的恐慌，老刑警劉巖蔫敲，帶你破解...
沈念sama閱讀 221,888評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件饲嗽，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡奈嘿，警方通過(guò)查閱死者的電腦和手機(jī)貌虾，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,677評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)裙犹，“玉大人尽狠，你說(shuō)我怎么就攤上這事∫镀裕” “怎么了袄膏？”我有些...
開封第一講書人閱讀 168,386評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)掺冠。經(jīng)常有香客問(wèn)我沉馆，道長(zhǎng)，這世上最難降的妖魔是什么德崭？我笑而不...
開封第一講書人閱讀 59,726評(píng)論 1贊 297
?港島之戀（遺憾婚禮）
正文為了忘掉前任斥黑，我火速辦了婚禮，結(jié)果婚禮上眉厨，老公的妹妹穿的比我還像新娘心赶。我一直安慰自己，他們只是感情好缺猛，可當(dāng)我...
茶點(diǎn)故事閱讀 68,729評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布。她就那樣靜靜地躺著椭符，像睡著了一般荔燎。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上销钝，一...
開封第一講書人閱讀 52,337評(píng)論 1贊 310
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音蒸健，去河邊找鬼座享。笑死婉商，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的渣叛。我是一名探鬼主播丈秩，決...
沈念sama閱讀 40,902評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼淳衙！你這毒婦竟也來(lái)了蘑秽？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,807評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤箫攀，失蹤者是張志新（化名）和其女友劉穎肠牲，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體靴跛，經(jīng)...
沈念sama閱讀 46,349評(píng)論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡缀雳，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,439評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了梢睛。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肥印。...
茶點(diǎn)故事閱讀 40,567評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖扬绪，靈堂內(nèi)的尸體忽然破棺而出竖独，到底是詐尸還是另有隱情，我是刑警寧澤挤牛，帶...
沈念sama閱讀 36,242評(píng)論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布莹痢，位于F島的核電站，受9級(jí)特大地震影響墓赴，放射性物質(zhì)發(fā)生泄漏竞膳。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,933評(píng)論 3贊 334
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一诫硕、第九天我趴在偏房一處隱蔽的房頂上張望坦辟。院中可真熱鬧，春花似錦章办、人聲如沸锉走。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,420評(píng)論 0贊 24
一樁弒父案藕届，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)挪蹭。三九已至，卻和暖如春休偶，著一層夾襖步出監(jiān)牢的瞬間梁厉，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,531評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工踏兜，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留词顾，地道東北人八秃。一個(gè)月前我還...
沈念sama閱讀 48,995評(píng)論 3贊 377
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像肉盹，于是被迫代替她去往敵國(guó)和親昔驱。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,585評(píng)論 2贊 359

可用性測(cè)試：任務(wù)評(píng)估模型與計(jì)量方式

推薦閱讀更多精彩內(nèi)容