文/Jakob Nielsen 翻譯/ONES Piece 何聰聰
譯者按:做用戶(hù)測(cè)試,聽(tīng)起來(lái)好像是件非常高大上、專(zhuān)業(yè)耀鸦、要花掉一大筆錢(qián)的事情。但其實(shí)并非如此啸澡。這篇文章是Nielsen Norman咨詢(xún)集團(tuán)的董事袖订、「十大可用性原則」理論的提出人Jakob Nielsen博士在2000年發(fā)表的,所以里面都是在談?wù)摼W(wǎng)站而不是現(xiàn)在更流行的app嗅虏。但是這并不妨礙我們思考他的結(jié)論洛姑,并且做出嘗試。
有人認(rèn)為可用性測(cè)試又燒錢(qián)又復(fù)雜皮服,即使要用也應(yīng)該是那一小部有預(yù)算楞艾、有時(shí)間的網(wǎng)頁(yè)設(shè)計(jì)項(xiàng)目上面参咙。但事實(shí)并非如此。復(fù)雜的可用性測(cè)試確實(shí)是種浪費(fèi)硫眯。其實(shí)蕴侧,每次測(cè)試只需不超過(guò)五個(gè)用戶(hù)。只要盡可能多搞些這種小測(cè)試两入,就能取得最佳效果净宵。
在之前的研究中,Tom Landauer和我曾提出裹纳,在一項(xiàng)有n個(gè)用戶(hù)參與的可用性測(cè)試中择葡,能夠找到的相關(guān)問(wèn)題的數(shù)量是:N (1-(1- L ) ^n )
其中,N是該產(chǎn)品設(shè)計(jì)中關(guān)于可用性的問(wèn)題的總數(shù)剃氧,L是測(cè)試單個(gè)用戶(hù)所能發(fā)現(xiàn)的可用性問(wèn)題占通過(guò)他發(fā)現(xiàn)的問(wèn)題總數(shù)的比例敏储。通常,L的值為31%朋鞍,這是我們研究大量項(xiàng)目后計(jì)算出的一個(gè)均值已添。如果取L為31%,將上述公式表示成曲線(xiàn)番舆,則如下圖:
(譯者注:橫軸是測(cè)試用戶(hù)的個(gè)數(shù)酝碳。豎軸是測(cè)試中發(fā)現(xiàn)的關(guān)于可用性的問(wèn)題的總數(shù)矾踱。)
不出意料恨狈,從這個(gè)曲線(xiàn)中我們看到,沒(méi)有測(cè)試的話(huà)我們得到的反饋是零呛讲。
一旦從第一位測(cè)試用戶(hù)那里搜集到了數(shù)據(jù)禾怠,你一下子就會(huì)有不少想法,幾乎就是關(guān)于這項(xiàng)設(shè)計(jì)的可用性你所應(yīng)該知道的全部問(wèn)題的三分之一贝搁。沒(méi)有數(shù)據(jù)和即使有一丁點(diǎn)兒的數(shù)據(jù)之間可謂天差地別吗氏。
當(dāng)你測(cè)試第二位用戶(hù)的時(shí)候,你會(huì)發(fā)現(xiàn)他/她的有些表現(xiàn)跟第一位用戶(hù)是一樣的雷逆,所以你新得知的東西里面其實(shí)有一部分重疊弦讽。毫無(wú)疑問(wèn),沒(méi)有兩個(gè)人是相同的膀哲,所以第二位用戶(hù)總是能給你帶來(lái)一些新的東西往产,而這些東西是你在測(cè)試第一位用戶(hù)時(shí)沒(méi)有觀(guān)察到的。所以某宪,第二位用戶(hù)能帶來(lái)一些新鮮的想法仿村,但遠(yuǎn)不及第一位用戶(hù)多。
第三位用戶(hù)的很多行為可能你已經(jīng)在第一位或者第二位用戶(hù)身上兴喂,甚至在兩者身上你都已經(jīng)觀(guān)察到了蔼囊。不過(guò)當(dāng)然了焚志,即使比不上第一位和第二位用戶(hù),這第三位用戶(hù)依然會(huì)給你帶來(lái)些許新的數(shù)據(jù)畏鼓。
隨著你測(cè)試的用戶(hù)越來(lái)越多酱酬,你能新獲取的東西會(huì)越來(lái)越少,因?yàn)槟銓⒁淮未蔚乜吹酵瑯拥臇|西云矫。所以真的沒(méi)有必要不斷地觀(guān)察相同的東西岳悟,你將會(huì)迫不及待地想回到你的工作臺(tái)前重新設(shè)計(jì)網(wǎng)站來(lái)消除這些可用性方面的問(wèn)題。
從第五位用戶(hù)之后泼差,你就在浪費(fèi)你的時(shí)間重復(fù)觀(guān)察同樣的結(jié)論而沒(méi)有任何新的收獲贵少。
設(shè)計(jì)迭代
上面的曲線(xiàn)明確顯示,你需要測(cè)試至少15位用戶(hù)才能發(fā)現(xiàn)關(guān)于這項(xiàng)設(shè)計(jì)所有的可用性問(wèn)題堆缘。那為什么我建議只需要測(cè)試五位用戶(hù)呢滔灶?
主要是因?yàn)楸绕鸢阉匈Y源砸到一個(gè)復(fù)雜的大型測(cè)試?yán)铮杨A(yù)算分配到很多小型用戶(hù)測(cè)試會(huì)更理想『鸱剩現(xiàn)在我們假設(shè)你有足夠的預(yù)算來(lái)招募15位代表用戶(hù)進(jìn)行測(cè)試录平。很好,把這筆預(yù)算拿來(lái)做三次小測(cè)試缀皱,每次五名用戶(hù)斗这!
進(jìn)行多次測(cè)試是因?yàn)椋捎眯怨こ痰恼嬲康牟粌H僅是記錄設(shè)計(jì)的不足之處啤斗,而是做出改進(jìn)表箭。通過(guò)第一次對(duì)五名用戶(hù)進(jìn)行測(cè)試之后, 85%的可用性問(wèn)題已經(jīng)被發(fā)現(xiàn)钮莲。這時(shí)候你會(huì)希望著手重新設(shè)計(jì)免钻,解決這些問(wèn)題。
當(dāng)你完成新一輪的設(shè)計(jì)之后崔拥,你需要再次測(cè)試极舔。盡管我之前說(shuō)過(guò)新設(shè)計(jì)應(yīng)該“解決”在第一次測(cè)試中發(fā)現(xiàn)的問(wèn)題,事實(shí)上只是你認(rèn)為新的設(shè)計(jì)已經(jīng)解決了這些問(wèn)題链瓦。但是既然沒(méi)有人能夠設(shè)計(jì)出完美的用戶(hù)界面拆魏,誰(shuí)也不能保證這個(gè)新的設(shè)計(jì)真的解決了前述問(wèn)題。而第二次測(cè)試就能夠發(fā)現(xiàn)這些改進(jìn)是否真的奏效慈俯。另外渤刃,在引入新的設(shè)計(jì)的同時(shí),總有可能會(huì)引入新的問(wèn)題肥卡,即使舊問(wèn)題已經(jīng)得到了解決溪掀。
此外,第二次測(cè)試將會(huì)發(fā)現(xiàn)第一次測(cè)試中遺留的15%的可用性問(wèn)題中的一大部分步鉴。(然后還會(huì)有2%的原始問(wèn)題——這些問(wèn)題得等到進(jìn)行第三次測(cè)試才能被發(fā)現(xiàn)揪胃。)
最后璃哟,第二次用戶(hù)測(cè)試能更深入地發(fā)掘出網(wǎng)站在基礎(chǔ)結(jié)構(gòu)方面的可用性問(wèn)題,包括信息架構(gòu)喊递、任務(wù)流以及用戶(hù)需求匹配随闪。這些重要問(wèn)題常常在起初的測(cè)試中被忽略了,因?yàn)楸粶y(cè)試的用戶(hù)被一些愚蠢的骚勘、表面的問(wèn)題絆住了铐伴,沒(méi)能夠真正發(fā)現(xiàn)網(wǎng)站的深層次問(wèn)題。
所以第二次測(cè)試既能夠保證第一次測(cè)試結(jié)果的質(zhì)量俏讹,也能夠幫助提供更深刻的反饋当宴。經(jīng)過(guò)這次測(cè)試,你將得到一份新的(但數(shù)量更少的)需要在下一輪設(shè)計(jì)中解決的可用性問(wèn)題清單泽疆。上述問(wèn)題同樣適用于下一輪設(shè)計(jì):不是所有的解決措施都有效户矢;優(yōu)化完互動(dòng)界面之后,一些更深層次的問(wèn)題將浮出水面殉疼。所以梯浪,第三次測(cè)試也是有它的用武之地的。
比起一次15名用戶(hù)參與的龐大的測(cè)試瓢娜,三次僅有五名用戶(hù)的小測(cè)試能更有效地提升用戶(hù)體驗(yàn)挂洛。
為什么不一次只測(cè)試一個(gè)用戶(hù)
也許你會(huì)想15次一個(gè)用戶(hù)的測(cè)試會(huì)比三次五個(gè)用戶(hù)的測(cè)試效果更好。上面的曲線(xiàn)圖也確實(shí)顯示我們從第一個(gè)測(cè)試用戶(hù)那里所獲取的信息遠(yuǎn)多于之后的其他用戶(hù)眠砾。既然如此虏劲,我們會(huì)什么要在一次測(cè)試中納入第二第三甚至更多個(gè)用戶(hù)呢?原因有兩個(gè):
- 你有可能會(huì)被某一個(gè)用戶(hù)的不尋常行為所誤導(dǎo)荠藤,這些行為是偶然為之或者不具有代表性伙单。三個(gè)用戶(hù)就足以讓你大概了解用戶(hù)行為的多樣性以及其中哪些是特例哪些具有代表性的。
- 用戶(hù)測(cè)試的成本收益分析顯示哈肖,最佳的每次測(cè)試用戶(hù)數(shù)量在三到五個(gè)之間,具體要根據(jù)測(cè)試的方式而定念秧。一次測(cè)試的規(guī)劃和實(shí)施總是有固定的初始成本淤井,這就意味著最好是將這筆初始的開(kāi)銷(xiāo)平攤到從用戶(hù)那里所取得的成果上。
什么時(shí)候需要測(cè)試更多用戶(hù)
如果你的網(wǎng)站面向幾類(lèi)非常不同的用戶(hù)摊趾,那么你需要對(duì)更多用戶(hù)進(jìn)行測(cè)試币狠。以上方法只對(duì)那些對(duì)網(wǎng)站的利用方式相差無(wú)幾的具有可比性的用戶(hù)有效。
如果說(shuō)你的網(wǎng)站同時(shí)面向孩子和家長(zhǎng)砾层,這兩個(gè)用戶(hù)群的行為表現(xiàn)極其不同漩绵,你就有必要對(duì)這兩群人都進(jìn)行用戶(hù)測(cè)試。同樣的方法也適用于連接銷(xiāo)售方和購(gòu)買(mǎi)方的系統(tǒng)肛炮。
即使各個(gè)用戶(hù)群之間差異再大止吐,從兩個(gè)群體之間觀(guān)察得到的結(jié)果也總會(huì)存在很多共同之處宝踪。畢竟,所有的用戶(hù)都是人碍扔。此外瘩燥,很多可用性問(wèn)題是關(guān)于人與頁(yè)面交互的根本方式和其它網(wǎng)站對(duì)于用戶(hù)行為的影響。
在對(duì)多個(gè)差異巨大的用戶(hù)群體進(jìn)行測(cè)試的時(shí)候不同,你不需要像對(duì)單一群體進(jìn)行單一測(cè)試時(shí)那樣在每個(gè)群體中都納入那么多用戶(hù)厉膀。即使對(duì)每個(gè)群體測(cè)試時(shí)沒(méi)有很多的用戶(hù),但不同群體之間的觀(guān)察結(jié)果的重疊部分會(huì)確保最終結(jié)果的有效性二拐。所以我建議:
- 如果有兩個(gè)用戶(hù)群體服鹅,每個(gè)群體挑選三到四個(gè)用戶(hù)就行。
- 如果測(cè)試三個(gè)及以上的用戶(hù)群體百新,每個(gè)群體挑選三個(gè)用戶(hù)(通常你需要至少三個(gè)用戶(hù)來(lái)確保該群體中用戶(hù)行為的多樣性)菱魔。
本文原載于 Nielsen Norman Group,由ONES Piece 何聰聰編譯吟孙。ONES Piece是一個(gè)由ONES Ventures發(fā)起的非營(yíng)利翻譯計(jì)劃澜倦,聚焦科技、創(chuàng)投和商業(yè)杰妓。