一敬特、 定義
1. 可用性(usability):
根據(jù)ISO 9241-11的定義赵刑,可用性是指在特定環(huán)境下院喜,產(chǎn)品為特定用戶用于特定目的時所具有的有效性既鞠、效率和主觀滿意度。
有效性是用戶完成特定任務(wù)和達(dá)成特定目標(biāo)時所具有的正確和完整程度朦肘。——能夠完成任務(wù)饭弓。
效率是用戶完成任務(wù)的正確和完成程度與所用資源(如時間)之間的比率。——快速完成任務(wù)媒抠。
主觀滿意度是用戶在使用產(chǎn)品過程中所感受到的主觀滿意和接受程度示启。——用的很滿意
Nielsen認(rèn)為可用性有五個指標(biāo),分別是易學(xué)性领舰、交互效率夫嗓、易記性、容錯性和用戶滿意度冲秽。產(chǎn)品只有在每個指標(biāo)上都達(dá)到很好的水品舍咖,才具有高的可用性。
易學(xué)性(learnability):產(chǎn)品是否易于學(xué)習(xí)
交互效率(efficiency):即客戶使用產(chǎn)品完成具體任務(wù)的效率
易記性(memorability):客戶擱置某產(chǎn)品一段時間后是否仍然記得如何操作
容錯性(errors):用戶使用產(chǎn)品時能夠少出錯锉桑,系統(tǒng)必須防止災(zāi)難性錯誤發(fā)生排霉。
滿意度(satisfaction):用戶使用產(chǎn)品主觀上感到滿意。
簡單來說民轴,可用性可以理解為“多大程度可以使用”攻柠,直接關(guān)系著產(chǎn)品是否能滿足用戶的功能性需要球订,是用戶體驗(yàn)中的一種工具性成分,是交互式產(chǎn)品的重要質(zhì)量指標(biāo)瑰钮。
2. 可用性測試:
在產(chǎn)品或產(chǎn)品原型階段實(shí)施的通過觀察或訪談或二者相結(jié)合的方法冒滩,發(fā)現(xiàn)產(chǎn)品或產(chǎn)品原型存在的可用性問題,為設(shè)計改進(jìn)提供依據(jù)浪谴。
該產(chǎn)品可能是一個網(wǎng)站开睡,軟件,或者其他任何產(chǎn)品苟耻,它可能尚未成型篇恒。測試可以是早期的紙上原型測試,也可以是后期成品的測試凶杖。
可用性測試不是用來評估產(chǎn)品整體的用戶體驗(yàn)胁艰,主要是發(fā)現(xiàn)潛在的誤解或功能在使用時存在的錯誤。
二智蝠、什么時候做
有了產(chǎn)品原型之后就可以做:
可以是灰度產(chǎn)品原型腾么,這時候多采用訪談的方式;
也可以是高保真原型寻咒,這時候通常觀察與訪談相結(jié)合哮翘;
一般使用高保真的Demo颈嚼,可以用Prott毛秘,F(xiàn)linto,proto阻课,墨刀等來制作,制作力求真實(shí)還原應(yīng)用的最終實(shí)現(xiàn)效果叫挟。
制作高保真Demo比較耗時,可以忽略一些動效限煞,界面等抹恳。在驗(yàn)證產(chǎn)品概念的階段,也可以直接用會的模型署驻。具體依實(shí)際情況而定奋献。
三、怎么做
按照可用性測試所處于的軟件開發(fā)階段旺上,可以將可用性評估劃分為形成性評估和總結(jié)性評估瓶蚂。
形成性評估:是指在產(chǎn)品開發(fā)或改進(jìn)過程中,請用戶對產(chǎn)品或原型進(jìn)行測試宣吱,通過測試后收集的數(shù)據(jù)來改進(jìn)產(chǎn)品或設(shè)計直至達(dá)到所要求的可用性目標(biāo)窃这。
形成性評估的目標(biāo)是發(fā)現(xiàn)盡可能多的可用性問題,通過修復(fù)可用性問題實(shí)現(xiàn)軟件可用性的提高征候。
總結(jié)性評估:橫向評估多個版本或者多個產(chǎn)品杭攻,輸出評估數(shù)據(jù)進(jìn)行對比祟敛。
通常我們提到可用性測試,大多是指形成性評估兆解。
1. 幾種常用的測試方法:
認(rèn)知預(yù)演(Cognitive Walkthroughs):
由Wharton等(1990)提出馆铁。測試步驟;
a. 定義目標(biāo)用戶、代表性的測試任務(wù)痪宰、每個任務(wù)正確的行動順序叼架、用戶界面
b. 然后進(jìn)行行動預(yù)演并不斷地提出問題: 包括用戶能否達(dá)到任務(wù)目的,用戶能否采用適當(dāng)?shù)牟僮鞑襟E衣撬,用戶能否根據(jù)系統(tǒng)的反饋信息評價是否完成任務(wù)
c.最后進(jìn)行評論乖订,諸如要達(dá)到什么效果,某個行動是否有效具练,某個行動是否恰當(dāng)乍构,某個狀況是否良好。
該方法優(yōu)點(diǎn)在于能夠使用任何低保真原型扛点,包括紙原型哥遮。
該方法缺點(diǎn)在于:評價人不是真實(shí)的用戶,不能很好地代表用戶陵究。
產(chǎn)品經(jīng)理或設(shè)計人員的自我審查法眠饮?
啟發(fā)式評估(Heuristic Evaluation):
由Nielsen和Molich(1990)提出。
由多位評價人(通常4至6人)根據(jù)可用性原則反復(fù)瀏覽系統(tǒng)各個界面铜邮,獨(dú)立評估系統(tǒng)仪召,允許各位評價人在獨(dú)立完成評估之后討論各自的發(fā)現(xiàn),共同找出可用性問題松蒜。
10大可用性原則
十大可用性測試原則:
狀態(tài)可見原則(Visibility of system status):
用戶的任何操作扔茅,單擊,滑動秸苗,按下按鈕等召娜,頁面應(yīng)即時給出反饋【ィ“即時”是指玖瘸,頁面響應(yīng)時間小于用戶能忍受的等待時間。
環(huán)境貼切原則(Match between system and the real world):
產(chǎn)品的一切表現(xiàn)或表述檀咙,應(yīng)該盡可能貼近用戶所在的環(huán)境(年齡雅倒、學(xué)歷、文化攀芯、時代背景)屯断。
系統(tǒng)應(yīng)該用用戶的語言,用詞,短語和用戶熟悉的概念殖演,而不是系統(tǒng)術(shù)語氧秘。
《iPhone人機(jī)交互指南》里提到的隱喻與擬物化是很好的實(shí)踐。
用戶控制性與自由度趴久,撤銷重做原則(User control and freedom):
不要替用戶做決定丸相。
為了避免用戶的誤用和誤擊,產(chǎn)品應(yīng)該可以撤銷彼棍,重做灭忠。
一致性原則(Consistency and standards):
同一用語,功能座硕,操作一致弛作。
防錯原則(Error prevention):
比出現(xiàn)錯誤信息提示更好的是更用心的設(shè)計防止這類問題發(fā)生。在用戶選擇動作發(fā)生之前华匾,就要防止用戶容易混淆或者錯誤的選擇映琳。
識別比記憶好,易取原則(Recognition rather than recall):
盡量減少用戶對操作目標(biāo)的記憶負(fù)荷蜘拉,動作和選項(xiàng)都應(yīng)該是可見的萨西。用戶不必記住一個頁面到另一個頁面的信息。系統(tǒng)的使用說明應(yīng)該是可見的或者是容易獲取的旭旭。
靈活高效原則(Flexibility and efficiency of use) :
中級用戶的數(shù)量遠(yuǎn)高于初級和高級用戶數(shù)谎脯。為大多數(shù)用戶設(shè)計,不要低估持寄,也不可輕視源梭,保持靈活高效。
審美與簡約設(shè)計--易掃原則(Aesthetic and minimalist design):
互聯(lián)網(wǎng)用戶瀏覽網(wǎng)頁的動作不是讀际看,不是看咸产,而是掃矢否。易掃仲闽,意味著突出重點(diǎn),弱化和剔除無關(guān)信息僵朗。
幫助用戶識別赖欣,診斷,并從錯誤中恢復(fù)-- 容錯原則(Help users recognize,diagnose, and recover from errors) :
錯誤信息應(yīng)該用語言表達(dá)(不要用代碼)验庙,較準(zhǔn)確地反應(yīng)問題所在顶吮,并且提出一個建設(shè)性的解決方案。
人性化幫助原則(Help and documentation):
幫助性提示最好的方式是:1粪薛、無需提示悴了;2、一次性提示;3湃交、常駐提示熟空;4;幫助文檔搞莺。如果系統(tǒng)不使用文檔是最好的息罗,但是有必要提供幫助和文檔。任何信息應(yīng)容易去搜索才沧,專注于用戶的任務(wù)迈喉,列出具體的步驟來進(jìn)行。
該方法的優(yōu)點(diǎn)在于專家決斷比較快温圆、使用資源少挨摸,能夠提供綜合評價,評價機(jī)動性好岁歉,但是也存在不足之處:
一是會受到專家的主觀影響油坝,
二是沒有規(guī)定任務(wù),會造成專家評估的不一致---可以預(yù)設(shè)評估任務(wù)刨裆,
三是評價后期階段由于評價人的原因造成信度降低澈圈,
四是專家評估與用戶的期待存在差距,所發(fā)現(xiàn)的問題僅能代表專家的意思帆啃。
用戶測試法(User Test):
讓用戶真正地使用軟件系統(tǒng)瞬女,由實(shí)驗(yàn)人員對實(shí)驗(yàn)過程進(jìn)行觀察、記錄和測量努潘。
這種方法可以準(zhǔn)確地反饋用戶的使用表現(xiàn)诽偷、反映用戶的需求,是一種非常有效的方法疯坤。用戶測試可分為實(shí)驗(yàn)室測試和現(xiàn)場測試报慕。實(shí)驗(yàn)室測試是在可用性測試實(shí)驗(yàn)室里進(jìn)行的,而現(xiàn)場測試是由可用性測試人員到用戶的實(shí)際使用現(xiàn)場進(jìn)行觀察和測試压怠。
一般情況下我們講可用性測試眠冈,指的是用戶測試法:讓一群有代表性的用戶嘗試對產(chǎn)品進(jìn)行典型操作,同時觀察員在一旁觀察菌瘫,聆聽蜗顽,做記錄,從而發(fā)現(xiàn)產(chǎn)品的可用性問題雨让,為設(shè)計提供改進(jìn)依據(jù)雇盖。
套用來自網(wǎng)易u(yù)edc的一張圖:
可用性測試
2. 用戶測試法詳細(xì)測試流程
可用性測試的一般過程
2.1. 測試之前--確定目標(biāo)與范圍
產(chǎn)品的不同階段,測試目標(biāo)及側(cè)重點(diǎn)有所不同栖忠,開始之前我們需明確一些基本問題崔挖。
WHY:為什么進(jìn)行這個測試贸街?測試目標(biāo)是什么?
是探索型測試--發(fā)現(xiàn)產(chǎn)品可用性問題狸相,還是驗(yàn)證型測試--驗(yàn)證不同設(shè)計方案的合理性匾浪,最終選擇最優(yōu)方案?
WHEN:什么時候測試卷哩?時間需與用戶協(xié)調(diào)
WHERE:在哪里測試蛋辈?實(shí)驗(yàn)室模擬還是真實(shí)環(huán)境?現(xiàn)場測試還是遠(yuǎn)程測試将谊?測試設(shè)備還是用戶設(shè)備冷溶?
WHAT: 測試什么?測試的功能點(diǎn)等尊浓。
在產(chǎn)品設(shè)計初期逞频,需關(guān)注產(chǎn)品整體層面的問題,如導(dǎo)航的合理性栋齿、頁面邏輯關(guān)系等苗胀,這個階段可能只有低保真原型可以用于測試,這時任務(wù)設(shè)計需寬泛有彈性瓦堵,關(guān)注核心流程基协。
產(chǎn)品設(shè)計基本完善,開始進(jìn)行細(xì)節(jié)的修改迭代菇用,且有可用的高保真原型或現(xiàn)成產(chǎn)品澜驮,則需要精細(xì)的任務(wù)設(shè)計。
最后我們還要準(zhǔn)備測試工具:
用以記錄用戶操作行為惋鸥,用戶手勢杂穷,最好同步記錄用戶表情和聲音。一般使用鏡像軟件擴(kuò)展屏幕+攝像頭/麥克風(fēng)記錄表情聲音+PC錄屏卦绣。
常用方案:
iOS--Display Recorder + QuickTime耐量;
Android--Mobizen + AirDroid
2.2 典型測試任務(wù)設(shè)計
a. 列出任務(wù)清單
資源有限,任務(wù)不宜過多滤港,只列出重要的廊蜒,核心的,你覺得可能有問題的任務(wù)蜗搔。
b. 將任務(wù)還原為場景
這和需求分析階段的由場景抽象任務(wù)的過程剛好相反劲藐。場景是要讀給用戶聽或給用戶看的內(nèi)容八堡,對用戶來說樟凄,你的功能并不重要,重要的是他們的目的以及他們完成目的的過程兄渺,因此場景必須包含用戶行為目標(biāo)與動機(jī)缝龄。
應(yīng)盡量避免“直接指導(dǎo)操作”式的語言描述方式:
例如:想考察豆瓣讀書頁面【想要】按鈕是否能被看到、是否具備可點(diǎn)擊感。下面列出兩種表述方式叔壤,以作對比:
A.請找到您喜歡的那本書瞎饲,并在該頁面點(diǎn)擊【想要】。(×)
B.請找到您喜歡的那本書炼绘,并在該頁面對其作個標(biāo)記嗅战。(√)
c. 確定任務(wù)完成的必要條件
需要提前準(zhǔn)備提供給用戶的東西,比如是否需求新的賬號
d.預(yù)測試
預(yù)測試是正式實(shí)施可用性測試前的一次模擬俺亮, 模擬有助于發(fā)現(xiàn)問題驮捍,這時候邀請同事即可。把正式測試的流程走一遍脚曾,包括設(shè)配的調(diào)試东且、訪談切入、問題的提問本讥、記錄者的記錄等珊泳,然后把記錄的錄音、視頻等放出來看看效果如何拷沸,效果不如意的時候再進(jìn)行調(diào)整色查。
總之,預(yù)測試可以幫助發(fā)現(xiàn)問題撞芍,包括以下幾個方面的問題:
設(shè)備的問題综慎。舉個例子,錄音設(shè)備放置的位置會影響錄音的效果勤庐。
測試腳本的問題示惊。測試問題是否足夠清晰。
訪談的切入以及問題的提問愉镰。
記錄者的記錄米罚。
發(fā)現(xiàn)問題之后去解決問題,才能使正式測試的時候達(dá)到更好的效果丈探。
2.3. 典型用戶招募
a. 找誰來
可以從三個角度入手:
人口學(xué)特征录择,性別、年齡碗降、學(xué)歷隘竭、職業(yè)、地域等
使用動機(jī)讼渊,如買家/賣家动看、企業(yè)/個人等
使用經(jīng)驗(yàn),如產(chǎn)品使用時長爪幻、競品使用情況菱皆、互聯(lián)網(wǎng)使用年限等须误。
這里的重點(diǎn)是有代表性的用戶,依據(jù)分析前期的用戶畫像仇轻,盡量包含多種類型的用戶京痢。
b. 找多少人來
Nielsen的研究發(fā)現(xiàn),5個用戶可以發(fā)現(xiàn)80%以上的可用性問題篷店,一般不超過5個用戶祭椰。
c.怎么找用戶
同事(非同部門)或者好友也是目標(biāo)用戶,可以選用同事或者好友作為測試人員
通過官方微博疲陕,微信吭产,論壇等進(jìn)行招募
委托第三方機(jī)構(gòu)尋找
2.4. 正式測試
-1. 事前接待
-2. 暖場介紹
-3. 正式測試
-4. 結(jié)束感謝
測試中有三種角色:用戶,主持人鸭轮,記錄人臣淤。
用戶:
使用產(chǎn)品,完成測試任務(wù)窃爷,說出自己的想法
主持人:
可能是用研人員邑蒋,也可能是產(chǎn)品和設(shè)計人員自己。引導(dǎo)用戶完成測試任務(wù)按厘。
要強(qiáng)調(diào)的是,在測試中不要試圖教用戶如何使用產(chǎn)品逮京,也不要試圖向用戶推銷你的產(chǎn)品。
測試前主持人做什么
測試中
測試后
記錄人:
記錄時都要注意草描,記錄的重點(diǎn)不是用戶說了什么,而是用戶如何使用策严。
記住,在測試中逛绵,做了什么比說了什么更重要。
可以同時記錄問題倔韭,但不要急于討論問題的解決方案术浪。因?yàn)轳R上想到的方案或者用戶提出的方案并不一定是最好的,這個工作可以留待可以安靜思考或者大家討論時進(jìn)行
發(fā)聲思考:
被測試者一邊使用系統(tǒng)胰苏,一邊不停地說出他們的想法——在操作用戶界面的同時份名,把他們所想的東西簡單地轉(zhuǎn)化為語言妓美,表達(dá)出來鲤孵。
2.5. 數(shù)據(jù)分析——可用性問題分級
-1 匯編和總結(jié)測試中獲得的數(shù)據(jù)
任務(wù)完成度:每個測試任務(wù)都對應(yīng)一個目標(biāo)辰如,只有當(dāng)用戶達(dá)到目標(biāo)之后琉兜,我們才認(rèn)為他們完成了任務(wù)。對于每個任務(wù)豌蟋,用戶完成的情況如何梧疲?有多少用戶最終沒能完成任務(wù)?多少用戶需要在主持人提示下完成任務(wù)幌氮?多少人可以自行完成任務(wù)?這些都是很重要的指標(biāo)米者。
完成任務(wù)的時間:每個任務(wù)需要完成多少時間宇智,決定了交互設(shè)計流程和界面的設(shè)計是否足夠友好。
主觀情緒:用戶對于任務(wù)的主觀感受败明,比如是否足夠簡單太防,是否容易找到信息,可以讓用戶衡量一下讳嘱。
偏好和建議:可以讓用戶說出產(chǎn)品中哪些地方很喜歡酿愧?哪些地方不喜歡?或者讓他們提一下建議嬉挡。
-2 可用性問題分級
經(jīng)過可用性測試汇恤,可能會發(fā)現(xiàn)產(chǎn)品或頁面的很多可用性問題因谎。為了方便內(nèi)部人員決策颜懊,需要對這些可用性問題進(jìn)行分類或等級界定。常見的分級方法有:
a. 五級劃分
5級:無關(guān)緊要的錯誤
4級:問題雖小但卻讓用戶焦躁
3級:中等程度匠璧,耗費(fèi)時間但不會丟失數(shù)據(jù)
2級:導(dǎo)致數(shù)據(jù)丟失的嚴(yán)重問題
1級:災(zāi)難性錯誤咸这,導(dǎo)致數(shù)據(jù)的丟失或者軟硬件的損壞
b. 三級劃分
低:會讓參加者心煩或沮喪,但不會導(dǎo)致任務(wù)失敗酿雪。
中:與任務(wù)的失敗有一定關(guān)系但不直接導(dǎo)致任務(wù)的失敗侨艾。
高:直接導(dǎo)致任務(wù)失敗的問題。
c. 二維劃分袋励。根據(jù)出現(xiàn)頻率和影響嚴(yán)重性劃分当叭。
d. 決策樹蚁鳖。根據(jù)以下三個因素綜合決定的:
頻率(Frequency):偶然的or經(jīng)常性的
影響(Impact):容易克服or很難克服
持續(xù)性(Persistence):一次性的or持續(xù)的
e. 多維劃分。根據(jù)問題所屬范圍和問題出現(xiàn)頻率 :
問題所屬范圍:交互钾腺、視覺讥裤、文案、功能间螟、bug
問題出現(xiàn)頻率:N個人出現(xiàn)同樣的錯誤
-3 根據(jù)問題的嚴(yán)重程度和緊急程度排序撰寫最終測試報告。
四荣瑟、小結(jié)
大廠有可用性測試實(shí)驗(yàn)室摩泪,普通公司,有可用性測試就不錯了仙辟。那一般公司有哪些機(jī)會可以進(jìn)行可用性測試鳄梅?
產(chǎn)品經(jīng)理自測法:
認(rèn)知預(yù)演未檩,啟發(fā)式評估,沒有人孙蒙,對照可用性原則悲雳,自己來
同事:
-原型階段合瓢,向同事解說你的原型,在說明的過程中晴楔,大家會貢獻(xiàn)很多問題及建議
-有了可運(yùn)行產(chǎn)品税弃,設(shè)計典型任務(wù),請同事幫忙預(yù)測試
客戶現(xiàn)場:觀察客戶操作
不管是請同事測则果,還是請客戶試用西壮,抓住與使用者接觸的機(jī)會,都可以做一些小批量的可用性測試贡定,上文中的一些主持人的引導(dǎo)可都,注意事項(xiàng)都是通用的蚓耽,個人感受最深的幾點(diǎn)是:
不要和用戶討論旋炒,這很容易變成爭論瘫镇;
不要評論用戶的意見,既不要批評也不要反對铣除,這很容易失焦尚粘,表示“知道了”就可以;
不要在當(dāng)下想解決方案秉继,這通常都不是最佳方案泽铛;
一句話,少說多聽杠茬。