可靠性:當(dāng)重復(fù)測試的時(shí)候偷线,是否還會(huì)的到與原來一樣的結(jié)果栋烤。要考慮解決可用性問題花費(fèi)的成本和收益之間的問題酿愧。這里設(shè)計(jì)置信度問題,置信度是用戶在一定時(shí)間范圍內(nèi)完成任務(wù)的百分比政敢。置信度低到一定程度才值得去修正這個(gè)可用性問題其徙。因此對于實(shí)際開發(fā)來說把目標(biāo)定在80%的置信程度就可以了。(這里給出的確定測試用戶人數(shù)的方法有不太能直接操作的地方喷户,這里就不記錄了)
有效性:所測試的結(jié)果是否能夠真實(shí)地反應(yīng)出想要測試的可用性問題唾那。典型的有效性問題包括選擇了不恰當(dāng)?shù)挠脩簟⒔o出了不當(dāng)?shù)挠脩魷y試任務(wù)褪尝、沒有考慮時(shí)間約束和社會(huì)因素的影響闹获。
6.1測試目標(biāo)和測試計(jì)劃
明確測試目的,是對界面進(jìn)行形成性評估還是總結(jié)性評估河哑。
形成性評估:主要目標(biāo)是了解界面細(xì)節(jié)方面的優(yōu)劣避诽,以及如何改進(jìn)設(shè)計(jì)。典型方法是邊說邊做璃谨。
總結(jié)性評估:目的是評定界面的整體質(zhì)量沙庐,例如2選一,或者了解競品好在哪佳吞。典型方法是度量型測試(給產(chǎn)品的易學(xué)習(xí)性拱雏、效率、專管滿意度打分底扳、量化铸抑。參考本書第2章)。
測試計(jì)劃
計(jì)劃中列請:測試目的衷模、時(shí)間羡滑、地點(diǎn)、用時(shí)算芯、硬件設(shè)備柒昏、軟件、系統(tǒng)版本熙揍、系統(tǒng)響應(yīng)快慢职祷、測試人員、測試用戶、具體測試任務(wù)有梆、用戶完成測試的標(biāo)準(zhǔn)是尖、測試時(shí)用戶的輔助幫助、收集什么數(shù)據(jù)泥耀、界面是否成功的標(biāo)準(zhǔn)饺汹。
測試預(yù)算
包含:咨詢專家、測試人員的工作痰催、軟件開發(fā)人員的工作兜辞、測試用戶、設(shè)備夸溶、場地逸吵、耗材。
試點(diǎn)測試
正式測試之前進(jìn)行試點(diǎn)測試缝裁,以發(fā)現(xiàn)測試計(jì)劃的不足扫皱,可以找同事,最好是測試用戶捷绑。修訂測試任務(wù)韩脑,或者分配合適的時(shí)間。
6.2招募測試用戶
尋找測試用戶的主要原則粹污,就是所選測試用戶越能代表預(yù)期使用系統(tǒng)的用戶越好段多。
測試用戶除了是最終用戶,也可以試銷售人員:把產(chǎn)品的可演示性做好厕怜,能促進(jìn)銷售。
以下為如何招募:
如果是為某個(gè)公司的用戶定制蕾总,那么測試人員就是使用的員工粥航,要注意用戶的資歷等。
針對特定類型用戶的設(shè)計(jì)生百,比如醫(yī)生递雀、律師等,就要從幾個(gè)不同的顧客哪里找測試用戶蚀浆。
面向普通大眾的產(chǎn)品缀程,可以通過中介、招募學(xué)生等手段來招募測試用戶市俊。
新手用戶還是熟練用戶
對這兩類用戶分別測試杨凑,測試任務(wù)中有些會(huì)不同。
有時(shí)需要就界面上用戶不熟悉的地方進(jìn)行培訓(xùn)摆昧,培訓(xùn)內(nèi)容不要涉及主要的測試任務(wù)撩满。
用戶間還是用戶內(nèi)測試
對于比較產(chǎn)品或者版本的可用性測試,有兩種基本方法來選擇測試用戶:用戶間測試、用戶內(nèi)測試伺帘。
用戶間測試是在不同的系統(tǒng)測試中使用不同的測試用戶昭躺。隱患是用技能存在巨大個(gè)體差異,一次可能需要一定數(shù)量的用戶數(shù)伪嫁,來抵消用戶個(gè)體的差異领炫。并隨機(jī)分配組。
用戶內(nèi)測試就是讓所有測試用戶來使用所有被測試的系統(tǒng)张咳。這種方法能抵消用戶個(gè)體差異帝洪,但是用戶進(jìn)行完第一個(gè)系統(tǒng)后再去使用其他系統(tǒng)就不是新手了。因此最好隨機(jī)分組晶伦,進(jìn)行交叉測試碟狞。
6.3選擇實(shí)驗(yàn)人員
最好選擇以前曾使用過所選測試方法的有經(jīng)驗(yàn)的實(shí)驗(yàn)人員。實(shí)驗(yàn)人員需要具備測試方法方面的知識婚陪,也要有大量有關(guān)應(yīng)用程序和用戶界面方面的知識族沃。
設(shè)計(jì)人員作為記錄員,可用性專業(yè)人員和用戶交流泌参。
6.4用人來進(jìn)行測試的倫理問題
測試前:
在用戶來之前準(zhǔn)備好所有的東西
強(qiáng)調(diào)測試的對象是產(chǎn)品而不是用戶
告知用戶軟件是新的脆淹,沒被測試過,可能存在問題
讓用戶知道他們隨時(shí)可以停止測試
解釋所有的記錄沽一、監(jiān)控設(shè)備
告訴用戶測試結(jié)果會(huì)被完全保密
在開始前回答用戶的所有問題
測試過程中:
讓用戶盡早體驗(yàn)到成功
一次給用戶一個(gè)測試任務(wù)
在測試房間保持輕松的氛圍盖溺,提供零食飲料中間休息時(shí)間
避免干擾,關(guān)上房門貼出免打擾铣缠,關(guān)掉電話
不要以任何方式表現(xiàn)出用戶正在犯錯(cuò)誤或者用戶操作太慢
測試觀察人員數(shù)量保持最少
不允許用戶的上司觀看測試
如果測試過程不愉快烘嘱,在必要時(shí)可以停止
測試之后:
向用戶說明是他們幫助發(fā)現(xiàn)了要改進(jìn)的地方
千萬不能以可以區(qū)分出具體用戶的方式報(bào)告測試結(jié)果
只有在用戶同意情況下,才能在可用性小組外公開錄像內(nèi)容
6.5測試任務(wù)
測試任務(wù)盡可能代表系統(tǒng)的最終使用蝗蛙,大致覆蓋用戶界面上最重要的那些部分蝇庭。
測試任務(wù)要設(shè)計(jì)的比較小,保證有限時(shí)間內(nèi)完成捡硅,但也不能太小哮内。測試任務(wù)應(yīng)該詳細(xì)精確說明用戶執(zhí)行后產(chǎn)生什么結(jié)果。
測試任務(wù)書面形式提供給用戶壮韭。實(shí)驗(yàn)人員要回答用戶關(guān)于任務(wù)描述提出的問題北发。
測試任務(wù)不要輕佻、滑稽或者有冒犯喷屋,應(yīng)該是面向業(yè)務(wù)處理的琳拨。任務(wù)難度由簡單到復(fù)雜,幫助用戶建立信心屯曹。最后的任務(wù)也相應(yīng)的要設(shè)計(jì)的讓用戶感到自己完成了一些事情从绘。
6.6測試的各個(gè)階段
1寄疏、準(zhǔn)備
在實(shí)驗(yàn)的準(zhǔn)備階段,實(shí)驗(yàn)人員應(yīng)該確保測試房間已經(jīng)準(zhǔn)備好僵井,計(jì)算機(jī)系統(tǒng)已處于測試計(jì)劃中規(guī)定的初始狀態(tài)陕截,還有所有準(zhǔn)備的測試材料、指南和問卷都已經(jīng)準(zhǔn)備就緒批什。
2农曲、介紹
參見本文6.4的內(nèi)容
介紹完成后交給用戶測試指南和測試任務(wù),詢問用戶是否有疑問驻债。
3乳规、測試
測試期間,實(shí)驗(yàn)人員通常不要與用戶進(jìn)行交流合呐,也不要有任何個(gè)人觀點(diǎn)或關(guān)于用戶操作好或者不好的表示暮的。
對用戶明顯停滯感覺不快的時(shí)候,實(shí)驗(yàn)人員要提供幫助淌实。
有多人參與實(shí)驗(yàn)的情況下冻辩,要指定一名實(shí)驗(yàn)員,其他成員有疑問不能在測試進(jìn)行中提出拆祈。
4恨闪、事后交流
測試之后,要求用戶填寫一份主觀滿意度問卷放坏。
然后再與用戶進(jìn)行討論咙咽,請用戶對系統(tǒng)使用情況進(jìn)行評論并提出改進(jìn)意見,并請用戶回答實(shí)驗(yàn)員的一些關(guān)于測試中的疑問淤年。
測試用戶離開后钧敞,實(shí)驗(yàn)員盡快檢查測試結(jié)果,標(biāo)記資料等麸粮,撰寫簡短報(bào)告溉苛。完成試驗(yàn)后,撰寫完整報(bào)告豹休。
6.7績效度量方法
評估是否達(dá)到可用性目標(biāo)(本書4.3節(jié))炊昆,以及比較競爭產(chǎn)品桨吊。對用戶績效水平的度量通常是通過讓一組測試用戶完成預(yù)先規(guī)定的測試任務(wù)威根,收集所用時(shí)間和出錯(cuò)率等數(shù)據(jù)。
關(guān)于度量的一個(gè)主要問題是所度量的東西可能與真正想要評估的特性關(guān)系不大视乐。比如像評估系統(tǒng)的可用性洛搀,評估的東西可能是用戶完成任務(wù)的時(shí)間,完成任務(wù)的時(shí)間并不能完全代表可用性佑淀。
度量方法中包含:量化指標(biāo)(測試任務(wù))留美、度量績效的方法(如何進(jìn)行用戶測試)、收集研究數(shù)據(jù)的方式、明確定義任務(wù)什么時(shí)候開始和結(jié)束谎砾。
6.8邊做邊說法
邊說邊做就是讓測試用戶在使用系統(tǒng)的同事把他們的想法說出來逢倍,可能是單個(gè)最有價(jià)值的可用性方法。
優(yōu)點(diǎn)是1景图、能從很少量的用戶那里收集定性數(shù)據(jù)较雕。2、能在用戶操作時(shí)就顯示出用戶在做什么和為什么這樣做挚币,而不必以后再來推斷分析亮蒋。3、獲得用戶喜歡和不喜歡的小感觸妆毕。
缺點(diǎn)是1慎玖、不適用于大多數(shù)類型的績效度量。2笛粘、邊說邊做用戶犯的錯(cuò)誤比沉默用戶少趁怔,速度慢,測試結(jié)果可能不準(zhǔn)確闰蛔。
可以在邊說邊做測試之前痕钢,為用戶演示如何邊說邊做。
協(xié)同交互方法
邊說邊做的一種變形叫做協(xié)同交互序六,就是讓兩個(gè)測試用戶同時(shí)使用一個(gè)系統(tǒng)任连。
優(yōu)點(diǎn)是比單一用戶邊說邊做自然一些,人們習(xí)慣于在共同解決問題時(shí)說出自己的想法例诀。
缺點(diǎn)是用戶可能有不同的學(xué)習(xí)和使用產(chǎn)品的策略随抠。
這個(gè)方法適合對兒童使用的用戶界面的可用性測試。也適合容易找到大量用戶并且費(fèi)用低廉的情況下繁涂。
回顧式測試
如果測試期間錄了像拱她,就可以讓用戶回顧錄像的內(nèi)容來獲得額外信息,叫做回顧式測試扔罪。在難以找到有代表性測試用戶時(shí)尤其有用秉沼。缺點(diǎn)是每個(gè)測試的時(shí)間較長。
輔導(dǎo)方法
輔導(dǎo)方法是在測試用戶和實(shí)驗(yàn)人員之間有清楚的交互過程矿酵。測試用戶可以問任何與系統(tǒng)相關(guān)的問題唬复,輔導(dǎo)員盡可能回答這些問題。
通常關(guān)注新手用戶全肮,發(fā)現(xiàn)這類用戶的信息需求敞咧。可以用在面向用戶群小辜腺、特殊或者報(bào)酬高的情況休建。還能用于想用熟練用戶測試卻找不到的情況乍恐。
6.9可用性實(shí)驗(yàn)室
有專門的試驗(yàn)室最好,沒有也可以测砂。
可用性實(shí)驗(yàn)室通常有隔音的單面鏡茵烈,隔開觀察間和測試間。測試前可以請用戶參觀觀察間砌些。還可以在觀察間后面設(shè)立討論間瞧毙,讓第三組人員觀察討論。觀察間可以放置攝像機(jī)寄症。
需不需要錄像
實(shí)際上測試本身來說不太需要錄像宙彪,發(fā)現(xiàn)的問題當(dāng)下就能記錄下來,查看錄像消耗時(shí)間不如進(jìn)行更多用戶測試有巧。
但是錄像释漆,能回到錄像帶中準(zhǔn)確調(diào)查有多少用戶遇到同樣的問題,耽誤了多少時(shí)間篮迎。使用錄像帶容易說服不同意見者男图。同時(shí)配備大量設(shè)備,可以給可用性工作形成廣告價(jià)值甜橱。
沒有攝像機(jī)的錄像
錄屏和聲音逊笆。缺點(diǎn)是用戶不在畫面內(nèi)。優(yōu)點(diǎn)是用戶能感覺放松一些岂傲。
便攜式可用性實(shí)驗(yàn)室
一個(gè)記事本难裆,一個(gè)提供測試的硬件設(shè)備、便攜式錄像機(jī)镊掖、必要時(shí)可以有話筒和三腳架乃戈。
可以在用戶不愿去某個(gè)固定場所時(shí)進(jìn)行測試。
可用性信息亭
將界面和測試設(shè)備顯示在公司的人流大的地方亩进,收集用戶和路人的意見症虑。