A/B 分類測(cè)試
A/B分類測(cè)試使得網(wǎng)站可以通過比較同一網(wǎng)頁的不同設(shè)計(jì),來決定其中哪些設(shè)計(jì)將產(chǎn)生最好的結(jié)果裹芝。在A/B測(cè)試中用到的指標(biāo)是微觀和宏觀的轉(zhuǎn)化率踱稍。隨著那些不需要太多開發(fā)協(xié)助和技術(shù)資源就能運(yùn)作A/B測(cè)試的工具的出現(xiàn),A/B測(cè)試已經(jīng)變得愈加常見湃番。這個(gè)方法本在市場(chǎng)營銷從業(yè)者中有著很穩(wěn)的立腳點(diǎn)席吴,而因?yàn)槌杀鞠鄬?duì)較低赌结,它也正在越來越廣泛地被用戶體驗(yàn)設(shè)計(jì)師們所運(yùn)用捞蛋。許多大型電子商務(wù)網(wǎng)站如谷歌及亞馬遜都以“總在測(cè)試中”而著稱--他們?cè)谌魏芜m合都同時(shí)進(jìn)行著多組A/B測(cè)試。
?無用輸入柬姚,無用輸出(GIGO)
使用得恰當(dāng)時(shí)拟杉,A/B測(cè)試是一個(gè)非常強(qiáng)大的工具。然而以下三種情形下的A/B測(cè)試還是會(huì)有潛在的問題:
1)當(dāng)所要測(cè)試的設(shè)計(jì)元素并沒有很好地提現(xiàn)設(shè)計(jì)意圖量承。
糟糕的設(shè)計(jì)會(huì)導(dǎo)致糟糕的轉(zhuǎn)換率 - 這很顯而易見搬设。但是,每個(gè)設(shè)計(jì)都是一個(gè)產(chǎn)品概念的后續(xù)執(zhí)行撕捍,因而通過設(shè)計(jì)的實(shí)施來評(píng)判一個(gè)產(chǎn)品概念本身的優(yōu)劣是很可笑的拿穴。通常要經(jīng)過許多次設(shè)計(jì)嘗試才能充分地體現(xiàn)出真正的設(shè)計(jì)意圖。
比如說忧风,你可以認(rèn)為理論來說默色,增加對(duì)某一選項(xiàng)的說明會(huì)增加其被選擇的可能性,然而如果這條描述表達(dá)得像一則廣告狮腿,用戶就可能會(huì)無視腿宰。這個(gè)增加選項(xiàng)的說明的設(shè)計(jì)意圖是對(duì)的,但其表達(dá)形式卻是錯(cuò)的缘厢。因此設(shè)計(jì)意圖和設(shè)計(jì)結(jié)果的偏差可能會(huì)是致命的吃度。
當(dāng)設(shè)計(jì)元素本身并不能告訴你問題的源頭在哪。對(duì)問題起因的錯(cuò)誤推測(cè)贴硫,也會(huì)讓你在錯(cuò)誤的設(shè)計(jì)元素上浪費(fèi)時(shí)間椿每,因?yàn)樵撛貐s并非是該問題背后真正的原因。即便修改這個(gè)設(shè)計(jì)元素也不能真正解決問題夜畴,因?yàn)槟愕那腥朦c(diǎn)一開始就錯(cuò)了拖刃。比如删壮,你可能猜測(cè)一個(gè)貸款申請(qǐng)?zhí)峤晦D(zhuǎn)化率低是因?yàn)榱鞒痰捻撁嫣嗔颂盎妫阅惆阉鼭饪s到一個(gè)頁面里,但是你仍看不到任何轉(zhuǎn)化率的提升央碟。你忽略的是税灌,用戶真正的問題是找不到貸款利率,而他們點(diǎn)進(jìn)申請(qǐng)頁面其實(shí)是為了找貸款利率亿虽。
2)當(dāng)設(shè)計(jì)只是設(shè)計(jì)者的主觀猜想菱涤。
使用A/B測(cè)試時(shí)你只能從已提供的設(shè)計(jì)選項(xiàng)中找到最佳的那個(gè)。如果這些選項(xiàng)是基于主觀經(jīng)驗(yàn)和意見的話洛勉,誰又能說這個(gè)測(cè)試包含了最優(yōu)的設(shè)計(jì)呢粘秆?
3)這些A/B測(cè)試實(shí)驗(yàn)過程當(dāng)中的瑕疵可以通過用戶研究來減少。
即使只實(shí)施了些許的用戶研究收毫,我們?nèi)阅塬@取一些極其寶貴的有關(guān)于轉(zhuǎn)化率問題的潛在原因的線索攻走。
發(fā)現(xiàn)真正原因殷勘,定義更好的設(shè)計(jì)
發(fā)現(xiàn)(造成轉(zhuǎn)化率低的)真正原因,定義更好的(用于測(cè)試的)設(shè)計(jì)昔搂。
“實(shí)驗(yàn)可以證實(shí)一個(gè)理論玲销,但實(shí)驗(yàn)永遠(yuǎn)無法創(chuàng)造出一個(gè)理論。 ? ” - 愛因斯坦
要保證A/B測(cè)試執(zhí)行得好摘符,需要定義以下這幾步:
你可以先集中全部精力建立一套致因體系贤斜,并羅列設(shè)計(jì)元素的可能性,然后用A/B方法把他們?nèi)繙y(cè)試一遍:這是最直接了當(dāng)卻不免有一些魯莽的方法逛裤。不經(jīng)深思熟慮的 A/B測(cè)試等同于把想法往墻上扔然后看哪個(gè)能黏住瘩绒。不幸的是,你做不起這樣的測(cè)試:這樣大規(guī)模地測(cè)試會(huì)增大用戶放棄操作的幾率别凹,并且使總體驗(yàn)變?cè)愀獠菅取.?dāng)你等著從大量A/B測(cè)試像抽中彩票一樣找到最好的方案,用戶可能已經(jīng)轉(zhuǎn)而使用了他們第二選擇的產(chǎn)品炉菲。他們可能最終認(rèn)定你的網(wǎng)站是失敗的堕战,以后再也不來了。你需要縮小假設(shè)的數(shù)量范圍拍霜,并且小心謹(jǐn)慎嘱丢、高效地部署你的A/B測(cè)試;為達(dá)到此目的祠饺,我們推薦使用用戶研究的方法越驻。
提升最優(yōu)化測(cè)試的用戶體驗(yàn)研究方法
1)定義用戶意圖和可能反對(duì)的理由
理解人們?yōu)楹卧L問、是否能成功訪問道偷、和他們?yōu)楹螘?huì)離開缀旁,是相當(dāng)重要的。如果你錯(cuò)誤地假設(shè)了人們?cè)L問網(wǎng)站的原因勺鸦,那么你的起因理論和設(shè)計(jì)假設(shè)將不能夠反應(yīng)用戶感知該環(huán)境的真實(shí)情況并巍。沒有做過調(diào)查就對(duì)用戶離開的原因做假設(shè)是很危險(xiǎn)的。舉個(gè)例子换途,假定你假設(shè)訪問者沒有做意想中的操作(買單)是因?yàn)閮r(jià)格太高懊渡,你于是將價(jià)格降低,邊際利潤就受到了打擊军拟。如果人們真正不買賬的原因不是價(jià)格剃执,而是他們不理解你提供的服務(wù)所解決的需求是什么,那么你就大錯(cuò)特錯(cuò)了懈息。
讓我們來看看Netflix是怎么做的:
Netflix就做了一個(gè)很有趣的A/B測(cè)試來了解影響轉(zhuǎn)化率的因素肾档。Netflix的主頁上展示了大量的影視作品,然而不同用戶所看到的是不一樣的。作為其A/B測(cè)試的一部分怒见,這是該公司對(duì)用戶提供的個(gè)性化推薦戒祠。然而,不僅如此速种,Netflix更對(duì)看到同一個(gè)影視產(chǎn)品推薦的用戶進(jìn)行了分批測(cè)試姜盈。他們讓視覺設(shè)計(jì)師重新設(shè)計(jì)了不同版本的影視劇海報(bào),并將這一變量用于A/B測(cè)試配阵。得到的結(jié)果是馏颂,即便是同一個(gè)作品,不同的海報(bào)仍會(huì)造成不同的轉(zhuǎn)化率棋傍。這就印證了造成用戶離開或點(diǎn)擊的理由是多樣化的救拉。因此不要局限于那些明顯的理由,而要深掘用戶可能關(guān)注的點(diǎn)瘫拣。有時(shí)候用戶說的不一定是他們所做的亿絮,所以往往觀察比問卷調(diào)查能提供更為真實(shí)的用戶使用傾向。
(圖片來自Netflix博客)
2)發(fā)現(xiàn)界面的缺陷
如果你忽視了重大的可用性問題派昧,比如讓人難以理解的交互流程,或容易造成誤解的微交互拢切,那么你可能不會(huì)從不斷的A/B測(cè)試中獲得轉(zhuǎn)化率的提升蒂萎,因?yàn)槟愕脑O(shè)計(jì)并沒有應(yīng)對(duì)問題的根源。舉個(gè)例子:如果你提供的填空題中有幾項(xiàng)要求的信息是用戶不方便或不愿意提供的淮椰,那么僅僅靠更改提交按鍵的顏色來做A/B測(cè)試是不會(huì)有效提升轉(zhuǎn)化率的五慈,反而是浪費(fèi)力氣。理解低轉(zhuǎn)化率的真正原因才是執(zhí)行智慧主穗、成功的測(cè)試的關(guān)鍵泻拦。
如何發(fā)掘界面的缺陷:可用性測(cè)試(遠(yuǎn)程主持或免主持,或當(dāng)面)可以快速進(jìn)行并可在五個(gè)左右用戶的幫助下就揭露網(wǎng)站近85%的重大缺陷忽媒。
3)衡量網(wǎng)站的可尋性
測(cè)試導(dǎo)航標(biāo)簽和菜單設(shè)計(jì)能披露可尋性的問題争拐。但是,糟糕的可尋性可以并且應(yīng)該在實(shí)施A/B測(cè)試之前就確認(rèn)猾浦,這直接影響了信息架構(gòu)和站內(nèi)導(dǎo)航陆错。
如何衡量可尋性:樹圖測(cè)試可以在不影響任何界面設(shè)計(jì)的情況下測(cè)量一個(gè)已有的或設(shè)定的信息架構(gòu)灯抛。樹圖測(cè)試會(huì)告訴你標(biāo)簽金赦、鏈接分組、頁面層級(jí)及命名系統(tǒng)是否直觀对嚼。如果你在糾結(jié)如何命名網(wǎng)站中的區(qū)塊夹抗、頁面、鏈接以及標(biāo)簽纵竖,樹形測(cè)試能幫你找出最有問題的命名漠烧,并幫你設(shè)計(jì)出能改善可尋性的新標(biāo)簽杏愤。樹圖測(cè)試可以用Optimal Workshop開發(fā)的Treejack這樣的工具進(jìn)行,它生成可用于測(cè)試信息架構(gòu)的任務(wù)已脓。
3)測(cè)試前先”鋪好路”
最簡單的方法珊楼,就是開始在A/B測(cè)試前,先把那些可能會(huì)影響用戶操作的絆腳石解決掉度液。一般幾個(gè)小時(shí)的測(cè)試即能揭露幾乎所有你網(wǎng)站上特別糟糕的設(shè)計(jì)厕宗。更為復(fù)雜和完善的用戶研究當(dāng)然益處更多,但不要忽視了最基本的審查清理工作堕担。對(duì)A/B測(cè)試而言已慢,你當(dāng)然希望所要測(cè)試的目標(biāo)元素不會(huì)受到其它可用性問題的干擾,而是能被用戶更好的體驗(yàn)到霹购。所以開始測(cè)試前先做一次“路障清理”吧佑惠。
結(jié)語
結(jié)合不同方法最大化轉(zhuǎn)化率。
A/B測(cè)試是一個(gè)絕妙的工具齐疙,卻時(shí)常不幸被誤用膜楷。如果用A/B測(cè)試替代用戶研究,那么測(cè)試中的設(shè)計(jì)選項(xiàng)本質(zhì)上只是主觀猜測(cè)贞奋。你可以通過結(jié)合用戶研究來更精準(zhǔn)的找到問題起因把将、提出更符合現(xiàn)實(shí)的假設(shè),從而為更好的測(cè)試結(jié)果提供更大的可能忆矛。
英文原文:Jennifer Cardello, Define Stronger A/B Test Variations Through UX Research.
原文地址:https://www.nngroup.com/articles/ab-testing-and-ux-research/
本文作者:霍詩雨(點(diǎn)融黑幫)察蹲,來自點(diǎn)融DDC設(shè)計(jì)團(tuán)隊(duì)的交互設(shè)計(jì)師,曾在紐約大學(xué)研習(xí)藝術(shù)史催训。熱愛游戲洽议,信仰中醫(yī),關(guān)注時(shí)事漫拭。