一個基于機器學習的人機交互研究表明:在使用由機器學習算法所驅(qū)動的應用界面中撵摆,用戶在操作時會有一定的使用困難底靠,并且只能形成較弱的心智模型。(譯者注:用戶通常無法理解自己的使用行為特铝,與應用內(nèi)所呈現(xiàn)的內(nèi)容推薦結(jié)果有什么關(guān)聯(lián)暑中。)
我們正處于信息大爆炸的時代,對信息的跟蹤捕捉和人工整理歸納變得越來越難鲫剿。但幸運的是鳄逾,現(xiàn)代數(shù)據(jù)科學可以對龐大的數(shù)據(jù)和信息進行歸類整理,在界面上直接展示與我們相關(guān)的內(nèi)容(例如網(wǎng)易云音樂推薦歌單)牵素。
機器學習算法可以基于用戶信息和行為數(shù)據(jù)严衬,為用戶推薦感興趣的內(nèi)容。如今笆呆,機器學習技術(shù)能更多地被開發(fā)者利用请琳,這推動了大批的公司利用大數(shù)據(jù)算法去改善產(chǎn)品和提升用戶體驗懦尝。
利用人工智能去提升用戶體驗的3個典型例子有:
1. 內(nèi)容推薦:(例:為用戶推薦潛在感興趣的電影/商品)
2. 廣告或內(nèi)容(如新聞頭條)的選擇性展示:根據(jù)用戶需求提供定制化的折扣和優(yōu)惠信息呀洲。(如用戶最近有搜索過汽車購買內(nèi)容,推送給用戶的可能是與汽車購買折扣相關(guān)的廣告)
3. 定制個性化捷徑,用戶可以一鍵觸發(fā)下一步的操作
遺憾的是拖叙,這一系列的算法對用戶通常是不可見的:用戶在操作過程中,無法感知自己的哪些行為會被定義為“影響算法的行為”疲吸。并且算法的產(chǎn)出通常很難以理解敞葛。
由算法所提供的內(nèi)容建議或推薦有可能命中用戶需求,有可能表面上看起來是隨機的圾旨,甚至有可能是毫無意義的踱讨。通常的情況是,這些算法對展示內(nèi)容的分類標準是不可見的砍的,它們會把展示內(nèi)容按照特定的痹筛、并不互斥的分類進行分組。
雖然從算法角度出發(fā)廓鞠,這樣的內(nèi)容展示/推薦機制是有意義的帚稠,但是用戶通常很難理解推薦內(nèi)容的邏輯,而且還可能會與傳統(tǒng)的內(nèi)容構(gòu)建方式產(chǎn)生沖突床佳。
在本文中滋早,我們會探討 Facebook,Instagram砌们,Google news杆麸,Netflix 用戶以及 Uber 司機與機器學習人機交互過程中遇到的一些問題。我們所采用持續(xù)一周的日記研究方式怨绣,在研究中角溃,14 位真實用戶會用 v-log 的形式記錄下他們的人機交互過程。
黑盒模型
若想與任何系統(tǒng)進行順暢的人機交互篮撑,用戶必須對該系統(tǒng)建立一個心智模型减细。
大部分人都不是軟件工程師,對軟件程序的執(zhí)行過程都沒有清晰的概念赢笨。但是人們通常都能根據(jù)他們之前對應用程序未蝌、用戶界面甚至是對世界的認知去形成一個相對正確的心智模型。
在很多情況下茧妒,測試者將一個新的系統(tǒng)當成黑盒萧吠,并且會通過改變測試過程中所有潛在的輸入方式(如:瀏覽的內(nèi)容或瀏覽的路徑)去改變系統(tǒng)的產(chǎn)出。
機器學習算法對于用戶來說就是一種黑盒系統(tǒng)桐筏。參與調(diào)研的用戶可以理解:機器學習算法會將他們的交互行為作為產(chǎn)出內(nèi)容的判斷依據(jù)纸型。
為了與算法進行順暢的人機交互,用戶必須形成一個對人機學習機制有足夠認知的心智模型,通過這個心智模型狰腌,用戶需要理解機器學習算法是如何去改變產(chǎn)出結(jié)果除破,從而滿足用戶需求的。在形成這個心智模型的過程中通常會出現(xiàn)兩種阻礙:
1. 不明確的用戶輸入:用戶的何種行為會對產(chǎn)出造成影響并不明確琼腔。
2. 對產(chǎn)出缺乏控制:即使用戶知道他們的何種行為會被算法判定為有效的輸入瑰枫,用戶依然無法確定這些輸入對產(chǎn)生所需結(jié)果是否有效。
我們將對以上的原因進行分類探討
不明確的用戶輸入
對輸入行為若沒有一個明確的認知或判斷丹莲,將很難在黑盒實驗里構(gòu)建一個準確的用戶心智模型光坝。導致用戶輸入行為不明確的原因包括
1. 算法對于用戶來說是不透明的:算法無法告訴用戶,在他們的人機交互過程中甥材,哪些行為是重要行為盯另,會對算法構(gòu)成影響。用戶對于“潛在輸入行為”的定義了解不充分擂达。用戶的行為不會僅僅局限于當前的應用土铺,這些“潛在的輸入行為”也包括在操作過程中的其他行為數(shù)據(jù)(如:閱讀第三方網(wǎng)站)胶滋。
2. 用戶輸入行為與界面呈現(xiàn)的結(jié)果存在時間延遲:用戶的某些輸入行為不會直接影響界面上輸出結(jié)果的變化板鬓。
在我們所討論的機器學習系統(tǒng)中,Netflix 很好地幫助用戶去了解他們的何種行為會對 app 的推薦系統(tǒng)有影響究恤。Netflix 的主頁通常是一長串的影片信息流俭令,這些信息流列表會有相應的標簽解釋為什么這條信息會出現(xiàn)在用戶的首頁——因為你曾觀看過相關(guān)的內(nèi)容/因為你曾添加過某些內(nèi)容到你的播放列表 等等。
(譯者注:補充閱讀Netflix相關(guān)介紹)
人們非常喜歡這類型的推薦抄腔,不僅僅是用戶感覺到對 App 內(nèi)容的控制權(quán),更重要的是理张,他們認為當前頁面所展示的內(nèi)容對于他們來說是有用的赫蛇。
即便是這樣, Netflix 在幫助用戶去了解用戶的操作行為與首頁的推薦內(nèi)容之間的關(guān)聯(lián)性仍無法做到最好雾叭,因為 用戶當前的操作行為 并不會立刻直觀地影響App的推薦內(nèi)容悟耘。舉個例子,一個用戶在最近一次使用 Netflix 的時候觀看了單口相聲织狐,但是她“最佳推薦”里的播放列表似乎沒有出現(xiàn)這個內(nèi)容相關(guān)的信息暂幼。這時候的用戶可能會很疑惑:“我以為‘最佳推薦’里的內(nèi)容會根據(jù)我曾經(jīng)的觀看記錄而有所改變,但是看來兩者似乎并沒有太大的關(guān)系移迫,我的‘最佳推薦’列表里并沒有出現(xiàn)很多相關(guān)的喜劇”旺嬉。一個 Facebook 用戶曾把他的首頁信息流的一個廣告關(guān)閉,但是在接下來的信息流里卻再次看到了這個廣告厨埋。另外一些用戶認為“最佳推薦”里的內(nèi)容和自己播放列表里的內(nèi)容重合度非常高邪媳,他們也會疑惑:“我不知道‘最佳推薦’里的內(nèi)容是怎樣進行篩選的,我相信內(nèi)容篩選的算法和我曾經(jīng)的觀看行為會有一定的關(guān)聯(lián)。但無論怎樣我希望這個算法能更精準一些雨效,因為里面推薦的內(nèi)容要么有一些是我很久之前已經(jīng)看過的套菜,要么是我已經(jīng)添加到播放列表的,要么就是我根本不感興趣的设易。所以我有時候也很奇怪為什么會推薦這些內(nèi)容給我逗柴?”
Facebook 與 Instagram 的用戶會更難理解他們的何種行為會對自己首頁的信息流內(nèi)容造成影響。用戶會認為顿肺,信息流中自己曾經(jīng)參與過互動的內(nèi)容(互動包括:點贊等相關(guān)操作)戏溺,會成為機器學習算法展示信息流內(nèi)容的參考。但一些關(guān)于“潛在輸入行為”的定義很明顯是牽強的屠尊,有時甚至是錯誤的旷祸。(譯者注:有些用戶會誤以為自己現(xiàn)實生活中的聊天內(nèi)容也會被應用監(jiān)控,成為 “潛在輸入行為”讼昆。)這也意味著托享,對于大部分用戶來說,機器學習算法的邏輯關(guān)系并不清晰明確浸赫。舉個例子闰围,一個用戶昨天和朋友聊到忽然很想吃越南粉,這是一樣平常他很少吃的東西既峡。然后不久后羡榴,他就看到了一個越南粉春卷的廣告≡烁遥“這是一件多么有趣又可怕的事情校仑!”這個用戶說“我很懷疑這些應用是不是甚至竊取了我們的聊天內(nèi)容〈荩”
另一個剛從再應用里看到夏威夷航空廣告的用戶迄沫,半認真半開玩笑地說:“或者算法也知道我需要一個假期∝苑剑”
另一個懷孕的媽媽也表示:“自從我懷孕之后羊瘩,我看到的廣告都是關(guān)于懷孕,嬰兒用品或者是人壽保險相關(guān)的愿汰±Ш螅”
從上面的例子我們可以看出,當機器學習算法對于用戶“潛在輸入行為”沒有明確公開的定義時衬廷,用戶會產(chǎn)生相當多的疑惑——他們會假設(shè)自己的所有行為(包括應用內(nèi)的操作和現(xiàn)實世界中的行為)都會被機器學習算法所記錄并作為參考摇予,最終他們會認為這些 APP 或操作系統(tǒng)非常“可怕”并會侵犯日常生活的隱私吗跋。用戶對自己隱私被侵犯的感知越來越明顯侧戴,尤其是被Goolge宁昭、Facebook等公司掌握了大量的用戶數(shù)據(jù)的情況下。
Google 新聞的用戶通常會為其高度定制化的信息流而感到愉悅酗宋,但他們?nèi)匀徊磺宄@個高度定制化的信息流來源于他們?nèi)粘5哪男┎僮餍袨榛獭R粋€參與實驗的用戶表示:“Google News 似乎在迎合我的興趣——在信息流中我能看到三篇與汽車相關(guān)的文章,而汽車正是我感興趣的主題蜕猫。我對“為你推薦”這個頁面上的內(nèi)容是如何產(chǎn)生的非常感興趣寂曹。它會為我推薦本地的消息,因此很明顯它能獲取到我的地理位置信息回右,地理位置信息對于內(nèi)容的篩選非常有用隆圆。”
雖然 Uber 本身不需要對信息進行推薦翔烁,但據(jù)說它同樣使用了機器學習去預測用戶的需求渺氧,并以高峰溢價、推廣活動蹬屹、游戲化的任務(wù)系統(tǒng)* 等手段去激勵司機侣背。
(譯者注:Uber開發(fā)了一套硅谷稱之為“Gamification”游戲化的策略。最主要的體現(xiàn)就是搭建“任務(wù)系統(tǒng)”慨默。比如在某高峰時段完成5單贩耐,可以額外獲得100美金,每周完成100單可以額外再獲得1000美金等等业筏,就和打游戲做任務(wù)一樣憔杨。補充閱讀Uber 相關(guān)閱讀?游戲化任務(wù)系統(tǒng)相關(guān)解釋)
Uber 的算法并不是基于司機的行為,相反蒜胖,Uber 算法中的“輸入”更多的是來源于外部的數(shù)據(jù),例如歷史交通路況抛蚤。即便是在這種情況下台谢,對于哪些數(shù)據(jù)能被定義為“輸入”的清晰認知,依舊會影響司機是否會被 Uber 的促銷手段影響自己的判斷岁经。舉個例子朋沮,一個司機被 Uber 告知,他需要去接一個位于 2.3 英里以外的乘客缀壤,這段路程行駛時長為 15 分鐘樊拓,并且這一單乘客有可能會溢價支付。
這位司機表示:“Uber 的這個新的預測功能有時候挺讓人惱怒的塘慕。以前我一般接到的單都是只需要 5 分鐘左右的車程就可以接到乘客筋夏,但現(xiàn)在 Uber 告訴我,這個接乘客需要 15 分鐘車程的單子很有可能會得到溢價獎勵图呢。我曾經(jīng)試過接到這樣的單子条篷,但是乘客并沒有溢價支付骗随。我認為這個只是 Uber 引誘司機免費地去接遠距離乘客的單子的一種手段。我并不喜歡這種不確定的溢價支付赴叹『枞荆”對于司機來說,他們對為什么溢價支付會出現(xiàn)以及它出現(xiàn)的前提條件并不了解乞巧,這會令他們?nèi)ベ|(zhì)疑 Uber 的意圖涨椒。
對算法的產(chǎn)出結(jié)果缺乏控制
在我們所研究的系統(tǒng)中,產(chǎn)出結(jié)果往往不僅僅以用戶的交互行為為決定因素绽媒,還會根據(jù)一些外部事件去進行調(diào)整丢烘,這些外部事件包括:當前時刻應用內(nèi)其他人的發(fā)帖內(nèi)容,新聞事件些椒,最新電影的上演播瞳,甚至有可能是交通情況等等。這些大批量免糕、廣范圍的數(shù)據(jù)會令整個算法變得更復雜赢乓,更難以理解和控制。同時石窑,將用戶自身的行為數(shù)據(jù)與這些第三方的數(shù)據(jù)分離開來也會變得更困難牌芋。
當應用內(nèi)同系列的信息展示是取決于某個特定的自動預測算法時,這一系列的信息的展示順序甚至是這一系列信息最終是否會被完全展示都會取決于一個相關(guān)性衡量指標:高相關(guān)性的信息會被優(yōu)先展示松逊,接下來展示的會是相關(guān)性稍低的信息躺屁。當某條信息的相關(guān)性低于某一個臨界值時,它甚至有可能根本不會被展示出來经宏。(Netflix 曾經(jīng)公開展示過一個帶有明確匹配分值的相關(guān)性衡量指標犀暑,但這個指標對用戶來說并沒有直接的利益關(guān)系,本次調(diào)研中的參與者完全忽略了這個匹配分值烁兰。)
雖然有些人認為一個好的相關(guān)性衡量指標不會將重要信息安排在列表中較后的位置耐亏,然而事實是,這些系統(tǒng)只能收集到用戶很碎片化的信息沪斟。這些用戶是復雜的個體广辰,他們的需求不僅僅是基于過去的使用習慣,更可能是基于當前的內(nèi)容甚至是當下的心情主之。(舉個例子择吊,其中一個參與調(diào)研的用戶表示:“我希望我可以隱藏我 Facebook 首頁上所有帶有悲傷情緒的帖子〔坜龋”此外几睛,一些帖子與用戶的興趣可能有著強相關(guān)性,但是出現(xiàn)的頻率非常低史翘,因此系統(tǒng)無法收集到足夠多的信息去判斷這些信息與用戶興趣的關(guān)聯(lián)性枉长。)所以冀续,即使是一個好的相關(guān)性衡量系統(tǒng)也有可能無法準確地預測信息與用戶興趣的相關(guān)性,至少偶爾也會出現(xiàn)這種情況必峰。
一個不完善的相關(guān)性衡量系統(tǒng)會引發(fā)以下的一些問題:
1. 用戶一些感興趣的信息會被遺漏(在信息檢索的層面上洪唐,這會被視作低召回率)
若信息流自動過濾掉一些與用戶高相關(guān)性的信息,用戶在閱讀信息時會花費很高的成本吼蚁。在 Facebook 和 Instagram 之類的應用內(nèi)凭需,當用戶錯過了一條他最親密的好友的信息,這會對用戶造成很大的困擾并帶來較差的用戶體驗肝匆。事實上粒蜈,會給參與調(diào)研的用戶帶來很糟糕的體驗的主要原因是,這些應用內(nèi)的信息流若只包含帖子中的部分內(nèi)容而過濾掉其他內(nèi)容旗国。其中一位參與者表示:“為了看到我希望看到的某些用戶所發(fā)的帖子枯怖,我甚至需要和應用內(nèi)的算法作斗爭∧茉”用戶試圖通過 自己對該系統(tǒng)的理解而建立起的心智模型去引導算法(雖然用戶對系統(tǒng)的理解往往可能是不正確的或是碎片化的度硝。一些用戶會通過對信息流里他所有感興趣的內(nèi)容進行點贊,試圖引導算法去了解自己的興趣并不再過濾掉相關(guān)的信息寿冕。在這種情況下蕊程,“點贊”的含義已經(jīng)不僅僅是它字面所表達出來的社交層面的意思(“點贊”通常用于表達對某種內(nèi)容或帖子的欣賞),而開始變成用戶試圖控制算法的一種手段驼唱。
即使是一些自認為自己可以操縱算法的人也很經(jīng)常會懷疑這種行為的有效性藻茂。他們會不斷地直接訪問自己所感興趣的用戶或組織的主頁信息流以確保自己不會錯過任何信息。
但過濾掉一些和用戶高相關(guān)性的信息亦不盡然會為用戶帶來高的閱讀成本玫恳。例如辨赐,在 Netflix 和 Spotify 之類的平臺,用戶可能感興趣的新聞信息/歌曲成千上萬纽窟,過濾掉這其中的一些信息并不一定會引發(fā)用戶的抱怨肖油。(譯者注:因為用戶無法感知到自己感興趣的信息被過濾掉了)
2. 信息流展示的內(nèi)容順序是不可預知的/難以理解的
信息流過濾掉一些用戶感興趣的消息不僅僅是因為 算法并沒將其息包含在內(nèi)容列表內(nèi),也有可能是因為這些信息的權(quán)重并不高臂港,因此沒有出現(xiàn)在信息流的頭部位置。歸根結(jié)底视搏,這種考慮與“注意力經(jīng)濟*”有關(guān)(譯者注:注意力經(jīng)濟是指企業(yè)最大限度地吸引用戶或消費者的注意力审孽,通過培養(yǎng)潛在的消費群體,以期獲得最大未來商業(yè)利益的一種特殊的經(jīng)濟模式浑娜。) :如果用戶對新聞或社交媒體的注意力有限佑力,那么用戶可能會遺漏掉一些對他們很重要的信息內(nèi)容,因為這些內(nèi)容在信息流的列表里處于較尾部的位置筋遭。(譯者注:信息量太大打颤,而用戶對信息閱讀的精力有限暴拄,往往只會閱讀到頭部的內(nèi)容。)
對于一些我們所看到的信息推薦系統(tǒng)编饺,推薦列表的順序?qū)τ谟脩魜碚f是毫無意義的:用戶無法理解為什么在 Facebook 的信息流里乖篷,某一條內(nèi)容會排列在另一條內(nèi)容的前面。也并不知道為什么在 Netflix 的輪播模塊里透且,某一部電影會展示在另一部電影之前撕蔼。Facebook,Instagram 和 Google News 經(jīng)常受到的用戶投訴的其中一項內(nèi)容就是:用戶抱怨信息流展示的內(nèi)容不是按時間順序排列的(譯者注:新版的微博信息流同樣不是以時間線順序展示的)秽誊。因此鲸沮,用戶無法確保他們已經(jīng)完全地閱讀完某個用戶的所有信息并且沒有無遺漏掉其它內(nèi)容。同樣地锅论,對于新聞內(nèi)容讼溺,這次調(diào)研中的參與者會擔心,一些他們感興趣的但是并不太重要的信息內(nèi)容(例如汽車相關(guān)的文章)會位于信息流中的頭部位置最易,因此他們會遺漏掉一些最近一般感興趣但可能重要的內(nèi)容怒坯。
在 Netflix 的情況里,根據(jù)特定的分類方法(如:因為你曾經(jīng)看過某些電影內(nèi)容)而構(gòu)成的推薦列表會模糊了用戶對之前已經(jīng)形成的自然分類的方法的認知(如:按時間排序)耘纱。例如敬肚,對于視頻內(nèi)容,用戶普遍關(guān)注的維度是時間(如:用戶知道自己只有一小時的時間去觀看視頻)或者是視頻內(nèi)容的種類束析。然而艳馒,在 Netflix 創(chuàng)建的類別中,電視節(jié)目與完整長度的電影被混雜在一起员寇,且被以無明確標識的順序呈現(xiàn)在用戶面前弄慰,用戶的篩選過程會非常困難。
3. 一些用戶并不太感興趣的內(nèi)容會被推薦給用戶(在信息檢索的范疇內(nèi)蝶锋,這被定義為信息匹配精度低)
糟糕的推薦體系會對花費用戶巨大的注意力成本——用戶必須仔細檢查信息陆爽,判斷他們?yōu)椴幌嚓P(guān)內(nèi)容,再跳過他們扳缕。然而慌闭,糟糕的推薦算法在不同的系統(tǒng)下并不一定會對用戶造成相同的影響。在 Netflix 這種平鋪輪播的列表布局下躯舔,不敢興趣的推薦內(nèi)容相對會更容易被跳過驴剔,因為這些不敢興趣的內(nèi)容并不會占用頁面內(nèi)太多的位置,用戶可以輕易地略過它粥庄。
但是,在諸如 Spotify 或者 StichFix(服裝運輸服務(wù)平臺)等平臺上惜互,用戶略過一個不敢興趣的推薦成本會變得很高布讹。用戶不愿意花費時間去嘗試聽一首他們所不喜歡的歌曲琳拭,或者穿一條不是自己風格的褲子。Facebook 的情況介乎于上述的兩者之間:一個與用戶不相關(guān)的帖子或者是廣告會在首頁信息流占用一定的空間描验,用戶必須手動滑動才能跳過白嘁。
跳過頁面上不感興趣的內(nèi)容所花費的成本,將決定了用戶直接對帖子/廣告內(nèi)容提供反饋的可能性挠乳。例如权薯,在 Spotify 的平臺上,用戶會參與推薦內(nèi)容的篩選并標記他們不感興趣的內(nèi)容睡扬。這樣做不僅是為了幫助調(diào)整推薦系統(tǒng)的算法盟蚣,更是為了盡量避免自己花費時間去收聽一些不感興趣的曲目。在 Facebook卖怜,我們的確注意到用戶偶爾會使用到“隱藏該廣告”的按鈕屎开。但由于這個按鈕的入口比較深,有些用戶并不愿意花費這個操作成本去隱藏廣告马靠。相對于隱藏不感興趣的推薦內(nèi)容奄抽,用戶更愿意去“點贊”一些自己感興趣的內(nèi)容。
4. 推薦列表內(nèi)的內(nèi)容所占用的頁面范圍越多(或者是用戶跳過的成本越高)甩鳄,內(nèi)容的反饋按鈕就應該越明顯逞度。
如果推薦列表的內(nèi)容能被用戶很容易地跳過,內(nèi)容反饋入口的外露優(yōu)先級可以降低妙啃。
5. 內(nèi)容的個性化定制不應該增加用戶的使用成本
我們在上面看到档泽,在用戶體驗中,最成功的推薦算法應該能 成功地向用戶傳達合理的揖赴、關(guān)于“輸入行為”的心智模型馆匿。尤其是,本次調(diào)研的用戶非常喜歡 Netflix 的推薦列表上的內(nèi)容燥滑,因為這些內(nèi)容清晰地展示了用戶“輸入行為”與呈現(xiàn)內(nèi)同的關(guān)系(如 你曾看過的/你曾添加到播放列表的等等)渐北。
然而,這種方法可能會導致一個問題:同一個內(nèi)容會被多次推薦铭拧。例如:在 Netflix 中赃蛛,一部影片可能會出現(xiàn)在“曾經(jīng)看過”模塊,它同樣有可能會出現(xiàn)在“我的列表”或者“熱門推薦”模塊中搀菩。用戶在瀏覽頁面的過程中焊虏,會為這些重復出現(xiàn)的內(nèi)容花費更多的注意力。至少秕磷,用戶需要辨別出哪些內(nèi)容他們曾經(jīng)看到過并跳過他們。其中一位參與調(diào)研的用戶表示:“為什么首頁中會有這么多的列表模塊炼团?并且模塊中的內(nèi)容在不斷重復澎嚣?我非常討厭這些重復內(nèi)容的列表疏尿。每一次查看列表我都會看到相同的東西,這讓我非常困擾易桃。這對我來說簡直就是浪費時間褥琐。”
但是敌呈,在用戶交互過程中,重復消耗的注意力成本不僅限于內(nèi)容的重復出現(xiàn)造寝。Netflix 承認磕洪,他們嘗試去做超越內(nèi)容個性化層面的更高的個人定制化頁面,這包括用戶個性化的頁面布局(甚至是基于特定場景下的頁面布局)诫龙,為視頻封面做個性化定制析显。但這一系列的個性化定制都有可能會增加用戶的交互成本:
1. 模塊限定的視頻封面縮略圖,內(nèi)容描述與大標題
對某一項內(nèi)容針對特定的用戶進行個性化定制签赃,這在很大程度長可以吸引用戶的注意力谷异。在研究過程中,我們的參與者用戶被提供大量的內(nèi)容锦聊。他們快速地瀏覽頁面歹嘹,縮略圖,粗略地閱讀頁面上的文字內(nèi)容孔庭。一位 Facebook 用戶表示:“我通常并不會仔細閱讀別人寫了什么東西尺上,我只是粗略地掃一眼∈贩桑”而另一位 Netflix 的用戶則表示:“在列表中尖昏,我通常會找一些和其他內(nèi)容不同的,更有趣的內(nèi)容构资,通常一個特別的封面圖片能吸引到我的注意力抽诉。”
在 Netflix吐绵,同一部影片迹淌,不同的用戶可能會看到兩個不同的封面。更甚的情況是己单,同一部影片唉窃,同一個用戶會在兩個不同的模塊中看到這部電影不同的封面。
理論上纹笼,這種做法可能會提高用戶“點贊”和觀看該影片的機會——因為應用內(nèi)不同的推薦模塊能強調(diào)這部影片的不同的亮點纹份,任何一個亮點都有可能會引起用戶的注意。遺憾的是,這種做法可能會令這部影片喪失記憶點蔓涧,因此會浪費用戶的時間:用戶有可能會在這個過程中多次點入同一影片的詳情頁去瀏覽影片的內(nèi)容介紹件已,最終卻發(fā)現(xiàn)自己對這部影片仍然是不感興趣的或者是其實已經(jīng)曾將這部影片添加到播放列表了。
2. 不同模塊的不同布局
Netflix 同樣會針對不同的用戶元暴,不同的場景篷扩,甚至是不同的設(shè)備去定制化頁面布局。因此茉盏,“繼續(xù)瀏覽”可能在某些模塊中會在列表的靠前位置鉴未,而在下一個模塊中會處于靠后的位置。這種做法是頁面自適應的一個例子鸠姨,并減少了用戶對適應頁面布局的學習成本铜秆。因此,那些喜歡在開始瀏覽頁面的時候就查看最新內(nèi)容的用戶享怀,會優(yōu)先主動訪問“最近新增內(nèi)容”列表羽峰。這種情況下,當該用戶打開應用時添瓷,如果頁面定位在上次瀏覽的地方梅屉,頁面上的信息對于該用戶來說基本沒有意義。因為 Netflix 對于用戶來說是一個更側(cè)重于瀏覽性質(zhì)的頁面鳞贷,改變不同模塊中的推薦列表的順序并不會對整體用戶造成較大的影響坯汤,然而,這種方法其實已被證明會明顯地降低用戶體驗搀愧。
一些總結(jié)
日常中惰聂,我們所使用到的極大依賴于機器學習算法進行內(nèi)容推薦的應用/系統(tǒng)寥寥無幾。以下是幾點小建議:
1. 努力地去創(chuàng)建一個準確的基于算法的心智模型咱筛。想做到這一點搓幌,需要讓用戶清楚地知道他們的何種交互行為,會對算法產(chǎn)出的推薦內(nèi)容有直接影響迅箩。
2. 讓用戶能夠簡易地控制機器學習算法所產(chǎn)生的結(jié)果溉愁。允許用戶通過已知的,熟悉的饲趋,易于明白的邏輯(例如:時間線邏輯)去對這些結(jié)果進行分類整理拐揭。若用戶對關(guān)閉一個不合適的推薦的成本越高,app 越應該提供一個越便捷的反饋入口給用戶奕塑。
3. 如果推薦的內(nèi)容均適合在不同的模塊被推薦(譯者注:既是“今日熱門”也是“曾經(jīng)看過”)堂污,盡量不要重復推薦此內(nèi)容。
4. 對用戶進行個性化定制的同時龄砰,在改變同一頁面上不同模塊的布局時需要多加注意盟猖,避免用戶在瀏覽時出現(xiàn)較大的視覺跳躍讨衣。
5. 內(nèi)容元素應該盡量包括與用戶強相關(guān)的信息內(nèi)容(譯者注:如網(wǎng)易云x---音樂給用戶推薦歌單的時候會標注推薦原因——”因為你曾收藏過某些歌曲”),這些信息在用戶篩選大量內(nèi)容的時候?qū)浅S杏谩?/p>
6. 提前預加載內(nèi)容描述或標題扒披,以便于用戶在快速瀏覽時更便捷地篩選判斷值依。
遵循以上 6 條用戶體驗原則,將能提人工智能算法的效益碟案,讓人工智能不僅僅再是”花哨的技術(shù)”,為用戶的使用過程提供更好的幫助颇蜡,提升用戶體驗价说。
作者: Raluca Budiu?
翻譯:隕石旁