本文會從一個360AI搜索的負面案例切入花颗,討論三個大問題:
1捕传、為什么AI搜索產(chǎn)品成了共識
2、AI搜索產(chǎn)品的演進方向猜測
3扩劝、AI搜索產(chǎn)品的核心體驗及影響因素
全文約15000字庸论,文末有思維導(dǎo)圖獲取方式,看不完記得收藏~~
----正文分割線----
最近在使用360AI搜索的時候遇到一個比較嚴重的產(chǎn)品設(shè)計問題棒呛,非常影響體驗聂示。
在360AI搜索首頁,和普通搜索產(chǎn)品類似簇秒,有信息流和今日熱搜兩個模塊鱼喉。
昨天偶然看到一條熱搜是【工資四千月工作300h】,這個標題確實很吸引人趋观,所以作者打開了這條熱搜想看看詳細信息麸恍,結(jié)果打開的頁面內(nèi)容是這樣的:
標題和內(nèi)容完全對不上!
原因也簡單敏弃,360AI搜索使用了大模型能力對輸入的信息進行了處理,而不是點擊這條熱搜新聞直接打開一個鏈接。
按照傳統(tǒng)的搜索引擎的做法一般是把關(guān)鍵詞“月薪4000工作300小時”匹配到各個新聞網(wǎng)站屋匕,然后用戶打開新聞網(wǎng)站查看詳細內(nèi)容借杰。
360這里應(yīng)該是只把熱點新聞的標題傳給模型處理工作流了翩隧,結(jié)果出現(xiàn)了這么個驢頭不對馬嘴的結(jié)果。(可能是出于節(jié)約成本的做法吩跋,傳標題和傳全部正文消耗的token可能是百倍旺韭,不過后續(xù)的測試好像又推翻了這個猜測)
這里面的體驗問題不止一個遵湖,挨個分析一下:
1悔政、新聞信息是否適合用大模型處理后呈現(xiàn)?
用大模型處理新聞信息優(yōu)點非常明顯延旧,能夠在短時間內(nèi)對大量新聞內(nèi)容進行總結(jié)和提取關(guān)鍵點谋国,節(jié)省用戶的時間。對企業(yè)來說也能減少對人工編輯和記者的依賴迁沫,降低成本芦瘾。
但問題是:用戶讀新聞時一定需要節(jié)省時間嗎?類比一下看網(wǎng)絡(luò)小說可能更容易理解集畅,某著名網(wǎng)文凡人修仙傳也可以用一句話總結(jié)出來:韓立(主角)經(jīng)過千年修行終于渡劫成功飛升仙界近弟,全書完。這里的小說完全可以類比具有娛樂屬性的新聞挺智,不巧的是在所有新聞的被閱讀量占比中祷愉,娛樂新聞遠多于嚴肅新聞。
當內(nèi)容的細節(jié)被模型處理后丟失時赦颇,內(nèi)容是否還能引起用戶消費的興趣是一個比較重要的問題二鳄。還以360AI搜索來說,處理前后的新聞分別是這樣的:
入口:
處理后:
處理前:
https://www.thepaper.cn/newsDetail_forward_27930855(原文較長媒怯,感興趣朋友用這個鏈接看看订讼,也可以直接看下面的結(jié)論)
以作者閱讀處理前后的新聞的主觀感受來說,閱讀原文體驗更好扇苞,原因大概在于幾點:
1)文風:不同類型的新聞肯定會使用不同的文風欺殿,這種新聞和政務(wù)新聞和UC震驚部的新聞肯定文風都不一樣,但現(xiàn)在的AI搜索產(chǎn)品顯然還沒有做到根據(jù)不同新聞類型使用不同的文風來形成最后直面用戶的內(nèi)容杨拐,因此文風一定程度上影響了閱讀體驗祈餐。
2)多媒體信息:原文中存在不少動圖,有的鏈接中還有視頻哄陶,但經(jīng)過模型處理的新聞只有文字帆阳,多種媒體類型的信息對閱讀的影響很大,在信息協(xié)同接收、情感傳遞蜒谤、情緒影響等方面都會影響閱讀體驗山宾。
現(xiàn)在有的AI搜索產(chǎn)品已經(jīng)可以做到讀多種媒體信息,但很顯然還沒有任何一款產(chǎn)品能做到輸出多模態(tài)信息(準確的說是可以但很貴鳍徽,某視頻生成模型的生成5秒的視頻成本在1.5元左右)资锰。
3)信息與場景的匹配錯位:用戶可能是在午休時間悠閑的刷著網(wǎng)頁,但看到的確實更偏向工作內(nèi)容的結(jié)構(gòu)化信息阶祭,情感投射一下就錯位了绷杜,這種體驗可能用戶講不清楚,但一定會明確的反應(yīng)在主觀感受上濒募。
現(xiàn)在各家AI搜索產(chǎn)品都以結(jié)構(gòu)化的結(jié)果呈現(xiàn)方式作為賣點鞭盟,但信息的呈現(xiàn)方式一定需要與場景匹配,也并非所有場景用戶的目的都是節(jié)省時間瑰剃。
據(jù)說360AI搜索已經(jīng)能夠識別4000種用戶意圖齿诉,聽起來很多,但以其目前覆蓋的用戶量和用戶使用時涉及到的場景來說晌姚,依然需要時間進行跨量級的意圖積累粤剧。畢竟讀新聞都可以再細分成多種意圖~
以上是對這個小案例的第一方面體驗分析,寫的比較長可能讀者朋友已經(jīng)忘了問題本身挥唠,我們把話題拉回來一下抵恋,面對下圖的這個問題,第2方面的體驗問題是什么宝磨?
2馋记、是輸入信息無主語時,模型是否應(yīng)該自主添加懊烤?
以上面的例子來說,用戶想看【工資4000月工作300小時】的新聞宽堆,結(jié)果幫用戶算了一下“您的時薪是13.33元/小時”腌紧,話說這是咋判斷出來主體是用戶的?這個【您】字問題太大了畜隶。
這個例子只是略微有些負面體驗壁肋,但萬一哪天用戶打開的熱點新聞是“父親去世早全靠母親艱難撫養(yǎng)”怎么辦?到時候把主體默認為用戶那負面體驗可就太嚴重了籽慢。
即使不考慮這種極端的負面事件浸遗,例如“沖進火場連救三人”這樣的新聞還是比較常見也比較容易上熱搜的。
長此以往經(jīng)常被用戶看到主體與事件混亂的問題箱亿,會影響用戶對整個產(chǎn)品所以提供信息的信任度跛锌,這對搜索產(chǎn)品太致命了。(目前用戶對AI搜索結(jié)果的信任也是個重要問題届惋,不過如何構(gòu)建信任這里不展開了髓帽,有機會再寫吧)
(這個問題其實也呼應(yīng)第一點)
以上是對360AI搜索的這個小案例的體驗分析菠赚,其實其他AI搜索產(chǎn)品也有類似的問題,此處并無貶低360的意思郑藏,據(jù)作者所知360AI搜索的增速衡查、迭代速度都非常牛逼。體驗上也遠超360其他產(chǎn)品.....
因為作者是做用戶體驗工作的必盖,所以還是習慣從體驗的角度評價產(chǎn)品拌牲。
一、為什么AI搜索產(chǎn)品成了共識
AI類產(chǎn)品這么多歌粥,為什么只有AI搜索各個大廠都在做塌忽?
目前在討論AI和產(chǎn)品時,有一個比較明顯的結(jié)論:AI更多是作為新技術(shù)阁吝、新能力參與到產(chǎn)品中砚婆,而用戶的需求并未發(fā)生本質(zhì)變化,所以要考慮的是如何用新能力解決為舊需求帶來新體驗突勇。
在接近一年半之前装盯,阿里原CEO張勇就提出:所有應(yīng)用都值得用AI重做一遍,當時作者并未理解其含義甲馋,現(xiàn)在看來其實也有需求不變埂奈,變的是實現(xiàn)方式的意思在里面。
AI搜索產(chǎn)品能成為共識定躏,尤其是很多大廠的共識否副,當然要從市場規(guī)模 、用戶需求場景數(shù)量慢洋、發(fā)展?jié)摿Φ确矫婵紤]刚陡。只有這些指標都足夠大,才能讓各個大廠忍不住動心下場碧聪。
對于這些下場指標冒版,看看谷歌、百度逞姿、360等公司答案就很明確了辞嗡,不必多講,本文中作者主要想從用戶體驗方面聊聊這個問題滞造。選擇這個角度的原因也正如上面所說续室,用戶需求基本不變時,AI產(chǎn)品能取代傳統(tǒng)產(chǎn)品關(guān)鍵博弈點就是在用戶體驗谒养。
按作者的理解:功能只是代碼的結(jié)果挺狰,體驗才是用戶的結(jié)果,是用戶視角下最直觀的指標,是用戶很主觀的決定繼續(xù)使用或離開的原因她渴。
下面是AI搜索產(chǎn)品和傳統(tǒng)搜索產(chǎn)品的體驗對比:
要對比傳統(tǒng)搜索和AI搜索达址,首先要回到用戶使用搜索產(chǎn)品的目的。
當用戶使用時趁耗,一定是帶有要解決的問題過來的(好像是廢話沉唠,別急往后看),以完成一份產(chǎn)品分析為例苛败,在傳統(tǒng)搜索產(chǎn)品中完整的鏈條大概是這樣:
根據(jù)用戶意圖復(fù)雜度的不同满葛,一定會經(jīng)歷上述過程3-6個環(huán)節(jié),以及極端情況下無搜索結(jié)果罢屈,問題無法解決的情況嘀韧。
由于互聯(lián)網(wǎng)行業(yè)多年的蓬勃發(fā)展和積累,以及數(shù)量龐大的用戶參與內(nèi)容建設(shè)的過程中缠捌,無結(jié)果的情況比較少了锄贷,但在一些較垂直的領(lǐng)域依然是對體驗影響較大的問題,例如作者經(jīng)常搜索人因工程與交互設(shè)計交叉領(lǐng)域相關(guān)的問題曼月,很多時候都找不到答案谊却。
就像用戶體驗的基礎(chǔ)是能解決問題一樣,搜索產(chǎn)品的體驗基礎(chǔ)是有答案哑芹。
傳統(tǒng)的搜索產(chǎn)品炎辨,由于其原理是先收錄千億數(shù)量級的網(wǎng)頁,當用戶搜索時進行匹配聪姿,所以只能在有答案的這部分場景下解決問題碴萧,且只能在上述“需求從產(chǎn)生到解決的過程”中2-3個環(huán)節(jié)中發(fā)揮作用。
面對無結(jié)果的問題末购,其實出現(xiàn)了不少優(yōu)秀的解法和產(chǎn)品破喻。例如百度做了提問產(chǎn)品,面對搜索結(jié)果需要用戶二次整合盟榴、答案質(zhì)量差等問題低缩,也有最佳答案、贊同數(shù)等設(shè)計曹货。
甚至傳統(tǒng)搜索產(chǎn)品也很清楚自己只能解決上述完整流程中部分環(huán)節(jié),也在向【搜索結(jié)果直接解決問題】這個方向努力讳推,例如在百度中搜索“2024年法定假日”顶籽,搜索結(jié)果頁面的第一條信息就可以直接解決用戶的問題:
這種方案已經(jīng)無需用戶從結(jié)果列表中做選擇再點擊打開,但是這種做法一是需要人工識別場景做特殊處理银觅,二是只能直接解決簡單需求礼饱。三是與一些廣告和商業(yè)化的場景天然有矛盾(例如搜索優(yōu)酷,可能第一個結(jié)果“必須”是愛奇藝),所以整體上對用戶體驗的提升很有限镊绪。
AI搜索產(chǎn)品由于其原理是使用預(yù)訓練的大模型生成內(nèi)容匀伏,所以在無結(jié)果這部分長尾需求中體驗很好 ,而AI搜索產(chǎn)品最大的優(yōu)勢蝴韭,則是在解決一個需求的完整流程中覆蓋了更多環(huán)節(jié)够颠,并用AI技術(shù)代替一部分人腦的工作,向All in one方向的體驗邁進了一步榄鉴。
詳細列舉AI搜索產(chǎn)品的體驗優(yōu)勢如下:
1)能夠跨媒體履磨、跨模態(tài)得到信息
跨媒體、跨模態(tài)得到信息意味著答案更準確庆尘、知識庫更全面剃诅、專業(yè)領(lǐng)域答案效果更好。
舉個例子驶忌,如果我想知道‘XX書店有沒有座位’矛辕,傳統(tǒng)搜索引擎想回到這個問題,幾乎必須依靠人類用戶參與回答才行付魔,但AI搜索如果找到了一張此書店的圖片聊品,則可以使用OCR、ASR技術(shù)去讀圖得到信息抒抬,這張圖片可能在傳統(tǒng)搜索時期就已經(jīng)存在杨刨,但當時圖片內(nèi)的信息無法被利用起來,導(dǎo)致這個問題只能由用戶進行回答擦剑。這就是跨媒體得到信息輔助答案更準確的簡單案例妖胀。
在談?wù)揂I產(chǎn)品時,經(jīng)常提到多模態(tài)的概念惠勒,作者發(fā)現(xiàn)很多人都把媒體類型和模態(tài)類型搞混了赚抡,這里稍微明確一下:
文字、圖片纠屋、視頻是不同的媒體類型涂臣,這些媒體中包含的信息都可以通過視覺模態(tài)由人類接收。
圖片售担、聲音赁遗、味道是不同的模態(tài)類型,其中的信息須通過視覺族铆、聽覺岩四、味覺等不同模態(tài)由人類接收。
模態(tài)在人機交互過程的嚴格定義是:信息傳遞的通道哥攘。
信息能夠在不同的媒體類型和模態(tài)類型之間相互轉(zhuǎn)換的意義體現(xiàn)在搜索過程的輸入與輸出環(huán)節(jié)剖煌,也體現(xiàn)在知識總量的積累上材鹦。
例如上面提到的從圖片中獲取信息給予用戶答案的例子,同理的場景也可以是從音頻中得到得到答案提供給用戶耕姊,假如某AI搜索產(chǎn)品和喜馬拉雅這樣的音頻產(chǎn)品結(jié)合桶唐,就可以在喜馬拉雅龐大的音頻數(shù)據(jù)庫中得到無數(shù)專業(yè)領(lǐng)域的信息。
2)覆蓋的需求場景范圍更大
這一點要分兩方面理解茉兰,第一方面是普通用戶能使用自然語言描述要搜索的復(fù)雜問題了尤泽,傳統(tǒng)搜索產(chǎn)品雖然也有高級模式,但易用性較差邦邦、用戶觸達率極低安吁,如下圖是百度的高級搜索模式,大家覺得普通用戶有多少人用過燃辖?
作者自己曾經(jīng)參與的醫(yī)療產(chǎn)品中鬼店,也遇到過需要使用多字段條件判斷+維度關(guān)系+邏輯關(guān)系+多級括號來描述自然語言的例子,只能說那個操作復(fù)雜度即使對專業(yè)交互設(shè)計師也非常費勁黔龟,更別說普通用戶了妇智。
第二方面是基于大模型的各種能力,衍生出了新的使用場景氏身,例如在360AI搜索中有大量用戶是使用該產(chǎn)品的生成能力巍棱、改寫能力來解決自己的需求。用戶對搜索產(chǎn)品的心智在隨著搜索產(chǎn)品能力邊界的擴展而發(fā)生變化蛋欣。
3)解決需求的鏈路變短航徙,復(fù)雜度降低
AI搜索產(chǎn)品可以將多個網(wǎng)頁的內(nèi)容聚合、總結(jié)并以結(jié)構(gòu)化的方式呈現(xiàn)出來陷虎,這在整體流程中這些環(huán)節(jié)中做到了提效
在這些環(huán)節(jié)到踏,AI 顯著的提升了傳統(tǒng)搜索產(chǎn)品中信息分散在各處的問題,是AI搜索產(chǎn)品在當前階段與傳統(tǒng)搜索產(chǎn)品最大的區(qū)別之一尚猿。同時也在一定程度上減少了廣告的干擾窝稿。
未來各家一定會在AI搜索產(chǎn)品中加入廣告,具體時間取決于AI搜索產(chǎn)品的增速凿掂,相對于通用Chatbot伴榔,AI搜索產(chǎn)品在輸入輸出環(huán)節(jié)消耗的token更多,同樣輸入一句“產(chǎn)品設(shè)計原則”庄萎,AI搜索產(chǎn)品需要先拿到多個網(wǎng)頁的內(nèi)容給到大模型踪少,這個過程消耗的token可能是通用Chatbot的上百倍。面對這樣的成本糠涛,商業(yè)化是必然的結(jié)果秉馏。
4)信息呈現(xiàn)方式更多樣化
現(xiàn)在很多AI搜索產(chǎn)品的結(jié)果中都使用了思維導(dǎo)圖來顯示內(nèi)容結(jié)構(gòu),有些還支持一鍵生成PPT脱羡,信息呈現(xiàn)方式的多樣化意味著在上述流程中的【二次加工】環(huán)節(jié)為用戶提供了更多支持萝究。將完整流程中的更多環(huán)節(jié)的工作代替用戶完成了。
未來可能除思維導(dǎo)圖和PPT之外锉罐,常用的流程圖帆竹、拓撲圖、魚骨圖以及各種數(shù)據(jù)展示圖表可能都會根據(jù)意圖識別環(huán)節(jié)做出的判斷做匹配脓规,或是支持以當前結(jié)果生成不同圖示栽连。
在本文開頭的360案例中也曾經(jīng)提到目前的答案基本是只有文字的,很多原文鏈接中的圖片侨舆、動圖消失了秒紧,這非常影響閱讀體驗,未來當模型的理解能力繼續(xù)提升后挨下,應(yīng)該也可以根據(jù)意圖和內(nèi)容做交叉判斷選擇保留更多媒體類型的信息熔恢。
5)更友好的廣告體驗
傳統(tǒng)搜索產(chǎn)品的廣告顯示位置周邊的界面樣式是由第三方網(wǎng)站站長決定的,所以廣告樣式和內(nèi)容樣式可能存在較大差異臭笆,廣告很明顯就能被辨別出來叙淌,突兀且生硬。
如下圖是微信公眾號文章中廣告(樣式不可控)愁铺,和知乎官方廣告(樣式可控)鹰霍,大家看一下就能感受的到體驗的差距。
而AI搜索產(chǎn)品的結(jié)果頁內(nèi)容是由自家的大模型生成的茵乱,內(nèi)容樣式也是自家完全可控可定制的茂洒,因此可以與廣告統(tǒng)一視覺樣式,帶來更好的轉(zhuǎn)化效果并降低對用戶的干擾瓶竭。
6)結(jié)果更準確督勺、內(nèi)容質(zhì)量更高
這一點可以結(jié)合第1)點理解,傳統(tǒng)的搜索產(chǎn)品由于結(jié)果大部分由第三方網(wǎng)站提供在验,所以對內(nèi)容的準確度無法控制玷氏,對內(nèi)容的質(zhì)量更加無法控制。
而AI搜索產(chǎn)品的原理決定了其結(jié)果更準確腋舌,在用戶輸入搜索詞后盏触,首先會由模型對問題進行改寫,例如搜索“2000元以下性能最強手機”块饺,可能就會被改寫成“截止2024年7月赞辩,中國境內(nèi)銷售的2000元以下性能最強的手機”,由系統(tǒng)補全了用戶下意識知道但沒有寫明的那部分信息授艰。問題描述更準確了辨嗽,結(jié)果自然就更準確了。
第二點原因則是現(xiàn)階段的AI搜索產(chǎn)品的結(jié)果并非單一來源淮腾,一般是經(jīng)過多個內(nèi)容來源聚合糟需、對比屉佳、總結(jié)形成的,并且在選擇內(nèi)容來源的時候可能根據(jù)問題類型選擇更靠譜的源頭洲押,例如新聞類信息可以來源于官媒武花、代碼類問題可以來源于CSDN。(人真的會下意識省略那些默認雙方都知道的信息杈帐,例如這段文字中的“第二點”這幾個字体箕,其實我并沒有說過“第一點”,但并不影響大家理解~)
同時挑童,基于節(jié)省token和反饋速度方面的考慮累铅,并不會把所有檢索到的結(jié)果(例如10000篇)全部傳遞給模型處理,而是選擇其中的幾個(例如10篇)作為源信息站叼,那么在選擇這1000中選擇10篇時娃兽,可能就會按照來源網(wǎng)站、閱讀量大年、作者换薄、互動量、相關(guān)性等指標進行選擇翔试。
最終從10000篇中篩選出了閱讀量更高轻要、被贊同更多、來自某幾個知名專業(yè)人士的文章傳遞給了大模型垦缅,所以能夠在篩選過程中保障AI搜索產(chǎn)品的結(jié)果可能更加準確冲泥、內(nèi)容質(zhì)量更高。
以上6點是AI搜索產(chǎn)品在用戶體驗上的優(yōu)勢壁涎,下面繼續(xù)聊聊作者猜測的AI搜索產(chǎn)品未來的演進方向凡恍。
二、AI搜索產(chǎn)品的演進方向
為了得到更靠譜的結(jié)論怔球,依然從搜索的流程開始分析嚼酝,傳統(tǒng)搜索產(chǎn)品的流程可以簡單示意為:
結(jié)合AI后在各個環(huán)節(jié)可做的事情如下:
1)輸入階段:擴充輸入方式
目前傳統(tǒng)搜索引擎基本支持了文字搜索和語音搜索,少數(shù)非廣域搜索產(chǎn)品還支持了以圖片搜索闽巩。
這里要注意一點是:作者覺得單純的使用語音轉(zhuǎn)文字輸入問題并不能定義成語音搜索担汤,這樣的做法只是改變了文字的輸入形式,但沒有改變信息總量崭歧,語音模態(tài)信息中的非文字信息沒有被整合進query隅很。
未來則會提升已有搜索方式的可用性,如準確度提升率碾、用時減少叔营。同時基于用戶輸入信息做補全屋彪、糾錯和問題推薦(問題推薦應(yīng)該已經(jīng)有產(chǎn)品上線了)
再之后可能會對這些搜索方式進行擴充,支持更多的媒體類型绒尊,例如動圖和視頻撼班,讀取其中的信息形成query。
但這并不酷垒酬!對人機交互的過程改變也非常有限,如果想再進一步則需要打破固有的思維件炉,為什么搜索一定需要以用戶主體輸入信息呢勘究?
輸入過程完成可以變手動為自動,或者說輸入環(huán)節(jié)可能會在整個搜索流程中被透明化斟冕。
想一想當我們閱讀一篇“super黃的AI文章”時口糕,如果結(jié)合具體用戶的歷史閱讀信息、當前的閱讀進度磕蛇,在某個段落的停留時長等信息景描,就極有可能判斷出用戶對這個段落中的某個名詞含義有些模糊,此時如果直接將這個名詞的含義顯示出來秀撇。就做到了輸入階段的透明化(自動化)超棺。
當然這種階段的產(chǎn)品可能短時間不會出現(xiàn)呵燕,還是需要結(jié)合用戶的一些簡單行為做判斷再扭,例如豆包中以劃詞搜索作為過渡方案泛范。
在人機交互中赡突,一般可以用行為來判斷意圖麸俘,要做到自動化的輸入過程則需要更大量的獲知用戶的環(huán)境信息,例如用戶看到的界面包含什么信息拜效,用戶所處的環(huán)境包含什么信息到千,同時結(jié)合大量歷史數(shù)據(jù)憔四、當下特征數(shù)據(jù)就一定有可能判斷出用戶想問的問題。
舉一個生活中的例子柿汛,一個5歲的小朋友讀課文,遇到了一個【貔】字貌笨,同時小朋友的聲音停止了,那么一款智能課本產(chǎn)品在得知閱讀進度净刮、生僻字字庫淹父、聲波消失等信息后,非常有可能直接告訴小朋友:這個字念pi蘸际,而不是需要小朋友主動詢問。這就做到了搜索過程中輸入環(huán)節(jié)的透明化(或者叫自動化/被動化)屿良。
在AI技術(shù)的具體應(yīng)用上尘惧,意圖識別是非常重要的一部分能力,而意圖識別準確率的前提有一方面是多模態(tài)交互重慢,準確的說是人機交互過程中人對機的多模態(tài)信息輸入隅熙。
信息的來源和模態(tài)變多了之后總量一定會變多酵熙,那么在已知條件變多后匾二,解題準確率(產(chǎn)品判斷用戶意圖的準確率)一定會提高。
就像人與人對話中語言文字只占信息總量的一半左右分飞。多模態(tài)交互解決了之前無法被機器接收到的那部分信息的問題譬猫,能從信息源上提升意圖識別的準確率。(這是AI搜索后續(xù)直鏈其他服務(wù)的基礎(chǔ))
不過這還只是把【模態(tài)】限制在了【人類信息通道類型】的范圍內(nèi)柳刮,對機來說晕换,可能不是【多模態(tài)】而是【超模態(tài)】闸准,人僅有五感模態(tài),但機器安裝傳感器器后則可以有更多種信息通道如陀螺儀库快、GPS、紅外信號闽铐、人類無法感知到的電磁波兄墅、聲波......
所以從底層來說機的信息通道數(shù)量可以遠超人,那么解決了中間層的算力和算法之后五督,意圖識別準確率很大概率可以達到人的水平,變意圖識別的下一階段就是我們剛剛提到的意圖預(yù)測(智能課本獲知多個信息后預(yù)測了小朋友不會讀貔這個字)误证。
意圖預(yù)測的意義就非常重要了,它可以變給出反饋為主動服務(wù)蓝谨。這才是對人機交互過程的重要改變咖楣。此處作為一名交互設(shè)計師诱贿,真誠的點贊榮耀手機發(fā)布會中人機交互那部分內(nèi)容,非潮翰洌酷孔厉!
稍微有點跑題,拉回來:以上這一小段是作者對AI搜索產(chǎn)品未來演進方向的猜測。除此之外可能在情感理解和跨多語言方面也會有更多意義此處就不展開了姿搜。下面繼續(xù)說查詢階段。
2)查詢階段:結(jié)合其他信息
目前的AI搜索在用戶輸入完成后,一般會對問題進行改寫氮块,使其更精準或覆蓋更多用戶可能需要的信息,例如把“RAG”改寫成“RAG是什么意思”蝠引,甚至改寫成“RAG在AI搜索產(chǎn)品中的具體含義”矫夯。
這樣一來就通過查詢階段的改寫進一步提升的輸入信息量融蹂,可以找到更加精準的信息区拳。
這一點涉及到的技術(shù)問題樱调,作者懂得不多,但基于“問題描述的越清楚答案就越精準”這一原理乞而,作者猜測改寫的進一步做法是融合更多信息,而不只是對用戶在本次使用中輸入信息的修改擴展屋灌。
融合更多信息指的是融合用戶的個人信息、過去查詢過的問題除嘹、復(fù)制行為、寫作數(shù)據(jù)等等很多方面的歷史行為數(shù)據(jù)蟆肆,再與用戶本次輸入的信息做融合判斷來獲取結(jié)果。
其實在現(xiàn)階段一些內(nèi)容平臺缓溅、電商網(wǎng)站的推薦算法已經(jīng)非常精準了蛇损,往往我們正需要的內(nèi)容/商品都會被主動推薦過來,這就是因為這些平臺掌握了大量用戶的數(shù)據(jù)坛怪。
而AI搜索產(chǎn)品掌握的用戶數(shù)據(jù)類型和總量可能沒有電商產(chǎn)品那么多淤齐。所以為了提升搜索準確度,作者猜測未來各個大廠可能會努力實現(xiàn)數(shù)據(jù)互通袜匿,但僅以當下的搜索產(chǎn)品商業(yè)模式來說更啄,各個大廠還沒有足夠的利益能夠驅(qū)動達成這個目標义锥。
所以作者的觀點是:AI搜索產(chǎn)品的商業(yè)模式和數(shù)據(jù)積累/互通可能會協(xié)同促進,如果AI搜索產(chǎn)品的答案中能夠為用戶推薦更精準的收費服務(wù)/商品,為廣告主帶來更高的轉(zhuǎn)化和營收锈候,則現(xiàn)在的數(shù)據(jù)持有者有可能將掌握的數(shù)據(jù)提供給AI搜索產(chǎn)品蛔垢。(當然也可以是數(shù)據(jù)主擴展業(yè)務(wù)自己做個同類產(chǎn)品)
具體的使用過程還有很多細節(jié)需要協(xié)商鞠抑,例如數(shù)據(jù)是否是直接可見的還是只提供特征等等。
3)輸出階段:擴充輸出方式
輸出的方式同樣包括不同的模態(tài)滑进、媒體、形式還有文件類型揍庄,目前各個產(chǎn)品支持腦圖和PPT,未來應(yīng)該會支持流程圖挟秤、魚骨圖....來覆蓋更多用戶需求。
同時對已支持形式的精細化改進也非常重要,例如目前只支持將答案中的腦圖作為圖片下載唠倦,其實無法滿足用戶編輯修改的需要毛肋,如果能生成xmind源文件或支持在網(wǎng)頁中對腦圖進行修改也非常有意義厂财。
包括PPT的排版形式、精美程度其實目前的AI搜索產(chǎn)品都還做的比較弱味滞,如果和Gamma這樣的產(chǎn)品對比跷睦,算是被按在地上摩擦了憨降,即使和國產(chǎn)的比格PPT相比爵嗅,也有很大差距。
面對創(chuàng)作場景,生成與內(nèi)容相關(guān)的配圖也是很需要的能力,在把非常長的答案內(nèi)容如何分割秕狰、提取與圖像相關(guān)的關(guān)鍵詞,以及保證全文中配圖視覺風格一致都是要考慮的問題饰恕。
以上說的是輸出階段支持不同的媒體形式挠羔,下面說輸出不同模態(tài):
以文字形式輸出和以聲音形式輸出可以滿足不同的使用場景,例如當用戶設(shè)備的距離稍大時埋嵌,視覺模態(tài)就無法幫助用戶有效接收信息褥赊。
在多任務(wù)場景中也可以使用不同模態(tài)的信息接收通道來獲得更好的協(xié)同體驗,使用戶可以把更多精力集中在主任務(wù)莉恼。
舉個例子現(xiàn)在很多人都有使用雙顯示器的需求拌喉,主要就是為了解決多任務(wù)協(xié)同的問題,這種方式相對于使用聲音通道進行多任務(wù)協(xié)同更適合需要更多時間理解內(nèi)容的場景俐银,如果只是想獲取一個簡單數(shù)據(jù)尿背,完全可以用語音操控“小愛同學,幫我查一下百度2024年營收數(shù)據(jù)”并以聲音的形式接收直接寫到文章里捶惜,避免多界面切換帶來的割裂感田藐。
再進一步,輸出階段還需要考慮到用戶對信息的儲存和分享等需求,甚至可以做多內(nèi)容關(guān)聯(lián)輔助用戶后期再查找等需求汽久。
按作者的理解鹤竭,對信息的儲存最好能與筆記產(chǎn)品關(guān)聯(lián)起來,最好能做到無縫導(dǎo)入筆記景醇,并與相關(guān)話題產(chǎn)生關(guān)聯(lián)臀稚。最簡單的做法可以是提取相同關(guān)鍵詞形成標簽,可以按標簽篩選內(nèi)容三痰。
對于分享的需求則需要考慮分享的渠道吧寺、分享的排版精致化、分享時添加用戶需要的信息(如加入作者的ID散劫、自媒體名稱甚至聯(lián)系方式等等)稚机,以減少用戶的二次加工。
4)瀏覽結(jié)果階段:千意千面
這一階段是現(xiàn)在各個AI搜索產(chǎn)品重點發(fā)力的部分获搏,主要使用大模型的總結(jié)能力和文生圖能力為用戶帶來更聚合赖条、更清晰、結(jié)構(gòu)化的結(jié)果瀏覽體驗常熙。
但也同樣存在問題谋币,上面曾經(jīng)*·37-提到閱讀娛樂新聞的場景就不適合使用結(jié)構(gòu)化、總結(jié)后的信息進行展示症概。
所以作者猜測當未來的AI搜索模型能夠識別出更多種蕾额、更細致的用戶場景和意圖后,在界面呈現(xiàn)上會根據(jù)不同的場景和意圖做出對應(yīng)的界面樣式彼城。
目前結(jié)構(gòu)化的結(jié)果顯示方式只適合閱讀場景中專業(yè)知識閱讀的細分場景诅蝶,對于搜索產(chǎn)品來說覆蓋的場景數(shù)量太多了。看劇、下載文件攻冷、尋址等等場景都需要更細致更個性化的界面設(shè)計虫蝶,甚至如尋址這種場景都不需要界面設(shè)計笑陈,當對尋址意圖的判斷準確率夠高之后,完全可以在用戶搜索【優(yōu)酷】時直接打開該網(wǎng)站。
從這個角度來說,千意千面的面完全可以不限制在頁面樣式上棘钞,包括整體流程都可以根據(jù)意圖做出區(qū)別。屆時結(jié)合上述其他猜想干毅,可能搜索的流程會變得面目全非:
如果不從業(yè)務(wù)角度考慮的話宜猜,還可以根據(jù)用戶的審美對頁面設(shè)計中的字體、顏色硝逢、布局等很多其他視覺樣式做出個性化呈現(xiàn)姨拥。同樣可以成為體驗提升的一部分绅喉,但要注意視覺統(tǒng)一性、品牌性與個性化之間的平衡叫乌。
5)結(jié)果復(fù)用與社區(qū)化
目前AI搜索產(chǎn)品的成本依然較高柴罐,按super黃與360負責AI業(yè)務(wù)的VP梁先生的博客公開的數(shù)據(jù)是每次搜索在0.2元左右。
粗糙的這個成本的構(gòu)成視為輸入和輸出階段消耗的token憨奸,那么對于類似的相似度達到一定標準的問題完全可以使用相同的答案革屠。這樣可以降低輸出階段token消耗的成本。
對于相似但不達標的問題膀藐,之前已經(jīng)生成的回答依然可以作為信息源參與新問題的結(jié)果生成,此時上一個問題生成的結(jié)果相當于把多篇內(nèi)容提煉出與此問題匹配度更高的內(nèi)容红省,可能同樣可以節(jié)省一部分token消耗额各。
當結(jié)果生成后,部分場景有可能用戶會對結(jié)果內(nèi)容進行再次優(yōu)化吧恃,如果此時能夠引導(dǎo)用戶將自己人工修改后的信息作為公開內(nèi)容虾啦,允許被其他用戶訪問,那么就可以將內(nèi)容沉淀下來痕寓,形成內(nèi)容社區(qū)傲醉,最終把內(nèi)容社區(qū)產(chǎn)品與AI搜索產(chǎn)品融合。
傳統(tǒng)的搜索產(chǎn)品結(jié)果來源大多是第三方網(wǎng)站呻率,所以搜索產(chǎn)品雖然是整個互聯(lián)網(wǎng)重要的流量入口硬毕,但也只能做做賣流量賣廣告的生意。其原因就是因為內(nèi)容不是自己的礼仗,商業(yè)鏈路到搜索結(jié)果這一步就停了吐咳。
而AI搜索產(chǎn)品如果能將內(nèi)容完成沉淀,形成類似小紅書元践、知乎這樣的內(nèi)容社區(qū)則對產(chǎn)品天花板是一次巨大的提升韭脊。
簡單來講,搜索產(chǎn)品一般是有需求才使用单旁,而內(nèi)容社區(qū)產(chǎn)品則是有事沒事都可以逛一逛沪羔。
例如用戶喜歡看冷笑話,現(xiàn)在這個時間常規(guī)的路徑一般是在某內(nèi)容社區(qū)關(guān)注了冷笑話類博主象浑,而不是在百度搜索“冷笑話”蔫饰。
第二意味著用戶留存。內(nèi)容本身就是消費品愉豺,更可以在kol與消費者之間進行連接死嗦,兩方面都是留存的關(guān)鍵。其實內(nèi)容消費產(chǎn)品的留存能力也不必多說粒氧,想想抖音和小紅書就知道了~
有些傳統(tǒng)的筆記產(chǎn)品也是這個思路越除,希望能把用戶創(chuàng)作的高質(zhì)量筆記授權(quán)后公開顯示,基于大基數(shù)的用戶量形成內(nèi)容社區(qū),為筆記類產(chǎn)品突破天花板摘盆,變工具型產(chǎn)品為社區(qū)型產(chǎn)品翼雀。例如印象筆記就有源于筆記產(chǎn)品內(nèi)容板塊的獨立的【識堂】產(chǎn)品。
對AI搜索產(chǎn)品來說孩擂,由于其創(chuàng)作內(nèi)容更簡單狼渊,在內(nèi)容全面性和大眾領(lǐng)域的內(nèi)容質(zhì)量也能達到一定標準,所以想按這個思路發(fā)展是更有機會的类垦,最重要的是可以把自家消耗大量算力產(chǎn)出的內(nèi)容沉淀下來狈邑,產(chǎn)生2次-N次被消費的價值。
通觀全篇蚤认,其實會發(fā)現(xiàn)數(shù)據(jù)的價值體現(xiàn)在AI搜索產(chǎn)品的各個環(huán)節(jié)米苹,輸入環(huán)節(jié)可以結(jié)合用戶個性化數(shù)據(jù)把問題改寫的更清楚準確,匹配環(huán)節(jié)可以找到更多信息源砰琢,輸出環(huán)節(jié)決定了答案準確度和內(nèi)容質(zhì)量蘸嘶,搜索后服務(wù)環(huán)節(jié)甚至可以有突破搜索產(chǎn)品天花板的機會。
由此可見數(shù)據(jù)是AI搜索產(chǎn)品(甚至所有AI產(chǎn)品)的最重要競爭壁壘之二陪汽,另一方面毫無疑問是模型能力训唱。
形成社區(qū)/搜索融合形態(tài)的產(chǎn)品后,更重要的意義是商業(yè)方面實現(xiàn)更多模式的收入構(gòu)成挚冤,對于自家不涉及的業(yè)務(wù)依然可以像傳統(tǒng)搜索產(chǎn)品那樣出售流量變現(xiàn)况增,對于自家涉及的業(yè)務(wù),完全可以變賣流量為賣產(chǎn)品训挡,拿到更多利潤巡通。
從這一點來說,AI搜索產(chǎn)品對規(guī)模越大舍哄、涉及業(yè)務(wù)越多的公司重要程度就會越高宴凉。再加上新一代流量入口的屬性,作者認為AI搜索產(chǎn)品是大廠必爭之地表悬。
6)從搜索產(chǎn)品到全部產(chǎn)品
上面的5點我們討論的基本是AI搜索作為獨立搜索產(chǎn)品的演進猜測弥锄,但搜索+AI的能力其實可以體現(xiàn)在任何需要搜索功能的產(chǎn)品中。
如筆記產(chǎn)品蟆沫,用戶積累了10年的筆記內(nèi)容在查找和關(guān)聯(lián)時都是比較困難的問題籽暇,在相關(guān)內(nèi)容聚合方面也非常需要AI能力。如果把AI能力加入之后可以實現(xiàn)更精準的搜索饭庞、模糊搜索戒悠、基于筆記內(nèi)容的問答等等。
同樣的舟山,對電商產(chǎn)品的搜索過程绸狐,基于對搜索關(guān)鍵詞的改寫可以做到更精準的商品匹配卤恳,于公司而言可以在企業(yè)級知識管理產(chǎn)品中發(fā)揮作用,對特定行業(yè)可以做科研文獻快速查找寒矿。
因此作者認為,廣義的AI搜索產(chǎn)品可能不是獨立產(chǎn)品符相,而是在眾多類型產(chǎn)品的查找場景中發(fā)揮作用。
搜素的本質(zhì)是人的信息需求啊终,而AI搜索的未來形態(tài)會分成兩種主要場景:
一種是基于已有直接可用信息的匹配散怖,另一種主要場景是基于非直接可用內(nèi)容的聚合+生成菇绵。
三咬最、 AI搜索產(chǎn)品的核心體驗
嘮叨了這么多翎嫡,其實AI搜索產(chǎn)品的核心體驗已經(jīng)很清晰了,按照用戶路徑的順序來說依次是:
輸入體驗永乌、反饋速度惑申、結(jié)果質(zhì)量、接收體驗翅雏、搜索后服務(wù)圈驼,下面依次詳細介紹其影響因素:
1)輸入體驗
輸入體驗,首先指支持輸入的媒體/文件類型望几,文字绩脆、圖片、音頻橄抹、視頻靴迫、動圖、文檔楼誓、鏈接....支持的類型越多則用戶的操作自由度越高玉锌、能覆蓋的場景越多,還可以減少輸入限制導(dǎo)致的用戶手動轉(zhuǎn)換格式的成本疟羹,所以支持輸入的媒體/文件類型越多體驗一定越好主守。
輸入體驗的第二方面是非文字信息理解能力禀倔,例如的當用戶使用語音方式搜索時是否能從語速、音量丸逸、停頓等其他方面獲取更多信息蹋艺,使這些信息與語音轉(zhuǎn)化成文字的信息融合起來形成更準確的輸入Query。
第三方面是問題轉(zhuǎn)寫能力黄刚,同樣影響著輸入Query質(zhì)量捎谨,例如用戶輸入的是“12400f和12490f相比”被轉(zhuǎn)寫為“對比12400f和12490f兩個CPU,兩者在性能和功耗憔维、游戲體驗等方面相比哪個好”其實可以更完善的描述問題并更多更準確的答案涛救。輸入體驗并非指用戶輸入的體驗,而是指從用戶輸入直到將query信息輸入到模型這一過程的整體影響业扒。
2)反饋速度
反饋速度由索引庫检吆、模型效率、算力程储、服務(wù)器性能蹭沛、網(wǎng)速、需要反饋給用戶的數(shù)據(jù)量等指標決定章鲤。
索引庫是一個包含產(chǎn)品信息的數(shù)據(jù)庫摊灭,其特殊的數(shù)據(jù)結(jié)構(gòu)可以提升查詢效率,使查詢過程不需要掃描整個數(shù)據(jù)就能找到相關(guān)結(jié)果败徊,對于復(fù)雜條件的查詢帚呼,也能做到更高效的完成。因此索引庫效率越高反饋時間越短皱蹦。
模型效率則在輸出環(huán)節(jié)決定了結(jié)果內(nèi)存的生成速度煤杀,不同模型生成內(nèi)容的速度可能有明顯的快慢之分,因此模型效率同樣影響反饋速度沪哺。反饋速度越快則用戶能得到結(jié)果信息越快沈自,體驗越好。
算力(用戶可用部分)直接影響了生成速度辜妓,算力在不同時間的需求量會有明顯差距枯途,例如工作時間的需求量一定大于夜晚時段,在需求峰時可考慮結(jié)合收費方式為付費用戶帶來更好的體驗嫌拣,或采用其他對企業(yè)有益的用戶引導(dǎo)給與用戶優(yōu)先使用權(quán)柔袁,kimichat在幾個月前就試水了打賞機制讓付費用戶在高峰時段能優(yōu)先使用算力。
對于閑時算力异逐,同樣可以預(yù)先生成用戶可能需要的內(nèi)容或一些長尾問題捶索,當用需要時直接顯示處理,以提高反饋速度灰瞻。
同樣的服務(wù)器性能腥例、網(wǎng)速也會事實上對反饋速度有較大影響辅甥,但兩個方面也適用于傳統(tǒng)搜索產(chǎn)品,非AI搜索產(chǎn)品獨有的體驗影響因素燎竖。
需要反饋給用戶的數(shù)據(jù)量這一指標是作者認為需要優(yōu)化的重點璃弄,例如當用戶搜索【喬布斯在哪一年創(chuàng)立了蘋果公司】,可能用戶只是需要一個具體的年份信息构回,而不需要非常多的長篇大論夏块,把蘋果公司和喬布斯的各種信息全部輸出一遍對用戶來說可能是沒有意義的信息。輸出這些信息的過程中既消耗了token增加了成本又影響力反饋速度纤掸。
某些場景下甚至可以沒有輸出信息脐供,例如尋址場景用戶的最終目的就是打開一個網(wǎng)站,那么沒有搜索結(jié)果頁面直接打開某網(wǎng)站是既低成本又短路徑的優(yōu)秀體驗借跪。
3)結(jié)果質(zhì)量
結(jié)果質(zhì)量由索引庫數(shù)據(jù)量政己、信息源選擇規(guī)則、信息源總量掏愁、模型質(zhì)量歇由、輸入query信息量、問題理解準確度等指標決定果港。
索引庫數(shù)據(jù)量越大沦泌,則匹配過程能找到回答用戶問題的信息總量就越多,就涵蓋更多用戶所需的答案京腥。
信息源選擇規(guī)則影響了用于傳遞給模型的信息質(zhì)量赦肃,面對同樣的問題溅蛉,如果選擇了百度問答中的答案作為信息源頭或使用知乎作為信息源頭對結(jié)果質(zhì)量的影響可想而知公浪。
當然信息源選擇并非簡單選擇從百度獲取信息還是從知乎獲取信息,一般來說對于專業(yè)領(lǐng)域的問題可以從各種垂直網(wǎng)站獲取專業(yè)信息質(zhì)量更好船侧。對于普通問題欠气,則可能會從內(nèi)容的相關(guān)性、瀏覽量镜撩、作者身份预柒、內(nèi)容互動量、內(nèi)容發(fā)布時間...等很多維度的指標進行選擇袁梗,總體原則就是希望通過各種直接的或間接的指標抽象判斷出內(nèi)容質(zhì)量宜鸯,將內(nèi)容質(zhì)量較好的一部分文章傳遞給模型進行總結(jié)和結(jié)構(gòu)化加工。那么很容易理解信息源選擇規(guī)則越合理結(jié)果質(zhì)量越好遮怜、用戶體驗越好淋袖。
模型質(zhì)量則在答案信息傳遞進模型后發(fā)揮作用,面對同樣的輸入信息各家的模型生成的答案可能會有很大不同锯梁,此時自然是模型質(zhì)量越高結(jié)果質(zhì)量越高即碗、體驗越好焰情。
同時模型質(zhì)量的一部分指的是對自然語言的理解能力,面對用戶輸入的問題能否做到準確理解含義剥懒,明白用戶需要的是什么内舟,此處不得不再提一下360AI搜索,當我搜索“老虎圖片”的時候初橘,居然不能直接定位到圖片結(jié)果验游,而是給我顯示了這樣的結(jié)果頁面:
首先頁面主題居然用文字給我描述了兩個圖片,然后給我推薦了老虎的其他相關(guān)信息保檐,同時右上角的引導(dǎo)我點了十幾秒還是關(guān)不掉批狱,體驗糟透了。
對問題的準確理解影響了后續(xù)流程如何推進展东,再舉個簡單的例子赔硫,當我輸入“優(yōu)酷”的時候,是應(yīng)該給我介紹一下優(yōu)酷公司的信息還是應(yīng)該直接給一個跳轉(zhuǎn)鏈接盐肃?
輸入query信息量是被模型處理前的信息量爪膊,此信息量越大一般結(jié)果質(zhì)量會越好,但會存在一個臨界值砸王,超過此臨界值后信息量的增加對結(jié)果質(zhì)量優(yōu)化將變得很有限推盛,同時考慮到輸入類token的成本問題、模型處理所需時間問題谦铃,也不能將所有相關(guān)信息全部輸入給模型耘成。需要界定一個合理數(shù)值,這也印證了數(shù)據(jù)源選擇規(guī)則的重要性驹闰。
4)接收體驗
接收體驗由可輸出的媒體/模態(tài)/格式類型瘪菌、UI界面、二次加工時間嘹朗、廣告體驗等指標決定师妙。
可輸出的媒體類型和格式越多對用戶需求的覆蓋度越廣,屬于有和沒有的區(qū)別屹培,省去了用戶二次轉(zhuǎn)換的時間默穴,這方面的體驗的影響不必廢話。
可輸出的模態(tài)則略有不同褪秀,例如在駕車場景中蓄诽,一定是以聲音模態(tài)輸出更符合該場景下用戶能接受的方式。在辦公室場景中則視覺模態(tài)更好媒吗。
所以支持不同模態(tài)的輸出一是匹配不同場景用戶適合接收信息的方式仑氛,二是多模態(tài)協(xié)同可以進一步提升信息傳遞的效率。
視覺模態(tài)接收信息的效率可以是聽覺的百倍以上蝴猪,但聽覺模態(tài)具有被動性调衰、注意力敏感性膊爪、環(huán)繞性等特點。
被動性指信息可以被動的由人進行接收嚎莉,相比于視覺信息更不易被遺漏米酬,注意力敏感性指聲音的變化能更快速的被用戶感知,環(huán)繞性指信息來源的位置可以由人周邊360°發(fā)起趋箩,都可以被人接收到赃额。
基于視覺模態(tài)和聽覺模態(tài)的不同特點,多模態(tài)融合的方式可以各取其所長叫确,幫助用戶同時處理多任務(wù)及各種場景下更輕松的接收信息跳芳。(多模態(tài)交互涉及的內(nèi)容極多,可能需要另一篇萬字長文才能完全解釋清楚竹勉,這里不多展開了)
上面略微展開了一下信息以不同模態(tài)的特點飞盆,下面繼續(xù)說UI界面對接收體驗的影響。
UI界面是發(fā)展時間最長次乓,被研究最深入的視覺通道信息傳遞方式吓歇,而視覺通道是人類90%以上接收信息的方式,因此單獨把UI界面作為影響接收體驗的因素之一票腰。
廣義的UI設(shè)計包括排版城看、文字、圖形杏慰、動效测柠、交互方式及其二級屬性,由于人類從外界獲取信息最主要的途徑就是視覺模態(tài)缘滥,所以UI界面是接收體驗中非常重要的一部分轰胁。
排版的方式?jīng)Q定了用戶獲取信息的先后順序、視覺壓力完域,文字的字體決定了獲取信息的難易程度(如草書和楷書)和美觀的感受软吐,圖形可以更直觀的表達信息并附帶情感瘩将,動效可以引導(dǎo)用戶的注意力使視覺焦點始終位于目標信息吟税,交互方式可以讓用戶更自然的得到隱藏信息、多環(huán)節(jié)信息姿现。
舉個例子如token生成速度對UI界面的影響肠仪,現(xiàn)在很多Chatbot的生成答案時都是一個token一個token顯示到用戶界面上的,這種方式造成了很強烈的動態(tài)效果备典,會對用戶注意有嚴重干擾异旧,影響信息接收效率。
目前token生成速度的價格差異主要體現(xiàn)在廠商定價階段提佣,作者查了一下沒看到根據(jù)生成速度定價的廠商吮蛹,從反饋速度的體驗來說荤崇,一定是結(jié)果生成的越快越好,但可以稍微控制一下顯示到界面上的間隔時間潮针。
一般首次等待時間在2秒內(nèi)不會造成用戶流失术荤,后續(xù)可以考慮生成一段內(nèi)容后一次性顯示到界面上,避免界面頻繁變化每篷。(想一想垃圾網(wǎng)站上不停跳動的小廣告應(yīng)該可以感受到類似的體驗~)
二次加工時間則受到前面講過的可輸出的媒體/模態(tài)/格式類型瓣戚、結(jié)果質(zhì)量等因素影響,用戶難免遇到搜索結(jié)果無法直接在其他場景(如各種匯報)中使用的情況焦读,此時對內(nèi)容的二次加工時間非常影響體驗子库。
例如對思維導(dǎo)圖的編輯是可在線編輯還是需下載后編輯,對生成的圖片能否局部修改等等矗晃,二次加工所需時間越長則體驗越差仑嗅。
廣告體驗則是繞不過去的話題,AI搜索產(chǎn)品必定需要進行商業(yè)化以覆蓋成本张症,前文中曾提到過視覺樣式對廣告體驗的影響无畔,如下圖:
除視覺樣式外,廣告內(nèi)容能否與用戶屬性匹配同樣重要吠冤,當廣告內(nèi)容恰巧是用戶所需內(nèi)容浑彰,并與用戶的消費能力相符時,甚至可以實現(xiàn)整體正向的廣告體驗拯辙。
如果整體生態(tài)郭变、合作廣告主規(guī)模足夠大,將廣告內(nèi)容無形融合到答案內(nèi)容將會是未來廣告形態(tài)的重要變化涯保。
現(xiàn)階段基于關(guān)鍵詞的廣告最大的體驗問題是非用戶所需诉濒,即用戶需要的東西與廣告推薦的東西不匹配,導(dǎo)致了廣告信息影響了用戶找到夕春、閱讀正確的目標信息未荒。
如果用戶搜索的目標是“AI課程”,那么即使出現(xiàn)賣課的廣告也不會影響用戶體驗及志,因為這正是用戶所需的片排。如果再能夠保證課程質(zhì)量(廣告對應(yīng)的商品質(zhì)量)則體驗更佳。而保證廣告對應(yīng)的商品質(zhì)量的基礎(chǔ)就是上方提到的各作廣告主規(guī)模足夠大速侈,有篩選的基礎(chǔ)率寡。
5)搜索后服務(wù)
搜索后服務(wù)的體驗由服務(wù)范圍、搜索-服務(wù)融合度倚搬、服務(wù)-意圖匹配度冶共、服務(wù)路徑長度、信息記憶、廣告體驗等指標決定捅僵。
服務(wù)范圍指搜索到相關(guān)信息后家卖,能否接近一站式的繼續(xù)解決需求,例如搜索北京旅行攻略庙楚,能繼續(xù)預(yù)定去北京的機票/酒店/旅行團篡九。搜索iphone15能在結(jié)果頁中馬上下單購買。
這方面的體驗與前文中提過的數(shù)據(jù)互通醋奠、AI搜索產(chǎn)品融合等話題相關(guān)榛臼,顯而易見的是AI搜索后服務(wù)能提供的服務(wù)范圍越大,則路徑越短窜司、操作越簡沛善、體驗越好。
在搜索后服務(wù)的流程中塞祈,傳統(tǒng)方式是在各個大廠的平臺切換金刁,用戶路徑較長并且需要在不同產(chǎn)品中多次輸入賬號/密碼/地址....等很多信息,操作復(fù)雜度很高還有詐騙風險议薪。
AI搜索產(chǎn)品如果能融合其他業(yè)務(wù)尤蛮,則可以更接近一站式的完整解決需求,而不是將需求分解到多個公司的多個產(chǎn)品中完成斯议。如旅行場景就可以把搜索攻略與機/酒/團等需求一次性解決产捞。這就是搜索-服務(wù)融合度的意義。
而服務(wù)-意圖匹配度則還是強調(diào)的意圖識別準確率的問題哼御,當某大廠覆蓋的業(yè)務(wù)范圍極廣坯临,那么能否把各業(yè)務(wù)與用戶搜索的意圖精準對應(yīng)就成了影響商業(yè)轉(zhuǎn)化和體驗的重要因素。
服務(wù)路徑長度上面也舉過例子恋昼,當用戶的目的是打開一個網(wǎng)站看靠,那么沒有搜索結(jié)果頁面直接打開某網(wǎng)站是既低成本又短路徑的優(yōu)秀體驗。沒有必要非給用戶一個結(jié)果頁面上面有個網(wǎng)站入口液肌,還需要再點擊一次挟炬。不過這個具體場景可能會影響廣告曝光量,實際環(huán)境中需要再仔細考慮嗦哆。
廣告體驗同樣也在前文中提到過都不再多說谤祖。
----總結(jié)分割線----
本文內(nèi)容由3個大主題構(gòu)成:
1、為什么AI搜索產(chǎn)品成了共識
2吝秕、AI搜索產(chǎn)品的演進方向猜測
3泊脐、AI搜索產(chǎn)品的核心體驗及影響因素
其實目前大多數(shù)Chatbot和其他AI類產(chǎn)品出現(xiàn)時間都非常短,很多用戶體驗方面的問題也來不及做的很細烁峭,大多數(shù)公司依然在關(guān)注模型層面的技術(shù)問題。
但作者一直認為在用戶視角下其實并不關(guān)心模型層面的技術(shù)問題,更直接與用戶接觸的是體驗约郁,體驗是用戶使用產(chǎn)品后在極短時間內(nèi)缩挑、極主觀決定是否繼續(xù)使用這一產(chǎn)品的決定性因素。
因此作者更關(guān)注AI產(chǎn)品體驗方面的問題鬓梅,未來也將輸出更多AI產(chǎn)品體驗的案例與大家分享