姓名:杜敏剛 ? ? ?學號:17021211253
轉(zhuǎn)載自:http://36kr.com/p/5098918.html
【嵌牛導讀】:任何一款產(chǎn)品的出現(xiàn),都是源自用戶需求签舞。要么是已經(jīng)存在的存量需求秕脓,要么是正在規(guī)模化的增量需求儒搭,對話機器人也不例外吠架。本文站在純產(chǎn)品的視角分析:一款產(chǎn)品對話機器人背后,需求和產(chǎn)品邏輯是怎樣的搂鲫。
【嵌牛鼻子】:對話傍药、機器人、需求
【嵌牛提問】:當我們在談?wù)摗皩υ挋C器人”產(chǎn)品時,我們該如何看待它背后的需求呢拐辽?
【嵌牛正文】:
今天拣挪,擁有對話能力的機器人,被逐漸認為是一種核心智能俱诸,是否能夠流利地完成對話菠劝,可被視作這款機器人是否真正擁有智能的唯一憑證。
從可以追溯的歷史資料來看乙埃,對話機器人(chat-bot)至少在上世紀六十年代就已經(jīng)問世,經(jīng)過近五六十年的發(fā)展锯岖,今天我們已經(jīng)可以在許多產(chǎn)品中看到對話機器人的影子介袜,微軟的Cortana、小冰出吹,蘋果的Siri遇伞、Google Now、阿里小蜜捶牢、百度度秘鸠珠、圖靈機器人、助理來也秋麸、出門問問等等渐排。
可以肯定的是:對話機器人已經(jīng)成為了一種業(yè)界時尚,越來越多的公司試圖通過這種全新的交互形式灸蟆,來優(yōu)化或者升級自己產(chǎn)品——我們已經(jīng)可以在許多的產(chǎn)品中看到各種名為“小X機器人”的子產(chǎn)品驯耻。
如此多的對話機器人很容易給人一種百花齊放、方興未艾的感覺炒考。我們可能會隱約覺得:每家的對話機器人產(chǎn)品都大同小異可缚,有些家的產(chǎn)品會有一些別樣的特征,可是終究給人一種不屬于過去十年移動互聯(lián)網(wǎng)發(fā)展的感覺——這些對話機器人似乎都還處在很早期斋枢,用戶量似乎都不大帘靡,顯得都有些小眾。
我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對話機器人背后瓤帚,需求和產(chǎn)品邏輯是怎樣的(文中我無意去對比各家對話機器人的優(yōu)劣描姚,也不討論某款對話機器人的產(chǎn)品觀或方法論)。
一戈次、探索“對話”行為背后的需求
首先轰胁,我們試圖探索“對話”這一行為的場景與背后的需求。
在《人類簡史》一書中朝扼,認為語言能力是智人區(qū)別于其他猿類最重要的特質(zhì)和能力赃阀;因為語言能力,智人可以互相通過對話而形成更豐富的交互,從而才有了協(xié)作和后來的文明榛斯。
人類有三種最直接的方式來使用語言:“一對零”观游、“一對多”、“一對一”驮俗。
“一對零”是自我內(nèi)化的反思懂缕、總結(jié)、沉淀王凑,不向外做交互和分享搪柑。
“一對多”是廣播式的宣講和相對單向的輸出,譬如開大會或者發(fā)號施令索烹。
“一對一”是對話——群聊也是由許多的“一對一”構(gòu)成的桥滨,所以我認為不存在真正意義上的“多對多”對話没佑。我認為對話是我們?nèi)伺c外界進行交互的最直接即時的途徑(注意“即時”很重要)伞矩。
所謂對話瓢阴,一定是一個雙方交互行為,并且互為I/O(input / output)的過程垒拢。比如兩個人對話旬迹,每個人所說的話,對于自己而言是輸出求类,對于對方而言是輸入奔垦。原則上,對話可以永遠持續(xù)下去尸疆。
但我們幾乎從未見過兩個人會永遠在對話宴倍,那是因為:如果需要對話持續(xù)下去,雙方都需要保持參與仓技;任何一方覺得疲勞或者無價值感了鸵贬,對話就會終止。
對話的場景更加貼近我們的生活行為脖捻,它頻次最高阔逼,且環(huán)境開放多變,分析它背后的需求并不容易〉鼐冢現(xiàn)在嗜浮,我們需要回答兩個問題:
1.1 第一個問題:對話為什么能夠開始?
我認為人在對話中存在三個層面的需求摩疑。
第一層危融,是基礎(chǔ)問答的需求±状可以描述為:
我有一個問題吉殃,請你回答我。
二次追問的問題,屬于新問題蛋勺。這個過程瓦灶,非常類似于我們今天所使用的搜索引擎。
第二層抱完,是任務(wù)流程協(xié)作的需求贼陶,以達成某種目的為止∏捎椋可以描述為:我想請你幫我買一張明天下午14:00-18:00出發(fā)碉怔,北京到上海的機票;經(jīng)濟艙禁添,盡可能便宜撮胧,最好是東航的。我們和朋友相約去逛街上荡,拜托同事幫忙預定會議室趴樱,接受閨蜜的請求明早叫她起床馒闷。
這些都是任務(wù)流程協(xié)作的需求酪捡。
第三層,是共同的情感建立纳账,無論喜怒哀樂逛薇。聊天的目標很難定量量化,我們更多是嘗試定性地去制定聊天的目標疏虫∮婪#可能是心情不好需要人陪,也可能是好事情需要向好朋友分享卧秘,我們需要對話來表達進行最直接即時的表達呢袱。
我并不認為只有孤獨的情感才需要對話——人作為擁有萬年發(fā)展歷程的群居動物,與他人進行情感分享是早已刻入基因的特質(zhì)翅敌。只是我們建立的情感在不同人之間會有所不同羞福,對于信任之人的情感建立會很深刻,而對于點頭之交則會保留許多蚯涮。
開啟一段對話一定源自上述的某種需求治专,而開啟的契機則是一個相對明確的話題,哪怕只是一句“我餓了”遭顶。
1.2 第二個問題:對話為什么會持續(xù)张峰?
對話能夠持續(xù),是有兩個層面的原因棒旗。
第一個原因喘批,是至少一方的需求沒有得到滿足。比如我去提問題,對方回答我不滿意谤祖,我就會持續(xù)追問婿滓。兩個女生在一起聊八卦,聽的人很入神粥喜,講的人才有成就感能繼續(xù)講下去凸主。
第二個原因,是雙方相對平等额湘。如果我提了個問題卿吐,或者請對方幫個忙,但是對方始終是一種高姿態(tài)不搭理我锋华,那我就很容易放棄嗡官,不想聊了。反過來毯焕,如果對方對我過分尊敬衍腥,總在說一些沒有營養(yǎng)的恭維拍馬屁的話,時間久了纳猫,我也會變得更虛榮婆咸,而且會覺得很無聊。所以芜辕,人不會和自己階層或者品味相差太多的人聊天尚骄,絕大多數(shù)人更不會和寵物長時間聊天。
對話會終止侵续,最根本的原因是:雙方都放棄了這輪對話倔丈。
感性一些來描述對話終止的原因,可以認為是雙方都覺得“疲憊”了状蜗,也就是這一輪對話的能耗消耗殆盡需五;哪怕是情侶之間說甜言蜜語,聊個兩三千句也會覺得累了轧坎,也會在十幾個回合的互道“晚安”中結(jié)束本次對話宏邮。
所以,對話總會終止眶根,能耗殆盡就會終止蜀铲。
二、“對話機器人”產(chǎn)品的發(fā)展源自搜索引擎
在我以前的文章《進階之路:站在高視角看產(chǎn)品是一種怎樣的體驗》中属百,講述過一個概念记劝,叫做“知識詛咒”。簡單說:現(xiàn)在我明白一件事情族扰,但是要完整清楚的講授給你厌丑,是很難的定欧;因為我們所擁有的知識背景不同怒竿,我們對同一件事情的理解不同。這也就解釋了為什么很多老師在上課的時候索然無味爷辱,很多人做Presentation的時候顯得蒼白無力,這其實是知識詛咒在起作用朦肘。
知識詛咒帶來一個很大的問題媒抠,就是每當我們接觸到一個陌生事物時弟断,都會和自己的背景知識進行類比。譬如對于長發(fā)飄飄的素顏美女趴生,在我所知中苍匆,這類美女一般都是家境不錯锉桑,待人溫柔窍株,家教優(yōu)良球订。所以當我再次見到一個類似的美女時冒滩,我會做相似的第一印象類比开睡。
不只是美女,我們幾乎所有的認知都源自于過往的背景知識扶檐。
在人類發(fā)展的歷史上款筑,對于即時的問答需求幾乎時時刻刻都存在奈梳。最早大家是詢問部落中最年長的智者攘须,后來大家互相都有了知識儲備于宙,就可以通過對話來進行基本的問答和辯論——這一個過程持續(xù)了千萬年。同一個問題抹恳,最早時只能去問一個人奋献,得到一個答案瓶蚂;到后來窃这,可以去問很多人杭攻,得到許多答案疤坝,然后“擇其善者而從之”跑揉。如果我能把所有人都問一遍历谍,可能會得到一個巨大的答案集合望侈;我需要過濾甜无、排序、取舍眠饮,你發(fā)現(xiàn)仪召,這個過程就是“搜索引擎”松蒜。我們使用搜索引擎時秸苗,是通過一個“輸入框”輸入想問的問題或者關(guān)鍵詞惊楼,然后搜索引擎會丟給我一個經(jīng)過相關(guān)性排序和優(yōu)化的答案集合檀咙。
但我認為兩個原因弧可,會導致搜索引擎會逐漸向?qū)υ挋C器人演變棕诵。
2.1 其一:精準答案的需求愈發(fā)旺盛
搜索引擎從簡單的信息集合展示年鸳,逐漸向精準答案給予搔确,這個已經(jīng)持續(xù)了好幾年膳算√榉洌“百度阿拉丁”就是這方面的典型机隙,譬如當你問“北京天氣”,百度搜索結(jié)果頁第一項是經(jīng)過精心設(shè)計的天氣卡旭旭,會通過豐富的UI展示天氣相關(guān)的信息持寄。在頭部熱門搜索詞中稍味,阿拉丁已經(jīng)可以覆蓋大多數(shù)模庐,但是對于腰部需求和長尾需求赖欣,隨著信息爆炸顶吮,人們對于翻多頁進行搜索的忍耐度會越來越低悴了,對于“快”“準”的需求只會越來越大湃交。
2.2 其二:搜索場景下輸入能耗太大
從能耗體驗的角度來說搞莺,搜索的輸入框遠高于對話聊天的輸入框才沧,即使是同一個話題的持續(xù)輸入温圆,對話聊天的疲勞感也會明顯低于搜索岁歉。
如果今天人們每天平均提問的次數(shù)是N锅移,那么幾年后會迅速到10N非剃,體驗不升級會很難讓用戶滿意努潘。而回歸對話的方式疯坤,是一種很好的體驗優(yōu)化压怠,可以抵消需求的增長菌瘫。
三雨让、“對話機器人”產(chǎn)品場景:封閉域?qū)υ?VS 開放域?qū)υ?/p>
優(yōu)秀的產(chǎn)品經(jīng)理很懂得如何控制自己的用戶使用產(chǎn)品時的各種操作栖忠,從而提前把控用戶的預期庵寞,進而達到體驗的相對最優(yōu)捐川。
許多優(yōu)秀App的基本設(shè)計邏輯就是:頁面之間的跳轉(zhuǎn)有規(guī)則且有順序古沥,這樣用戶不會通過點擊跳出預設(shè)流程渐白,預期就相對可控纯衍。手機上的App產(chǎn)品交互中襟诸,可以通過各種邏輯和提示信息來把控預期——可是對話機器人該如何控制預期呢菇用?
由于對話機器人用戶幾乎都是通過自然語言輸入實現(xiàn)交互惋鸥,而且每次只有一句卦绣;所以只能通過用戶的輸入滤港,以及針對輸入的回復來實現(xiàn)用戶預期的把控溅漾。
可是在對話聊天的場景中添履,用戶的輸入時而可控缝龄,時而不可控叔壤;我們做不到像App設(shè)計那樣可以制造一個封閉的邏輯閉環(huán)來讓用戶遵守規(guī)則——對話聊天是一個天然的開放場景炼绘,用戶平時怎么和朋友對話俺亮,和機器人也會怎么對話。
因此本讥,我們?nèi)藶榈匕褜υ挿譃閮煞N場景:
封閉域?qū)υ挘阂笥脩糨斎胫付ǖ卦捳Z才能繼續(xù)對話
開放域?qū)υ挘河脩魫壅f什么就說什么都可以持續(xù)對話
3.1 封閉域?qū)υ?/p>
封閉域?qū)υ捰袃蓚€關(guān)鍵的特征:
輸入和輸出可歸類可枚舉
對話有明確的始和終拷沸,且有流程
所以撞芍,在對話的三個需求中序无,問答和任務(wù)流程協(xié)作都屬于封閉域?qū)υ挕?/p>
封閉域?qū)υ挼脑O(shè)計邏輯延續(xù)自“IFTTT(if this then that)”帝嗡,是workflow的進化交互形式(感興趣的同學可以去App Store去搜索一款App录择,叫做“Workflow”隘竭,它就是可以將一系列原本不相關(guān)的App通過條件判斷串聯(lián)起來)动看。
下面我來分享兩個封閉域聊天的典型案例。
讀心機器人
10年前微軟必應(yīng)推出過一個“讀心機器人”仇轻,它會在20個問答中猜你心中所想篷店。這個機器人曾經(jīng)在幾年前出過一個對話問答版本疲陕,用戶只要在每一步時回答“是”或者“不是”蹄殃,對話就會持續(xù)進行讳苦,直到猜出或者猜不出結(jié)果医吊。
必應(yīng)讀心機器人
這就是一個典型的封閉域多倫問答對話,用戶的輸入只有兩個懒棉,而過程是一大堆背后的邏輯判斷策严,且有相對固定的流程妻导,而且有明確的開始和結(jié)束倔韭。
Amazon Echo音箱
Amazon的Echo音箱,大家都很熟悉了醇疼,Echo之所以成為爆款產(chǎn)品秧荆,很關(guān)鍵的一個原因是乙濒,它的對話機器人Alexa在Echo音箱的場景設(shè)計中是一個封閉域?qū)υ挕S捎谝粝涫俏覀兙蛹覉鼍爸型泱诉b控器之外最常見的高頻交互式Commander梧疲,我們很難再在家里找到一個這樣的硬件缭受,它除了可以輕易地輸入指令米者,還可以快速且明顯地反饋蔓搞。
當我們面向Commander進行輸入時喂分,我們可以輸入的話語就已經(jīng)變得局限,可以想象到的是梆掸,在居家場景中我們可以發(fā)出的指令幾乎就是“打開”、“關(guān)閉”之類的钝鸽。更重要的是拔恰,在居家場景中可以控制的物品也是有限的,而且任何一個操作的流程都很短河爹。
所以咸这,人們和第一代Echo音箱的對話中酿雪,輸入和輸出都是可枚舉的指黎,而且有始有終有流程醋安,Echo最優(yōu)秀的特質(zhì)茬故,就是它選擇了一個封閉域場景赁炎,極大地控制了用戶的預期讥裤,獲得了更優(yōu)的體驗己英。
Amazon Echo音箱
從上面兩個例子中,我可以看到吴旋,封閉域?qū)υ捲诋a(chǎn)品設(shè)計中有幾個明顯的特征损肛。
3.1.1 其一:封閉域?qū)υ捚鋵嵤莣orkflow的延伸
其實封閉域中的“封閉”二字,無論在話題量荣瑟、輸入輸出量治拿,還是對話輪次、對話流程劫谅,都是封閉的,封閉就代表了有限集合嚷掠。workflow之所以可以通過ifttt設(shè)計捏检,就是因為有限集合,只有各種條件有限不皆,才可以設(shè)計出條例清晰且邏輯合理的workflow贯城。
封閉對話通常是為了解決某個特定的問題或者需求,從結(jié)果來看粟焊,它的效果會顯得更加“有用”冤狡。但是孙蒙,從過程來看,封閉域?qū)υ挷⒉皇且环N真正意義上的創(chuàng)新悲雳,它的效率相比workflow并沒有本質(zhì)上地提升挎峦,只是在交互的體驗上更加接近人的語言交互本能,所以大多數(shù)封閉域?qū)υ挾紩O(shè)計地如同助理或者秘書合瓢,譬如阿里小蜜坦胶,百度度秘。
3.1.2 其二:封閉域?qū)υ拡鼍皢我豢煽?/p>
封閉域由于擁有特定的目的性晴楔,往往都是在單一確定的場景里顿苇。如下圖中的百度度秘,兩個紅色框中的部分税弃,是預設(shè)了各種封閉域的場景纪岁,每一種看似簡單的功能其實都是一個特定的封閉域?qū)υ挘黄┤缃貓D中正在使用的圖片笑話则果。
度秘機器人
很顯然幔翰,不同的封閉域?qū)υ捴校瑢υ挼妮喆我笫遣灰粯拥奈髯常v笑話是一個單輪次對話遗增,度秘產(chǎn)品中通過圖中藍色框里的“再來一個”這種預設(shè)輸入,來不斷強化用戶輸入的單一性款青。而“叫外賣”這類的封閉域?qū)υ捵鲂蓿蜁且粋€標準的workflow,感興趣的同學可以自己去試試抡草。
3.1.3 其三:封閉域的邊界處理很重要
封閉域有一個很重要的問題饰及,就是用戶可能隨時跳出封閉域,開始聊其他的話題渠牲,或者不按照預設(shè)的規(guī)則邏輯出牌旋炒。
譬如微軟小冰的一個封閉域?qū)υ挘凶觥靶”R狗”签杈。
正常的邏輯中瘫镇,用戶的發(fā)給小冰的應(yīng)該是一張狗的照片,可是有的用戶可能就是發(fā)了一張不是狗的照片答姥,如下所示铣除,那么這個時候就是邊界case,需要額外處理鹦付。用戶發(fā)來的可能是語音尚粘、文字、其他任何照片敲长,每一種的處理都是需要單獨設(shè)計的郎嫁。
微軟小冰之“小冰識狗”
多說一點秉继,在封閉域?qū)υ挼倪吔缭O(shè)計中,很難做到萬無一失周密完全泽铛,因為用戶輸入可能會千奇百怪尚辑,所以最佳也是最討巧的方式,就是用開放域?qū)υ拋怼岸档住薄?/p>
3.2 開放域?qū)υ?/p>
開放域是相對于封閉域而言的盔腔。由于對話機器人的話題幾乎都源自用戶杠茬,而每個用戶可能有任何輸入,話題就會無法窮舉弛随,且在多個場景中跳來跳去瓢喉,進而形成了所謂的開放域?qū)υ挘簿褪恰吧抖寄芰摹薄?/p>
2011年在人人網(wǎng)上橫空出世的“小黃雞”算得上是國內(nèi)最早出名的開放域?qū)υ挋C器人舀透,其后發(fā)展最好的當屬微軟小冰栓票。
開放域?qū)υ捵畲蟮奶攸c是:輸入無法窮盡,導致輸出無法窮盡盐杂,而且對話沒有確切的結(jié)束點逗载,無流程可言。
我們一般情況下想去考驗一個機器人是否智能链烈,通常考驗的就是開放域?qū)υ捴壳竺ΧΦ摹皥D靈測試”通常所面向的也是開放域?qū)υ捘芰Α?/p>
從可以承載的對話輸入范圍來講强衡,開放域?qū)υ捪駱O了搜索引擎,我們可以在百度搜索中輸入任何的詞句码荔,百度幾乎都會給出結(jié)果頁面(除了敏感詞)漩勤;相應(yīng)的,在開放域?qū)υ捴兴踅粒覀円彩强梢哉f任何話越败,機器人也應(yīng)該每一句都可以回復。
3.2.1 開放域?qū)υ挳a(chǎn)品設(shè)計的基本原理
對話需要的是雙方的平等硼瓣。
和微軟小冰聊天時究飞,有時甚至感受不到她是真人還是假的機器——其實這并不重要,小冰正在解決開放域聊天中一個核心的問題:如何不斷給用戶制造話題堂鲤,從而延續(xù)聊天的能量亿傅?
說到話題制造,我們先來看看開放域?qū)υ挋C器人到底是如何制造的:
幾乎所有的開放域?qū)υ捳Z料都源自于網(wǎng)絡(luò)上公開的對話瘟栖,譬如百度知道葵擎、知乎、豆瓣半哟、貼吧等等酬滤,這些對話都是人與人形成的签餐;那么,當一個機器人把其中的某些話在當時的場景下再說一遍盯串,我們是分辨不出來這個機器人是不是真人的——這便是開放域?qū)υ挋C器人制造的基本依據(jù)贱田。
當我們和一個看起來像人的機器人聊天時,由于場景發(fā)生在人與人對話的場景下嘴脾,根據(jù)“知識詛咒”的原理男摧,我們很容易帶入一種“對方也是人”的感覺。而一旦對方的回話像人译打,我們就會認可她是人耗拓。
人與人的情感建立源自于長期的交流和溝通,聊天本身就是開放域的奏司;所以那些樂于和機器人聊天的人類乔询,就會越來越覺得機器人像人。
我們知道:對話機器人是一個新興的產(chǎn)品韵洋,最初嘗鮮的人是所謂的“種子用戶”竿刁,這些人建立了與機器人之間的最早形態(tài)親密感和信任感,這對后續(xù)的對話機器人發(fā)展積累了非常寶貴的經(jīng)驗搪缨。
3.2.2 開放域?qū)υ挋C器人的兩個產(chǎn)品陷阱
其一食拜,面向用戶的機器學習
很多人認為,對話機器人和人聊得越多副编,學習的語料就越多负甸,就可以省去很多語料獲取的問題,這是一個巨大的誤區(qū)痹届。由于用戶的輸入無法預期呻待,導致從用戶處采集來的語料千奇百怪,而且大量罵人的臟話队腐,非常不適合作為開放域?qū)υ捳Z料蚕捉。由于用戶的語料是海量且無規(guī)則特征,導致語料清洗非巢裉裕苦難迫淹,無法使用。
其二悠就,無人為引導的個性
由于開放域的語料完全來自于互聯(lián)網(wǎng)千绪,所以機器人回復的話語帶有何種語氣很難把控,如果不加以認為干預梗脾,機器人說的話會顯得時而有趣荸型,時而刁蠻,時而無知,時而夸張瑞妇,時而智慧稿静,在用戶的心智中無法用一個或幾個明確的形容詞去形容它,這會帶來一個很尷尬的結(jié)果辕狰,用戶是抱著“調(diào)戲改备、戲謔”的態(tài)度去對話,長此下去蔓倍,想建立用戶的親密感和信任感幾乎不可能悬钳。
四、對話機器人的用戶價值
現(xiàn)在偶翅,我們試圖回答一個問題:對話機器人為什么需要開放域?qū)υ捘矗績r值是什么?僅僅是為了逗比有趣嗎聚谁?
這是一個非常復雜的問題母剥。
由于對話機器人同時具有“開放域?qū)υ挕焙汀胺忾]域?qū)υ挕眱芍貓鼍埃驹谟脩粢暯莵砜葱蔚迹瑢υ挋C器人意味著它更像人环疼,而非機器。像人朵耕,意味著用戶會更愿意像與人交流那樣炫隶,同對話機器人進行對話交流——而一旦如此,“個性”和“意識”便是用戶主動強加于對話機器人的標簽憔披。譬如等限,幾年前被玩壞的10086短信聊天,還有《生活大爆炸》中Rajsh幻想Siri是個性感御姐芬膝,都無一例外地源自于用戶主動強加于對話機器人的人性標簽。
這便給一個可落地的對話機器人產(chǎn)品設(shè)計帶來了巨大的挑戰(zhàn)形娇。
我們知道锰霜,任何的產(chǎn)品都是能夠和用戶產(chǎn)生親密感和信任感的,這份親密和信任是建立在產(chǎn)品體驗之上的桐早,是建立在“產(chǎn)品解決了核心需求”+“產(chǎn)品制造了驚喜”癣缅。我們因為問題解決而對一個產(chǎn)品產(chǎn)生依賴,因為驚喜而對產(chǎn)品形成感情,打開我們的手機,我們會一眼就找到那幾個充滿親切感的產(chǎn)品——譬如經(jīng)常開車的人會十分信任高德地圖辩越,追劇《那年花開月圓時》的人會十分喜愛騰訊視頻鳍置。
同理,機器人需要有基礎(chǔ)個性荒辕,需要極大地拉近人與機器人之間的親密感和信任感。對話機器人的親密感和信任感建立症虑,也是站在“解決了需求”和“制造了驚喜”兩個方面膨俐。
站在產(chǎn)品的視角來看勇皇,解決需求通過封閉域?qū)υ捦瓿桑_放域?qū)υ拋聿粩嘀圃祗@喜焚刺。
4.1 問答敛摘、助理、聊天乳愉,哪個才是剛需兄淫?
已經(jīng)在落地的對話機器人產(chǎn)品中,基本上是以純to C和to B再to C來劃分蔓姚。由于對話機器人的交互特征是面向終端用戶的捕虽,所以基本很少有純to B的產(chǎn)品場景(即使有,它的邏輯也與to C邏輯相似)赂乐。這意味著薯鳍,對話機器人的用戶都是一些終端個人用戶。
那么挨措,我們來看看這些對話機器人在to C中挖滤,到底解決了怎樣的核心需求。
在我們所知的對話機器人產(chǎn)品中浅役,有主打客服的問答機器人斩松,有主打秘書的助理機器人,還有純?nèi)の秾虻牧奶鞕C器人觉既,它們的背后惧盹,都是剛需嗎?
4.1.1 一個事實:瞎聊難為剛需瞪讼,情感計算任重道遠
聊天是一個容易被激發(fā)钧椰,卻也容易迅速消退的場景,唯有情感依賴可能長久符欠。
以微軟小冰為例嫡霞。小冰最耳熟能詳?shù)墓δ苁莄hit-chat(瞎聊),但是從用戶活躍和留存周期來看希柿,用戶最易被激發(fā)的時間是在首次領(lǐng)養(yǎng)時诊沪、每周更新時、重大更新時曾撤,而且被激發(fā)后端姚,活躍上升后就會很快下降。這是為什么呢挤悉?因為人與機器之間的對話聊天是基于趣味話題的渐裸,想要通過自然的情感依賴,成為像《HER》里面的Samantha,至少還有相當長的路要走橄仆。
情感計算并非只是一個數(shù)學或者計算機科學問題剩膘,更是一個產(chǎn)品問題。
由于情感并非一個可具象問題盆顾,而且人的情感變化會隨著時間怠褐、環(huán)境、他人您宪、自身思想等等因素發(fā)生變化奈懒;而且情感并非連續(xù)的計算,你喜歡一個女孩子宪巨,并不意味著時時刻刻與她發(fā)生情感依賴磷杏,而是通過一些關(guān)鍵的情感觸達,來完成情感連接捏卓。
在微軟小冰的諸多被設(shè)計的Feature中极祸,“給用戶起外號”、“升級解鎖”都是斷點式情感觸達怠晴,通過細微的產(chǎn)品設(shè)計遥金,寄希望于黏住用戶。
4.1.2 一個問題:用戶真的需要一個秘書機器人嗎蒜田?
助理型對話機器人的發(fā)展建立在其他各種線上線下服務(wù)的完善基礎(chǔ)上稿械,譬如Siri;只有當你手機里已經(jīng)有了“鬧鐘”冲粤、“提醒”美莫、“打電話”、“搜索引擎”等功能時梯捕,Siri的助理功能才能發(fā)揮效用厢呵,此時你才有可能面向Siri發(fā)出指令“提醒我明天8點給老板回微信”。
大概兩年前傀顾,YC孵化的Magic轟動東西兩個半球述吸,無數(shù)效仿者爭先恐后去探索“助理型”機器人,時至今日锣笨,鮮有成效——我們普通人真的需要一個像秘書一樣的對話機器人嗎?
我們先來看兩個例子道批。
第一個例子——我想定個這樣的鬧鐘“每周一错英、周三、周五的上午8:15”隆豹。
若我用iPhone的鬧鐘程序椭岩,那我的步驟會大致如下:
STEP1:解鎖手機屏幕;
STEP2:左右滑屏,找到鬧鐘程序判哥;
STEP3:點擊鬧鐘程序献雅;
STEP4:點擊新建鬧鐘;
STEP5:選擇鬧鐘時間為“上午8:15”塌计;
STEP6:選擇重復時間為“周一挺身、周三、周五”锌仅;
STEP7:點擊完成章钾。
若我選用Siri幫我來做,那我的步驟大致會如下:
STEP1:長按Home鍵热芹,喚醒Siri贱傀;
STEP2:對Siri說“幫我設(shè)定每周一、周三伊脓、周五上午8:15的鬧鐘”府寒;
STEP3:Siri反饋設(shè)置成功,完成报腔。
現(xiàn)在我們看第二個例子——通過秘書類對話機器人叫外賣 VS 通過“餓了么”叫外賣株搔。
在秘書類機器人中,叫外賣的流程大致是這樣的:
STEP1:發(fā)出“叫外賣”的指令榄笙,在機器人推薦的餐廳中邪狞,尋找想吃的那家
STEP2:如果沒有合適的,就輸入想吃的店家名字
STEP3:在推薦的列表中選中想吃餐茅撞,或者直接輸入想吃的餐
STEP4:輸入“確認”實現(xiàn)下單帆卓,輸入訂單信息并提交訂單
STEP5:支付,并等待接收外賣米丘,可以詢問送餐進度
在餓了么中剑令,叫外賣的流程大致是這樣的:
STEP1:在餐廳列表中選擇想吃哪家
STEP2:如果沒有合適的,就搜索店家
STEP3:在推薦的列表中選中想吃餐拄查,或者直接輸入想吃的餐
STEP4:確認下單吁津,確認訂單信息,提交訂單
STEP5:支付堕扶,并等待接收外賣碍脏,可以查看送餐進度
這兩個例子有什么本質(zhì)區(qū)別嗎?
你會發(fā)現(xiàn)稍算,如果通過Siri來設(shè)置鬧鐘典尾,我其實只做了一件事情:對著Siri發(fā)出一個單條指令,然后就一切搞定——相比我通過App來做糊探,節(jié)省了近乎70%的操作步驟钾埂『尤颍可是,如果是叫外賣褥紫,我需要對著機器人發(fā)出一組系列指令姜性,但是和App的操作步驟一樣多。
這里有兩個關(guān)鍵點——
如果助理機器人可以一步到位髓考,那么將極大地提升效率和體驗部念,是新的需求升級;
若一個workflow可被一步解決绳军,機器人需要補全的數(shù)據(jù)信息巨大印机,這是核心產(chǎn)品難點;
第一個關(guān)鍵點门驾,我們只要設(shè)身處地地想一下射赛,就會發(fā)現(xiàn):在不考慮語音識別準確率的前提下,任何事情我只要一個指令就可以達成奶是。譬如“幫我叫個車”楣责、“幫我交份外賣”、“幫我交一下水電費”聂沙、“幫我定一下出差的機票”秆麸,其他都不用管了,這種體驗簡直贊爆了及汉。
我們再看看第二個關(guān)鍵點沮趣。
就拿上面這個外賣的例子來看,如果用戶只需要一句“幫我叫個外賣”即可坷随,那么機器人需要補全的信息至少包括“餐廳”房铭、“餐食”、“價格”温眉、“送餐時間”缸匪、“送餐地點”、“支付信息”等类溢,這些信息中的“送餐時間凌蔬、送餐地點、支付信息”是相對靜態(tài)的信息闯冷,獲取一次就可長期使用砂心。可是“餐廳蛇耀、餐食计贰、價格”則是動態(tài)信息,若想每次都可自動獲取蒂窒,則代表機器人需要非常了解這位“主人用戶”才可以躁倒,否則只要有一兩次推薦偏差太大,體驗就會降低近乎一個量級洒琢。從本質(zhì)上來說秧秉,這時的助理機器人已是一款強大的推薦引擎,而且代表了極佳的魅力和美好的發(fā)展未來衰抑。
4.1.3 一個肯定:問答機器人是很有價值的
最常見的問答機器人是“客服機器人”象迎,譬如京東的JIMI,阿里的小蜜機器人呛踊,還有一些銀行的客服機器人砾淌,但它們更像FAQ過濾器。
我們細想一下阿里小蜜的使用場景谭网。如果我問阿里小蜜“我的快遞怎么還沒送到汪厨?”,它的回復方式本質(zhì)是在常見的關(guān)于“快遞”的問題中愉择,把最常見的答案丟給我劫乱,比如它會告訴我“你的快遞已經(jīng)簽收了,如果沒收到可能是放到大門口了”锥涕。
這些企業(yè)為什么要做個問答機器人呢衷戈?效率自然是第一位的,無論是節(jié)約人工客服成本层坠,或是節(jié)約溝通時間殖妇,帶來的都是效率的提升。這些企業(yè)為什么如此看重效率呢破花?因為他們的客戶是最貼近自己的利潤池的谦趣,品控是所有交易型企業(yè)的核心,你看京東的用戶客服和QQ的用戶客服簡直一個天上一個地下旧乞,原因就是京東用戶是京東現(xiàn)金流的關(guān)鍵角色蔚润,而QQ的普通用戶并非其現(xiàn)金流業(yè)務(wù)的關(guān)鍵角色。
如此尺栖,我們再回過頭來看看問答機器人嫡纠,它其實是在頭部問題上實現(xiàn)了綜合過濾,然后通過對話的形式反饋給用戶延赌,如果用戶實在問的是長尾問題除盏,問答機器人回答不了的,可以把問題再拋給人工客服挫以。滿足了用戶九成以上問題的直接答復者蠕,是問答機器人的核心目標。而至于其他類似導購掐松、協(xié)助訂單管理等等踱侣,不過是附加在頭部問題之上的增值體驗優(yōu)化粪小。
4.2 對話機器人真的適合分為“聊天、助理抡句、問答”這三類嗎探膊?
這是一個目前業(yè)內(nèi)比較慣用的分類,我們來看看這個分類的視角待榔。
如果站在技術(shù)視角來看逞壁,對話機器人應(yīng)該分為“開放域”和“封閉域”,這個我們已經(jīng)聊過了锐锣,這里不再贅述腌闯。
如果是站在用戶角色來看,對話機器人可能分為“教育版本”雕憔、“醫(yī)療版本”姿骏、“二次元版本”等等。
如果是站在業(yè)務(wù)視角來看橘茉,對話機器人可以分為純To C和To B再To C工腋。
所以,這種分類更像是站在抽象場景視角來看的畅卓。幾乎任何場景都會被劃分到這三個類別中擅腰,要么無主題聊天,要么是任務(wù)導向翁潘,要么是提問解答趁冈。其實,倒過來看拜马,幾乎所有我們已知的App也被這個分類所覆蓋了渗勘。
可是,對話機器人不是一個移動互聯(lián)網(wǎng)時代的App俩莽,它是一個綜合體旺坠,直接這樣劃分并不是一個好的產(chǎn)品分類。
你不會在淘寶里視頻聊天扮超,更不會在支付寶里侃大山取刃,百度幾年前試圖在大搜索中推出“直達號”去顛覆微信公眾號,結(jié)果以失敗告終出刷。
這個道理很簡單:在移動互聯(lián)網(wǎng)時代璧疗,幾乎每個App都有自己的專屬定位。有自己專屬的產(chǎn)品主路徑馁龟,不在自己路徑邏輯中的行為是不能順暢流轉(zhuǎn)的崩侠;每個App都像有自己的緊箍咒,不能輕易破除互相之間的壁壘坷檩。
可是却音,在對話機器人產(chǎn)品的世界里改抡,這些壁壘會瓦解。
如果我們站在互聯(lián)網(wǎng)整體產(chǎn)品世界里來看僧家,其實我們每個人生活在一個混在的江湖社會中雀摘,手頭的各種工具幫我們實現(xiàn)一個個小任務(wù)目標,但是幾乎每一件小事都需要與人打交道八拱,衣食住行無一例外。如果每一次與外界的接觸被看做一個流量的話涯塔,那么最大的流量便是頻繁且無實際任務(wù)目的的人與人之間的交互肌稻,而相對較小的是去做一個個的具體任務(wù)事情:你會每天都見一些人,但你不會天天都買衣服匕荸。
幾乎所有的流量都是圍繞著人與人之間的交互而形成的爹谭,而且你會發(fā)現(xiàn)一個規(guī)律:離現(xiàn)金流越近的流量,其活躍性越低榛搔,而且流失率越高诺凡。騰訊系的產(chǎn)品、百度的產(chǎn)品都是通過流量漏斗來多元變現(xiàn)的践惑,而阿里系的產(chǎn)品腹泌,是直接拉人來買東西,盈利空間就直接建立在交易之上尔觉,需要不斷刺激人們買買買凉袱。
在所有的產(chǎn)品中,社交類產(chǎn)品是最貼近“江湖社會”的侦铜,它距離現(xiàn)金流是最遠的专甩,也是最活躍的,可以說是幾乎所有互聯(lián)網(wǎng)產(chǎn)品中活躍度最高钉稍,并且可以向任何產(chǎn)品導流的源流量產(chǎn)品涤躲,所以你看到了,阿里無所不用其極地想去做社交產(chǎn)品贡未。
說了一圈种樱,那么我們回來看看社交產(chǎn)品的最小雛形。
社交產(chǎn)品分為即時社交和延時社交羞秤,簡單類比就是聊天和朋友圈缸托,而這兩個都是建立在“語言對話”的基礎(chǔ)上。由于社交產(chǎn)品的場景中幾乎可以做任何事情瘾蛋,前段時間網(wǎng)上流傳的微信“發(fā)現(xiàn)”頁面那張神圖俐镐,就可見一斑。
微信“發(fā)現(xiàn)”頁面網(wǎng)絡(luò)神圖
對話機器人具有社交產(chǎn)品的通性哺哼,原因只有一個——對話機器人的交互場景天然就是一個社交產(chǎn)品的交互場景佩抹。
當我們站在用戶視角來看待對話機器人時叼风,用戶根本不理解什么是“開放域、封閉域”棍苹,也不了解什么是“聊天機器人无宿、助理機器人、問答機器人”枢里,用戶也記不住那些分類孽鸡,也沒法記住,只要有一個對話輸入框擺在用戶面前栏豺,就像微信的輸入框那樣彬碱,由于知識詛咒的原因,用戶就會去類比他所理解的對話輸入框奥洼,就會在這里輸入任何他們想輸入的自然語言巷疼,可能是瞎聊的話,也可能是某個任務(wù)灵奖,也可能是提一個問題嚼沿,我們根本不能阻止用戶在面對京東JIMI機器人時不做瞎聊的操作。
這時帶來的一個巨大難題就是瓷患,開放域?qū)υ挄r有發(fā)生骡尽,而只要一次兩次回答不佳,體驗不滿就會提升尉尾。站在產(chǎn)品設(shè)計的角度來說爆阶,我們能做的就是盡量讓用戶的輸入是可控的,就像度秘沙咏、阿里小蜜已經(jīng)在做的辨图。這就是為什么,每當我們?nèi)ピO(shè)計對話機器人時肢藐,總是要設(shè)法去多涉及一些開放域?qū)υ挼墓δ茳c故河,也是為什么每當我們談起對話機器人時,卻也總是繞不開“機器人在開放域下是不是智能”這個問題吆豹。
4.3 像朋友一樣的伙伴會是對話機器人的終局嗎鱼的?
如果你在微信上,問你最好的朋友“幫我看看有沒有戰(zhàn)狼2的票痘煤,我晚上想去看”凑阶,他/她會如何回答你?
我猜衷快,他可能會說“你去看《戰(zhàn)狼2》不叫我宙橱?!”,他可能還會說“我也去师郑,咱倆一塊兒去”环葵,然后他會繼續(xù)說“我看了下,你家跟前那家萬達有票宝冕,晚上七點的张遭,下班一塊兒去?”
如果一樣的問題問Magic呢地梨?它的回答就是讓你告訴他幾點去看菊卷,它幫你挑選了五家,每家的時間都挺合適宝剖,有一些距離你近的烁,有些有優(yōu)惠,等等诈闺。
你喜歡哪種體驗?zāi)兀窟@個其實很難說铃芦。如果站在封閉域的角度來說雅镊,Magic的算法要比朋友優(yōu)很多,選擇也更豐富刃滓,可是和朋友一起去的這種體驗仁烹,才是生活。
我認為這個可能是對話機器人的終局咧虎,它存在的意義仍然是協(xié)助人們?nèi)ジ玫亟鉀Q一系列問題卓缰;但是它不能太傻,像個指令機一樣待在那里砰诵,而是應(yīng)該像個朋友一樣懂你卻也能幫你征唬。以前在對話機器人產(chǎn)品的討論中還經(jīng)常討論:對話機器人應(yīng)該更“有趣”還是更“有用”,其實從這個終局來看這個討論毫無意義茁彭,你能說你的朋友只有用总寒,但是無趣嗎?
五理肺、對話機器人的產(chǎn)品價值
上面關(guān)于對話機器人的用戶價值的討論摄闸,有一些發(fā)散了,我們收攏回來妹萨,聊整個文章的最后一個部分年枕,關(guān)于其產(chǎn)品的價值。
對待產(chǎn)品乎完,一定要從其商業(yè)視角出發(fā)熏兄,不然沒有聊的意義。站在商業(yè)視角,對話機器人擁有三個方面最核心的產(chǎn)品價值霍弹。
5.1 跨場景連接成為可能
由于對話機器人的交互方式原始而單一毫别,使得機器人背后所有的計算邏輯都被隱藏,機器人可以成為一個獨立的橋梁連接不同場景下的服務(wù)典格,讓用戶只在一個對話場景下都可以完成交互岛宦。
譬如Skype for business中,就有一個機器人耍缴,幫助通過Skype做協(xié)同的人們預定會議室砾肺、設(shè)置工作項目提醒、代理自動回復等等——原本每個工作都是跨場景的防嗡,現(xiàn)在只要一個對話交互場景就可以解決了变汪。如果再往大了去說,未來如果伙伴式的機器人可以逐漸出現(xiàn)蚁趁,那在聊天中完成訂機票裙盾、訂酒店,甚至管理家里的智能空調(diào)他嫡,這些跨場景可能通過一個伙伴都可以完成了番官。
5.2 交互升級帶來的流量深度沉淀
對話的方式有很多,可以是打字钢属,也可以是語音徘熔。如果是語音,那么帶來的是革命性地變化淆党。
5.2.1 指數(shù)級的流量增長
百度DuerOS和Amazon Alexa的邏輯是相似的酷师,都是通過賦予所有智能硬件語音對話的能力,進而獲取新流量染乌,同時實現(xiàn)流量的深度交互和沉淀山孔。
我們知道,在互聯(lián)網(wǎng)的生意經(jīng)中慕匠,一切都是圍繞著流量來完成的饱须,要么是流量足夠多,要么流量的價值足夠大台谊。由于對話帶來的交互效率提升蓉媳,使得在單個用戶身上獲取的流量頻次呈現(xiàn)指數(shù)級增長,如果一般的互聯(lián)網(wǎng)產(chǎn)品PV/UV是個位數(shù)的話锅铅,那么對話機器人的PV/UV(其實就是對話的頻次)至少是兩位數(shù)酪呻。
一些曾經(jīng)很難成為交互場景的,譬如在家里面向Echo音箱發(fā)號施令盐须,如今都通過對話機器人成為現(xiàn)實玩荠。沒有任何一款App能比一個對話機器人更容易和人產(chǎn)生親密感,產(chǎn)生如此多高頻互動的可能。最后的結(jié)果可能就是阶冈,我們的生活方方面面都在觸網(wǎng)闷尿,每一次交互就是一次所謂的PV,指數(shù)級的流量映射出一個人生活的方方面面女坑。
5.2.2 高頻次的端計算
我有一個猜測:由于對話機器人是一個高頻次交互場景填具,帶來的最直接影響可能是要求在設(shè)備端上擁有更加強大的計算能力;可能一些封閉域或者開放域的計算能力直接預加載到了客戶端匆骗,可能是硬件也可能是軟件劳景。如果網(wǎng)絡(luò)能力不能同樣倍數(shù)增長的話,對于端的計算能力會增強——我猜這也是為什么一些AI企業(yè)會做芯片的原因之一碉就。
5.3 流量沉淀帶來的數(shù)據(jù)深耕
正是由于流量的深度沉淀盟广,使得每個用戶多維的數(shù)據(jù)沉淀成為可能。當平均每個用戶的數(shù)據(jù)量和維度增長十倍瓮钥,那么到底意味著什么呢筋量?
對于百度而言,起碼廣告費要漲價碉熄,對于阿里而言毛甲,可以賣給這個用戶更多的東西,總而言之具被,ARPU(Average Revenue per User)會增長許多,這些就是最直接的商業(yè)價值只损。我在之前的文章《人工智能「風口」一姿,先行者為什么是搜索引擎?》中跃惫,曾分析過這其中的一些邏輯關(guān)系叮叹,因為流量的深維度價值尚未被開發(fā),對于計算廣告而言可能是一塊從未嘗鮮的處女地爆存。
六蛉顽、總結(jié)
如上是我針對對話機器人的一些比較淺顯的分析和探討,作為一款正在發(fā)展的新興產(chǎn)品先较,對話機器人還有非常多的細節(jié)值得探討携冤;限于篇幅,只能先聊這么多了闲勺,希望以后還能繼續(xù)深入探討曾棕。
從個人層面來說,我看好To C的對話機器人產(chǎn)品的未來——但是它的產(chǎn)品路徑非常曲折漫長菜循,與我們過往所經(jīng)歷的移動互聯(lián)網(wǎng)產(chǎn)品差異巨大翘地;但是萬變不離其宗,任何產(chǎn)品都是從用戶的需求出發(fā)的。
對話機器人承載了全新的交互形式衙耕,可能帶來了全新的產(chǎn)品服務(wù)體驗昧穿,這種進步過去從來沒有過。
我們每個人幾乎都在渴望著機器人時代的到來橙喘,也許很遙遠时鸵,也許已經(jīng)在路上,誰知道呢~
作者:趙帥渴杆,“優(yōu)護家” 聯(lián)合創(chuàng)始人兼COO寥枝;前微軟小冰初創(chuàng)團隊產(chǎn)品經(jīng)理;北京大學計算機系碩士磁奖。專注產(chǎn)品囊拜、運營和商業(yè)的分析,熱衷產(chǎn)品方法論的總結(jié)比搭。熱愛足球冠跷、民謠音樂、吉他彈唱身诺、軟筆書法蜜托、閱讀和旅游,熱愛生活霉赡。