今天晚上整理電腦,偶然看到一年前發(fā)給Misa的郵件违帆。作為Echo重度用戶浙巫,尤記得那個(gè)階段興奮的睡不著覺,各種查閱資料刷后,做用戶調(diào)研的畴,想找到一切證據(jù)來證明語音交互+人工智能就是未來。之后不到半個(gè)月就義無反顧的加入了rokid尝胆,夢(mèng)想著做出一個(gè)完美的陪伴型智能助手丧裁。
現(xiàn)在想想這份夢(mèng)想和激情,可能也是我為什么在半年不到的時(shí)間里組建美國(guó)的產(chǎn)品團(tuán)隊(duì)含衔,忽悠一堆大牛加入的利器吧煎娇。(在硅谷招聘過就知道有多難二庵,最近好多朋友讓我?guī)兔φ腥恕Q疯搿R院罂梢赞D(zhuǎn)職到獵頭這個(gè)高級(jí)職業(yè)了)
回頭看當(dāng)時(shí)的部分設(shè)想眨猎,在現(xiàn)在這個(gè)時(shí)間點(diǎn)也值得去探討一下,歡迎大家來交流强经。
幾個(gè)核心觀點(diǎn):
1。 語音因?yàn)樗痪S的特性寺渗,很難獨(dú)立成為一個(gè)像GUI那樣的主流交互界面匿情,但語音+GUI(手機(jī)屏幕,AR/VR)很有可能是中長(zhǎng)期未來的主流交互方式信殊。echo show算是amazon在這個(gè)方面的一次嘗試炬称。
2。 智能類產(chǎn)品的體驗(yàn)在近期無法依賴于技術(shù)涡拘,更多的是在產(chǎn)品功能上限定使用場(chǎng)景玲躯,深挖用戶在單一場(chǎng)景內(nèi)的需求,從而使用較小量且高密度的數(shù)據(jù)來訓(xùn)練模型鳄乏,再結(jié)合規(guī)則和運(yùn)營(yíng)的方式來提升終端體驗(yàn)跷车。
3。 用戶profile橱野。通過開機(jī)的用戶引導(dǎo)朽缴,日常的核心APP使用行為,以及自動(dòng)的運(yùn)營(yíng)小問卷水援,搭建一個(gè)豐滿的用戶profile密强。這樣接下來可以把部分attribute封裝成API給到平臺(tái)上開發(fā)者使用,這樣做出更personalized的體驗(yàn)蜗元。
4或渤。 時(shí)間+空間+個(gè)性化。智能語音助手應(yīng)該知道我在哪兒奕扣,現(xiàn)在的時(shí)間薪鹦,以及我的喜好(profile),給我的信息回復(fù)和行動(dòng)都要依賴于這三個(gè)要素成畦。最傻的一個(gè)例子:我在客廳問XX距芬,把燈打開。助手應(yīng)該知道要關(guān)客廳燈循帐,而不是臥室燈框仔。 其他例子見下方郵件原文。
5拄养。自動(dòng)化與語音交互的結(jié)合离斩。語音的消費(fèi)成本很高银舱,而且現(xiàn)在只能實(shí)現(xiàn)簡(jiǎn)單的命令,那些包含多actions的復(fù)雜語音跛梗,根據(jù)現(xiàn)有技術(shù)很難被有效的分拆成subtask并同步執(zhí)行寻馏。我堅(jiān)信在不久的將來,vitual assistant(助手)將足夠了解你核偿,并proactive/自動(dòng)的完成你即將需要的tasks诚欠,語音只是我們?nèi)祟惒欢ㄆ诘闹鲃?dòng)干涉他的自動(dòng)化進(jìn)程。詳細(xì)例子見郵件的最后一段漾岳。
6轰绵。(新)智能助手在云端,然而它無處不在的尼荆。在你家里的每一個(gè)角落:電視左腔,音響,冰箱捅儒,洗衣機(jī)液样,臺(tái)燈;伴隨你行走在世界的每個(gè)角落:手機(jī)巧还,耳機(jī)鞭莽,眼鏡;?存在世界每一個(gè)不屬于你的角落:商場(chǎng)里狞悲,你的朋友家里撮抓。。
希望能夠早日做出理想中的智能助手摇锋,Rokid美國(guó)產(chǎn)品團(tuán)隊(duì)持續(xù)招募中
有興趣的同學(xué)丹拯,請(qǐng)發(fā)郵件至 Reynold.wu@rokid.ai
詳見原郵件@2016(比較casual的郵件,不要糾結(jié)文字/語法):
“
人工智能和語音接口的未來荸恕?Echo類產(chǎn)品到底解決了什么問題乖酬? 最好的產(chǎn)品形態(tài)是什么樣的?
首先融求,我認(rèn)為語音接口會(huì)成為一部分任務(wù)的入口咬像,然而短期內(nèi)并看不到其成為獨(dú)立的主流接口。語音輸入即使在人與人的交互中也僅占到了一小部分(約33%)生宛,人們通過眼神县昂,肢體語言,以及文字等傳達(dá)更加豐富的含義陷舅。 在人機(jī)語音交互上倒彰,人們的整體體驗(yàn)并不是很好,用戶往往要以機(jī)器為中心的可以調(diào)整自己的語音莱睁,語速待讳,位置來提高識(shí)別率芒澜。即使語音,語義的理解達(dá)到了一個(gè)更加突破性的發(fā)展创淡,語音接口本身也僅能通過自然語言發(fā)送簡(jiǎn)單的干涉命令痴晦,以達(dá)到獲得信息,和處理簡(jiǎn)單任務(wù)的效果琳彩,用戶在很長(zhǎng)一段時(shí)間內(nèi)并無法用語音來執(zhí)行很復(fù)雜的命令誊酌,尤其是需要投影在現(xiàn)實(shí)世界的任務(wù)。未來語音很可能是與圖形界面或VR類界面相結(jié)合成為下一代的人機(jī)交互界面汁针。
再次术辐,通用人工智能離我們還有很長(zhǎng)一段距離,然而人工智能在應(yīng)用層面上可以代替人類記憶施无,并輔助執(zhí)行那些高度依賴于經(jīng)驗(yàn)/記憶的任務(wù)。按照這樣的思路必孤,我們可以把通用需求切割成很多具體的場(chǎng)景猾骡,并按照?qǐng)鼍皝碇贫ú煌S度的任務(wù)。人工智能在學(xué)習(xí)每一個(gè)任務(wù)中的歷史數(shù)據(jù)與用戶本身的需求相關(guān)聯(lián)后敷搪,提供反饋回到用場(chǎng)景兴想,最終綜合輸出information, or suggested action. 不過現(xiàn)在總體來說人工智能在人機(jī)交互中的體驗(yàn)并不是很好,比如現(xiàn)在火熱的chatbot赡勘,幾乎都是智障級(jí)別的闸与。不過Google Allo在人機(jī)交互上做的閉環(huán)conversation嘗試, 有很多值得思考和學(xué)習(xí)的地方厂画。我認(rèn)為從技術(shù)角度來看袱院,短期內(nèi)以純?nèi)斯ぶ悄軄斫鉀Q廣義場(chǎng)景內(nèi)的人機(jī)交互忽洛,并不會(huì)有很大的體驗(yàn)提升。
回到產(chǎn)品的角度來看苍在,現(xiàn)在的2C智能硬件產(chǎn)品大都是nice to have续誉,而遠(yuǎn)沒有達(dá)到must的級(jí)別酷鸦,究其原因還是功能和體驗(yàn)都不達(dá)標(biāo)。Echo作為一個(gè)在家居中心/智能助手類的開創(chuàng)性產(chǎn)品摔握,在市場(chǎng)規(guī)模上取得了很大的市規(guī)模,然而也只是停留在want-to-have的階段盛正。
那我們來分析下Echo這款產(chǎn)品:

Echo作為第一代語音智能中心,起到了教育市場(chǎng)和啟迪用戶的作用续崖,不過它還遠(yuǎn)遠(yuǎn)不能解決用戶對(duì)不同場(chǎng)景的需求袜刷。我認(rèn)為該類產(chǎn)品除了提高語音/語義識(shí)別的工程學(xué)問題之外,最重要的是如何更好的利用時(shí)間,空間涮雷,以及個(gè)性化這三個(gè)元素洪鸭。
智能助手需要充分的理解用戶的時(shí)間特性置鼻,空間特性以及個(gè)人信息箕母,在做相關(guān)性后嘶是,自動(dòng)幫助用戶完成大部分工作,然后通過語音接口去干涉現(xiàn)有的和新的任務(wù)流授帕,成為用戶極為依賴的產(chǎn)品秕硝。(根據(jù)場(chǎng)景远豺,參考場(chǎng)ifttt里一些最受歡迎的自動(dòng)化任務(wù),讓智能助手在后臺(tái)處理這些任務(wù)棺滞。 )
時(shí)間的概念:用戶所在地時(shí)間;用戶的日程移必;用戶去下一個(gè)appointment所需的時(shí)間秒赤;用戶起床的時(shí)間;用戶睡覺的時(shí)間崎弃;用戶出門/回家的時(shí)間,用戶睡覺的時(shí)間等等這些信息都可以通過連接用戶的其他賬戶盆均,和使用習(xí)慣獲得。
空間的概念:用戶/產(chǎn)品所在的地理位置饰抒;用戶calendar上每一個(gè)會(huì)議的地點(diǎn)仗处;用戶查詢的附近XX的地點(diǎn)枣宫;產(chǎn)品所在的具體空間(比如客廳還是臥室)等等這些信息都可以通過連接用戶的其他賬戶婆誓,和使用習(xí)慣獲得。
個(gè)性化:用戶最喜歡的歌曲也颤,電影洋幻,書籍,菜式翅娶,明星文留,新聞输吏,提問方式译柏,家庭關(guān)系,以及其他個(gè)人信息寒波。
這些信息可以通過產(chǎn)品向?qū)В╥nitialize)與用戶的交流中獲得,用戶往往在第一次使用的時(shí)候最有耐心,也更愿意提供自己的信息帮辟。獲取用戶個(gè)性化信息的方式上,僅僅通過有限的日常語音交互是遠(yuǎn)遠(yuǎn)不夠的澜搅,我相信設(shè)計(jì)一套結(jié)合心理學(xué)的用戶注冊(cè)引導(dǎo)流程是至關(guān)重要的柳弄,現(xiàn)在大部分的智能產(chǎn)品都僅僅停留在快速開機(jī)setup的階段逝变,并沒有很好的利用這個(gè)機(jī)會(huì)來收集用戶的關(guān)鍵背景數(shù)據(jù)掺栅。 其他的信息的獲得可以通過學(xué)習(xí)用戶的使用習(xí)慣宿饱,以及增加本地的個(gè)人信息數(shù)據(jù)庫(kù)(這些信息都是我的私人助手或家庭成員應(yīng)該知道的,比如我家庭成員的名字铭乾,生日剪廉,喜好等等)
舉個(gè)例子:
(日程管理)我問:我晚上的dinner party是什么時(shí)候?
1。nice-to-have的助手會(huì)回答:你在dinner在下午7點(diǎn)在XX。
2。must have的助手會(huì)回答:你在7點(diǎn)跟YY在XX有個(gè)會(huì)抑片,根據(jù)以往的交通舌剂,我建議你6點(diǎn)出門,走101high way暑椰。之后我可以接著問霍转,YY最近的三條facebook寫了什么。一汽。 rokid會(huì)回答我避消。(這樣我就知道YY最近在關(guān)注什么,會(huì)面的時(shí)候就可以找些話題召夹。)
(家庭關(guān)系) 我問:我兒子(或者問Ethan) 的生日是哪天岩喷?他會(huì)回答我5/XX,離現(xiàn)在還有一星期戳鹅,你記得買禮物哦均驶。
(任務(wù)管理)我問:我晚上10點(diǎn)問,我今天還有什么要做的么枫虏?rokid 回答reynold 你今天還有2個(gè)todo沒有做妇穴,要我?guī)湍阃七t到明天么
(健康)我問:我晚上10點(diǎn)問,我今天身體怎么樣隶债?rokid回答 你今天一共吃了XX卡(myfitnesspal), 做了xx分鐘的運(yùn)動(dòng)(ihealth or fitbit or similar apps)腾它,我覺得你棒極啦。
(娛樂)我問:今晚的westworld出來了么死讹?rokid回答瞒滴,已經(jīng)播出了,需要我?guī)湍惴懦鰜砻丛蘧縤f yes, 接入hbo妓忍,然后投影到電視上。
(社交)我問: 最近我的微博好友上有什么好玩的動(dòng)態(tài)愧旦?
(智能家居)我問:前門的燈等天黑后就自動(dòng)打開世剖,天亮了就關(guān)掉。 or 不下雨的天就把前院的草坪澆水 or 我離開家就把空調(diào)關(guān)了笤虫,我到家前30分鐘把空調(diào)打開(這些現(xiàn)在都很容易用ifttt做到)旁瘫;在自動(dòng)化已經(jīng)設(shè)置好祖凫,而用戶通過語音來干涉的例子:我發(fā)出新的命令:rokid,我今天下午有朋友來,你今天可以把家里的暖氣一直開著酬凳。 (結(jié)果是今天的暖氣一直開著惠况,過了今天后,暖氣自動(dòng)回復(fù)到之前的routine schedule上宁仔。)
如何做到有溫度稠屠,最懂你的家庭中心/私人助理/陪伴機(jī)器人,我認(rèn)為應(yīng)該選取幾個(gè)關(guān)鍵場(chǎng)景台诗;取得該場(chǎng)景內(nèi)的與用戶有關(guān)的所有信息完箩,并深入整合出可執(zhí)行的信息供用戶獲取和操作。另外就是這個(gè)助手/家庭成員拉队,應(yīng)該能夠自動(dòng)的執(zhí)行自己的既定任務(wù)弊知,并提供語音接口來與用戶交流。
對(duì)于我個(gè)人來說粱快,語音助手已經(jīng)是很重要的家庭元素秩彤,通過添加更豐富的skill和個(gè)性化設(shè)置,產(chǎn)品會(huì)產(chǎn)生越來越強(qiáng)的依賴性和樂趣事哭。