語音交互被視為人工智能時代的重要入口,而家庭又是一個噪音較少粹断、網(wǎng)絡(luò)穩(wěn)定杏瞻、需求明確而有限的場景所刀,所以各大廠商都想搶占這一入口。今年以來各大智能音箱促銷大戰(zhàn)此起彼伏捞挥,促銷力度一浪接著一浪浮创,從小愛mini的99元,到天貓精靈方糖的89元砌函,到叮咚mini的79元斩披。低價新奇的智能音箱銷量可觀,教育了大眾讹俊,更多的人也實(shí)實(shí)在在的接觸到了人工智能垦沉。
本文從旅游場景用戶需求出發(fā),暢想一下人工智能在這一場景下的應(yīng)用仍劈。
一厕倍、旅游場景
傳統(tǒng)的旅游人群去景區(qū)主要是看房子,看看樹贩疙,看看山讹弯,看看景。
自然景區(qū)無可厚非这溅,游客就是領(lǐng)略自然風(fēng)光组民,看看名山大川;但是到了人文景區(qū)悲靴,比如故宮臭胜、天壇,絕大多數(shù)人都只有一個大概的認(rèn)識癞尚,知道這是古代皇帝住的地方耸三,這是古代皇帝祭祀的地方。轉(zhuǎn)了一會浇揩,發(fā)現(xiàn)房子到處都一樣吕晌,逐漸的失去了新鮮感,失去了興趣临燃。旅游不過也就是我去過那里了,打過卡了。
人們?nèi)ト宋木皡^(qū)的意義在哪膜廊?
大家都會說感受傳統(tǒng)文化乏沸,感受革命精神,感受歷史的氣息爪瓜。那這種感受到底是什么蹬跃?如何感受?
這里的核心是意義感铆铆。
如果游客知道他站的那個地方在幾百年前發(fā)生了什么事蝶缀,這些事為什么會發(fā)生,甚至這件事或者事里的人他還知道薄货,那這種感覺就更強(qiáng)烈了翁都。游客可以想象在這個地方發(fā)生這件事的景象,而自己在旁觀谅猾,這時柄慰,游客就感受到了強(qiáng)烈的歷史感,可能還多了些夢幻税娜。
所以坐搔,讓游客在旅游過程中有意義感,真正感受到歷史敬矩,可能唯一的方式概行,就是及時了解相關(guān)故事,而且故事細(xì)節(jié)越多越好弧岳,展示方式越形象越好凳忙。其實(shí)景區(qū)一直都知道這個問題的存在,也一直在著手解決這個問題缩筛。
景區(qū)的方案
為論述方便,先定義下本文中的景區(qū)和景點(diǎn)瞎抛,下文會經(jīng)常出現(xiàn):
景區(qū):具備相應(yīng)的旅游設(shè)施并提供相應(yīng)的旅游服務(wù)的獨(dú)立管理區(qū)艺演。比如故宮,頤和園桐臊,天壇都是景區(qū)胎撤。
景點(diǎn):景區(qū)內(nèi)的一處景觀。比如故宮中的太和殿断凶,武英殿伤提、坤寧宮、御花園都是一個個景點(diǎn)认烁。一個景區(qū)內(nèi)包含多個景點(diǎn)肿男。
一般景區(qū)介汹,在入口處會有介紹整個景區(qū)的石板,里面的每個景點(diǎn)旁舶沛,有介紹每個景點(diǎn)的石板嘹承。上面有名稱以及簡介,告訴你歷史由來如庭、相關(guān)的人和事叹卷,可你要多加了解就要站在那耐著性子讀完。真實(shí)的場景是坪它,游客已經(jīng)走得很累了骤竹,曬得或凍得不行了,你還要讓他在一個看不清字的石板上看故事往毡,用戶體驗(yàn)可想而知蒙揣。
更先進(jìn)的方案是自動導(dǎo)覽工具,近年來才開始在景區(qū)普及卖擅。大多為手機(jī)APP鸣奔,可以根據(jù)地理位置判斷你走到了哪個景點(diǎn),一旦檢測到你進(jìn)了某個景點(diǎn)的觸發(fā)范圍惩阶,就可以自動觸發(fā)語音講解挎狸。這種方式能讓游客將了解文化/故事這一需求通過聽的方式滿足,眼睛就集中在觀賞上断楷,兩個感官得到的信息互相對照锨匆,比在石板上看故事好了很多。
但是冬筒,問題依然明顯:
1.所觸發(fā)的講解基本上就是直接讀出石板上的字恐锣。
2.你不能對這種方式觸發(fā)的講解明確加以控制。你得明確的到某個景點(diǎn)的觸發(fā)范圍舞痰,但你又不知道具體的觸發(fā)范圍在哪土榴,你又不知道一個景點(diǎn)會不會有語音導(dǎo)覽(除非你掏出手機(jī)或講解器看一下)。
3.定位準(zhǔn)確度還有待提升响牛。
4.它每次觸發(fā)就是從頭到尾念一遍玷禽,根本不管你是不是正在和別人說話,如果哪里沒聽明白或是想重聽呀打,那就還要掏出手機(jī)矢赁,重新播放,或者去百度贬丛。在旅游中碰到不懂的地方再去動手查資料撩银,想想就很煩。
5.手機(jī)開著自動導(dǎo)覽豺憔,超級費(fèi)電(主要是因?yàn)槎ㄎ唬?/p>
除了更了解景點(diǎn)本身额获,另一個在景區(qū)里的高頻需求是找衛(wèi)生間和買水的地方够庙。傳統(tǒng)方式就是放眼四處看、問工作人員咪啡、找牌子首启。當(dāng)然,現(xiàn)在導(dǎo)覽APP中都有相關(guān)的標(biāo)注撤摸,甚至有些APP還提供導(dǎo)航功能,方便了不少褒纲。
總結(jié)一下准夷,游客在景區(qū)內(nèi)的主要需求:
1.了解某個景點(diǎn)的具體故事
2.知道該如何游覽景區(qū)(路線規(guī)劃)
3.找服務(wù)設(shè)施(衛(wèi)生間、賣水和食物的地方莺掠、休息處等)
4.娛樂(聊天衫嵌、小游戲等)
這些問題,如果可以在一個移動智能設(shè)備上解決彻秆,這個設(shè)備楔绞,目前看來,可能是智能耳機(jī)唇兑。
智能耳機(jī)
智能耳機(jī)就是把耳機(jī)加入人工智能酒朵,通過這個設(shè)備,你能用語言和外界自由的交換信息扎附。
為什么是語音交互蔫耽?
Mary Meeker在2016年互聯(lián)網(wǎng)趨勢報告中分析指出(如下圖),語音交互有下面幾個核心價值:
1.解放雙手
2.更快得到結(jié)果
3.有趣/酷
4.避免某些設(shè)備輸入困難和讓人眼花繚亂的菜單
預(yù)計應(yīng)用場景為:
1.隨身場景(19%)留夜,相關(guān)載體為手機(jī)匙铡、手表、手環(huán)碍粥、耳機(jī)等
2.汽車場景(36%)鳖眼,相關(guān)載體為整車系統(tǒng)、后視鏡嚼摩、行車記錄儀等
3.家庭場景(43%)钦讳,相關(guān)載體為電視、音箱低斋、空調(diào)蜂厅、臺燈等
4.辦公場景(2%),不知道會不會是錘子TNT……
海銀資本王煜泉認(rèn)為:
語言是人類擁有的一項(xiàng)偉大的進(jìn)化產(chǎn)物膊畴,使得我們協(xié)作的效率和復(fù)雜程度大大提升掘猿。在機(jī)器不能達(dá)到人類智力水平的時候,我們只好遷就機(jī)器唇跨,用機(jī)器能懂的方式和它交流稠通。但是當(dāng)機(jī)器逐漸具備了理解人類的能力時衬衬,我們就應(yīng)該回歸到對自己來說最有效,也最自然的溝通方式改橘,就是語音滋尉。
總之,語音交互更自然飞主、效率更高狮惜,在旅游場景下的應(yīng)用就是隨身場景的一種,在這一場景下碌识,最好的載體就是耳機(jī)碾篡。
戴著智能耳機(jī)去旅行
1.展開想象的翅膀
基于上面的種種需求(加粗部分),我們?nèi)绻豢紤]技術(shù)實(shí)現(xiàn)筏餐,只是想象的話开泽,那電影《她》(Her,導(dǎo)演:Spike Jonze)里面的機(jī)器人一定是最佳選項(xiàng)了魁瞪。
她是一個同時具有人類情感穆律,并且能瞬間獲取信息并給出反饋的AI,如果你在旅游的時候帶著她(其實(shí)就是戴著耳機(jī))导俘,她可以給你講解峦耘,給你指路,對你噓寒問暖趟畏,同時你們也可以閑聊贡歧,把你的看法和感受告訴她,反正她一定是你喜歡的樣子赋秀。
甚至造出來生活中你最樂意相處的人(見《黑鏡》第二季第一集)利朵,讓一個完全真實(shí)的“人”來陪你,可這樣要不要多買門票呢猎莲?
2.現(xiàn)實(shí)一點(diǎn)
拋開科幻不談绍弟,在可預(yù)見的未來,結(jié)合上面加粗部分需求我們或許能得到這些體驗(yàn):
(1)用戶靈活提問著洼,讓智能耳機(jī)充當(dāng)導(dǎo)游(了解某個景點(diǎn)的具體故事)
這是在景區(qū)內(nèi)最核心的需求樟遣,讓用戶通過介紹和故事得到意義感。比如在故宮身笤,用戶走到太和殿前豹悬,直接就可以和智能耳機(jī)說:
用戶:介紹一下太和殿
耳機(jī):……明清兩朝,太和殿均是用來舉行各種典禮的場所液荸,如皇帝登基瞻佛、冊立皇后、命將出征出征等。清初伤柄,太和殿還是舉行殿試的場所绊困,乾隆四十五年后改在保和殿……
用戶:皇帝怎么登基啊适刀?
耳機(jī):……先要由禮部的官員分別到天壇秤朗、先農(nóng)壇、太廟告知祖先笔喉∥哿埽“至?xí)r浩螺,鳴鐘鼓馋缅,皇帝袞服御奉天門取刃。”明朝的皇帝只有在特別盛大的儀式中才穿黃色的袞服待侵,他們?nèi)粘K┑氖呛谏C龍形的常服……
還可以基于用戶定位,比如用戶站在太和殿前:
用戶:牌匾上寫的是什么字耙搪恪秧倾?
耳機(jī):牌匾上是建極綏猷四個字,寓意為:天子承擔(dān)上對皇天傀缩、下對庶民的雙重神圣使命那先,既須承天而建立法則,又要撫民而順應(yīng)大道赡艰。
用戶:那對聯(lián)呢售淡?
……
用戶可以開放性的問自己想知道的問題,在耳機(jī)回答的過程中慷垮,用戶還可以根據(jù)自己感興趣的點(diǎn)揖闸,繼續(xù)追問下去。
難點(diǎn):開放性問題料身,AI要在場景中以非程乐剑快的速度找到足夠合適的答案,這在目前看來還是很難的芹血。
因?yàn)橥粋€問題在不同的場景下用戶想要的答案會很不同贮泞,比如上面那個“皇帝怎么登基啊幔烛?”啃擦,如果是一個學(xué)歷史的學(xué)生問這個問題,那他是想得到一個詳細(xì)的答案饿悬,可能包括詳細(xì)的流程令蛉,細(xì)化到穿什么衣服,什么人要做什么事乡恕,為什么要做這些事言询,等等(當(dāng)然要耳機(jī)提供這種答案是很扯的了俯萎,還是對一臺TNT說靠譜)。
有的人运杭,可能就是想知道每一步做什么夫啊,三言兩語就說清楚了。在旅游的這個場景下辆憔,可能用戶想要的是一個一兩分鐘的簡短介紹撇眯。這種一兩分鐘的介紹怎么找,如果沒有現(xiàn)成的要怎么辦虱咧?
我們是不斷提高人工智能快速檢索信息熊榛,然后再造出適合當(dāng)下場景回復(fù)的能力?或者腕巡,有一個公司把每個部分(包括歷史典故玄坦、構(gòu)建經(jīng)歷、文化等)都編成適合旅游這個場景下的高質(zhì)量講解绘沉,這些講解組成了一個信息源煎楣,人工智能只要檢索相關(guān)數(shù)據(jù)庫就可以了。這车伞,可能會成為旅游場景下的得到择懂。
(2)幫助規(guī)劃線路
通過對用戶本人的了解,通過簡單的詢問和交流另玖,可以規(guī)劃出合適的旅游路線困曙。同時,在游玩途中谦去,可以記住用戶行走的路線慷丽,并根據(jù)關(guān)門時間、旅游計劃哪轿、景區(qū)內(nèi)人流分布等盈魁,規(guī)劃后續(xù)的最佳路線。
(3)幫用戶找服務(wù)設(shè)施
比如用戶想找衛(wèi)生間:
用戶:這周圍哪里有衛(wèi)生間窃诉?
耳機(jī):最近的衛(wèi)生間距您500米杨耙,您要現(xiàn)在出發(fā)嗎?
用戶:現(xiàn)在就去
耳機(jī):好的飘痛,您右拐一直走……左拐……
難點(diǎn):是否可以在耳機(jī)中放置傳感器珊膜,讓智能耳機(jī)知道用戶面向哪個方位。
(4)娛樂
在景區(qū)內(nèi)宣脉,可以有語音版的貼吧车柠、留言墻、彈幕墻,游客們可以抒發(fā)感想竹祷、說出游覽趣事谈跛、吐槽,這些內(nèi)容可以基于關(guān)鍵詞或位置塑陵,其他人通過說出關(guān)鍵詞感憾,或走到相關(guān)位置,收聽相關(guān)內(nèi)容令花、語音點(diǎn)贊阻桅。
其他比如歌曲、相聲兼都、有聲書等內(nèi)容嫂沉,現(xiàn)在就可以滿足。
(5)其它體驗(yàn)
出門時扮碧,查到用戶計劃去的景區(qū)是否賣水和食物趟章,甚至提前警告景區(qū)內(nèi)的相關(guān)商品價格,讓用戶提前做好準(zhǔn)備慎王。
旅行中不可避免的翻譯問題尤揣。
3.再現(xiàn)實(shí)一點(diǎn)
開放域問題的解答對AI來說很難,短期內(nèi)柬祠,我們可以做一個個skill,相當(dāng)于手機(jī)上的APP负芋,來滿足旅游場景下的主要需求漫蛔。這個skill可以專門針對旅游這一場景,把功能限制在四個主要的需求上旧蛾,這樣就可以把語言理解限制在有限的幾個意圖中莽龟,同樣,每個意圖下的關(guān)鍵詞和話術(shù)的組合是有限的锨天。
通過窮盡這些組合毯盈,我們可以得到旅游場景下的有限域問答系統(tǒng),這樣病袄,就可以較出色完成任務(wù)搂赋。
這個領(lǐng)域短期內(nèi)可能會呈現(xiàn)如下幾種模式:
1.一個skill內(nèi)有所有的景區(qū)內(nèi)容,智能耳機(jī)收到相關(guān)問題益缠,并判斷用戶是在旅游場景下(可以根據(jù)地理位置和問題關(guān)鍵詞判斷)脑奠,就會調(diào)用這個skill,去查找相關(guān)的回答幅慌。相當(dāng)于你對小愛音箱說“紅豆”宋欺,它會自動認(rèn)為你想聽這首歌,然后打開QQ音樂,為你播放這首歌齿诞。這種模式下酸休,公司可以自己做內(nèi)容,也可以做成平臺祷杈,讓用戶或者第三方產(chǎn)生內(nèi)容斑司,問題是,怎么讓平臺上的內(nèi)容生產(chǎn)者有動力持續(xù)輸出優(yōu)質(zhì)內(nèi)容吠式。
2.或者陡厘,每個景區(qū)只專注于做自己的skill,只滿足自己景區(qū)的需求特占。游客每去一個景點(diǎn)糙置,都可以在門前的牌子上看到喚醒這個景區(qū)skill的喚醒詞,說了這個喚醒詞是目,在這個景區(qū)旅游的過程中都可以調(diào)用相關(guān)能力谤饭。
4.基礎(chǔ)性問題
(1)續(xù)航問題:
如果把計算和數(shù)據(jù)傳輸都放到耳機(jī)上,續(xù)航可想而知懊纳。
1.一種較好的方案是耳機(jī)只負(fù)責(zé)數(shù)據(jù)傳輸揉抵,將語音識別、處理嗤疯、生成回答冤今、合成語音等都放到其他設(shè)備上,比如手機(jī)茂缚∠钒眨《她》中的解決方案類似這種。
2.也可以將智能耳機(jī)的電池倉放入芯片脚囊,作為智能中樞龟糕,這樣可以每次使用一個耳機(jī),另一個耳機(jī)在充電悔耘,同時可以有不間斷的智能體驗(yàn)讲岁。
(2)反饋時間:
反饋時間會對語音交互體驗(yàn)造成很大影響。你問人工智能一句話衬以,等了半天沒有反應(yīng)缓艳,過了好長時間突然說了句話,很是嚇人看峻。反饋時間受數(shù)據(jù)傳輸速度和計算速度影響郎任。
1.數(shù)據(jù)傳輸速度:即將到來的5G會讓數(shù)據(jù)傳輸速度上一個新臺階。
2.計算速度:是更嚴(yán)重的問題备籽,要在較短時間內(nèi)將語音識別舶治、處理分井、生成回答、合成語音都搞定霉猛。就使用小愛同學(xué)的體驗(yàn)來看尺锚,在多次語音交互后,有明顯的發(fā)熱惜浅,說明這些處理過程還是很耗內(nèi)存的瘫辩。如果說了幾句話,耳機(jī)或者手機(jī)變得特別燙坛悉,那還怎么用伐厌。
(3)區(qū)分說話對象:
用戶獨(dú)自旅游的時候智能耳機(jī)最好一直處在這個skill中,這樣能快速而準(zhǔn)確的應(yīng)答用戶需求裸影,而不是用戶每問一個問題就要說一句喚醒詞挣轨。
但如果幾個人結(jié)伴同行,互相聊天時智能耳機(jī)總是在搭茬轩猩,而且還都是它聽不懂你在說啥卷扮,這時,每次單獨(dú)喚醒會有更好的體驗(yàn)均践。那是否這個skill要有兩種模式呢晤锹?
總結(jié)
旅游場景下應(yīng)用人工智能有美好的前景,同時也有很多問題亟待解決彤委。目前情況下鞭铆,下個APP還是較好的解決方案。
喜歡旅游的朋友可以去App Store或者應(yīng)用寶下個大雁導(dǎo)游體驗(yàn)下焦影,就醬~~~<