4月底隨公司同事一起去參加阿里巴巴的 UCAN 大會我衬，由于路途上發(fā)生了各種驚險的事情，我們在27號大會當天才到達杭州饰恕，錯過了早上的主會場分享挠羔。但是總的來說這次大會之行的收獲還是頗豐的，特別是27號下午智慧技術這場關于天貓精靈的分享埋嵌。

天貓精靈的分享共由4位設計師來進行破加，講述了天貓精靈的人格化塑造到場景化劇本打造再到最后的多模態(tài)設計的量化。除了許多拗口難懂的新鮮詞匯雹嗦，整個分享過程也是干貨滿滿范舀，誠意十足。接下來我將按照他們的分享順序進行簡單回顧和總結了罪。

提起天貓精靈锭环，大家印象中可能還是那個笨笨的人工智障音箱，“連放個歌都放不了”捶惜。但是這次大會后我了解到田藐，天貓精靈已經(jīng)不再只是一個產(chǎn)品荔烧，而是阿里巴巴對人工智能領域進軍的一個代名詞吱七。除了最早的天貓精靈外，天貓精靈cc鹤竭、方糖踊餐、火眼等等產(chǎn)品搬卒，系統(tǒng)覆蓋了家居错沽、生活图筹、車載、娛樂乘寒、學習、購物等多種場景项秉。

覆蓋場景如此之全的天貓精靈系統(tǒng)是怎么設計出來的呢韧涨？

一、人格化搭建

在仆人幕帆、助手获搏、顧問這三種角色中，仆人只能夠簡單回應失乾，服從指令常熙；助手能夠清晰理解你的意圖和情感；顧問能夠先你所想碱茁，除了理解你的意圖和情感裸卫，還能超出預期。人工智能發(fā)展到現(xiàn)在還只是處于從仆人向助手過渡的一個階段纽竣。

指令界面和圖形界面都是人在學習機器怎么用墓贿，但是在自然界面中，機器開始要學習人的邏輯蜓氨。機器走向人的一個過程中會出現(xiàn)許多問題募壕，著名的恐怖谷理論說的就是反面案例。

由于機器所存在的缺陷语盈，導致機器在向人的靠近過程中伴隨著生硬和殘缺舱馅。在這個時代，設計師最底層的職責還是站在用戶的角度去洞察人心刀荒，把技術按照人的方式輸出代嗤。其實設計還是設計，只是對象有所不同缠借。

要達到這個目標干毅，設計師必須要了解人的認知構成。在日常生活中泼返，人們了解一個人是自下而上地從他所展露出的情緒來推斷行事的意圖硝逢，從而了解到他的性格特質(zhì)，進而推導他可能是什么樣的人格绅喉。但是設計師應該自上而下地去推導一個產(chǎn)品的人格和表現(xiàn)渠鸽，就像是造物主創(chuàng)造萬物或是小說家創(chuàng)造人物角色一般。先定義它的人格柴罐，再從人格去推導它的個性徽缚、目標意圖和情緒表征應該是什么樣的。

設計師需要了解人的認知構成

定義了產(chǎn)品的人格后就可以避免團隊內(nèi)部意識不統(tǒng)一而造成產(chǎn)品的人格分裂革屠。天貓精靈的人格是如何去定義的呢凿试？

他們引入了 MBTI 人格類型論去定義產(chǎn)品人格排宰。MBTI 人格類型論主要用在職業(yè)類型測試，將人格劃分為4個維度那婉，8個項板甘，16種人格表達類型。選擇這個理論是因為這個理論是按照職業(yè)角色來定義人格類型的详炬。智能產(chǎn)品的本質(zhì)就是讓產(chǎn)品在不同場景下扮演不同的角色虾啦，比如汽車場景下應該是什么角色，教育場景下應該是什么角色等等痕寓“磷恚基于產(chǎn)品想要帶給用戶積極活躍的小助手形象，設計團隊將天貓精靈設定為了 ESPF 型人格呻率，人格特征偏外向硬毕、感性。

MBTI性格分類理論模型

定義了人格之后礼仗，要接著定義它的個性特征吐咳。這里他們又引入了一個16PF的個性特質(zhì)。因為個性特質(zhì)不同元践，所表現(xiàn)出來的行為傾向也不同韭脊，這就影響到了產(chǎn)品的多模態(tài)表達。最終他們將產(chǎn)品定義為擁有樂群型单旁、興奮型的個性沪羔。

16pf個性特質(zhì)

最后他們用了一個 Arousal Valence 的情緒模型，這個情緒模型定義了100多種不同的情緒象浑，讓情緒可以量化。

Arousal Valence 情緒模型

通過這一系列的理論和思考愉豺，可以讓設計師對對產(chǎn)品的設計自上而下有一個完整的思考鏈路篓吁。

為什么設計師這么注重情緒的表達？在此不得不提情緒表達的兩個意義蚪拦。情緒是有結果導向和過程導向兩種意義的杖剪，結果導向就是情緒表達可以增強你的意圖，而過程導向則是情緒可以在這個過程中和對象產(chǎn)生情感的共鳴驰贷。這兩重意義在產(chǎn)品和人之間的交互過程中最顯性盛嘿，最直接，對體驗影響也最大饱苟。

他們通過三種理論知識進行了天貓精靈的人格化搭建孩擂，設定天貓精靈是一個 ESPF 人格狼渊，并且作了一個「人格畫像」箱熬，所定義的內(nèi)容包括人物畫像（背景信息类垦、年齡、性別城须、職業(yè)）蚤认，聲音畫像（聲音語言的風格、音效）糕伐，行為畫像（肢體行為砰琢、表情）。最后通過 16PF 的人格特質(zhì)為天貓精靈「設置意圖」良瞧，什么場合說什么話陪汽、如何對待他人、社會規(guī)則褥蚯、外部刺激挚冤、如何處理語言和組織信息等等。

二赞庶、具有生命感的語音交互設計

在通過上述分析設定了天貓精靈的人格训挡、特性之后，就要設定對應的語言風格和聲音風格歧强。

影響到語言風格的要素有：句式類型澜薄、詞匯選用、組織結構摊册。根據(jù)天貓精靈的人格特征和特性表現(xiàn)肤京，這三個要素分別表現(xiàn)為：

句式類型：使用很多的祈使句和感嘆句

組織結構：使用短小精干的短語，避免使用邏輯化茅特、句式化的長句

詞匯選用：多使用一些語氣詞蟆沫、感嘆詞、填充語温治，一些網(wǎng)絡流行語等

在聲音風格的設置上選用需要符合這個人的人格化特征的聲線饭庞，它的情緒在不同的場景下處于不同的區(qū)間內(nèi)。在處理任務時熬荆，情緒應該是偏穩(wěn)定和冷靜的舟山；在閑聊時，情緒的表現(xiàn)力則可以更豐富卤恳。

通過對語音三要素（音高累盗、語速、音量）進行參數(shù)化調(diào)節(jié)突琳，達到不同場景下的情緒表達若债。另外，使用一些語音表情包來使對話更自然拆融。

那么蠢琳，僅僅是能發(fā)出類人的聲音和語氣就能表現(xiàn)生命感了嗎啊终？不，還遠遠不夠“列耄現(xiàn)在市面上大多數(shù)的語音產(chǎn)品也僅僅做到了這一點蓝牲，我們只能用它來訂外賣、查快遞泰讽、播放語音等例衍。這和我們想象中的人工智能相距甚遠。原因在于我們現(xiàn)在的技術還只停留在語音識別和語義理解上已卸，只是簡單地用語音指令代替了過去的觸控指令佛玄。但是真實世界中的語音交互不止是語音操控。人和人之間的對話充滿了不確定性累澡。

試想翎嫡，我們下班回到家跟天貓精靈說，“請打開空調(diào)永乌』笊辏”

天貓精靈會說：“好的，空調(diào)正在打開翅雏∪ν眨”

如果是飯店的服務員，她會說：“先生望几，您覺得24度可以嗎绩脆？”

如果是女朋友，她可能會說：“忙了一天橄抹，辛苦了靴迫。”

那如果是父母呢楼誓，則可能是：“不要老吹空調(diào)玉锌，對身體不好∨备”

服務員主守、女朋友、父母這三種角色對一個指令的反饋是不同的榄融，這也就是機器的反饋和人的反饋之間存在差異参淫。機器只會對當前的指令作出應答，但是人和人之間的交互卻是經(jīng)過認知推理的愧杯，認知推理的因素包括人和人之間的交互記憶涎才、共同經(jīng)歷、共同的知識背景力九、當前的環(huán)境各種因素綜合而成的耍铜。人和人之間的關系越緊密邑闺，中間經(jīng)過的認知推理就越多，反饋話術也就越自然业扒。這對機器來說需要大量的數(shù)據(jù)基礎和訓練检吆。

如何用設計的方法去模擬任何人之間的互動舒萎？這里提出了一個“劇本化設計”的手段程储。

他們使用了一個在語音場景下最經(jīng)常使用的功能作為案例去分析如何進行劇本化設計。以前當用戶問天貓精靈臂寝，杭州明天有沒有雨的時候章鲤，天貓精靈可能會一次性丟出大量信息，并且這些信息不是完全有用的咆贬。

顯然這個不是用戶想要的败徊。那么問題來了，人們在談論天氣的時候掏缎，到底在談論什么皱蹦？用戶關心的是什么？這里有兩個點眷蜈，一個是想要了解到天氣對生活產(chǎn)生了什么影響沪哺，應該對應做些什么？另外酌儒，天氣是一個情感閑聊的觸發(fā)點辜妓，可以觸發(fā)對家庭成員的關心。

因此忌怎，他們設計了一個場景話術庫籍滴，按照用戶對天氣的敏感程度進行了以下的優(yōu)先級排序，各個天氣類型對應了相應的話術建立話術庫榴啸，天貓精靈便在當前的基礎上展開閑聊孽惰。

這一部分的分享是由阿里巴巴的語言學博士來進行的。她從語言學與人類文化的角度去理解語音產(chǎn)品的設計鸥印，“語言對人類來說是一個重要的標志之一灰瞻，當智能產(chǎn)品的語音通道被打開之后，用戶會自然而然地拉高對產(chǎn)品的期待辅甥，認為自己面對的不再是一臺機器酝润，而是要能讀懂自己的情緒，甚至能夠超前完成任務璃弄∫”將產(chǎn)品設計的價值和意義拉高了一個維度。

三夏块、多感官交互需要注意什么

很多人可能會把語音產(chǎn)品理解為只使用語音進行交互疏咐，但是實際場景中纤掸，用戶接收的信息來源可能來自聽覺，但也可能來自視覺浑塞、觸覺借跪、甚至任何一個感官。因此在語音產(chǎn)品的設計中需要兼顧不同感官的設計體驗酌壕。因此這里提出了多感官的交互設計掏愁。

多感官的交互設計需要注意什么？

第一點是對用戶場景的關注：

在多感官的設計中需要注意不同空間中的事物對使用的影響卵牍。需要考慮到用戶是誰果港、在什么時間、在什么場所糊昙、和機器的空間關系是什么樣的辛掠、是使用語音交互為主還是界面交互為主？（語音交互有范圍限制释牺，手勢交互有條件限制）

天貓精靈cc的菜譜內(nèi)容輕推送功能使用了語音為主萝衩，視覺為輔的方式。因為用戶需要一邊做菜一邊用產(chǎn)品没咙，注意力是非常不集中的猩谊，這個場景下的設計需要更多包容性，如加大字號镜撩、精簡信息等预柒。

第二點是注意用戶感官注意力的分配：

人的注意力是有限的，用戶的視覺和聽覺資源都是非常有限的袁梗，如果關注于自己想要關注的信息宜鸯，就容易丟失其他信息。

在車載場景下的設計需要注意的就是用戶在開車的時候注意力資源很低遮怜，但是處于上下起伏的狀態(tài)淋袖。在停車等待這些場景下還是有一定的注意力資源來對屏幕上的東西進行關注的。因此他們將開車場景分為安全場景锯梁、風險場景和危險場景即碗，針對不同場景下的注意力資源采用了不同的設計策略。

最后陌凳，他們將這種設計方式總結為「HIS——人-智-場」的多感官設計方法剥懒。（其實就是人-機-環(huán)境）

HIS——人-智-場

四、設計師在語音交互時代可以做什么

最后合敦，他們總結了他們整個團隊所做的事情其實就是理解用戶意圖初橘，統(tǒng)一產(chǎn)品對外表達的心智，對不同場景下產(chǎn)品的不同模態(tài)的規(guī)則進行量化，達到機器類人的一個目的保檐。

不管是語音時代還是觸控時代耕蝉，設計師所要做的事情都是一樣的，只不過載體發(fā)生了變化夜只。這就需要設計師除了傳統(tǒng)的交互設計和視覺設計能力之外擁有更多維度的知識垒在，如語言學，懂的知識越多扔亥，看待問題就能越全面场躯。也需要設計師從更全局的角度去看待產(chǎn)品，不再僅僅專注于手中的一畝三分地砸王。這也是我在這次大會中學到的最重要的東西推盛。

我在這次大會中學到的東西

正如第二個分享者張婉在公眾號文章中寫到的：

“語音交互的特殊性為體驗設計師提出了新的要求和挑戰(zhàn)峦阁。人類的語言能力是天生的谦铃，用戶的語言行為模式不會因為交互對象是計算機而發(fā)生改變。傳統(tǒng)的交互方式要求用戶學習計算機的規(guī)則榔昔，而在語音交互中驹闰，計算機必須完全順應用戶的邏輯。因此撒会，設計師首先要理解“語言”的本質(zhì)嘹朗，理解用戶的“語言邏輯”，才有可能設計出流暢自然的語音交互體驗诵肛。其次屹培，設計師還必須理解技術的實現(xiàn)機制，才能和技術配合怔檩，將技術能力最大化褪秀，并和技術攜手不斷拓寬彼此的邊界。

語音交互滲透人類生活場景的方方面面薛训，這就對我們設計師提出了更高的綜合素質(zhì)的要求媒吗。阿里常說“既要、又要乙埃、還要”闸英，對語音交互的體驗設計師而言，既要具備語言學能力介袜、技術背景甫何、交互設計能力，又要有產(chǎn)品思維遇伞、營銷思維辙喂、結構化能力、可視化能力，甚至是編劇能力加派，還要有一定高度的哲學思考叫确。在人工智能的時代中，產(chǎn)品的形式不斷突破人類的認知邊界芍锦，如何理解人竹勉、如何理解人的認知、如何為計算機構建世界觀娄琉，這都是值得我們思考的哲學命題次乓。”

最后還有兩個字：「匠心」孽水。很多人或許覺得現(xiàn)在的互聯(lián)網(wǎng)時代票腰，談「匠心」或許只是一個噱頭，賣情懷女气。但是當我看到他們在我們的機器還不夠智能的情況下杏慰，真的是在一點一點打磨每一個場景，每一句話炼鞠。試圖用一百分的匠心去彌補產(chǎn)品在技術上和用戶之間的鴻溝缘滥，我真的佩服這個團隊。

這次大會讓我深切感受到了與大廠的設計師還存在很大的差距谒主，并且這個差距正在一步一步拉大朝扼。我們所能夠做的就是多吸取不同維度的知識，不給自己設限霎肯；多了解用戶擎颖，才能做出更貼近用戶期望的產(chǎn)品。

p.s. 以上內(nèi)容是通過在大會中學習到的內(nèi)容和會后錄音整理而成观游，配圖是我在公司內(nèi)部二次分享時做的ppt搂捧。知識成果歸天貓精靈團隊所有，我只是知識的搬運工备典。

參會記錄 | 天貓精靈的生命感智能語音產(chǎn)品設計

參會記錄 | 天貓精靈的生命感智能語音產(chǎn)品設計

一、人格化搭建

二赞庶、具有生命感的語音交互設計

三夏块、多感官交互需要注意什么

四、設計師在語音交互時代可以做什么