1. 語音交互流程簡介
?1.1. AI 對話所需要的技術(shù)模塊有 4 個部分?
1.1.1. 自動語音識別(Automatic Speech Recognition, ASR)?
1.1.2. 自然語言理解(Natural Language Understanding, NLU)?
1.1.3. 自然語言生成(Natural Language Generation, NLG)
?1.1.4. 文字轉(zhuǎn)語音(Text to Speech, TTS)?
1.2.?
1.3. 戶與設(shè)備之間的交互沾谜,主要是采用語音方式處理和完成的多矮。
?2. 語音交互流程設(shè)計
?2.1. 交互流程的核心—意圖?
2.1.1. 所謂意圖,表示用戶在使用應(yīng)用時所做的動作(譬如:問一個問題或發(fā)送 一條指令)廷粒,這些意圖代表了應(yīng)用的核心功能。?
2.1.2. 如果應(yīng)用成功地識別了用戶意圖,則需要在完成業(yè)務(wù)動作后,將結(jié)果反 饋給用戶;如果應(yīng)用無法識別用戶意圖唧瘾,則需要給用戶友好的提示,指導(dǎo)用戶 使用别凤。
2.2. 如何識別意圖—語義解析?
2.2.1. 對語音識別結(jié)果進行分析理解饰序,簡單來說就是將用戶語音輸入映射到機 器指令。? 2.2.2. 它可能定義了一組包含指定的單詞或短語的語法結(jié)構(gòu)规哪,用戶通過說出滿 足這種結(jié)構(gòu)的語句求豫,來調(diào)用意圖。
2.3. 如何處理意圖—云端交互?
2.3.1. 調(diào)用意圖的結(jié)構(gòu)化請求诉稍,向服務(wù)器請求處理后做出反饋響應(yīng)蝠嘉。 通俗來講該流程主要處理用戶的請求,解決用戶問題的答案杯巨。?
2.4. 上下文意圖的處理-對話管理?
?2.4.1. 在用戶進行自然對話時蚤告,可能會因為表達事情的復(fù)雜度、時間服爷、地點杜恰、 效率等,產(chǎn)生具有脈絡(luò)的對話過程仍源,所有的對話元素會編織在一個連貫的線性 對話中心褐。
?2.5. 語言合成模塊 – 組織語言?
2.5.1. 根據(jù)解析模塊得到的內(nèi)部表示,在對話管理機制的作用下生成自然語言 句子笼踩。?
2.5.2. 同時將生成模塊生成的句子轉(zhuǎn)換成語音輸出檬寂。(把回答的機器語言再轉(zhuǎn) 換成 口語語言)
?3. 中文自然語言處理的關(guān)鍵技術(shù)?
?3.1. 詞法分析
?3.1.1. 一般來講,詞形主要表現(xiàn)在對單詞的前綴戳表、后綴等的分析桶至,而詞匯則表 現(xiàn)在對整個詞匯系統(tǒng)的控制。?
3.1.2. 在中文全文檢索系統(tǒng)中匾旭,詞法分析主要表現(xiàn)在對漢語信息進行詞語切分 镣屹,即漢語自動分詞技術(shù)。?
3.1.3. 通過這種技術(shù)能夠比較準確的分析用戶輸入信息的特征价涝,從而完成準確 的搜索過程女蜈。它是中文全文檢索技術(shù)的重要發(fā)展方向。?
3.2. 句法分析
?3.2.1. 句法分析是對用戶輸入的自然語言進行詞匯短語的分析色瘩,目的是識別句 子的句法結(jié)構(gòu)伪窖,實現(xiàn)自動句法分析過程。
?3.2.2. 其基本方法有線圖分析法居兆、短語結(jié)構(gòu)分析覆山、完全句法分析、局部句法分 析泥栖、依存句法分析等簇宽。?
3.3. 語義分析
?3.3.1. 語義分析是基于自然語言語義信息的一種分析方法,其不僅僅是詞法分 析和句法分析這樣語法水平上的分析吧享,而是涉及到了單詞魏割、詞組、句子钢颂、段落 所包含的意義
3.3.2. 其目的是從句子的語義結(jié)構(gòu)表示言語的結(jié)構(gòu)钞它。中文語義分析方法是基于 語義網(wǎng)絡(luò)的一種分析方法。語義網(wǎng)絡(luò)則是一種結(jié)構(gòu)化的殊鞭,靈活遭垛、明確、簡潔的 表達方式?
3.4. 語用分析?
3.4.1. 語用分析相對于語義分析又增加了對上下文钱豁、語言背景耻卡、環(huán)境等的分析 ,從文章的結(jié)構(gòu)中提取到意象牲尺、人際關(guān)系等的附加信息卵酪,是一種更高級的語言 學(xué)分析。?
3.4.2. 它將語句中的內(nèi)容與現(xiàn)實生活的細節(jié)相關(guān)聯(lián)谤碳,從而形成動態(tài)的表意結(jié)構(gòu) 溃卡。?
3.5. 語境分析?
3.5.1. 語境分析主要是指對原查詢語篇以外的大量“空隙”進行分析從而更為正 確地解釋所要查詢語言的技術(shù)。
?3.5.2. 這些“空隙”包括一般的知識蜒简,特定領(lǐng)域的知識以及查詢用戶的需要等瘸羡。 它將自然語言與客觀的物理世界和主觀的心理世界聯(lián)系起來,補充完善了詞法 搓茬、語義犹赖、語用分析的不足队他。
?4. Ai對話目前存在的問題?
4.1. 人機對話過程中,用戶難免會出現(xiàn)表達失誤的情況峻村,導(dǎo)致機器對用戶語言理 解出現(xiàn)偏差 10?
4.2. 人機對話過程中麸折,用戶難免會出現(xiàn)表達失誤的情況,導(dǎo)致機器對用戶語言理 解出現(xiàn)偏差粘昨,在這時垢啼,糾錯機制對機器而言則非常重要,如缺少這個機制张肾,用戶 需要花費相當(dāng)長的時間將其意圖解釋清楚芭析,相應(yīng)的用戶體驗也會十分糟糕。
?4.3. 另一方面吞瞪,雖然可以很好的識別語音馁启,但是卻不能理解你的對話目的,語義 理解上有偏差尸饺。?
4.4. 因此語音交互最終需要解決的關(guān)鍵問題是歧義消解問題进统,和未知語言現(xiàn)象的 處理問題。?
5. 智能語音助手背后的生態(tài)服務(wù)?
5.1. Amazon Echo 的勝利在于其語音助手 Alexa 掌握的無數(shù)技能浪听,Google Assistant 以及Google Home之所以被人看好是在于其 Android 后發(fā)優(yōu)勢所具備的開放性螟碎。
?5.2. 智能語音助手類的產(chǎn)品要想在中國落地開花,它不僅僅是簡單的語音識別那 么簡單迹栓,還有集成服務(wù)掉分,一整套的中文生態(tài)、內(nèi)容克伊、服務(wù)等配套設(shè)施酥郭,是一種涵 蓋很多基礎(chǔ)能力的生態(tài)系統(tǒng)。?
5.3. 未來基于語音交互的語義技能愿吹,必須要能夠達到幾萬不从、幾十萬甚至上百萬種 的時候,才能促使語音交互時代操作系統(tǒng)真正走向成熟犁跪,未來語音交互產(chǎn)品的形 態(tài)和樣式也將越來越豐富椿息。