人工智能的崛起披粟,各大AI公司都紛紛搭建自己開發(fā)者開放平臺庄岖,來構(gòu)建生態(tài)系統(tǒng)许蓖,比如說百度和訊飛的開發(fā)者開放平臺等,今天我們來聊聊科大訊飛的AIUI開放平臺漓摩。
01 概述
官方定義:AIUI是科大訊飛2015年推出的一套以語音技術(shù)為核心的人機(jī)交互解決方案裙士,意在使應(yīng)用和設(shè)備能快速具備能聽會說,能理解會思考的能力幌甘。
通俗理解:你把你的設(shè)備接進(jìn)來潮售,我給你強(qiáng)大的技術(shù)支持痊项,當(dāng)用戶輸入語音時(shí)锅风,我?guī)湍憷斫庥脩舻囊鈭D,幫你控制設(shè)備鞍泉。
AIUI的主要核心技術(shù)包括:
接入AIUI的應(yīng)用和設(shè)備皱埠,可實(shí)現(xiàn)查詢天氣、播放音樂視頻資源咖驮、設(shè)置鬧鐘以及控制智能家居等功能边器。AIUI目前提供的開放技能:
也就是說這是平臺已經(jīng)具備的技能了,我們可以直接調(diào)用托修,當(dāng)然你也可以自定義技能忘巧,比如說自定義一個(gè)撩妹聊天的技能、講笑話的技能睦刃、查詢快遞的技能等等(自定義技能我們在后面會重點(diǎn)講到)砚嘴。
為什么各大AI平臺都急著搭建自己的開放平臺呢?對平臺有什么好處涩拙?對開發(fā)者又有什么好處呢际长?
對平臺的好處:
構(gòu)建生態(tài):看看微信開放平臺的思路,你就理解了為什么AI平臺也玩開放兴泥;自己能做的事情畢竟有限工育,只有提供好基礎(chǔ)設(shè)施,吸引更多的人來玩搓彻,才更構(gòu)建一個(gè)生態(tài)系統(tǒng)如绸。
要更多數(shù)據(jù):AI的三架馬車算法、算力旭贬、數(shù)據(jù)竭沫,開放是拿到數(shù)據(jù)最好的辦法啊,特別是垂直細(xì)分領(lǐng)域的數(shù)據(jù)骑篙,在AI時(shí)代蜕提,誰掌握了數(shù)據(jù),誰就掌握了未來靶端。
對開發(fā)者的好處:
門檻低:不需要自己花這么大的人力成本去搞深度學(xué)習(xí)谎势,去搞語音識別凛膏,語音分析等等,就可以享受到這么復(fù)雜的技術(shù)服務(wù)脏榆,完成很智能的產(chǎn)品猖毫。
有更多的機(jī)會接觸用戶:這也是一個(gè)流量平臺,只要我的東西有足夠的吸引力须喂,就有人來用我的東西吁断,我就能獲得更多的用戶。
簡單:這里有很多組件坞生,我要組裝一個(gè)應(yīng)用仔役,很簡單。就像我要做一個(gè)個(gè)性化的自行車是己,這個(gè)什么零件都有又兵,我隨便取。
02 主要的模塊
我們今天所討論的內(nèi)容主要涉及以下這些模塊和專業(yè)詞匯卒废。
應(yīng)用沛厨、技能、服務(wù)和設(shè)備的關(guān)系如下圖:
應(yīng)用可由多個(gè)技能組裝而成摔认,而應(yīng)用又可以跟設(shè)備連接起來逆皮,控制設(shè)備;也可以跟服務(wù)和內(nèi)容連接起來参袱,給應(yīng)用提供更多的內(nèi)容和服務(wù)电谣。
2.1???? 應(yīng)用
如果把“應(yīng)用”比喻成一個(gè)APP的話,那么技能就是APP里的一個(gè)功能蓖柔,比如說美團(tuán)APP里有叫外賣功能辰企、有訂機(jī)票功能、有買電影票功能等况鸣。
2.2???? 接入服務(wù)
FLYOS 支持一系列的服務(wù)接入牢贸,這些服務(wù)可以分為三大類:語音技能、內(nèi)容信源和智能家居镐捧。
語音技能包括如播放音頻潜索、設(shè)置鬧鈴、回答問題等懂酱;
內(nèi)容信源包括(定期更新的)文本竹习、音頻、視頻等列牺;
智能家居則包括了如燈泡整陌、門鎖、風(fēng)扇、掃地機(jī)器人等被控設(shè)備的狀態(tài)控制泌辫。
當(dāng)在 iFLYOS 中接入了你提供的服務(wù)之后随夸,用戶可以通過搭載了 iFLYOS 的主控設(shè)備,如音箱震放、耳機(jī)宾毒、電視等,調(diào)用你開發(fā)的技能或控制你的接入的智能家居品牌設(shè)備殿遂。
控制智能家居的流程:
控制智能家居的邏輯:
1诈铛、選擇智能家居控制服務(wù)提供商,綁定對應(yīng)服務(wù)商IoT云的賬號墨礁;
2幢竹、當(dāng)用戶語音說:“打開廚房的燈”時(shí),iFLYOS會識別用戶開燈的意圖和要控制的設(shè)備饵溅;
3妨退、iFLYOS會向IoT云服務(wù)發(fā)送指令請求妇萄。這些指令包含用戶的授權(quán)信息蜕企,設(shè)備的唯一標(biāo)識,和設(shè)置請求的相關(guān)信息冠句;
4轻掩、智能家居控制廠商,在接收到iFLYOS的請求后懦底,通過IoT云控制特定的設(shè)備唇牧,并回復(fù)iFLYOS是否控制成功;
5聚唐、iFLYOS收到回復(fù)后丐重,將信息反饋給用戶。
2.3???? 接入設(shè)備
就是讓你的智能設(shè)備接入的平臺杆查,讓你的設(shè)備快速的具備更強(qiáng)大的語音交互能力扮惦。比如說智能音箱接進(jìn)來可以獲得講笑話等更豐富的功能;讓KTV房的設(shè)備接進(jìn)來亲桦,就可以語音點(diǎn)歌等功能崖蜜。
接入設(shè)備和接入服務(wù)的理念區(qū)別:
接入設(shè)備是讓你的設(shè)備具備能說會聽的能力;
接入服務(wù)是讓你的服務(wù)能連接更多的智能設(shè)備客峭,傳遞給更多的用戶豫领。
2.4???? 技能
技能指的是完成某一功能或任務(wù)的能力,比如說一個(gè)訂機(jī)票的功能舔琅。
技能包括兩大類:
一類是平臺已經(jīng)創(chuàng)建好的技能等恐,可以在技能商店里直接調(diào)用,比如說股票、鬧鐘课蔬、天氣等闪檬;
另一類是自定義的技能,你可以創(chuàng)建自己的個(gè)性化技能(后面我們會重點(diǎn)講)购笆;
03 自定義技能
自定義技能強(qiáng)大又簡單粗悯,是一個(gè)重量級武器,這一章同欠,我們重點(diǎn)來講自定義技能样傍。
先來聊一下自定義技能能做些什么,后面再具體講自定義技能怎么建铺遂。
自定義技能能做什么衫哥?
假設(shè)你是一家知識服務(wù)商,你可以把你的知識內(nèi)容封裝成一個(gè)技能襟锐,然后用戶就可以以語音的方式接收到你的內(nèi)容撤逢。比如說你的定位是新聞早報(bào),用戶去上班的路上粮坞,坐地鐵的時(shí)候聽的蚊荣;或者是定位是睡前的知識學(xué)習(xí)。
假設(shè)你是一家電影票的服務(wù)商莫杈,你可以把電影票和內(nèi)容封裝成一個(gè)技能互例,如果用戶的智能設(shè)備上使用了你的技能,用戶就可以跟設(shè)備進(jìn)行語音交互筝闹。用戶躺在沙發(fā)上的時(shí)候可以問:最近有什么好看的電影跋边丁?都有誰主演关顷?今天有哪些場次糊秆?要購買哪個(gè)場次?等等议双。
如果把開放平臺比喻成一個(gè)畫展痘番,那自定義技能就相當(dāng)于一幅畫,你可以申請畫框聋伦,自由發(fā)揮畫你想畫的畫夫偶,審核通過之后,平臺就放出來給觀眾展示觉增。
那這個(gè)過程中平臺有什么好好處兵拢,你又有什么好處呢?平臺的整個(gè)畫展的畫就可以更加豐富了逾礁,而你不需要自己這么大成本的宣傳说铃,租場地設(shè)備访惜,也可以宣傳自己的畫。
怎么創(chuàng)建自定義技能腻扇?
創(chuàng)建自定義技能通常分為以下幾個(gè)步驟:
假設(shè)我們以創(chuàng)建訂機(jī)票技能為例:
技能的場景和目的:訂機(jī)票债热;
窮舉盡可能多的用戶可能會問的方式(收集語料);
要怎么回答用戶幼苛,需要確定哪些信息才能完成訂機(jī)票(設(shè)計(jì)話術(shù))窒篱;
下面的內(nèi)容就是以訂機(jī)票技能為例,來創(chuàng)建一個(gè)自定義技能舶沿,說明創(chuàng)建技能過程中的具體步驟和涉及到的名詞墙杯。
3.1???? 創(chuàng)建
技能類型:
商店技能,只有審核通過后括荡,才能發(fā)布到iFLYOS技能商店高镐,可供其他用戶調(diào)用;
私有技能畸冲,只能自己調(diào)用嫉髓,不需要經(jīng)過嚴(yán)格的審核。
服務(wù)平臺:iFLYOS平臺邑闲、AIUI平臺
3.2???? 意圖
先介紹一個(gè)名詞“意圖”算行。
意圖是指用戶在技能中可能的請求或目的。
比如說訂機(jī)票监憎,出發(fā)地和目的地是一個(gè)意圖纱意,出發(fā)時(shí)間是一個(gè)意圖婶溯,飛機(jī)倉位(頭等艙鲸阔、經(jīng)濟(jì)艙)也是一個(gè)意圖等等,因此一個(gè)技能可能會包含多個(gè)意圖迄委。
如上圖褐筛,我們建了兩個(gè)意圖,確認(rèn)出發(fā)地和目的地叙身、確認(rèn)出發(fā)時(shí)間渔扎。
3.3???? 語料
接下來介紹另外一個(gè)名詞“語料”
語料是指用戶在完成某一意圖時(shí),可能會有很多種提問方式信轿。
如問年齡時(shí)可能會說:你多大了晃痴、你幾歲、你幾年出生财忽;這些都是問年齡這個(gè)意圖的語料倘核。
如上圖,在確認(rèn)出發(fā)地和目的地的意圖時(shí)即彪,用戶可能會問的方式紧唱。當(dāng)然我這里只是列舉了三個(gè),可能還會很多很多。
3.4???? 實(shí)體和輔助詞
接下來介紹另外兩個(gè)名詞“實(shí)體”和輔助詞漏益。
我們輸入的每一句語料中的詞蛹锰,都會被分為兩類:實(shí)體和輔助詞
實(shí)體:用戶的語料中,同一類型的名詞將會被總結(jié)為實(shí)體绰疤。
如上圖的語料中铜犬,“明天”是時(shí)間time實(shí)體,“深圳”和“北京”是城市city實(shí)體轻庆。因此這個(gè)語料結(jié)構(gòu)化的數(shù)據(jù)可以表示為“幫我訂一張{time} {city}到{city}的機(jī)票”翎苫。
輔助詞的官方定義:為了滿足開發(fā)者快速編寫語料的需求,同時(shí)保證語料的可維護(hù)性榨了,技能工作室提出了輔助詞的概念煎谍,不同于實(shí)體,輔助詞僅用于幫助開發(fā)者編寫語料龙屉,但在最終開發(fā)者拿到的結(jié)構(gòu)化數(shù)據(jù)中不會展現(xiàn)呐粘。
如上圖語料中,“幫我”转捕、“訂”作岖、“機(jī)票”都是輔助詞。
把語料分為實(shí)體和輔助詞是為了五芝,讓句子更加的結(jié)構(gòu)化痘儡,便于機(jī)器理解用戶的意圖。
平臺會提供一些常用的實(shí)體和輔助詞枢步,當(dāng)然你也可以自己創(chuàng)建實(shí)體或輔助詞沉删。
3.5? ?創(chuàng)建實(shí)體
在創(chuàng)建實(shí)體的時(shí)候會發(fā)現(xiàn)實(shí)體的類型又有三類,那這三類又有什么區(qū)別呢醉途,下面簡單說一下矾瑰。
先來說下靜態(tài)實(shí)體與動態(tài)實(shí)體的區(qū)別:
以一款《水滸傳百科》的應(yīng)用為例,假設(shè)這款應(yīng)用有一項(xiàng)技能是:給我介紹一下李逵隘擎;
結(jié)構(gòu)化的語料是:給我介紹一下{name}殴穴。
其中name是一個(gè)實(shí)體,當(dāng)其他應(yīng)用使用的時(shí)候货葬,這個(gè)實(shí)體指代的是同一個(gè)人采幌,這就是靜態(tài)實(shí)體。
但是假設(shè)還有另外一款應(yīng)用《西游記百科》震桶,里面也有一項(xiàng)技能是:給我介紹一下孫悟空休傍;
結(jié)構(gòu)化的語料同樣是:給我介紹一下{name}。
你會發(fā)現(xiàn)這兩個(gè)應(yīng)用的結(jié)構(gòu)化語料是一樣的尼夺,但實(shí)際上這兩款應(yīng)用的實(shí)體指代的人是不一樣的尊残。
因此為了區(qū)分這兩個(gè)實(shí)體名一樣炒瘸,但又是指代不同的兩個(gè)實(shí)體,我們引入的就是“動態(tài)實(shí)體”的概念寝衫。
所見即可說
假設(shè)有一款導(dǎo)航軟件顷扩,當(dāng)用戶語音輸入:導(dǎo)航到中科大;
然后屏幕出現(xiàn)了如下的顯示慰毅,很多選項(xiàng):
需要我們確認(rèn)地址隘截,假設(shè)我們需要到“南校區(qū)”,我們可以不用念一大串的文字汹胃,直接說“第三個(gè)”婶芭,那機(jī)器就知道我們?nèi)サ氖悄闲^(qū)。因?yàn)椤澳闲^(qū)”是排在所顯示位置的第三位着饥,這就是“所見即可說”犀农。
3.6? ? ?填槽
假設(shè)要訂一張機(jī)票,至少3個(gè)信息是必須要確認(rèn)的:出發(fā)地宰掉、目的地呵哨、出發(fā)時(shí)間,因此這些必填的信息轨奄,我們稱之為必填槽孟害。
因此在設(shè)置槽位的時(shí)候,我們把這3個(gè)信息設(shè)為必填挪拟,假設(shè)用戶的語料中沒有表達(dá)完整這3個(gè)信息挨务,我們可以針對缺失的信息設(shè)置追問。
比如如果沒有出現(xiàn)出發(fā)地玉组,我們設(shè)置的追問是:請問出發(fā)地是哪里
看下測試效果:
3.7? ? ?意圖確認(rèn)
設(shè)置意圖確認(rèn)語句:
測試:
意圖確認(rèn)其實(shí)就相當(dāng)于我們平時(shí)使用APP的一個(gè)二次確認(rèn)彈窗谎柄。
3.8? ? ?創(chuàng)建技能的小結(jié)
1、創(chuàng)建技能模塊(商店技能或私有技能)
2球切、創(chuàng)建意圖(一個(gè)技能可有多個(gè)意圖)
3谷誓、輸入語料(收集足夠多的語料,用戶可能的提問方式)
4吨凑、實(shí)體和輔助詞編輯(平臺提供的或自建的)
5、實(shí)體的分類(靜態(tài)户辱、動態(tài)鸵钝、所見即可說)
6、填槽(哪些是必填槽庐镐,追問語是什么)
7恩商、意圖確認(rèn)(是否需要二次確認(rèn))
04? 問答庫
語音問答(Q&A)是語音技能的簡單版。不同的是必逆,語音問答中的每一個(gè)用戶輸入怠堪,系統(tǒng)回復(fù)是確定的(可能是一個(gè)或者多個(gè))揽乱,不存在過多的邏輯處理。
下面以建一個(gè)“土味情話”的問答庫為例:
一個(gè)問題粟矿,可以設(shè)置成多個(gè)回答凰棉。
一個(gè)問答庫,可以設(shè)置多個(gè)問題陌粹。
這個(gè)問答庫其實(shí)很簡單撒犀,就是一堆“IF”組成的。
05? 創(chuàng)建應(yīng)用
前面我們說到了掏秩,一個(gè)應(yīng)用就相當(dāng)于一個(gè)APP或舞,應(yīng)用里的技能就相當(dāng)于APP里的某個(gè)功能。如美團(tuán)APP有叫外賣蒙幻、買電影票等功能映凳。
我們以創(chuàng)建一個(gè)家庭機(jī)器人的應(yīng)用為例:
應(yīng)用配置
在這里,我們可以給家庭機(jī)器人添加各種技能邮破,可以從自定義技能魏宽、自定義問答或技能商店中添加技能。
添加剛建好的自定義技能“訂機(jī)票”:
添加剛建好的自定義問答庫“土情話”:
從應(yīng)用商店里添加技能“股票”:
添加之后决乎,家庭機(jī)器人就具備了這三個(gè)技能队询,當(dāng)然你還可以添加更多的技能。
下面來測試下家庭機(jī)器人的技能构诚。
訂機(jī)票技能:
講土情話技能:
查看股市行情技能:
因此蚌斩,創(chuàng)建一個(gè)應(yīng)用實(shí)際上就是給應(yīng)用添加各種技能。
06 對AIUI平臺的評價(jià)
6.1???? 優(yōu)點(diǎn)
簡單便捷
如果我們利用平臺上已有的技能范嘱,我們只需要簡單的幾步送膳,就可以創(chuàng)建一個(gè)看起來還挺智能的應(yīng)用,即使是自己創(chuàng)建技能操作也很簡單丑蛤。
開放性
可以接入智能設(shè)備叠聋,可以接入各種服務(wù)或內(nèi)容(如百科知識或者一些原創(chuàng)內(nèi)容),也可以自定義技能受裹,這其實(shí)是鼓勵(lì)開發(fā)者在這個(gè)生態(tài)上創(chuàng)造內(nèi)容碌补。如果有足夠多的開發(fā)者在這里開墾,那各種技能將遍地開花棉饶,訊飛開放平臺也就變得無所不能了厦章。
生態(tài)閉環(huán)
硬件和軟件的閉環(huán),底層技術(shù)與實(shí)際場景應(yīng)用的閉環(huán)照藻,通用性和自定義個(gè)性化的閉環(huán)袜啃。
6.2???? 缺點(diǎn)
不夠智能
開發(fā)者做的并非真正的機(jī)器學(xué)習(xí),而更像是原始的if—else幸缕。比如說實(shí)體“北京”群发,用戶說“首都”晰韵、“京城”可能指的也是北京,但如果設(shè)置的語料不夠豐富熟妓,沒有覆蓋用戶的隨機(jī)話語雪猪,就無法識別了。
需要大量人工維護(hù)
自定義技能需要大量的人力成本維護(hù)滑蚯,比如說一個(gè)訂票技能浪蹂,需要用戶定義哪些是必填槽,如出發(fā)地告材、目的地坤次、時(shí)間,而當(dāng)缺乏時(shí)還需要設(shè)置追問語斥赋。這里只是假設(shè)有3個(gè)必填槽缰猴,但實(shí)際上可能會更加復(fù)雜,比如可能用戶有時(shí)需要選不同等級的倉位疤剑、選不同的航空公司滑绒、選擇不同位置等等,用人工處理起來就特別的麻煩了隘膘,而且不夠靈活疑故。
局限性
目前能接入的智能硬件還是非常受限的,需要智能硬件的服務(wù)商IOT云的授權(quán)弯菊,科大訊飛平臺云才能操作智能設(shè)備纵势。也就是說這個(gè)對于個(gè)人用戶來說非常的無能為力,比如說我想把我的智能音箱“天貓精靈”接入訊飛的體系就不行了管钳。
6.3???? 總結(jié)
AIUI開放平臺钦铁,讓開發(fā)者創(chuàng)建一個(gè)應(yīng)用非常簡單,但是不夠智能才漆,并非真正意義上的機(jī)器學(xué)習(xí)牛曹。
因此對于簡單的封閉域?qū)υ挘覀兛梢酝ㄟ^AIUI平臺簡單便捷實(shí)現(xiàn)醇滥,但是要實(shí)現(xiàn)復(fù)雜的黎比,更加智能的對話,還是需要自己踏踏實(shí)實(shí)的做機(jī)器學(xué)習(xí)腺办。