人工智能并不智能
很幸運(yùn)終于在今年年初加入人工智能行業(yè)辰狡,最近在做智能音箱項(xiàng)目番刊,一些小小感受驹溃。智能語(yǔ)音行業(yè)在ASR城丧,TTS目前的水平是可以的,ASR的準(zhǔn)確識(shí)別率達(dá)到97%豌鹤,TTS的語(yǔ)音合成技術(shù)也能達(dá)到真人效果亡哄,谷歌預(yù)約理發(fā)的演示已經(jīng)充分展示了TTS的效果。中間的自然語(yǔ)言處理布疙,對(duì)話管理蚊惯,自然語(yǔ)言生成這三部分是對(duì)話系統(tǒng)的暗箱部分,它們智能嗎拐辽?回答是不智能拣挪,用戶只要稍微變一下說(shuō)法,或者稍微有點(diǎn)推理性質(zhì)的說(shuō)法俱诸,比如“最近的法定假日是什么時(shí)候菠劝?”,大部分對(duì)話系統(tǒng)就歇菜了睁搭,至少本人親自試了市面上的四款智能音箱赶诊,都沒有回答出這么so easy的問題。
為什么對(duì)話系統(tǒng)不能像電影“her”一樣自如的交流呢园骆?因?yàn)檎Z(yǔ)言只是復(fù)雜三維世界里的二維輸出舔痪,也就是說(shuō)一句話的背后有一個(gè)復(fù)雜的知識(shí)體系和認(rèn)知體系,人與人的對(duì)話基于這個(gè)體系之上锌唾。有沒有發(fā)現(xiàn)锄码,和朋友在一起,話特別多晌涕,因?yàn)槟銈冇忠粋€(gè)共同的認(rèn)知體系滋捶;和陌生人好像就沒什么話說(shuō),只能聊一些很淺顯的東西余黎,這個(gè)淺顯的東西就是大家都掌握的常識(shí)(共同的認(rèn)知)重窟,一旦發(fā)現(xiàn)你們有共同愛好或觀點(diǎn)(共同的認(rèn)知),就會(huì)就此暢談惧财。
如果對(duì)機(jī)器說(shuō)“好無(wú)聊啊巡扇,想出去逛逛有沒有推薦的地方”扭仁,字面意思推薦一個(gè)地點(diǎn),可以調(diào)用第三方服務(wù)商接口厅翔,按照服務(wù)商已經(jīng)定義好的排序機(jī)制給用戶推薦乖坠,可能推薦三個(gè)或者五個(gè)。但是現(xiàn)實(shí)對(duì)話中知给,人們會(huì)基于對(duì)話人的認(rèn)知和常識(shí)給予回答瓤帚,去某個(gè)地方勢(shì)必要考慮到天氣描姚,或者這個(gè)地方最近剛?cè)ミ^(guò)涩赢,當(dāng)然不一定非要去戶外的,也可能是看個(gè)電影轩勘,最好是喜劇的筒扒,或者朋友正在搞露營(yíng)。歸納為兩點(diǎn):第一點(diǎn)绊寻,“推薦個(gè)地方”并不是唯一解決方案花墩;第二點(diǎn),具體推薦什么類型的地方澄步,需要一個(gè)龐大的知識(shí)體系作為判斷依據(jù)冰蘑,這些并不是現(xiàn)在的對(duì)話系統(tǒng)能做到的。這也是為什么人工智能在圖像處理方面比語(yǔ)音對(duì)話更成熟村缸,圖像“所見即所得”祠肥,語(yǔ)音“一句話只是冰山一角”
有人會(huì)說(shuō),多輪對(duì)話好像蠻智能的梯皿,那目前的多輪對(duì)話是怎么實(shí)現(xiàn)的呢仇箱?答案是“填槽”,目前市面上的多輪對(duì)話管理都是采用這種方法东羹,什么是填槽剂桥?舉個(gè)例子,比如說(shuō)“訂一張去恩施的車票”属提,判斷出意圖是“訂車票”权逗,查找訂車票訂表,訂票需要“出發(fā)地”冤议,“目的地”斟薇,“時(shí)間”三個(gè)必要條件,也就是三個(gè)槽位求类,“訂一張去恩施的車票”目的地是恩施奔垦,所以還有兩個(gè)槽位沒有填,系統(tǒng)會(huì)反問“您是從上海觸發(fā)嗎尸疆?”椿猎,“您是要訂今天的車票嗎”惶岭,直到槽位全部填上,系統(tǒng)才會(huì)進(jìn)入下一步查找推薦犯眠,具體的說(shuō)法是由人設(shè)定的按灶,具體有多少槽位也是由人設(shè)定的,確切的說(shuō)是由產(chǎn)品經(jīng)理設(shè)定的筐咧。如果你說(shuō)“訂一張去恩施的車票鸯旁,便宜的,靠窗的量蕊,時(shí)間短的”铺罢,它不會(huì)識(shí)別“便宜的,靠窗的残炮,時(shí)間短的”韭赘,也不會(huì)告訴你價(jià)格更便宜的機(jī)票,也許你會(huì)說(shuō)势就,可以在表的后面加時(shí)間泉瞻,價(jià)格,位置三個(gè)字段苞冯,確實(shí)現(xiàn)在大部分也都是用這樣的方法做的袖牙,但是用戶的說(shuō)法千千萬(wàn)萬(wàn),通過(guò)這樣的方法只是看起來(lái)智能舅锄,不是真正的智能鞭达,目前是狀態(tài)是:有多少智能就有多少人工。
(并不是在唱衰巧娱,只是更客觀理性一點(diǎn):)
AIPM做什么呢碉怔?
1.AIPM就是讓不那么智能的東西看起來(lái)很智能
2.為現(xiàn)有的智能技術(shù)尋求更多的落地場(chǎng)景
3.為已有的問題提供更優(yōu)的解決方案
AIPM要掌握幾個(gè)技能
1.懂商業(yè):即理解價(jià)值
對(duì)話產(chǎn)品的價(jià)值不在對(duì)話上,而是通過(guò)對(duì)話交互為用戶解決了什么問題禁添。一個(gè)本來(lái)就很強(qiáng)的APP撮胧,就不要想著去用對(duì)話重新做一遍。反而是一些APP/WEB還沒有能很好解決的問題老翘,可以多花點(diǎn)時(shí)間研究看看芹啥。
現(xiàn)在很多項(xiàng)目都是強(qiáng)行用新技術(shù)來(lái)套用某個(gè)領(lǐng)域或者某個(gè)應(yīng)用場(chǎng)景。但是這些項(xiàng)目都沒有去驗(yàn)證用戶是不是真正有這樣的痛點(diǎn)铺峭;或者用戶的痛點(diǎn)是不是足夠讓他們丟棄已有的習(xí)慣墓怀,使用一個(gè)新的產(chǎn)品,適應(yīng)一個(gè)新的方式卫键;或者這個(gè)加上人工智能后傀履,是不是真正解決了一個(gè)之前解決不了的問題。
2.懂技術(shù):即理解手中的工具
AI莉炉,算法钓账,IOT碴犬,5G等等,對(duì)產(chǎn)品經(jīng)理來(lái)說(shuō)梆暮,這些都是筑夢(mèng)的工具服协,PM要了解每個(gè)工具的特點(diǎn),用途啦粹。
在智能語(yǔ)音領(lǐng)域偿荷,最新的技術(shù)和論文都全部公開,所以大家的工具都差不多唠椭,成果如何跳纳,完全取決于藝術(shù)家。
現(xiàn)在AIPM手中有深度學(xué)習(xí)泪蔫,那么就應(yīng)該了解它擅長(zhǎng)什么和不擅長(zhǎng)什么棒旗,以避免提出太過(guò)于荒謬的需求喘批,導(dǎo)致開發(fā)的同學(xué)向你發(fā)起攻擊撩荣。了解深度學(xué)習(xí)的特性,會(huì)直接幫助我們判斷哪些產(chǎn)品方向更容易出效果饶深。
比如餐曹,做一個(gè)推薦餐廳的AI,就比做一個(gè)下圍棋的AI難太多了敌厘。圍棋的輸入包含了決策所需要的全部信息台猴,輸出只有輸和贏。而餐廳推薦俱两,輸入有限(無(wú)法包含決策所需要的全部信息)饱狂,輸出又是開放的∠懿剩總之休讳,需要系統(tǒng)數(shù)據(jù)以外的信息(需要思維)參與的都很難出效果。再舉個(gè)無(wú)人車的例子尿孔,路上一個(gè)垃圾桶俊柔,一個(gè)兒童推車,必須撞一個(gè)活合,無(wú)人車怎么判斷撞哪個(gè)雏婶?人是怎么判斷的呢?(有時(shí)感覺白指,我們對(duì)人的認(rèn)知都沒有研究很透徹)
3.懂人:心理和語(yǔ)言
這個(gè)不僅是對(duì)話AIPM留晚,所有PM都需要,指的是當(dāng)用戶在說(shuō)話的時(shí)候告嘲,對(duì)他腦中的模型的理解错维,即先揣摩心理憨闰,再恰當(dāng)說(shuō)話。
那對(duì)話系統(tǒng)怎么把握說(shuō)話人腦中的對(duì)話進(jìn)程需五?甚至把握說(shuō)話人的世界模型鹉动?怎么理解語(yǔ)言的言外之意?
(本文主要是講人工智能技術(shù)相關(guān)的思考宏邮,基本的產(chǎn)品技能不做展開)