姓名:韓宜真
學(xué)號(hào):17020120095
轉(zhuǎn)載自:https://mp.weixin.qq.com/s/FWYeiee3rk_Rajul-b4rdQ
【嵌牛導(dǎo)讀】未來(lái)的人機(jī)交互將是多模式狀態(tài),與人工智能密不可分索绪。
【嵌牛鼻子】智能人機(jī)交互 人工智能
【嵌牛提問(wèn)】當(dāng)人和機(jī)器之間的邊界逐漸模糊,人機(jī)交互的邊界在哪里饲漾?未來(lái)人機(jī)交互會(huì)發(fā)展成什么樣子妇押?
【嵌牛正文】在2013年的電影《她》中曲尸,男主結(jié)束了戀愛(ài)長(zhǎng)跑之后镇匀,愛(ài)上了一個(gè)電腦操作的系統(tǒng)女聲牙寞,這個(gè)叫“薩曼莎”的姑娘不僅有著略帶沙啞的迷人嗓音葡公,并且幽默風(fēng)趣罐农。
就這樣,他們成了無(wú)話不談的朋友催什,甚至發(fā)展出一段“畸形”的戀情涵亏。
雖然電影是虛構(gòu)的,但這也恰恰證明了,未來(lái)以用戶為中心的交互模式不會(huì)僅僅停留在操作方便等基礎(chǔ)方面气筋,對(duì)于更好地識(shí)別用戶表達(dá)意圖與情感等方面拆内,都將取得重大突破。
問(wèn)題來(lái)了宠默,當(dāng)人和機(jī)器之間的邊界逐漸模糊麸恍,人機(jī)交互的邊界在哪里?未來(lái)人機(jī)交互會(huì)發(fā)展成什么樣子搀矫?
在AI Time第七期的辯論中抹沪,清華大學(xué)的史元春、中科院軟件所的田豐瓤球、中科院計(jì)算所的陳益強(qiáng)融欧、小小牛科技創(chuàng)意公司的CEO曹翔就一起論道了人機(jī)交互與智能的相關(guān)問(wèn)題卦羡。
視覺(jué)化處理是關(guān)鍵
1945年噪馏,在電子計(jì)算機(jī)尚未“出世”時(shí),范內(nèi)瓦·布什就發(fā)表了題為“As We May Think”的文章绿饵,形象描述了未來(lái)個(gè)人電腦——一種被稱為MEMEX的機(jī)器欠肾,闡釋了直接交互、超鏈接拟赊、網(wǎng)絡(luò)存儲(chǔ)等概念董济。
1960年,約瑟夫·利克萊德提出“人機(jī)共生”的思想要门,并在布什的領(lǐng)導(dǎo)下通過(guò)美國(guó)國(guó)家科技計(jì)劃大力支持了人機(jī)共生理念下的圖形與可視化虏肾、虛擬對(duì)象操控、互聯(lián)網(wǎng)絡(luò)等研究項(xiàng)目欢搜,在他的主導(dǎo)下封豪,個(gè)人電腦、互聯(lián)網(wǎng)絡(luò)的標(biāo)志性關(guān)鍵技術(shù)在六七十年代逐次誕生了炒瘟。
約瑟夫·立克立德領(lǐng)導(dǎo)的交互式計(jì)算不但研發(fā)了分式操作系統(tǒng)吹埠,而且直接引導(dǎo)了圖形技術(shù)。
在范內(nèi)瓦·布什疮装、約瑟夫·利克萊德等先驅(qū)的推動(dòng)下缘琅,在語(yǔ)言學(xué)、心理學(xué)廓推、計(jì)算機(jī)科學(xué)的共同參與下刷袍,計(jì)算機(jī)從沒(méi)有用戶界面,到有了圖形用戶界面樊展,開(kāi)創(chuàng)了個(gè)人電腦以及互聯(lián)網(wǎng)絡(luò)等惠及整個(gè)社會(huì)的新產(chǎn)業(yè)呻纹。
現(xiàn)在手機(jī)無(wú)需利用鼠標(biāo)堆生,可以利用新的傳感技術(shù),包括AI技術(shù)雷酪,這些都在使得人們能夠更多地感受周圍世界淑仆,這也是人機(jī)交互的一部分。
未來(lái)哥力,在新的傳感和多媒體技術(shù)的共同支持下蔗怠,機(jī)器將可以通過(guò)感知和數(shù)據(jù)處理技術(shù)來(lái)理解我們,來(lái)理解周圍的環(huán)境吩跋,實(shí)現(xiàn)更自然寞射、更智能的人機(jī)交互。
人機(jī)互動(dòng)的研究領(lǐng)域呈多樣化
曹翔介紹道钞澳,他現(xiàn)在的工作可以說(shuō)是“現(xiàn)實(shí)版神筆馬良”,用一張普通的紙和一個(gè)普通的畫(huà)筆作畫(huà)之后涨缚,用手機(jī)采集轧粟,瞬間就能轉(zhuǎn)化生成三維動(dòng)畫(huà)。通過(guò)技術(shù)把創(chuàng)作的門坎降低脓魏,讓普通人能夠表達(dá)自己的創(chuàng)意是研究的初衷兰吟。
到目前為止還是普適計(jì)算的時(shí)代,未來(lái)人機(jī)交互會(huì)是多模態(tài)的茂翔,可以用鍵盤混蔼、語(yǔ)音,也可以用手勢(shì)珊燎、表情惭嚣、唇動(dòng)等。他首先介紹了基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別悔政,原因有二晚吞,其一是因?yàn)樽藙?shì)語(yǔ)言太多太泛,沒(méi)有清晰的目標(biāo)邊界谋国,其二是因?yàn)橄M夹g(shù)能服務(wù)于殘障人士的日常交流槽地。
第二個(gè)工作也和多模態(tài)相關(guān),人機(jī)交互的終極目標(biāo)是希望人機(jī)交互和人人交互一樣芦瘾。目前通過(guò)多模態(tài)捌蚊,包括知識(shí)性感知,讓機(jī)器獲知人目前的狀態(tài)近弟,繼而再進(jìn)行下一步行為缅糟。未來(lái)可以利用可穿戴設(shè)備,對(duì)人的生理和心理的境況進(jìn)行推斷祷愉,然后進(jìn)行交互溺拱。
陳益強(qiáng)也認(rèn)為逃贝,未來(lái)的人機(jī)交互模式會(huì)是多模態(tài)的。圍繞“多模態(tài)”設(shè)想迫摔,他提到了目前工作沐扳。一個(gè)是基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別,將面部識(shí)別句占、手勢(shì)動(dòng)作識(shí)別和手語(yǔ)識(shí)別相融合沪摄,用以提高手語(yǔ)識(shí)別精度。二是通過(guò)多模態(tài)手段纱烘,使機(jī)器人獲知人類當(dāng)前狀態(tài)杨拐。
田豐主要關(guān)注面向教育和醫(yī)療的人機(jī)交互的研究,他分享了再輸入技術(shù)和相關(guān)理論方面的研究成果擂啥。由于輸入不可避免地存在不精確性哄陶,希望用智能化的方法進(jìn)行改善和幫助。
運(yùn)動(dòng)目標(biāo)的選擇是人機(jī)交互里非常重要的任務(wù)哺壶,玩游戲的時(shí)候就知道屋吨,相對(duì)靜止來(lái)說(shuō)運(yùn)動(dòng)目標(biāo)的選中更難,怎樣來(lái)提高選中的效率山宾,同時(shí)去理解用戶選擇目標(biāo)的能力至扰。他們首先做了大量的用戶研究,產(chǎn)生了針對(duì)不同速度和尺寸的物體在運(yùn)動(dòng)過(guò)程的落點(diǎn)分布资锰,建立出模型敢课,計(jì)算出用戶選中物體的概率。這個(gè)模型不僅可以分析正常人绷杜,對(duì)帕金森病人等也可以用做輔助診斷直秆。
值得一提的是,田豐帶領(lǐng)團(tuán)隊(duì)研發(fā)的筆式電子教學(xué)系統(tǒng)獲得了國(guó)家科技進(jìn)步二等獎(jiǎng)鞭盟,并與協(xié)和醫(yī)院共同取得了國(guó)家衛(wèi)健委頒發(fā)的醫(yī)療健康人工智能應(yīng)用落地30最佳案例的榮譽(yù)切厘。
史元春介紹道,在使用手機(jī)軟鍵盤時(shí)懊缺,26個(gè)字母擠在狹窄的輸入界面里疫稿,再配上胖乎乎的手指,點(diǎn)錯(cuò)的經(jīng)歷太多了鹃两。這是觸屏這種自然交互界面上典型的難題:胖手指難題遗座。
基于研究工作,他們提出了基于貝葉斯推理的自然用戶意圖理解框架俊扳,建模用戶行為特征途蒋,在模糊的輸入信號(hào)上推測(cè)用戶的真實(shí)意圖。你點(diǎn)的不準(zhǔn)沒(méi)關(guān)系馋记,算法可以猜得準(zhǔn)号坡。利用這項(xiàng)技術(shù)懊烤,史元春團(tuán)隊(duì)已經(jīng)研究實(shí)現(xiàn)了手機(jī)、平板宽堆、頭盔腌紧、電視等一系列接口上的輸入法,輸入準(zhǔn)確度大幅度提高畜隶,且?guī)缀醪恍枰曈X(jué)瞄準(zhǔn)壁肋,進(jìn)而還能支持盲人用戶準(zhǔn)確實(shí)現(xiàn)軟鍵盤輸入。
未來(lái)的接口也會(huì)延伸感知人的操控行為籽慢,史教授正在研制的手機(jī)前置攝像頭上就能:“感知到人手在界面上的變化后浸遗,我們就能以此做出新的‘輸入法’∠湟冢”
比如手握手機(jī)的任意邊框或位置跛锌,就可以輸入信息、訪問(wèn)界面届惋,甚至和桌子的交互髓帽,也能變成對(duì)手機(jī)的操作∨握粒”
人機(jī)交互離不開(kāi)人工智能
針對(duì)交互界面的構(gòu)建是否存在計(jì)算模型的問(wèn)題氢卡,田豐指出锈至,傳統(tǒng)上存在計(jì)算模型晨缴,而針對(duì)自然人交互,現(xiàn)在還沒(méi)有相應(yīng)的理論計(jì)算模型峡捡,但是應(yīng)該朝著這個(gè)方向努力击碗。
史元春教授同意以上觀點(diǎn),并指出定量評(píng)估的方法雖有们拙,但很不充分稍途。不過(guò)借助相應(yīng)的傳感技術(shù),定量評(píng)估的原理和技術(shù)都在不斷拓展砚婆,這從紅外反射監(jiān)測(cè)血流械拍、血壓參數(shù)、情緒變化等一系列應(yīng)用上就可以看出装盯。
以后的計(jì)算終端是多種多樣的坷虑,適配的場(chǎng)景和任務(wù)也是不一樣的,所以完全統(tǒng)一的大而全的模型非常難以建立埂奈,但是在特定任務(wù)上迄损,技術(shù)背后的科學(xué)原理一定是有計(jì)算模型的,研究者們都應(yīng)該去努力探索账磺。
此外芹敌,定量評(píng)估的方法理論上是存在的痊远,但現(xiàn)在很難說(shuō)是好方法,因?yàn)榻缑嬖跀U(kuò)展氏捞,相應(yīng)的實(shí)現(xiàn)技術(shù)碧聪、原理和評(píng)價(jià)技術(shù)也都在做擴(kuò)展和變化。
曹翔也指出幌衣,因?yàn)槿藱C(jī)交互的任務(wù)多樣矾削,很難去界定效率,更多是用主觀感受衡量豁护。從大方向上講哼凯,一定是需要定量數(shù)據(jù)的,人工智能需要數(shù)據(jù)楚里,而人機(jī)交互離不開(kāi)人工智能断部。
針對(duì)建模的機(jī)制和限制,曹翔指出班缎,具有明確任務(wù)的工作建模相對(duì)容易蝴光,因?yàn)槟繕?biāo)很清晰,但是體驗(yàn)性的达址、娛樂(lè)性的蔑祟、溝通性的工作比較難用計(jì)算的方式建模,因?yàn)槠渲袏A雜著大量非簡(jiǎn)單人機(jī)交互的內(nèi)容沉唠,比如人與人之間的互動(dòng)等疆虚。
用大數(shù)據(jù)的方式對(duì)情緒的預(yù)測(cè)更有效果,本身人類對(duì)情緒化的東西也沒(méi)有細(xì)分到小單元满葛。反過(guò)來(lái)說(shuō)径簿,大數(shù)據(jù)分析或人工智能分析,能在沒(méi)有用明確的細(xì)分模型的情況下做出預(yù)測(cè)嘀韧,恰恰能解決非標(biāo)準(zhǔn)性任務(wù)篇亭。但如果是利用大數(shù)據(jù)解決問(wèn)題,建立的可能是一個(gè)通用的模型锄贷,涉及到個(gè)人也會(huì)一些差別译蒂。
陳益強(qiáng)認(rèn)為,人機(jī)交互要做得好谊却,就一定要做到個(gè)性化柔昼,也就一定會(huì)用到智能方法。從交互來(lái)說(shuō)因惭,最初鍵盤是確定性交互岳锁,鼠標(biāo)是屬于感知層次。往智能上走蹦魔,語(yǔ)音識(shí)別激率、手勢(shì)識(shí)別這部分在感知以外加入了知識(shí)性學(xué)習(xí)咳燕。到第三部分,即情感智能乒躺,在執(zhí)行前還需要加上知識(shí)招盲,或者說(shuō)認(rèn)知。這也與人腦的三個(gè)部分嘉冒,即中樞神經(jīng)曹货、小腦和大腦相對(duì)應(yīng)。
智能和人機(jī)交互一樣讳推,也是按人也分層次顶籽,人機(jī)交互我們從傳統(tǒng)到智能也分層次,可以把它理解為消除不確定性银觅。越往上走礼饱,不確定性越大,尤其對(duì)意圖理解究驴,但是我們?cè)趺慈ハ餍鳎侨藱C(jī)交互上應(yīng)用的一個(gè)探討。
人機(jī)交互和人工智能協(xié)同共進(jìn)
人工智能和人機(jī)交互洒忧,都有“人”這個(gè)字蝴韭,對(duì)于二者的關(guān)系,史元春首先指出熙侍,這是中文說(shuō)法榄鉴,英文沒(méi)有這樣的詞,但二者的共性在于都是很早很明確地談到人機(jī)關(guān)系核行。
史元春教授認(rèn)為牢硅,人機(jī)交互應(yīng)該讓機(jī)器更好的適應(yīng)人蹬耘,適應(yīng)人的本性芝雪,適應(yīng)人的操控能力、感知能力和認(rèn)知能力综苔。從“人” 的研究?jī)?nèi)容上來(lái)說(shuō)惩系,人機(jī)交互與人工智能有差異,但出發(fā)點(diǎn)是一致的如筛,即“人機(jī)共生”堡牡。
目前看,人工智能的研究更多的體現(xiàn)在人的識(shí)別杨刨、語(yǔ)言的表達(dá)等數(shù)據(jù)密集型任務(wù)上的處理方法晤柄,人機(jī)交互的研究更偏重于對(duì)人的主動(dòng)交互行為和感知能力的建模、傳感和建立適應(yīng)的接口技術(shù)妖胀,人機(jī)關(guān)系必定向著共生的方向發(fā)展芥颈,這些研究?jī)?nèi)容和方法會(huì)相互影響和適應(yīng)惠勒,交疊的研究?jī)?nèi)容會(huì)越來(lái)越多。
“做人工智能最后要接觸人機(jī)交互爬坑,做人機(jī)交互最后也要接觸人工智能纠屋。”
田豐提到中國(guó)科學(xué)上有一篇觀點(diǎn)性的論文盾计,他指出售担,人機(jī)交互和人工智能在未來(lái)的趨勢(shì)會(huì)從交替沉浮走向協(xié)同共進(jìn)。國(guó)家人工智能發(fā)展規(guī)劃里一個(gè)核心研究點(diǎn)是人機(jī)協(xié)同署辉,人機(jī)協(xié)同也是人機(jī)交互未來(lái)的方向族铆。從人工智能角度講,自動(dòng)駕駛等也講人機(jī)協(xié)同哭尝,其實(shí)是殊途同歸的骑素。
曹翔指出,人工智能和人機(jī)交互的研究?jī)r(jià)值觀刚夺、出發(fā)點(diǎn)會(huì)略有不同献丑。人工智能根本上講,終極目標(biāo)是讓機(jī)器能做所有人能做的事情侠姑,人機(jī)交互則是指人和機(jī)器的合作创橄,兩者不矛盾,但是要看情境莽红。
針對(duì)人機(jī)交互研究對(duì)AI的貢獻(xiàn)妥畏,他指出,首先必須承認(rèn)AI對(duì)人機(jī)交互研究的貢獻(xiàn)安吁。從大趨勢(shì)上講醉蚁,機(jī)器學(xué)習(xí)中大量的人工標(biāo)注數(shù)據(jù)就是人機(jī)交互的過(guò)程。進(jìn)一步講鬼店,AI的一個(gè)挑戰(zhàn)在于可解釋AI网棍,最終擔(dān)心的是可不可被信任,解釋的原因是希望能夠放心地使用妇智。
某種意義上講也許解決AI可信任的問(wèn)題滥玷,在于創(chuàng)造一種方式,讓人和AI的系統(tǒng)在一個(gè)互動(dòng)過(guò)程中慢慢通過(guò)衡量判斷巍棱,可能這個(gè)恰恰是人機(jī)交互幫助解決所謂AI可解釋問(wèn)題的方法惑畴。
對(duì)于智能人機(jī)交互的暢想,史元春指出航徙,未來(lái)計(jì)算機(jī)的形態(tài)會(huì)變化如贷,甚至可能不存在了,但計(jì)算機(jī)技術(shù)會(huì)持續(xù)為我們服務(wù),成為人機(jī)共生的一部分杠袱,交互接口泻红、交互任務(wù)會(huì)有很大的變化,但會(huì)更自然霞掺,更智能谊路。
她把智能人機(jī)交互集中分為三類,一是手勢(shì)菩彬,然后是語(yǔ)音缠劝,還有可穿戴設(shè)備,包括手環(huán)骗灶、頭盔惨恭。在這三類上看到了很多新技術(shù)和新產(chǎn)品,但都還沒(méi)有成為主流耙旦,也就是說(shuō)脱羡,都存在一定的問(wèn)題。
比如語(yǔ)音交互免都,不光是識(shí)別率沒(méi)有達(dá)到百分之百锉罐,同時(shí)語(yǔ)音表達(dá)的帶寬和表達(dá)的數(shù)據(jù)類型還不完整,和空間有關(guān)的數(shù)據(jù)效率低绕娘、沒(méi)有精度脓规。此外,還有打擾险领、隱私等侨舆,都有很大的限定條件,穿戴更是這樣绢陌。
陳益強(qiáng)舉例穿戴設(shè)備可以附著于衣服和鞋子挨下,人機(jī)交互最終將實(shí)現(xiàn)人機(jī)共生。并且脐湾,在材料臭笆、技術(shù)的進(jìn)步下,能夠完全理解人類自然行為的意圖沥割,甚至幫助解決人口老齡化耗啦、阿爾茨海默病等凿菩。
曹翔根據(jù)自己目前的研究?jī)?nèi)容机杜,指出,要通過(guò)技術(shù)把每個(gè)人的創(chuàng)造力充分發(fā)揮出來(lái)衅谷,創(chuàng)造力在未來(lái)會(huì)成為生存和工作所不可或缺的一部分椒拗。
未來(lái)在輸出上或許能獲得更多體驗(yàn),比如把挖掘出更多感官體驗(yàn),不只是視覺(jué)和聽(tīng)覺(jué)領(lǐng)域蚀苛,甚至創(chuàng)造一個(gè)幻想的世界在验,這是十分有趣的。
田豐稱堵未,他對(duì)于如何通過(guò)人機(jī)交互的研究推動(dòng)產(chǎn)業(yè)發(fā)展更為關(guān)心腋舌,相關(guān)人口老齡化問(wèn)題已經(jīng)與協(xié)和醫(yī)院進(jìn)行了深入合作,通過(guò)對(duì)老年人的動(dòng)作進(jìn)行解讀渗蟹,提供量化的輔助診斷块饺。
針對(duì)人機(jī)交互人才的培養(yǎng),史元春指出雌芽,工業(yè)界是有需求的授艰,但是學(xué)術(shù)界還很迷茫。有博士生畢業(yè)后在工業(yè)界無(wú)法找到與專業(yè)十分匹配的職位世落,由于工業(yè)界的進(jìn)步會(huì)促使學(xué)術(shù)界對(duì)人才培養(yǎng)建立一套科學(xué)的方法淮腾。
史元春教授提到:“我們培養(yǎng)的人才應(yīng)該能夠發(fā)現(xiàn)交互難題,并且能通過(guò)科學(xué)的方法來(lái)解決這個(gè)問(wèn)題屉佳」瘸”
曹翔指出,交互設(shè)計(jì)師武花、用戶研究員等對(duì)口培養(yǎng)的專業(yè)徘禁,不難找工作;難找工作的是把人機(jī)交互作為一個(gè)研究領(lǐng)域去學(xué)習(xí)的學(xué)生髓堪,因?yàn)楝F(xiàn)有的一個(gè)蘿卜一個(gè)坑的職業(yè)體系送朱,并不太適合跨學(xué)科的人才,但創(chuàng)業(yè)特別需要這樣的人干旁。