最近一段時間,「AI 寒冬將至」、「AI 泡沫即將破裂」的聲音此起彼伏铅祸。AI 的發(fā)展也確實遇到了一些瓶頸匾二,以至于不少人對通用人工智能的實現(xiàn)望洋興嘆。本文作者也認(rèn)可這些局限的存在,但同時他也指出,如果努力發(fā)展以人為中心的人工智能應(yīng)用,這一領(lǐng)域也將結(jié)出碩果母市。
我們周圍關(guān)于人工智能的炒作正在逐步降溫,接下來我們要關(guān)注是將以人為中心的機器學(xué)習(xí)技術(shù)應(yīng)用于重要問題的大豐收损趋!
我喜歡對關(guān)于人工智能的炒作吐槽患久,下面是前幾天的一篇推文:
MIT 展示了一個會玩疊疊樂的機器人(參見:MIT 的機器人會玩疊疊樂了!手殘的你怕不怕浑槽?)
機器人不會教它自己怎么玩疊疊樂(Jenga)游戲蒋失。我到現(xiàn)在也沒有讀過這篇文章,但有些人決定教機器人去玩 Jenga桐玻。人類付出巨大努力開發(fā)了一個讓機器人能夠利用某種數(shù)據(jù)進行學(xué)習(xí)的系統(tǒng)篙挽。最有可能用到的數(shù)據(jù)來自于人類的試驗,或者可能人們建立了適當(dāng)?shù)膹娀瘷C制讓機器可以通過「自己玩游戲」來學(xué)習(xí)镊靴。
類似的铣卡,在 2020 年之前,汽車也不會自動駕駛偏竟。語音識別語音識別也沒有達到與人類相媲美的水平煮落。亞馬遜的「Alexa」也不是一個對話性的系統(tǒng)。目前的計算機視覺技術(shù)不能解決任意的視覺問題踊谋。我們還沒有面臨具有自我意識的殺手機器人的危險蝉仇。
一些人看到一個又一個曾經(jīng)的預(yù)言失敗了,就認(rèn)為另一個「人工智能的冬天」可能即將到來,但這并不會發(fā)生轿衔。當(dāng)年人工智能之所以進入寒冬沉迹,是因為盡管有大量的炒作,但是其背后還沒有太多的理論支撐害驹。近一段時間以來胚股,在這樣的炒作之下也誕生了很多重要的工作。人們認(rèn)為 Alexa 是一種對話式的智能體裙秋,但它實際上只是一個更好的麥克風(fēng),是一種在工程中已經(jīng)被普遍應(yīng)用的基于規(guī)則的系統(tǒng)缨伊,而且它確實在某種程度上是由深度神經(jīng)網(wǎng)絡(luò)賦能的更好的語音識別系統(tǒng)摘刑。「連線」雜志表示刻坊,深度學(xué)習(xí)是貪婪的枷恕、脆弱的、不透明的谭胚、膚淺的徐块,這些說法沒有問題,但是即使有這些限制灾而,很多重要的東西還是可以實現(xiàn)的胡控。
目前實用性的人工智能技術(shù)更多地是探討我們?nèi)绾涡问交x問題以及我們能收集到什么數(shù)據(jù),而不是以新奇的模型為出發(fā)點——在技術(shù)層面上旁趟,今天的「人工智能」是與網(wǎng)絡(luò)昼激、系統(tǒng)以及數(shù)據(jù)庫息息相關(guān)的,正如它與新算法緊密相關(guān)一樣锡搜。最終橙困,人工智能技術(shù)還是圍繞人類展開的。
人類的表現(xiàn)是「被過度炒作」的人工智能技術(shù)的對比基準(zhǔn)(也就是說有些方法已經(jīng)在某些問題上可以與人類相媲美)耕餐。然而凡傅,被過度炒作的人工智能技術(shù)卻在很大程度上忽視了與人相關(guān)的因素。不過肠缔,它們也無法再被忽視了夏跷,因為當(dāng)人工智能技術(shù)朝著更實際的應(yīng)用方向發(fā)展而不能取得進展時,與人相關(guān)的因素又會重新回到前沿明未⊥卮海考慮到人的因素時,炒作就會減弱亚隅。當(dāng)你考慮到除了在光照良好硼莽、路況熟悉的道路上行駛,系統(tǒng)還要顧及人類駕駛員面臨的其他狀況時,自動駕駛汽車似乎不太可能實現(xiàn)懂鸵。人類駕駛員會尋找乘客偏螺,他們會去加油,有時還會去修車匆光,他們要確保喝醉的乘客沒有危險套像,他們要送老年乘客去醫(yī)院,等等终息。
我們已經(jīng)越過了炒作「使用人工智能模仿人類的表現(xiàn)」的時代夺巩,轉(zhuǎn)向更實際的以人為中心的機器學(xué)習(xí)應(yīng)用。如果炒作是冰山一角的快速融化周崭,那么以人為中心的偉大的應(yīng)用工作就是漂浮在下方柳譬、支撐一切的巨大冰山。
統(tǒng)計模式識別和非確定性的人類
幾天前续镇,我在推特上沉思道:如果我們不再將這個領(lǐng)域稱為「人工智能」美澳,轉(zhuǎn)而使用更加具體和準(zhǔn)確的術(shù)語「統(tǒng)計模式識別」,那么現(xiàn)在的這種炒作是否會消失呢摸航?
其他人則有不同的看法——Judea Pearl 認(rèn)為我們需要能夠進行因果推理的新方法制跟,Pedro Domingos 正在尋找「終極算法」,其他人則希望能夠超越「與動物相類似的能力的認(rèn)知功能優(yōu)化」酱虎,并促使我們朝著與人類同等水平的智能進發(fā)雨膨。
不管它是如何構(gòu)建的,這些討論之所以發(fā)生读串,是因為「人工智能」傳達了一種智能的概念——人類的智能哥放,這是目前的方法無法滿足的。我們的系統(tǒng)往往缺乏常識爹土、跨領(lǐng)域類比的能力甥雕、推理因果關(guān)系的能力,以及與非確定性的人類進行流暢的模仿和互動所必需的智能的其它組成部分 [1]胀茵。
統(tǒng)計模式識別是一個非常強大的工具社露。為了充分利用這一優(yōu)勢,我們需要進行艱苦的工作琼娘,找出既足夠重要又足夠有針對性的問題峭弟,從而使統(tǒng)計模式識別(SPR)方法能夠很好地發(fā)揮作用。發(fā)現(xiàn)重要的問題脱拼,將它們映射到從計算的角度來說容易處理的解決方案瞒瘸,收集有意義的數(shù)據(jù)集,設(shè)計對人們有意義的交互熄浓,這些都是以人為中心的智能(HCI)及其內(nèi)在方法的亮點情臭。
HCI 是我認(rèn)為人工智能這次遭遇的將不是冬天而是秋天的原因。能夠應(yīng)用機器學(xué)習(xí)技術(shù)來解決實際人類問題的人將成為最重要的技術(shù)人員。越來越多的易用庫能夠提供功能強大的機器學(xué)習(xí)技術(shù)俯在;如果你想保持領(lǐng)先竟秫,你需要我們在 HCI 課程中教授的技能。
如果你的目標(biāo)是熬過人工智能的冬天跷乐,希望有一天能開發(fā)出真正智能的人工智能肥败,那么就打破深度學(xué)習(xí)和實際應(yīng)用的束縛,勇敢前行愕提。
如果你的目標(biāo)是收獲豐厚的回報馒稍,那么就去學(xué)習(xí) HCI 技術(shù)吧。
HCI 如何在人工智能的豐收中獲利浅侨?
HCI 的優(yōu)勢來自對多個學(xué)科的結(jié)合——至少涉及到計算機科學(xué)纽谒、設(shè)計和行為科學(xué)(心理學(xué)、認(rèn)知科學(xué)等)仗颈。精通 HCI 的人可以使用各種以人為中心的方法來理解現(xiàn)在,設(shè)計和實現(xiàn)未來椎例,并驗證這些未來的設(shè)想挨决。就像在大多數(shù)領(lǐng)域一樣,從業(yè)人員是專門化的订歪。例如脖祈,有人可能專門研究當(dāng)前人們使用的技術(shù),或者專門設(shè)計預(yù)測性的或刺激性的未來刷晋,或者為人們使用的未來技術(shù)系統(tǒng)構(gòu)建原型盖高。
下面,本文將給出一些我認(rèn)為 HCI(以及相關(guān)的)研究和實踐將在人工智能的秋天收獲頗豐的一些領(lǐng)域眼虱,無論未來幾十年在真正的智能機器方面會有什么進展喻奥,它們都將扮演一定角色:
支撐人類的智能應(yīng)用
隨著機器學(xué)習(xí)方法被更好的理解,并被更好地打包成工具捏悬,最大的挑戰(zhàn)將轉(zhuǎn)變?yōu)槿绾螌⑺鼈儜?yīng)用于實際的與人類相關(guān)的問題撞蚕。這就是 HCI 的優(yōu)勢所在!
在人工智能發(fā)展的早期过牙,智能機器的關(guān)注點在于智能增強(IA)甥厦,正如 Vannevar Bush 在「As We May Think」中所描述的那樣。我們將 Douglas Engelbart 奉為「鼠標(biāo)之父」寇钉,但他在「Mother of All Demos」中著重討論了計算技術(shù)如何才能夠普遍地增強人類智能刀疙。Engelbart 對此進行了廣泛的討論。有一段時間扫倡,該領(lǐng)域被稱為「智能用戶界面」谦秧,這也成為了該領(lǐng)域的一個著名會議的名稱。現(xiàn)在,隨著人工智能(以及不切實際的通用人工智能)的局限性逐漸凸顯油够,「人類增強」的概念正變得越來越流行蚁袭,閱讀這本較老的著作是值得的,因為其中的許多見解都具有深遠(yuǎn)的相關(guān)性石咬。
HCI 正在努力解決支持人類的難題——收集和擴展新的數(shù)據(jù)集揩悄;找出人和機器協(xié)作的新方法;創(chuàng)造出使設(shè)備和世界能更易被理解的系統(tǒng)鬼悠,無論人的能力如何删性;為交互和健康創(chuàng)建機器學(xué)習(xí)技術(shù)賦能的傳感系統(tǒng);并致力于打造能夠幫助人們更好地創(chuàng)建機器學(xué)習(xí)模型的系統(tǒng)焕窝。
這一領(lǐng)域的挑戰(zhàn)和影響與這樣一個事實有關(guān)蹬挺,即它的根本目的是創(chuàng)造和解決新的問題,而不是改進現(xiàn)有問題的解決方案它掂。因此巴帮,整個過程可以被視為發(fā)現(xiàn)和驗證一個問題、迭代地提出潛在的解決方案虐秋、對這些解決方案進行原型化和精細(xì)化榕茧、最后驗證該解決方案是否解決了預(yù)期的問題。
隨著機器學(xué)習(xí)算法被商品化客给,那些能夠在整個機器學(xué)習(xí)的應(yīng)用過程中發(fā)揮作用的算法將是最有價值的用押。
設(shè)計和人工智能
HCI 的從業(yè)人員一直站在前沿,思考人類將如何與人工智能互動靶剑,以及如何做一些工作來讓人類有效地與人工智能互動蜻拨。你可以在 90 年代 Pattie Maes 和 Ben Schneiderman(HCI 先驅(qū))之間的「智能體 vs 直接操作」(agents vs. direct manipulation)的辯論中看到這一點。Ben 接著創(chuàng)建了信息可視化領(lǐng)域桩引,從方法論的層面回應(yīng)人類如何與日益豐富的數(shù)據(jù)和復(fù)雜的世界直接互動缎讼。
在人工智能和 HCI 的交叉領(lǐng)域工作的人們很久以前就意識到,構(gòu)建包含「人工智能」元素的用戶界面有一些不同之處坑匠,尤其是由于人工智能是不確定的休涤,而且常常是不正確的。Eric Horvitz 和其他人將其稱之為「混合主動交互」(Mixed-Initiative Interaction)笛辟。你可以在一篇發(fā)表在 1999 年的 CHI 會議上的經(jīng)典論文《Principles of Mixed-Initiative User Interfaces》中讀到這一點功氨,盡管我也喜歡下面的這個版本《Mixed-initiative interaction》,其中包括 James Allen 等對話式人工智能大牛的一些評論手幢。Eric 和 Saleema Amershi 等新作者在他們的 CHI 2019 的論文《Guidelines for human-AI Interaction》中對此進行了新的論述捷凄。
從某種程度上說,人類往往只在火燒眉毛時才思考围来,那就太遲了跺涤。一位我不確定是否應(yīng)該提及的同事這樣描述:「很多工作都在研究如何給人工智能豬涂口紅」匈睁。因此,如今設(shè)計和人工智能的研究前沿是理解設(shè)計師如何才能使用機器學(xué)習(xí)作為設(shè)計材料桶错。其中很大一部分是教設(shè)計師如何思考機器學(xué)習(xí)航唆。這不僅關(guān)乎如何將用戶接入不確定的人工智能結(jié)果:它考慮的是應(yīng)該解決什么問題;什么機器學(xué)習(xí)方法與人類預(yù)期的問題相匹配院刁;針對于特定的用例糯钙,哪些問題可以被很好地解決。
設(shè)計正迅速成為同類產(chǎn)品之間的差異所在退腥;因此任岸,那些最擅長機器學(xué)習(xí)的設(shè)計師將提供最大的價值。
計算社會科學(xué)
機器學(xué)習(xí)正在我們所做的每一件事中發(fā)揮作用狡刘,因此我們需要仔細(xì)思考機器學(xué)習(xí)的意義享潜,以及我們可以做些什么來減輕它的負(fù)面影響。計算社會科學(xué)家為我們帶來的方法往往更傾向于面向?qū)θ祟惖难芯啃崾撸褂?HCI 中教授的各種技術(shù)剑按,并借鑒心理學(xué)和認(rèn)知科學(xué)等基礎(chǔ)領(lǐng)域的方法(如調(diào)查、訪談澜术、日志分析和人種學(xué))艺蝴。
這些技術(shù)已經(jīng)對用戶如何理解(或誤解)與之交互的算法產(chǎn)生了難以置信的深遠(yuǎn)影響(例如,F(xiàn)acebook 的新聞 feed 流瘪板;YouTube 的推薦系統(tǒng)如何鼓勵極端主義吴趴;社交媒體虛假新聞的識別機制漆诽;用戶界面的元素如何影響在線言論侮攀;用戶對在線隱私的認(rèn)識,等等)厢拭。
HCI 技術(shù)在識別或解決此類問題上并沒有處于壟斷地位兰英,但考慮到我們也是開發(fā)者和設(shè)計師,它在揭露和干預(yù)這些問題上確實有獨一無二的地位供鸠。
結(jié)語
「埋頭苦干做好高質(zhì)量的工作畦贸,一切都會好起來,對嗎楞捂?薄坏!」... 總的來說,在人工智能領(lǐng)域寨闹,越來越明顯的現(xiàn)象是:人工智能的秋天即將到來胶坠,為了做好準(zhǔn)備,你需要在 HCI 可以大展身手的領(lǐng)域和方法上有所提升