中國 AI 明星說,社會必須做好準(zhǔn)備應(yīng)對前所未有的工作沖擊
...風(fēng)險投資人和前AI研究人員李開復(fù)討論了AI的影響揍瑟,以及為什么將對世界產(chǎn)生巨大影響...
中國風(fēng)險投資家李開復(fù)接受Edge采訪時表示白翻,現(xiàn)在的 AI 系統(tǒng)將對世界經(jīng)濟產(chǎn)生巨大的影響,以致造成像另一次工業(yè)革命般的后果绢片。 “未來十五到二十年里我們都將面臨一個非常具有挑戰(zhàn)性的問題滤馍,一半的工作將被機器所取代,人類從來沒有見過這樣大規(guī)模的工作消失底循。而工業(yè)革命造成同樣效果卻花了更長時間巢株, “ 他說。
他還表示熙涤,他擔(dān)心深度學(xué)習(xí)可能只是一個小把戲阁苞,因為我們不能期望在未來幾年會出現(xiàn)其他類似的突破,而是應(yīng)該在此基礎(chǔ)上調(diào)整對AI進展的看法祠挫。 “你不能繼續(xù)預(yù)測明年會有突破那槽,然后是下一個月,然后下一天等舔,那將是指數(shù)級骚灸。指數(shù)發(fā)明的想法本身就是一個荒謬的概念,我認為那些提出這些要求和聲稱奇點的人软瞎,只是基于完全沒有工程實際的猜測逢唤,“ 他說拉讯。
AI 有還是沒有:
他說,在人工智能時代鳖藕,像中國和美國這樣擁有大量人口和大量人工智能投資的國家已經(jīng)取得了不錯的成績魔慷。 “那些狀況不佳的國家可能是人口眾多的國家,但沒有人工智能著恩,沒有技術(shù)院尔,沒有Google,沒有騰訊喉誊,沒有百度邀摆,沒有阿里巴巴,沒有Facebook伍茄,沒有亞馬遜栋盹。這些人基本上只能成為數(shù)據(jù),這些數(shù)據(jù)指向軟件在其國家中占主導(dǎo)地位的國家敷矫±瘢“
更多:We Are Here To Create, A Conversation With Kai-Fu Lee(Edge)
伯克利研究人員用 Soft Q-Learning 讓機器人們成為任務(wù)解決小能手:
...研究減少了機器人學(xué)習(xí)新行為所需的時間...
最近,伯克利研究員們想出了如何用 Soft Q-Learning(最近提出的傳統(tǒng) Q-Learning 變體)來讓機器人更有效地學(xué)習(xí)曹仗。他們引入了一個新的技巧榨汤,可以學(xué)習(xí)如何從現(xiàn)有的學(xué)習(xí)策略中編寫出新的q函數(shù)。例如怎茫,訓(xùn)練一個機器人將其手臂移動到具有特定分布的 X 位置收壕,然后到有特定分布的 Y 位置,之后可以創(chuàng)建一個新的策略轨蛤,能將機械臂移動到 X 和 Y 位置的交叉部分蜜宪,而不需要在類似數(shù)據(jù)集上訓(xùn)練。
通常這種學(xué)習(xí)很難在單一策略中實現(xiàn)俱萍,因為它需要進行非常多的探索端壳,以至于大多數(shù)算法會花費很長時間進行試錯,并且無法完成任務(wù)成功枪蘑。
真實世界:
研究人員訓(xùn)練機器人來完成任務(wù),如在特定位置堆疊樂高積木岖免。他們展示了通過分別訓(xùn)練機器人避開其手臂附近的障礙物和堆砌樂高積木岳颇,然后結(jié)合這兩個策略,使得機器人能在避開障礙物的情況下堆積木颅湘,即使之前從未接受過這樣的訓(xùn)練組合话侧。
為何重要:
過去幾年 AI 的進步讓我們非常善于開發(fā)擅長單一任務(wù)的系統(tǒng); 如果能夠以組合這些單一能力來產(chǎn)生新的行為的話,那么就能進一步增加 AI 系統(tǒng)的能力闯参,并且使得可以學(xué)習(xí)一些基本行動瞻鹏,然后將它們鏈接起來找到更復(fù)雜任務(wù)的解決方法悲立。
更多:Composable Deep Reinforcement Learning for RoboticManipulation (Arxiv).
Salesforce 研究人員展示了簡化語言建模的價值:
...精心試調(diào)后的基于簡單 LSTM 或 QRNN 的系統(tǒng)勝過更復(fù)雜的系統(tǒng)...
Salesforce 的研究人員已經(jīng)表明,經(jīng)過良好調(diào)整的基本 AI 組件在很多情況在困難的語言任務(wù)上比更復(fù)雜的系統(tǒng)取得更好結(jié)果新博。他們的研究表明薪夕,基于RNN的系統(tǒng)通過用精心調(diào)整的簡單組件(如LSTM)或 Salesforce 發(fā)明的QRNN來就可以超越更加復(fù)雜的模型如 recurrent highway network,hyper network 或通過神經(jīng)架構(gòu)搜索找到的一些系統(tǒng)赫悄。
這一結(jié)果表明原献,人工智能近期的許多進展可能在某種程度上是虛假的:之前假設(shè)某個新模型在某個數(shù)據(jù)集上取得很好成績,是因為具有某些新能力埂淮,而如今顯示經(jīng)過細心調(diào)整和測試的簡單組件也能姑隅。
結(jié)果:
研究人員針對 Penn Treebank 和 enwik8 字符級數(shù)據(jù)集以及單詞級 WikiText-103 數(shù)據(jù)集測試了基于QRNN和LSTM的系統(tǒng),在 Penn Treebank 和 enwik8 上超越了當(dāng)前最好的系統(tǒng)倔撞,而在WikiText-103上的困惑度也顯著的優(yōu)于 SOTA 系統(tǒng)讲仰。
為什么重要:
如之前很多研究表明,現(xiàn)有的許多 AI 組件比研究人員想的可能更強大痪蝇,并且像 GAN 或 DCGAN 這樣的老系統(tǒng)可以比復(fù)雜的后繼系統(tǒng)能更有效地建模數(shù)據(jù)分布鄙陡。這并不是說這就應(yīng)該把后來的一些發(fā)當(dāng)做是無用功,而是提醒研究人員應(yīng)該花更多的時間來調(diào)查和調(diào)整現(xiàn)有系統(tǒng)霹俺,而不是試圖發(fā)明不同的“新系統(tǒng)”柔吼。
“快速且且精調(diào)過的基線是我們研究社群中的重要組成部分,沒有這些基線丙唧,就失去了準(zhǔn)確衡量我們進展的能力愈魏。通過擴展現(xiàn)有的基于 LSTM 和 QRNN 的最先進詞級語言模型,我們表明想际,一個良好的調(diào)整基線可以在不依賴復(fù)雜或?qū)iT架構(gòu)的情況下培漏,在字符級別(Penn Treebank,enwik8)和單詞級別(WikiText-103)數(shù)據(jù)集上實現(xiàn)最先進的結(jié)果胡本∨票“ 他們寫道。
更多:An Analysis of Neural Language Modeling at MultipleScales (Arxiv).
想要測試你的 AI 能多好的理解語言和圖像嗎侧甫?那來試試 VQA 2.0 吧
...用來測試 AI 系統(tǒng)同時處理語言和圖像的新挑戰(zhàn)來了...
AI 研究人員認為他們已經(jīng)開發(fā)出可以模擬語言和圖像之間關(guān)系的模型的珊佣,或許會想試試 VQA (視覺問答)挑戰(zhàn)的第三次更新。挑戰(zhàn)會讓模型回答關(guān)于圖像內(nèi)容的問題披粟。挑戰(zhàn)者將使用VQA數(shù)據(jù)集的v2.0版本咒锻,其中包括更多關(guān)于圖像的的問題和正確答案。
更多:VQA Challenge 2018 launched! (VisualQA.org).
認為 AI 模型對物理有很好的理解守屉?在IntPhys上運行它惑艇,準(zhǔn)備滴汗吧!
...用我們測試嬰兒和生物的方式測試AI系統(tǒng)...
INRIA,F(xiàn)acebook以及CNRS的研究人員發(fā)布了IntPhys滨巴,這是一種評估AI系統(tǒng)對物理世界進行建模的能力思灌,研究人員稱之為“物理合理性測試”。 IntPhys遵循AI的最新趨勢恭取,測試系統(tǒng)更嚴(yán)峻的問題泰偿,這些問題更貼近人類需要解決的各種問題(請參閱AI2'ARC'用于書面推理的數(shù)據(jù)集以及DeepMind認知科學(xué)啟發(fā)的'PsychLab'環(huán)境)。
它是如何工作的:
IntPhys給人工智能系統(tǒng)提供了使用UnrealEngine4渲染的電影場景秽荤,并讓他們挑戰(zhàn)想出一個場景是否會引出另一場景甜奄,從而讓他們測試模型內(nèi)化世界的基本概念的能力,如對象持久性窃款,因果關(guān)系等课兄。系統(tǒng)需要為每個場景或場景組合顯示每個場景或“場景組合”的“可信度分?jǐn)?shù)”,然后使用它來確定系統(tǒng)是否了解了世界底層動態(tài)晨继。
IntPhys基準(zhǔn):
IntPhys的v1版?zhèn)戎赜跓o監(jiān)督學(xué)習(xí)烟阐。第一個版本測試系統(tǒng)理解對象持久性的能力。未來版本將包括更多測試紊扬,如形狀恒定性蜒茄,時空連續(xù)性等。最初的IntPhys發(fā)布包含15,000個可能事件的視頻餐屎,每個視頻長達7秒檀葛,每秒15fps,共計21小時的視頻腹缩。它還包含一些附加信息屿聋,因此不必嘗試純粹無監(jiān)督的方式解決任務(wù),包括每個圖像的景深數(shù)據(jù)以及目標(biāo)實例分割掩碼藏鹊。
基線系統(tǒng) VS 人類:
研究人員為其他人創(chuàng)建兩條基線來評估他們的系統(tǒng):CNN編碼器 - 解碼器系統(tǒng)和條件GAN润讥。 “從進行像素級預(yù)測的初步工作中表明,我們的模型未能預(yù)測令人信服的目標(biāo)運動盘寡,特別是對于豐富背景下的小型目標(biāo)楚殿。因此,我們轉(zhuǎn)而使用目標(biāo)掩碼來更高級地計算預(yù)測竿痰〈嘀啵”研究人員在他們的系統(tǒng)上測試了人類影涉,發(fā)現(xiàn)當(dāng)場景可見時冠绢,人類的平均錯誤率約為8%,當(dāng)場景包含部分阻塞時常潮,平均錯誤率為25%。相比之下楷力,基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)在可見場景中出現(xiàn)31%的錯誤喊式,在部分被遮擋的場景出現(xiàn)50%的錯誤孵户。
計算機遇到的問題是:
“在2-4個月時間里,嬰兒能夠根據(jù)持久岔留,固體和時空連續(xù)的物體分析視覺輸入夏哭,6個月時,他們理解穩(wěn)定性献联,支持和因果關(guān)系的概念竖配,8到10歲幾個月后,他們掌握了重力里逆,慣性和碰撞動量守恒的概念进胯,10到12個月內(nèi),形狀穩(wěn)定性等等原押,“研究人員寫道胁镐。
為什么重要:
像這樣的測試會給我們更好的能力,來模擬AI系統(tǒng)執(zhí)行基本推理行為的能力诸衔。并且隨著研究人員使用更具挑戰(zhàn)性的組件擴展基準(zhǔn)盯漂,我們將能夠更好地解讀這些系統(tǒng)實際的能力。隨著新組件的增加笨农,“預(yù)測任務(wù)將變得越來越困難就缆,逐漸達到一歲人類所達到的場景理解水平”,他們寫道谒亦。
競爭:
AI研究人員可以下載數(shù)據(jù)集并將他們的系統(tǒng)分?jǐn)?shù)提交給官方IntPhys網(wǎng)站(IntPhys)的在線排行榜竭宰。
閱讀更多:
IntPhys:IntPhys: A Framework and Benchmark for Visual IntuitivePhysics Reasoning (Arxiv).
人工智能從業(yè)人員正在抓住即將到來的信息啟示:
...認為 DeepFakes不好。等到 DeepWar...
人工智能社區(qū)的成員開始對即將到來的震撼人心的聲音發(fā)出警報诊霹,制作合成圖像和視頻變得驚人地逼真羞延,驚人地容易。在一篇博客文章中脾还,人工智能從業(yè)者表示伴箩,隨著數(shù)據(jù)量的增加以及易于訪問的AI基礎(chǔ)設(shè)施(云出租圖形處理器)的出現(xiàn),正在降低制造這種媒體材料的入門門檻鄙漏,并且人工智能能力的持續(xù)進步意味著這些假媒體的質(zhì)量隨著時間的推移正在增加嗤谚。
我們?nèi)绾翁幚磉@些信息威脅?
我們可以看看社會如何通過高成本地生產(chǎn)高保真副本以及并行開發(fā)技術(shù)來驗證貨幣材料的真實性怔蚌,從而難以偽造貨幣巩步。不幸的是,盡管這可能有助于解決人工智能偽造帶來的一些問題桦踊,但它并沒有解決根本問題:人工智能主要體現(xiàn)在軟件而不是硬件上椅野,因此難以插入可檢測(非偽造)視覺分辨/音頻簽名到生成的媒體中,禁止某種DRM-on-steroids。一種解決方案可能是對來自相同域的真實和偽造數(shù)據(jù)集的訓(xùn)練AI分類器竟闪,以便提供在野外發(fā)現(xiàn)偽造媒體分類器离福。
Read more:Commoditisation of AI, digital forgery and the end oftrust: how we can fix it.