From Import AI
本期編輯小D非常給力雅镊,很用心的完成自己那部分的翻譯。
希望再接再厲刃滓,一起加油 _仁烹。
緊急問題
如何面對AI的惡意使用:
當(dāng)好人們天真地開源了AI系統(tǒng)時,壞人們卻可能通過修改它咧虎,將好的AI轉(zhuǎn)化為不好的AI...
人工智能卓缰,特別是深度學(xué)習(xí),是種非常強大且有效的技術(shù)砰诵。這使得一些不懷好意的人可能會將其用于壞的用途征唬。這基本上是所有重要技術(shù)需注意的:斧頭可用于砍樹也可以用來砍頭,電可以照亮家中也可以電死人茁彭,實驗室工作臺可用于做療藥也可以用來做毒藥...总寒。
但與這些不同的是,AI還有些很危險的特性:即 Rodney Brooks 過去用來描述機器人的一句話:“快速理肺,廉價摄闸,失控”。如今的AI系統(tǒng)運行在通用硬件上哲嘲,大都可以用開源軟件來實現(xiàn)贪薪,同時隨著底層算法和計算力的進步可以看到性能的顯著提高。
這些大家都是能夠直接接觸的眠副,這意味著該技術(shù)有可能在做出巨大貢獻同時画切,造成巨大的傷害。目前AI社區(qū)幾乎讓所有東西變成公開囱怕,雖然今天這看起來還是合理的霍弹,但未來可能就會變成大的危害,因為摩爾定律還有算法的進步(這意味著個人用更少的計算資源就能訓(xùn)練一個AI系統(tǒng)了)娃弓。
萬用警報:
AI不僅僅是一種“兩用”技術(shù)典格,而是一種萬金油的技術(shù)。意味著目前搞清如何管理它台丛,以防止壞人做壞事(大多數(shù)情況下)還很難做到耍缴。相反砾肺,更需要探索新的治理制度,社區(qū)規(guī)范防嗡,信息共享標(biāo)準(zhǔn)等等变汪。
101頁的問題報告:
如果您有興趣深入了解這個問題,請查看眾多研究人員花了去年一年時間制作的報告:The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and Mitigation (Arxiv)蚁趁。還可以通過這篇OpenAI的博文查看摘要裙盾。
百度可以通過少數(shù)樣本克隆你的聲音:
...真相只有一個...
百度研究所訓(xùn)練出了一種AI系統(tǒng),可以通過少量的單人聲音樣本他嫡,微調(diào)神經(jīng)網(wǎng)絡(luò)然后輸出聽起來就像是這個人的聲音番官。這種系統(tǒng)可能會非常強大,尤其是創(chuàng)建適用于多口音的多用戶AI服務(wù)時钢属。
然而細思極恐徘熔,如果它的性能變得非常好的話,那我們對聲音的信任將會完全喪失署咽〗辏可幸的是,現(xiàn)在克隆語音的能力仍然有很大的不足宁否,最好的系統(tǒng)也需要一百個不同的語音樣本窒升,而且聽起來就像是從井底發(fā)出的聲音,所以離我們真正遇到問題還有一段距離 - 但也要記住它們即將到來慕匠。
意味著什么:
這意味著將來不懷好意者可以將你的聲音錄下來饱须,然后用文本到語音生成現(xiàn)成的對話。一旦這個時代到來台谊,那么對聲音的信任還有一個人的聲音樣本價值將會完全改變蓉媳。
結(jié)果:為了更好地了解結(jié)果,可以聽聽這個示例(聲音克鹿Α:百度)酪呻。
更多:Neural Voice Cloning with a Few Samples (Baidu Blog).
為何未來機器人可能會被用作行人的減速帶:
...研究人員展示了人們在巡邏機器人面前放慢腳步...
新澤西州霍博肯市史蒂文斯理工學(xué)院電氣與計算機工程系的研究人員已經(jīng)研究過人群對機器人的反應(yīng)。他們?yōu)樘骄繖C器人輔助行人流量調(diào)節(jié)盐须,在出口處設(shè)置的被動式人機交互(HRI)的研究玩荠。
結(jié)果:
“我們的實驗結(jié)果表明,在出口通道環(huán)境中贼邓,機器人在與單向行人流垂直的方向上移動會減慢單向流動速度阶冈,機器人移動得越快, 平均行人速度變得更快塑径,而且女坑,當(dāng)人們以更快的速度行走時,機器人對行人速度的影響更為顯著统舀,”他們寫道匆骗。 換句話說:行人會避免一個笨拙的機器人在他們面前移動劳景。
方法:
為了進行實驗,研究人員使用定制的“Adept Pioneer P3-DX移動機器人”碉就,它的程序被編程為以不同的速度垂直于行人流方向移動枢泰。為了收集數(shù)據(jù),他們在房間內(nèi)配備了五個Microsoft Kinect 3D傳感器進行行人探測以及通過OpenPTrack進行追蹤铝噩。
意味:
由于低成本化的傳感器和硬件平臺的激增,機器人變得便宜窿克,人們很可能會將更多的機器人部署到現(xiàn)實世界中骏庸。 弄清楚這些非常愚笨的非反應(yīng)式機器人如何變得有用,將進一步推動這些技術(shù)的應(yīng)用年叮,并增加經(jīng)濟規(guī)模以進一步降低硬件平臺的成本并增加技術(shù)的推廣具被。 基于這項研究,您可能會期待未來的機場和交通系統(tǒng)只损,在擁擠的路線上擠滿了機器人往返穿梭一姿,通過自動化機器人施加隱性的人群速度控制。
更多: Pedestrian-Robot Interaction Experiments in an Exit Corridor (Arxiv).
茶杯和AI:
... Google Brain的Eric Jang通過短篇故事解釋了AI的難度...
你如何定義一個茶杯跃惫? 這是一個棘手的問題叮叹。 而且,越多嘗試通過特定的視覺屬性來定義它爆存,就越有可能提供一種受到限制的狹義描述蛉顽,或者遇到一個遲鈍的讀者。這些是Eric Jang在嘗試定義茶杯這個有趣的小故事中探索的一些問題先较。
更多:
Teacup (Eric Jang, Blogspot.)
為什么在強化學(xué)習(xí)的幫助下携冤,可以向你發(fā)送一輛自駕車?
...合作的研究人員與中國著騎行巨頭滴滴出行合作闲勺,為了策略性車輛分配曾棕,模擬和測試RL算法...
來自中國騎行巨頭滴滴 出行和密歇根州立大學(xué)的研究人員發(fā)表了關(guān)于使用強化學(xué)習(xí)來更好地管理跨給定城市區(qū)域的車輛分配的研究。 研究人員提出了兩種算法來解決這個問題:contextual multi-agent actor-critic (cA2C)
和 contextual deep Q-learning (cDQN)
這兩種算法都實施了調(diào)整菜循,考慮地理禁區(qū)(如湖泊)以及其他協(xié)作智能體的存在翘地。 算法的獎勵功能是“通過將可用車輛重新定位,需供差距大于當(dāng)前位置的地點债朵,使平臺的總商品量(GMV:所有訂單的價值)最大化”子眶。
數(shù)據(jù)集和環(huán)境:
研究人員在一個定制設(shè)計的大規(guī)模電網(wǎng)世界中測試他們的算法,這個世界充滿了來自滴滴出行車隊管理系統(tǒng)的真實數(shù)據(jù)序芦。 這些數(shù)據(jù)連續(xù)四周的中國成都的游樂設(shè)施臭杰,包括訂單價格,出發(fā)地谚中,目的地和時間等信息渴杆,以及真實滴滴車輛的軌跡和狀態(tài)寥枝。
結(jié)果:
研究人員通過模擬過去真實的情景來測試他們的方法,而不需要車隊管理; 包括T-SARSA磁奖,DQN囊拜,Value-Iteration等一系列不同的技術(shù); 然后通過實施基于RL的方法。CDQN和c2A2C的回報率高于所有基準(zhǔn)線比搭,其表現(xiàn)略高于(即略高于統(tǒng)計誤差閾值)存量DQN冠跷。
為什么重要:
歡迎來到平臺資本主義的新時代,在這個時代身诺,GPU以最高速度嗡嗡作響蜜托,模擬替代版的商業(yè)世界。 雖然本文中的結(jié)果并不特別令人驚訝霉赡,但它們表明了未來平臺公司將如何接近AI系統(tǒng)的部署:盡可能多地收集數(shù)據(jù)橄务,構(gòu)建一個基本模擬器,以便將實際數(shù)據(jù)插入穴亏,然后大力測試AI算法蜂挪。 這表明,平臺越大嗓化,數(shù)據(jù)和計算資源就越能夠承受越來越高的保真度模擬; 所有的事情都是平等的棠涮,誰能夠建立最高效和準(zhǔn)確的模擬器就將可能是他們在市場上最好的競爭對手。
更多: Efficient Large-Scale Fleet Management via Multi-Agent Deep Reinforcement Learning (Arxiv).
CMU研究人員為改善端到端的SLAM蟆湖,添加了“注意力”:
...離神經(jīng)SLAM的夢想越來越近...
卡內(nèi)基梅隆大學(xué)和蘋果公司的研究人員已經(jīng)發(fā)布了關(guān)于神經(jīng)圖優(yōu)化器的細節(jié)故爵。神經(jīng)圖優(yōu)化器是針對穿越在世界各地中的智能體同時定位和映射(SLAM)這一常年棘手的問題的神經(jīng)方法。任何渴望在現(xiàn)實世界中做出有用的東西的系統(tǒng)都需要有SLAM功能隅津。
今天诬垂,神經(jīng)網(wǎng)絡(luò)SLAM技術(shù)可以解決日常生活中遇到的問題,如錯誤的傳感器校準(zhǔn)和異常的亮度變化伦仍。所提出的神經(jīng)圖優(yōu)化器系統(tǒng)由多個專用模塊組成结窘,以處理不同的SLAM問題,但每個模塊都是可區(qū)分的充蓝,因此整個系統(tǒng)可以進行端對端培訓(xùn) - 這是一個理想的命題隧枫,因為這可以縮短測試,實驗谓苟,并迭代這些系統(tǒng)所需的時間官脓。不同的模塊處理從局部估計(基于當(dāng)?shù)厍榫车牡胤剑┑饺蚬烙嫞谌澜绲哪膫€位置)的問題的不同方面,并納入基于注意力機制的技術(shù)來幫助自動糾正訓(xùn)練期間產(chǎn)生的錯誤涝焙。
結(jié)果:
研究人員測試該系統(tǒng)是否能夠在2D網(wǎng)格迷宮中導(dǎo)航卑笨,以及基于Doom游戲引擎的更復(fù)雜的3D迷宮。 實驗表明仑撞,它能夠更好地將某物的位置映射到相對于先前系統(tǒng)的真實地面位置赤兴。
為什么它很重要:
這項技術(shù)能剔除大量手工設(shè)計的SLAM算法妖滔,并將其替換為完全學(xué)習(xí)基底,使得這樣的時代的到來變得更近桶良。
這對于新系統(tǒng)新技術(shù)的測試和開發(fā)來說座舍,是非常有用的,盡管它不可能在短期內(nèi)取代傳統(tǒng)的SLAM方法陨帆,因為神經(jīng)網(wǎng)絡(luò)很可能會繼續(xù)顯示他們在現(xiàn)實世界系統(tǒng)中不切實際的怪癖曲秉。
更多:
Global Pose Estimation with an Attention-based Recurrent Network (Arxiv).
AI 大佬們進行 Reddit AMA答題活動,承認了當(dāng)前的難題
Reddit 機器學(xué)習(xí)板塊是當(dāng)前最大的英文機器學(xué)習(xí)網(wǎng)上社區(qū)疲牵。
AMA (Ask me anything 想問啥就問啥)岸浑,是其中一個特殊的板塊,會定期請一些領(lǐng)域有名的人來回答大家問題瑰步。
...話說三位 AI專家走進一家網(wǎng)站...
Yann LeCun,Peter Norvig和Eric Horvitz最近在Reddit上做了一個Ask Me Anything(AMA)璧眠,大家像他們提出了很多最佳AI熱帶來的問題缩焦。這個AMA值得整個都閱讀完,下面是其中的幾個亮點:
計算鴻溝是不可否認的:“我的紐約大學(xué)學(xué)生在學(xué)性鹁玻可以使用的GPU袁滥,就不可能像在FAIR公司實習(xí)時那么多”,Yann LeCun說灾螃。但也不要沮喪题翻,他指出,盡管缺乏計算力腰鬼,但學(xué)術(shù)界還是可能會繼續(xù)成為新技術(shù)的主要發(fā)源地嵌赠,之后大公司再將其擴大規(guī)模。 “你不會去想著與大型團隊直接競爭的熄赡,這里有很多方法可以在不這樣做的情況下也可以進行卓越的研究姜挺。”
通向通用人工智能(AGI) 之路:許多問題都是關(guān)于深度學(xué)習(xí)的局限性彼硫,而且稍稍探討了可以產(chǎn)生更靈活炊豪,更強大智能體的研究途徑。
Eric Horvitz對合奏方法很感興趣**:“我們是否可以智能地將語音識別拧篮、自然語言词渤、視覺、規(guī)劃和推理等多種能力融入智能的大型協(xié)調(diào)的”合奏“中去串绩,并探索如何協(xié)調(diào)的這個大難題缺虐。“
Yann LeCun:“通過觀察世界來讓機器學(xué)習(xí)預(yù)測模型是AGI目前最大的障礙...... 我的預(yù)感是赏参,大腦中有一大塊正是預(yù)測機構(gòu)志笼,它可以訓(xùn)練本身來預(yù)測任何它能預(yù)測的(從任何觀察到的變量來預(yù)測未觀察的變量沿盅,例如從過去和現(xiàn)在預(yù)測未來)。通過學(xué)習(xí)預(yù)測纫溃,大腦詳細地勾畫出了分層級的特征表示腰涧。“
更多:AMA AI researchers from Facebook, Google, and Microsoft (Reddit).