AI Edge:百度新自駕車數(shù)據(jù)集 | Stack Overflow 年度調(diào)查:對AI的擔憂 | Allen AI 新的常識問答數(shù)據(jù)集秒殺傳統(tǒng)算法 | 微軟發(fā)布深度學習框架的“羅塞塔石碑”...

From Import AI
謝謝“極光火狐貍” 的贊賞车猬,拿到過最開心的兩塊錢撤奸。 _

百度呻右,豐田以及伯克利的研究人員組織自駕車挑戰(zhàn)賽饶套,來自百度新推出的自駕車數(shù)據(jù)集:

... ApolloScape 增加了中國自駕車研究人員的數(shù)據(jù),另外百度說它已加入伯克利的 DeepDrive 自駕車 AI 聯(lián)盟......

一個新的競賽和數(shù)據(jù)集可能會給研究人員提供更好的方法來測試自駕車 AI 的功能和進展芒填。

數(shù)據(jù)集

來自百度的 ApolloScape 數(shù)據(jù)集包含將近 200,000 張RGB圖像呜叫,并有相應的逐像素語義注釋。每一幀都有來自25個語義類的標注殿衰,包括:汽車朱庆,摩托車,人行道闷祥,交通錐娱颊,垃圾桶,植被等等凯砍。每幅圖像的分辨率均為3384 x 2710箱硕,每幀間隔一米距離。截至2018年3月8日悟衩,已有8萬張圖片剧罩。

更多信息Many of the researchers linked to ApolloScape will betalking at a session on autonomous cars at the IEEE Intelligent VehiclesSymposium in China

競賽

新的 WAD 比賽將給人們測試和開發(fā) ApolloScape 和 Berkeley DeepDrive (DeepDrive 數(shù)據(jù)集包含100,000個視頻剪輯,每個視頻剪輯大約40秒長座泳,有一個關鍵幀得到標注) 的數(shù)據(jù)集上的AI 系統(tǒng)的機會惠昔。獎金大約為10,000美元,研究人員正在征集有關研究技術的論文:可駕駛區(qū)域分割(drivable area segmentation 能夠找出場景的區(qū)域?qū)男撕炋羰疲约澳男﹨^(qū)域安全); 道路物體檢測(找出路上的東西); 學習從一個語義領域遷移到另一個語義領域镇防,特別是從Berkeley數(shù)據(jù)集(在美國加利福尼亞州拍攝)的訓練到 ApolloScape 數(shù)據(jù)集(在中國北京拍攝)。 更多: 關于'WAD'比賽

面對100,000+開發(fā)人員的調(diào)查顯示對 AI 的擔憂

......開發(fā)人員認為危險和令人興奮的薛耻,以及誰該負責......

開發(fā)者社區(qū) StackOverflow 發(fā)布了其社區(qū)年度調(diào)查結果营罢,今年它問到了AI:

  • 開發(fā)人員認為“危險”的

    提高工作自動化程度(40.8%)

  • 開發(fā)人員認為“令人興奮”的

    人工智能超越人類智能,也就是奇點 (Singularity)(28%)

奇點理論饼齿,一個根據(jù)技術發(fā)展史總結出的觀點饲漾,認為未來將要發(fā)生一件不可避免的事件──技術發(fā)展將會在很短的時間內(nèi)發(fā)生極大而接近于無限的進步

  • 誰需要考慮AI的后果:

    • 開發(fā)人員或創(chuàng)建AI的人員:47.8%

    • 政府或其他監(jiān)管機構:27.9%

  • 不同的角色=不同的擔憂

    技術專家們更傾向于說,比起奇點問題他們更關心公平問題缕溉,而設計師和移動開發(fā)人員傾向于更關心奇點考传。

閱讀更多:開發(fā)者調(diào)查結果2018年(StackOverFlow)

Allen AI 用新的常識問答數(shù)據(jù)集來讓現(xiàn)在的算法跪一地:

...常識問題旨在挑戰(zhàn)和挫敗當今最優(yōu)秀的算法...

在宣布了1.25億美元的融資证鸥,還有如何致力于開展推動 AI 處理常識方面的研究后僚楞,艾倫人工智能研究所 (Allen Institute for Artificial Intelligence勤晚,簡稱AI2) 發(fā)布了一項新的 ARC 挑戰(zhàn)和數(shù)據(jù)集,研究人員可以用其開發(fā)更智能的算法泉褐。

數(shù)據(jù)集

主要的 ARC 測試包含 7787 個自然科學問題赐写,分為一組簡單集和一組困難集。困難集是那些用基于檢索的和詞語共現(xiàn)算法不能正確回答的問題膜赃。同時挺邀,AI2 正在發(fā)布“ARC語料庫”,其收集了1400萬篇與ARC相關知識的科學相關句跳座,以支持 ARC 算法的開發(fā)端铛。這個語料庫包含與95%挑戰(zhàn)問題相關的知識。

神經(jīng)網(wǎng)絡基線模型

AI2還發(fā)布了三個基線模型疲眷,這些模型已經(jīng)在挑戰(zhàn)中進行了測試禾蚕,在簡單集中取得了一些成功,但卻不能比困難集中的隨機選擇更好狂丝。這些模型包括 decomposable attention model(DecompAttn)换淆,Bidirectional Attention Flow(BiDAF)和 decomposed graph entailment model(DGEM)。

ARC中的問題旨在測試從定義到空間到代數(shù)知識的所有內(nèi)容美侦,鼓勵使用能夠抽象和概括大數(shù)據(jù)語料庫概念的系統(tǒng)产舞。

基線結果

ARC非常具有挑戰(zhàn)性:AI2 以其神經(jīng)網(wǎng)絡方法為基準發(fā)現(xiàn),簡單問題的分數(shù)最高只為60%菠剩,更具挑戰(zhàn)性的問題的分數(shù)最高只有27%

示例問題

“通過觀察它可以確定哪種礦物性質(zhì)耻煤?

(A)光澤[正確](B)質(zhì)量(C)重量(D)硬度”具壮。

SQUAD 接班人

ARC 可能是斯坦福問答數(shù)據(jù)集(SQUAD)和挑戰(zhàn)的可行繼任者; SQuAD 競賽最近取得了一系列里程碑似的成果,從微軟到阿里巴巴的再到科大訊飛都在開發(fā) SQUAD 的解決方案哈蝇,這些解決方案的表現(xiàn)接近人的表現(xiàn)(ExactMatch 為82%棺妓,F(xiàn)1為91%)。

對 SQUAD 主題領域的深入評估讓我們更直觀地了解炮赦,為什么這個測試的分數(shù)比 ARC 高得多 - 簡而言之怜跑,SQUAD更容易些; 它將大量信息豐富的文本與諸如“大多數(shù)教師從哪里獲得憑據(jù)迎捺?”等基本問題放在一起傲武。可以從文本中就檢索到瘦黑,而不需要太多抽象剧防。

為什么很重要

“我們發(fā)現(xiàn)所有測試的基線系統(tǒng)在挑戰(zhàn)集中都不會超出隨機基線植锉,包括兩個在 SNLI 和 SQuAD 上具有高性能的神經(jīng)模型,” 研究人員寫道∏途校現(xiàn)在最大的問題是這個數(shù)據(jù)集在 Goldilocks 系譜上的位置 - 這是否太容易(請參考Facebook的早期記憶網(wǎng)絡的測試)或太難或恰到好處俊庇?如果一個系統(tǒng)在ARC的更具挑戰(zhàn)性的問題上得到75%左右的話狮暑,這似乎意味著理解和知識表示向前重要的一大步呢

更多Think you have Solved Question Answering? Try ARC, theAI2 Reasoning Challenge (Arxiv).

更多SQuAD: 100,000+ Questions for Machine Comprehension ofText (Arxiv)

微軟發(fā)布深度學習框架的“羅塞塔石碑”:

羅塞塔石碑辉饱,Rosetta Stone.

原本只是一塊刻有古埃及法老托勒密五世詔書的石碑搬男,石碑上用希臘文字、古埃及文字和當時的通俗體文字刻了同樣的內(nèi)容彭沼,這使得近代的考古學家得以有機會對照各語言版本的內(nèi)容后止后,解讀出已經(jīng)失傳千余年的埃及象形文之意義與結構,而成為今日研究古埃及歷史的重要里程碑溜腐。之后也指代類似的事物译株。

... GitHub repo為您提供以下幾種不同方式顯示的基本操作...

微軟發(fā)布了一個GitHub倉庫,其中包含了Caffe2挺益,Chainer歉糜,CNTK,Gluon望众,Keras(后端CNTK / TensorFlow / Theano)匪补,Tensorflow,Lasagna烂翰,MXNet夯缺,PyTorch 和 Julia-Knet 等各個框架。 這里的想法是甘耿,如果你在其中一個框架中閱讀一種算法踊兜,則可以使用這個算法來了解其他框架。

“我們今天發(fā)布的完整版本就像是一個深度學習框架的Rosetta Stone佳恬,展示了在不同框架中的模型構建端到端過程捏境,” 研究人員在一篇博文中寫道,該文章還提供了一些粗略的CNN和RNN的基準訓練時間毁葱。

閱讀更多Comparing Deep Learning Frameworks: A Rosetta StoneApproach (Microsoft Tech Net).代碼(Github)

進化算法對 AI 設計的奇怪垫言,美妙,而又潛在的危險影響:

[圖片上傳失敗...(image-e41654-1521681038341)]

...為什么AI安全社群可以從進化中學習...

一個國際研究人員組成的聯(lián)盟發(fā)布了一些奇怪且經(jīng)常有趣的發(fā)現(xiàn)倾剿,其中進化算法對其被要求解決的任務筷频,找出了一些讓人大跌眼鏡的解決方案和技巧。該論文包含了一系列很有啟發(fā)性的例子前痘,其中算法顛覆了人類觀察者的預期凛捏,其中包括:

  • 機會主義的空翻:當試圖讓生物進化進行跳躍時,一些智能體發(fā)現(xiàn)他們可以演變非常高的身體际度,然后空翻葵袭,獲得與地面距離成比例的獎勵。

  • 毫無意義的程序:當研究人員試圖用GenProg 來進化代碼以解決一個錯誤的數(shù)據(jù)排序程序時乖菱,GenProg 進化出了一個解決方案:該程序會返回一個空列表坡锡,因為空列表不能被計為負值因為它不包含任何內(nèi)容蓬网。

  • 物理學黑客:一個機器人計算出正確的振動頻率,以利用在物理模擬器的地板上發(fā)現(xiàn)摩擦bug鹉勒,讓它通過bug在地面上推動自身帆锋。

  • 進化總能找到出路:另一種類型的錯誤是即使研究人員認為這種方式是不可能的,進化也可能成功禽额,就像一個六腿機器人能夠在腳不接觸地面的情況下快速行走一樣(謎底揭曉:它翻轉過來背靠地面锯厢,并用腿的運動來推動自己)。

  • 還有很多很多

研究人員認為脯倒,進化也可能反應 AI 安全中一些令人不安的問題实辑。研究人員寫道:“數(shù)字化進化中令人驚訝的創(chuàng)造性也具有其他跨領域的影響。例如藻丢,本文中”瘋狂選擇“的很多例子都與 AI 安全這樣的新興領域相關剪撬。 “因此,這些小故事可以充當進化的證據(jù) - 無論是生物的還是計算的 - 都有內(nèi)在的創(chuàng)造性悠反,并且應該經(jīng)常會是讓人驚訝残黑,高興,甚至強過我們斋否±嫠”

更多The Surprising Creativity of Digital Evolution: ACollection of Anecdotes from the Evolutionary Computation and Artificial LifeResearch Communities (Arxiv).

自從有了神經(jīng)教練們,我們的 AI 性能也提高啦:

... 也就是茵臭,為什么我這有多名專家老師指導的小學生能打敗你那有更大資源但沒老師的高中生......

DeepMind 的研究展示了疫诽,如何通過傳輸預先訓練的“教師”智能體的知識,來提高特定智能體對某項任務的績效笼恰。該技術在訓練 AI 智能體方面產(chǎn)生了顯著的加速效應踊沸,并有些證據(jù)表明,被教授的智能體獲得比沒教的智能更高的性能社证。

該技術有兩個變種:單師和多師; 如預期的那樣,通過多名教師進行過預訓練的代理比單一訓練的代理要更好评凝。

奇怪而微妙

這種方法有一些特點對開發(fā)更復雜的 AI 智能體似乎有幫助:在一項任務中追葡,DeepMind 用智能體測試如何用短期記憶來獲得高分時。 '小'智能體(只有兩個卷積層)通常無法學會使用記憶奕短,因此也就無法達到某個闕值以上的分數(shù)宜肉,但通過與多位專業(yè)老師一起訓練后的'小'智能體,卻可以完成任務翎碑。

“這很讓人驚訝谬返,因為 Kickstarting 機制只能指導學生智能體采取哪個行動:它不會規(guī)定學生如何構建其內(nèi)部記憶狀態(tài)然而日杈,學生只能通過記住下一輪開始前的信息來預測教師的行為遣铝,這對短期記憶的形成似乎是強大的監(jiān)督信號佑刷,我們發(fā)現(xiàn)這與最好的人類教育者的教導方式非常相似:不告訴學生去想什么,而是簡單地讓學生在豐富的學習環(huán)境中為自己學習酿炸√毙酰“ 研究人員寫道。

為什么很重要

像這樣的趨勢表明填硕,科學家可以通過使用這種預先訓練的技術來更好地評估新代理麦萤,從而加快自己的研究。這進一步證實了 AI 研究的關鍵輸入將從預先標記的靜態(tài)數(shù)據(jù)集轉為計算扁眯。盡管應該指出壮莹,這里的數(shù)據(jù)隱含在研究人員可訪問的程序性、可修改的模擬器形式中姻檀。更具推測性的是命满,這意味著可以使用教師混合訓練復雜的智能體,這些智能體的能力遠遠超過其任何一位先輩的能力施敢。

更多:Kickstarting Deep Reinforcement Learning (Arxiv).

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末周荐,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子僵娃,更是在濱河造成了極大的恐慌概作,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件默怨,死亡現(xiàn)場離奇詭異讯榕,居然都是意外死亡,警方通過查閱死者的電腦和手機匙睹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門愚屁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人痕檬,你說我怎么就攤上這事霎槐。” “怎么了梦谜?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵丘跌,是天一觀的道長。 經(jīng)常有香客問我唁桩,道長闭树,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任荒澡,我火速辦了婚禮报辱,結果婚禮上,老公的妹妹穿的比我還像新娘单山。我一直安慰自己碍现,他們只是感情好幅疼,可當我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鸵赫,像睡著了一般衣屏。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上辩棒,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天狼忱,我揣著相機與錄音,去河邊找鬼一睁。 笑死钻弄,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的者吁。 我是一名探鬼主播窘俺,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼复凳!你這毒婦竟也來了瘤泪?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤育八,失蹤者是張志新(化名)和其女友劉穎对途,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體髓棋,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡实檀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了按声。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片膳犹。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖签则,靈堂內(nèi)的尸體忽然破棺而出须床,到底是詐尸還是另有隱情,我是刑警寧澤渐裂,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布侨颈,位于F島的核電站,受9級特大地震影響芯义,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜妻柒,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一扛拨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧举塔,春花似錦绑警、人聲如沸求泰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽渴频。三九已至,卻和暖如春北启,著一層夾襖步出監(jiān)牢的瞬間卜朗,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工咕村, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留场钉,地道東北人。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓懈涛,卻偏偏與公主長得像逛万,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子批钠,可洞房花燭夜當晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容