From Import AI
謝謝“極光火狐貍” 的贊賞车猬,拿到過最開心的兩塊錢撤奸。 _
百度呻右,豐田以及伯克利的研究人員組織自駕車挑戰(zhàn)賽饶套,來自百度新推出的自駕車數(shù)據(jù)集:
... ApolloScape 增加了中國自駕車研究人員的數(shù)據(jù),另外百度說它已加入伯克利的 DeepDrive 自駕車 AI 聯(lián)盟......
一個新的競賽和數(shù)據(jù)集可能會給研究人員提供更好的方法來測試自駕車 AI 的功能和進展芒填。
數(shù)據(jù)集:
來自百度的 ApolloScape 數(shù)據(jù)集包含將近 200,000 張RGB圖像呜叫,并有相應的逐像素語義注釋。每一幀都有來自25個語義類的標注殿衰,包括:汽車朱庆,摩托車,人行道闷祥,交通錐娱颊,垃圾桶,植被等等凯砍。每幅圖像的分辨率均為3384 x 2710箱硕,每幀間隔一米距離。截至2018年3月8日悟衩,已有8萬張圖片剧罩。
競賽:
新的 WAD 比賽將給人們測試和開發(fā) ApolloScape 和 Berkeley DeepDrive (DeepDrive 數(shù)據(jù)集包含100,000個視頻剪輯,每個視頻剪輯大約40秒長座泳,有一個關鍵幀得到標注) 的數(shù)據(jù)集上的AI 系統(tǒng)的機會惠昔。獎金大約為10,000美元,研究人員正在征集有關研究技術的論文:可駕駛區(qū)域分割(drivable area segmentation 能夠找出場景的區(qū)域?qū)男撕炋羰疲约澳男﹨^(qū)域安全); 道路物體檢測(找出路上的東西); 學習從一個語義領域遷移到另一個語義領域镇防,特別是從Berkeley數(shù)據(jù)集(在美國加利福尼亞州拍攝)的訓練到 ApolloScape 數(shù)據(jù)集(在中國北京拍攝)。 更多: 關于'WAD'比賽
面對100,000+開發(fā)人員的調(diào)查顯示對 AI 的擔憂
......開發(fā)人員認為危險和令人興奮的薛耻,以及誰該負責......
開發(fā)者社區(qū) StackOverflow 發(fā)布了其社區(qū)年度調(diào)查結果营罢,今年它問到了AI:
-
開發(fā)人員認為“危險”的:
提高工作自動化程度(40.8%)
-
開發(fā)人員認為“令人興奮”的:
人工智能超越人類智能,也就是奇點 (Singularity)(28%)
奇點理論饼齿,一個根據(jù)技術發(fā)展史總結出的觀點饲漾,認為未來將要發(fā)生一件不可避免的事件──技術發(fā)展將會在很短的時間內(nèi)發(fā)生極大而接近于無限的進步
-
誰需要考慮AI的后果:
開發(fā)人員或創(chuàng)建AI的人員:47.8%
政府或其他監(jiān)管機構:27.9%
-
不同的角色=不同的擔憂:
技術專家們更傾向于說,比起奇點問題他們更關心公平問題缕溉,而設計師和移動開發(fā)人員傾向于更關心奇點考传。
閱讀更多:開發(fā)者調(diào)查結果2018年(StackOverFlow)。
Allen AI 用新的常識問答數(shù)據(jù)集來讓現(xiàn)在的算法跪一地:
...常識問題旨在挑戰(zhàn)和挫敗當今最優(yōu)秀的算法...
在宣布了1.25億美元的融資证鸥,還有如何致力于開展推動 AI 處理常識方面的研究后僚楞,艾倫人工智能研究所 (Allen Institute for Artificial Intelligence勤晚,簡稱AI2) 發(fā)布了一項新的 ARC 挑戰(zhàn)和數(shù)據(jù)集,研究人員可以用其開發(fā)更智能的算法泉褐。
數(shù)據(jù)集:
主要的 ARC 測試包含 7787 個自然科學問題赐写,分為一組簡單集和一組困難集。困難集是那些用基于檢索的和詞語共現(xiàn)算法不能正確回答的問題膜赃。同時挺邀,AI2 正在發(fā)布“ARC語料庫”,其收集了1400萬篇與ARC相關知識的科學相關句跳座,以支持 ARC 算法的開發(fā)端铛。這個語料庫包含與95%挑戰(zhàn)問題相關的知識。
神經(jīng)網(wǎng)絡基線模型:
AI2還發(fā)布了三個基線模型疲眷,這些模型已經(jīng)在挑戰(zhàn)中進行了測試禾蚕,在簡單集中取得了一些成功,但卻不能比困難集中的隨機選擇更好狂丝。這些模型包括 decomposable attention model(DecompAttn)换淆,Bidirectional Attention Flow(BiDAF)和 decomposed graph entailment model(DGEM)。
ARC中的問題旨在測試從定義到空間到代數(shù)知識的所有內(nèi)容美侦,鼓勵使用能夠抽象和概括大數(shù)據(jù)語料庫概念的系統(tǒng)产舞。
基線結果:
ARC非常具有挑戰(zhàn)性:AI2 以其神經(jīng)網(wǎng)絡方法為基準發(fā)現(xiàn),簡單問題的分數(shù)最高只為60%菠剩,更具挑戰(zhàn)性的問題的分數(shù)最高只有27%。
示例問題:
“通過觀察它可以確定哪種礦物性質(zhì)耻煤?
(A)光澤[正確](B)質(zhì)量(C)重量(D)硬度”具壮。
SQUAD 接班人:
ARC 可能是斯坦福問答數(shù)據(jù)集(SQUAD)和挑戰(zhàn)的可行繼任者; SQuAD 競賽最近取得了一系列里程碑似的成果,從微軟到阿里巴巴的再到科大訊飛都在開發(fā) SQUAD 的解決方案哈蝇,這些解決方案的表現(xiàn)接近人的表現(xiàn)(ExactMatch 為82%棺妓,F(xiàn)1為91%)。
對 SQUAD 主題領域的深入評估讓我們更直觀地了解炮赦,為什么這個測試的分數(shù)比 ARC 高得多 - 簡而言之怜跑,SQUAD更容易些; 它將大量信息豐富的文本與諸如“大多數(shù)教師從哪里獲得憑據(jù)迎捺?”等基本問題放在一起傲武。可以從文本中就檢索到瘦黑,而不需要太多抽象剧防。
為什么很重要:
“我們發(fā)現(xiàn)所有測試的基線系統(tǒng)在挑戰(zhàn)集中都不會超出隨機基線植锉,包括兩個在 SNLI 和 SQuAD 上具有高性能的神經(jīng)模型,” 研究人員寫道∏途校現(xiàn)在最大的問題是這個數(shù)據(jù)集在 Goldilocks 系譜上的位置 - 這是否太容易(請參考Facebook的早期記憶網(wǎng)絡的測試)或太難或恰到好處俊庇?如果一個系統(tǒng)在ARC的更具挑戰(zhàn)性的問題上得到75%左右的話狮暑,這似乎意味著理解和知識表示向前重要的一大步呢。
更多:Think you have Solved Question Answering? Try ARC, theAI2 Reasoning Challenge (Arxiv).
更多:SQuAD: 100,000+ Questions for Machine Comprehension ofText (Arxiv)
微軟發(fā)布深度學習框架的“羅塞塔石碑”:
羅塞塔石碑辉饱,Rosetta Stone.
原本只是一塊刻有古埃及法老托勒密五世詔書的石碑搬男,石碑上用希臘文字、古埃及文字和當時的通俗體文字刻了同樣的內(nèi)容彭沼,這使得近代的考古學家得以有機會對照各語言版本的內(nèi)容后止后,解讀出已經(jīng)失傳千余年的埃及象形文之意義與結構,而成為今日研究古埃及歷史的重要里程碑溜腐。之后也指代類似的事物译株。
... GitHub repo為您提供以下幾種不同方式顯示的基本操作...
微軟發(fā)布了一個GitHub倉庫,其中包含了Caffe2挺益,Chainer歉糜,CNTK,Gluon望众,Keras(后端CNTK / TensorFlow / Theano)匪补,Tensorflow,Lasagna烂翰,MXNet夯缺,PyTorch 和 Julia-Knet 等各個框架。 這里的想法是甘耿,如果你在其中一個框架中閱讀一種算法踊兜,則可以使用這個算法來了解其他框架。
“我們今天發(fā)布的完整版本就像是一個深度學習框架的Rosetta Stone佳恬,展示了在不同框架中的模型構建端到端過程捏境,” 研究人員在一篇博文中寫道,該文章還提供了一些粗略的CNN和RNN的基準訓練時間毁葱。
閱讀更多:Comparing Deep Learning Frameworks: A Rosetta StoneApproach (Microsoft Tech Net).代碼(Github)
進化算法對 AI 設計的奇怪垫言,美妙,而又潛在的危險影響:
[圖片上傳失敗...(image-e41654-1521681038341)]
...為什么AI安全社群可以從進化中學習...
一個國際研究人員組成的聯(lián)盟發(fā)布了一些奇怪且經(jīng)常有趣的發(fā)現(xiàn)倾剿,其中進化算法對其被要求解決的任務筷频,找出了一些讓人大跌眼鏡的解決方案和技巧。該論文包含了一系列很有啟發(fā)性的例子前痘,其中算法顛覆了人類觀察者的預期凛捏,其中包括:
機會主義的空翻:當試圖讓生物進化進行跳躍時,一些智能體發(fā)現(xiàn)他們可以演變非常高的身體际度,然后空翻葵袭,獲得與地面距離成比例的獎勵。
毫無意義的程序:當研究人員試圖用GenProg 來進化代碼以解決一個錯誤的數(shù)據(jù)排序程序時乖菱,GenProg 進化出了一個解決方案:該程序會返回一個空列表坡锡,因為空列表不能被計為負值因為它不包含任何內(nèi)容蓬网。
物理學黑客:一個機器人計算出正確的振動頻率,以利用在物理模擬器的地板上發(fā)現(xiàn)摩擦bug鹉勒,讓它通過bug在地面上推動自身帆锋。
進化總能找到出路:另一種類型的錯誤是即使研究人員認為這種方式是不可能的,進化也可能成功禽额,就像一個六腿機器人能夠在腳不接觸地面的情況下快速行走一樣(謎底揭曉:它翻轉過來背靠地面锯厢,并用腿的運動來推動自己)。
還有很多很多
研究人員認為脯倒,進化也可能反應 AI 安全中一些令人不安的問題实辑。研究人員寫道:“數(shù)字化進化中令人驚訝的創(chuàng)造性也具有其他跨領域的影響。例如藻丢,本文中”瘋狂選擇“的很多例子都與 AI 安全這樣的新興領域相關剪撬。 “因此,這些小故事可以充當進化的證據(jù) - 無論是生物的還是計算的 - 都有內(nèi)在的創(chuàng)造性悠反,并且應該經(jīng)常會是讓人驚訝残黑,高興,甚至強過我們斋否±嫠”
自從有了神經(jīng)教練們,我們的 AI 性能也提高啦:
... 也就是茵臭,為什么我這有多名專家老師指導的小學生能打敗你那有更大資源但沒老師的高中生......
DeepMind 的研究展示了疫诽,如何通過傳輸預先訓練的“教師”智能體的知識,來提高特定智能體對某項任務的績效笼恰。該技術在訓練 AI 智能體方面產(chǎn)生了顯著的加速效應踊沸,并有些證據(jù)表明,被教授的智能體獲得比沒教的智能更高的性能社证。
該技術有兩個變種:單師和多師; 如預期的那樣,通過多名教師進行過預訓練的代理比單一訓練的代理要更好评凝。
奇怪而微妙:
這種方法有一些特點對開發(fā)更復雜的 AI 智能體似乎有幫助:在一項任務中追葡,DeepMind 用智能體測試如何用短期記憶來獲得高分時。 '小'智能體(只有兩個卷積層)通常無法學會使用記憶奕短,因此也就無法達到某個闕值以上的分數(shù)宜肉,但通過與多位專業(yè)老師一起訓練后的'小'智能體,卻可以完成任務翎碑。
“這很讓人驚訝谬返,因為 Kickstarting 機制只能指導學生智能體采取哪個行動:它不會規(guī)定學生如何構建其內(nèi)部記憶狀態(tài)。然而日杈,學生只能通過記住下一輪開始前的信息來預測教師的行為遣铝,這對短期記憶的形成似乎是強大的監(jiān)督信號佑刷,我們發(fā)現(xiàn)這與最好的人類教育者的教導方式非常相似:不告訴學生去想什么,而是簡單地讓學生在豐富的學習環(huán)境中為自己學習酿炸√毙酰“ 研究人員寫道。
為什么很重要:
像這樣的趨勢表明填硕,科學家可以通過使用這種預先訓練的技術來更好地評估新代理麦萤,從而加快自己的研究。這進一步證實了 AI 研究的關鍵輸入將從預先標記的靜態(tài)數(shù)據(jù)集轉為計算扁眯。盡管應該指出壮莹,這里的數(shù)據(jù)隱含在研究人員可訪問的程序性、可修改的模擬器形式中姻檀。更具推測性的是命满,這意味著可以使用教師混合訓練復雜的智能體,這些智能體的能力遠遠超過其任何一位先輩的能力施敢。