太讓當空照兼蜈,導師對我笑攘残,老師說,早早早饭尝,你為什么論文發(fā)的那么少肯腕。不說了,都是淚啊钥平,科研不易实撒,且行且珍惜吧姊途,尤其是我這一頭還算茂密的黑發(fā)(手動撩發(fā))。
最近科技界比較平靜知态,好像沒有什么驚世駭俗的事情發(fā)生捷兰,我每天也是默默的看著論文,擼著代碼负敏,享受著歲月靜好贡茅。要說有什么好玩的事情,應該是我們的吳恩達(Andrew Ng)老師最近就在今天宣布開始種地啦其做,國人田園風光才是真正美好啊顶考。開玩笑的啦,新聞是這樣的:
Landing.ai 是人工智能著名學者吳恩達(Andrew Ng)的第二個創(chuàng)業(yè)項目妖泄。在公司成立并宣布與富士康進行合作僅 7 個月后驹沿,今天 Landing.ai 又在湖南長沙宣布簽下第二個大單:與國內(nèi)高端裝備制造企業(yè)中聯(lián)重科達成戰(zhàn)略合作。
這份協(xié)議的簽訂標志著中聯(lián)重科進入人工智能技術(shù)領(lǐng)域蹈胡,成為國內(nèi)首家 AI 農(nóng)業(yè)裝備制造企業(yè)渊季。雙方將致力于共同研發(fā)基于人工智能(AI)技術(shù)的新產(chǎn)品,打造頂尖人工智能技術(shù)團隊罚渐,以使中聯(lián)重科成為以人工智能驅(qū)動的領(lǐng)先裝備制造企業(yè)却汉。
此次雙方的合作主要包括技術(shù)合作與人才培養(yǎng)兩大方向。技術(shù)合作上荷并,Landing.AI 將為中聯(lián)重科農(nóng)業(yè)機械和其他領(lǐng)域提供人工智能技術(shù)的戰(zhàn)略合砂,雙方將共同開發(fā)數(shù)款基于人工智能技術(shù)的農(nóng)業(yè)機械產(chǎn)品。人才培養(yǎng)方面源织,Landing.AI 將幫助中聯(lián)重科招聘既穆、培訓,為其建立一支專業(yè)的人工智能技術(shù)團隊雀鹃,讓中聯(lián)重科持續(xù)運用人工智能技術(shù)服務(wù)企業(yè)的發(fā)展。
不知道大家還記不記得百度的“阿波爬剑”黎茎,這次雙方的合作應該是為讓AI賦能傳統(tǒng)農(nóng)業(yè),這也說明各界大佬們對AI全面改變社會的生產(chǎn)方式充滿了信心当悔。說起這次合作的產(chǎn)品傅瞻,也是自動駕駛家族的一員哦,就是下面這個大家伙盲憎。
你看嗅骄,就像馬云大大在世界人工智能大會上說的一樣,自動駕駛的未來需要想象力饼疙,技術(shù)帶來的永遠不只是可預見的改變溺森,讓我們一起期待并見證美好的未來吧。
下面回歸正題,繼續(xù)介紹2018CVPR自動駕駛相關(guān)領(lǐng)域的論文屏积,今天的論文題目是《On the Importance of Stereo for Accurate Depth Estimation:An Efficient Semi-Supervised Deep Neural Network Approach》医窿,深度估計是計算機視覺領(lǐng)域長期存在的一項具有挑戰(zhàn)性的任務(wù)之一,在自動駕駛中也起著至關(guān)重要的作用炊林。目前深度估計采用的技術(shù)主要包括雙目深度估計(為了提高精度姥卢,特斯拉的前置攝像頭采用三目深度估計)、單目深度估計渣聚、結(jié)構(gòu)光(第一代kinect)独榴、TOF(time-of-flight,第二代kinect采用的技術(shù))奕枝,以及精度最高但是成本也最高的激光雷達(谷歌等公司在用棺榔,谷歌好像收購了一家激光雷達公司,可以把激光雷達的成本降低到了以前的十分之一倍权,好多數(shù)據(jù)集把激光雷達采集到的深度數(shù)據(jù)作為訓練和評價其他深度估計方法的ground truth)掷豺,當然還有其他利用非光學信號的測距技術(shù),例如聲納等薄声。
基于單目攝像機的深度估計技術(shù)的研究意義重大当船,尤其是對機器人領(lǐng)域和自動駕駛領(lǐng)域,準確的估計障礙物的距離對正確規(guī)劃汽車的路徑和行為至關(guān)重要默辨,但是由于單目深度估計只包含一幀幀的圖像德频,因此準確估計深度信息極為困難,目前精度最高的單目深度估計技術(shù)也不足以滿足實際的需求缩幸。
雙目(多目)深度估計模仿了生物兩只眼睛的結(jié)構(gòu)特點壹置,利用兩臺攝像機之間已知的幾何信息進行深度估計,其算法流程為
雙目匹配是雙目深度估計的核心部分也是難點所在表谊,發(fā)展了很多年钞护,也有非常多的算法,主要目的是計算參考圖與目標圖之間像素的相對匹配關(guān)系爆办,主要分為局部和非局部的算法难咕。一般有下面幾個步驟。
1.匹配誤差計算
2. 誤差集成
3.視差圖計算/優(yōu)化
4. 視差圖矯正
目前匹配算法中效果最好的是圖割算法距辆,但是會消耗大量的計算資源余佃。
本文就是利用深度學習的方法解決匹配問題,同時對比了單目深度估計和雙目深度估計的效果跨算,并進行了定性和定量的分析爆土。同時在本文提出方法上,使用嵌入式GPU可以達到~20fps的速度同時保證結(jié)果可用诸蚕。
由上圖可知步势,在自動駕駛場景中氧猬,單目深度估計得到的結(jié)果幾乎不可用(上圖左圖),圖中共有八個標記點(A-H)立润,基于單目的深度估計全部預測錯誤狂窑,而基于雙目的深度估計得到的結(jié)果幾乎和激光雷達得到的結(jié)果一致。單目深度估計之所以效果不好桑腮,其原因就是單目無法解決尺度縮放帶來的影響泉哈,也就是SLAM里面的尺度不確定性問題。雙目攝像機由于已知兩個攝像機之間的距離破讨,因此可以很容易的獲得空間信息丛晦,最大的難點就是對獲取到的圖像進行匹配,也就是兩個攝像機中哪些像素點對應空間中的同一個點提陶。
文中提到的網(wǎng)絡(luò)的結(jié)構(gòu)略微有些復雜烫沙,這里就不詳細展開了,感興趣的可以自己看論文里的附錄部分隙笆。
網(wǎng)絡(luò)通過對比得到的特征圖進行匹配锌蓄,然后就可以很方便的計算深度啦。文章涉及到的損失設(shè)計很復雜撑柔,本人能力有限加上非此方向瘸爽,所以想要深究的大神就自己看論文吧(萬分抱歉,嗚嗚)铅忿。
基于視覺信息的深度估計對降低自動駕駛汽車的成本很有幫助剪决,但是對算法的要求比較高,因此如何開發(fā)出高效準確的算法對自動駕駛的安全可靠至關(guān)重要檀训。
最后柑潦,祝好!愿與諸君一起進步峻凫。