主流深度學(xué)習(xí)框架及神經(jīng)網(wǎng)絡(luò)模型匯總

一、人工智能的研究領(lǐng)域和分支

image

二娱俺、主流深度學(xué)習(xí)框架

1.png

如果走學(xué)術(shù)路線缎谷,果斷PyTorch井濒,如果想走部署,TensorFLow+PaddlePaddle+Caffe列林。

1.TensorFlow

TensorFlow是Google開發(fā)的一款開源軟件庫瑞你,專為深度學(xué)習(xí)或人工神經(jīng)網(wǎng)絡(luò)而設(shè)計。TensorFlow允許你可以使用流程圖創(chuàng)建神經(jīng)網(wǎng)絡(luò)和計算模型希痴。它是可用于深度學(xué)習(xí)的最好維護(hù)和最為流行的開源庫之一者甲。TensorFlow框架可以使用C++也可以使用Python。你可以使用TensorBoard進(jìn)行簡單的可視化并查看計算流水線砌创。其靈活的架構(gòu)允許你輕松部署在不同類型的設(shè)備上虏缸。不利的一面是鲫懒,TensorFlow沒有符號循環(huán),不支持分布式學(xué)習(xí)刽辙。此外窥岩,它還不支持Windows。

  • 出生地:Google
  • 特點:計算圖扫倡、分布式訓(xùn)練效果強(qiáng)、底層C構(gòu)建速度快竟纳,生態(tài)強(qiáng)大
  • 主要調(diào)包語言:Python撵溃、C/C++、JS
  • 評價:對標(biāo)PyTorch锥累、學(xué)術(shù)界沒市場了缘挑、部署更加的方便
  • 入門推薦:建議做工程的小伙伴入門,學(xué)術(shù)界真的馬上被PyTorch壟斷

2.PyTorch

PyTorch是臉書的框架桶略,前身是Torch语淘,支持動態(tài)圖,而且提供了Python接口际歼。是一個以Python優(yōu)先的深度學(xué)習(xí)框架惶翻,不僅能夠?qū)崿F(xiàn)強(qiáng)大的GPU加速,同時還支持動態(tài)神經(jīng)網(wǎng)絡(luò)鹅心。Python是現(xiàn)在學(xué)術(shù)界的霸主吕粗,對于想要做學(xué)術(shù)的同學(xué)絕對首推(重點)。

  • 出生地:FaceBook
  • 特點:生態(tài)強(qiáng)大旭愧、入門爽歪歪颅筋、代碼量少(重點)
  • 主要調(diào)包語言:Python、C/C++
  • 評價:入門很快输枯、速度有點慢议泵、部署很垃圾、學(xué)術(shù)界的霸主
  • 入門推薦:想要做學(xué)術(shù)的童鞋絕對首選桃熄,幾乎現(xiàn)在頂會論文的代碼都是這個框架寫的先口,不過想要做部署的還是看看TensorFLow或者PaddlePaddle吧。

3.PaddlePaddle

PaddlePaddle是百度推出的深度學(xué)習(xí)框架瞳收,算是國人最火的深度學(xué)習(xí)框架了池充。跟新了2.0的高級API與動態(tài)圖后,Paddle更加的強(qiáng)大缎讼。百度有很多PaddlePaddle的教程收夸,對于初學(xué)者來說還是相當(dāng)不錯的。PaddlePaddle有很多便捷的工具血崭,比如detection卧惜、cv厘灼、nlp、GAN的工具包咽瓷,也有專門的可視化工具(遠(yuǎn)離tensorboard的支配)设凹。

  • 出生地:百度
  • 特點:計算圖動態(tài)圖都支持、有高級API茅姜、速度快闪朱、部署方便、有專門的平臺
  • 主要調(diào)包語言:Python钻洒、C/C++奋姿、JS
  • 入門推薦:如果沒有卡那就非常適合,如果算力不缺素标,建議先看看PyTorch称诗,當(dāng)然也可以PaddlePaddle。

4.Keras

Keras可以當(dāng)成一種高級API头遭,它的后端可以是Theano和tensorFlow(可以想成把TF的很多打包了)寓免。由于是高級API非常的方便,非常適合科研人員上手计维。

  • 作者:Google AI 研究人員 Francois Chollet
  • 特點:生態(tài)強(qiáng)大袜香、入門爽歪歪、代碼量少(重點)
  • 主要調(diào)包語言:Python鲫惶、C/C++困鸥、JS
  • 評價:太適合入門了、速度有點慢剑按、版本得匹配后端框架的版本
  • 入門推薦:強(qiáng)推入門首選疾就,但是后續(xù)一定要看看算法的底層是怎樣工作的。

5.Caffe/Caffe2

Caffe是頂級高校UCB的賈揚清博士開發(fā)的艺蝴,主要是適用于深度學(xué)習(xí)在計算機(jī)視覺的應(yīng)用猬腰。使用Caffe做算法代碼量很少,經(jīng)常就是修修改改就能用猜敢,神經(jīng)網(wǎng)絡(luò)模型的管理非常的方便姑荷,而且算是比較早的部署在各種落地場景中。Caffe2可以理解為一個新版本的Caffe缩擂,但是有很多不同鼠冕,Caffe2后來并入了PyTorch。該工具支持Ubuntu胯盯,Mac OS X和Windows等操作系統(tǒng)懈费。

  • 作者:UCB 賈揚清博士
  • 特點:計算圖、部署方便博脑、訓(xùn)練方便憎乙、cuDnn與MKL均支持
  • 主要調(diào)包語言:Python票罐、Matlab腳本、C++
  • 評價:卷積人的大愛泞边、環(huán)境不好配置该押、感覺偏底層、Caffe2還是PyTorch
  • 入門推薦:不是很建議阵谚,真的想了解可以先入門PyTorch

6.MXNet

MXNet 是一個社區(qū)維護(hù)起來的深度學(xué)習(xí)框架蚕礼,后來被亞馬遜看上了。有類似于 Theano 和 TensorFlow 的計算圖梢什,也有靈活的動態(tài)圖奠蹬,摒棄有高級接口方便調(diào)用。MXNet的底層為C構(gòu)建绳矩,優(yōu)化的很好罩润,很多推理框架都能直接轉(zhuǎn)換玖翅,非常方便翼馆。

  • 出生地:社區(qū)
  • 特點:計算圖動態(tài)圖都支持、有高級API金度、速度快应媚、部署方便
  • 主要調(diào)包語言:Python、C/C++猜极、JS(js用的相對少)
  • 評價:一定意義上是國人的框架中姜、小團(tuán)體整的社區(qū)維護(hù)、文檔少生態(tài)不行
  • 入門推薦:一般跟伏。

7.Theano

Theano是07年左右開發(fā)的一個多維數(shù)組的計算庫丢胚,支持GPU計算,當(dāng)時很多人當(dāng)成“支持GPU的Numpy”受扳,底層優(yōu)化的非常好携龟,支持導(dǎo)出C的腳本。

  • 出生地:蒙特利爾大學(xué)
  • 特點:計算圖勘高、Python+Numpy峡蟋、源于學(xué)術(shù)界
  • 主要調(diào)包語言:Python
  • 評價:很臃腫、不支持分布式华望、被后面的TensorFlow打擊的很大
  • 入門推薦:絕對不建議蕊蝗,真的要用的話,先學(xué)習(xí)別的框架再看Github就行了

8.Torch

Torch是一款針對ML算法且又簡單易用的開源計算框架赖舟。該工具提供了高效的GPU支持蓬戚,N維數(shù)組,數(shù)值優(yōu)化例程宾抓,線性代數(shù)例程以及用于索引碌更、切片和置換的例程裕偿。基于Lua的腳本語言痛单,該工具帶有大量預(yù)先訓(xùn)練好的模型嘿棘。這款靈活高效的ML研究工具支持諸如Linux,Android旭绒,Mac OS X鸟妙,iOS和Windows等主流平臺。

9.CNTK

Microsoft Cognitive Toolkit是具有C#/C++/Python接口支持的最快的深度學(xué)習(xí)框架之一挥吵。此款開源框架帶有強(qiáng)大的C++ API重父,比TensorFlow更快、更準(zhǔn)確忽匈。該工具還支持內(nèi)置數(shù)據(jù)讀取器的分布式學(xué)習(xí)房午。它支持諸如前饋,CNN丹允,RNN郭厌,LSTM和序列到序列等算法。該工具支持Windows和Linux雕蔽。

  • 出生地:微軟
  • 特點:非常嚴(yán)謹(jǐn)折柠、語音上有一些優(yōu)勢、難度有點高
  • 調(diào)包語言:C++批狐、Python
  • 評價:語音上不錯呀扇售、微軟推不下去了、感覺不如TensorFlow嚣艇、有點復(fù)古
  • 入門推薦:不建議承冰,看看就好。

10.ONNX

ONNX是一種針對機(jī)器學(xué)習(xí)所設(shè)計的開放式的文件格式食零,用于存儲訓(xùn)練好的模型困乒。它使得不同的人工智能框架(如Pytorch, MXNet)可以采用相同格式存儲模型數(shù)據(jù)并交互。用大白話說就是是一個中間件慌洪,比如你PyTorch的模型想轉(zhuǎn)換別的顶燕,就得通過ONNX,現(xiàn)在有的框架可以直接轉(zhuǎn)冈爹,但是在沒有專門支持的時候涌攻,ONNX就非常重要了,萬物先轉(zhuǎn)ONNX频伤,ONNX再轉(zhuǎn)萬物恳谎。ONNX本身也有自己的模型庫以及很多開源的算子,所以用起來門檻不是那么高。

2.png
  • 出生地:有點多因痛,很多大廠一起整的
  • 特點:萬能轉(zhuǎn)換
  • 主要調(diào)包語言:Python婚苹、C/C++
  • 入門推薦:感覺不用刻意去學(xué)習(xí),用到了再看就可以的

三鸵膏、深度學(xué)習(xí)移動端推理框架

一些框架是面向算力有限的設(shè)備上做模型部署的膊升,比如嵌入式設(shè)備、機(jī)器人或者移動設(shè)備上谭企。

1.TensorRT

TensorRT是NVIDIA公司推出的面向GPU算力的推理框架廓译,在服務(wù)端和嵌入式設(shè)備上都有非常好的效果,但是底層不開源债查。TensorRT的合作方非常的多非区,主流的框架都支持。如果有GPU的話盹廷,傳統(tǒng)的算子可以用CUDA征绸,深度學(xué)習(xí)搞成TensorRT。

  • 出生地:NVIDIA
  • 特點:自產(chǎn)自銷NVIDIA不多解釋俄占,框架支持很多管怠,生態(tài)很棒,穩(wěn)定性高
  • 主要調(diào)包語言:Python颠放、C/C++
  • 推薦平臺:NVIDIA Jetson系列的嵌入式排惨、NVIDIA的GPU(一條龍)
  • 支持模型:TensorFlow1.x吭敢、TensorFlow2.x碰凶、PyTorch、ONNX鹿驼、PaddlePaddle欲低、MXNet、Caffe畜晰、Theano砾莱,Torch,Lasagne凄鼻,Blocks腊瑟。
  • 入門推薦:非常適合入門,畢竟直接在自己的GPU上做測試就行块蚌。

2.TF-Lite

TF-Lite是谷歌針對移動端的推理框架闰非,非常的強(qiáng)大。強(qiáng)大的原因在于Keras峭范、TensorFlow的模型都能使用财松,而且有專門的TPU和安卓平臺,這種一條龍的服務(wù)讓TensorFlow在部署方面還在稱霸。TF-Lite如果用Keras辆毡、TensorFlow的模型去轉(zhuǎn)換一般來說都是腳本直接開搞菜秦,自己重構(gòu)的部分相對少很多。

  • 出生地:Google
  • 特點:一條龍的服務(wù)專屬平臺
  • 主要調(diào)包語言:Python舶掖、C/C++球昨、Java
  • 支持模型:Keras、TensorFlow眨攘、ONNX
  • 推薦平臺:幾乎所有的ARM處理器和微控制器(樹莓派褪尝,甚至單片機(jī))、TPU專享
  • 入門推薦:TFboys(TensorFlow使用者)的必備期犬,畢竟一條龍河哑,還有機(jī)會了解TPU,非常貼心龟虎。

3.OpenVINO

OpenVINO是Intel的推理框架璃谨,一個超級強(qiáng)的推理部署工具。工具包中提供了很多便利的工具鲤妥,例如OpenVINO提供了深度學(xué)習(xí)推理套件(DLDT)佳吞,該套件可以將各種開源框架訓(xùn)練好的模型進(jìn)行線上部署,除此之外棉安,還包含了圖片處理工具包OpenCV底扳,視頻處理工具包Media SDK。如果是針對Intel的加速棒或者工控機(jī)上部署真的是非常不錯的贡耽。

  • 出生地:Intel
  • 特點:面向Intel設(shè)備的加速衷模,便捷使用,安裝和SDK很方便
  • 主要調(diào)包語言:C/C++蒲赂、Python
  • 支持模型:TensorFlow阱冶、PyTorch、ONNX滥嘴、MXNet木蹬、PaddlePaddle
  • 推薦平臺:自己的電腦、Intel神經(jīng)網(wǎng)絡(luò)加速棒若皱、Intel的FPGA
  • 入門推薦:作為入門的不啊還是不錯的镊叁,只是落地場景有點少,畢竟現(xiàn)在是邊緣設(shè)備的時代

因為工業(yè)上工控機(jī)多但是深度學(xué)習(xí)模型用的還是少走触,很多都是傳統(tǒng)的算法晦譬,很多落地場景中上Intel的處理器并不占優(yōu)勢。

4.CoreML

CoreML是蘋果公司推出針對ios以及macOS系統(tǒng)部署的機(jī)器學(xué)習(xí)平臺饺汹,底層不開源蛔添。在蘋果設(shè)備上,CoreML的速度是最快的,但是也只能用于蘋果的設(shè)備上∮疲現(xiàn)在開發(fā)apple app主要是Swift夸溶,受到Swift出的特性,真的是各種語言各種粘凶硅,很好入門缝裁。

  • 出生地:Apple
  • 特點:面向蘋果設(shè)備,專業(yè)設(shè)備上速度第一足绅,穩(wěn)定捷绑、入門簡單
  • 主要調(diào)包語言:C/C++、Python氢妈、Obj-C粹污、Swift
  • 支持模型:TensorFlow、ONNX首量、PyTorch壮吩、ONNX、MXNet加缘、Caffe
  • 推薦平臺:iMac鸭叙、MacBook、iPhone拣宏、iPad沈贝、AppleWatch
  • 入門推薦:針對Apple的開發(fā)者,業(yè)余選手得買個MBP

5.NCNN

NCNN是騰訊推出的推理框架勋乾,一定意義上是之前使用非常廣的一個推理框架宋下,社區(qū)做的也非常棒。NCNN的速度是超過TFLite的市俊,但是有點麻煩的是之前得經(jīng)常自己用C去復(fù)現(xiàn)一些算子(框架起步都這樣)杨凑,現(xiàn)在因為使用的人數(shù)很多滤奈,因此算子很多摆昧。NCNN對于X86、GPU均有支持蜒程,在嵌入式绅你、手機(jī)上的表現(xiàn)非常好。

  • 出生地:騰訊優(yōu)圖實驗室
  • 特點:面向移動端的加速昭躺、手機(jī)處理器的加速單元支持很棒
  • 主要調(diào)包語言:C/C++忌锯、Python
  • 支持模型:TensorFlow、ONNX领炫、PyTorch偶垮、ONNX倦西、MXNet放案、DarkNet、Caffe
  • 推薦平臺:安卓/蘋果手機(jī)、ARM處理器設(shè)備
  • 入門推薦:對于嵌入式或者APP開發(fā)有經(jīng)驗的同學(xué)絕對首推的

6.MNN

MNN是阿里巴巴推出的移動端框架汤踏,現(xiàn)在也支持模型訓(xùn)練,支持OpenCL怔揩,OpenGL蔗坯,Vulkan和Metal等。同樣的設(shè)備蛛芥,MNN的部署速度是非程崮瘢快的,樹莓派3B上cpu的加速是NCNN速度的3被以上仅淑,而且文檔非常的全称勋,代碼整潔清晰,非常適合開發(fā)者使用涯竟。

  • 出生地:阿里巴巴多部門合作
  • 特點:面向移動端的加速铣缠、應(yīng)該是現(xiàn)在速度之最
  • 主要調(diào)包語言:C/C++、Python
  • 支持模型:TensorFlow昆禽、ONNX蝗蛙、PyTorch、MXNet醉鳖、NCNN捡硅、Caffe、TF-Lite
  • 推薦平臺:安卓/蘋果手機(jī)盗棵、ARM處理器設(shè)備
  • 入門推薦:首推的部署推理框架壮韭,絕對的好用,在蘋果設(shè)備上的速度也很棒纹因。MNN框架感覺比NCNN穩(wěn)定一些喷屋,而且源碼非常整潔,研究底層也是非常方便瞭恰。

7.Tenigne

Tenigne-Lite是OpenAILab推出的邊緣端推理部署框架屯曹,OpenCV官方在嵌入式上的部署首推Tenigne-Lite。現(xiàn)在對于RISC-V惊畏、CUDA恶耽、TensorRT、NPU的支持非常不錯颜启。Tengine是現(xiàn)在來說感覺安裝環(huán)境中bug最少的框架偷俭,幾乎安按照文檔走不會出問題的。

  • 出生地:OpenAILab
  • 特點:面向移動端的加速缰盏、速度和MNN不相上下涌萤、對于嵌入式的支持非常好
  • 主要調(diào)包語言:C/C++淹遵、Python
  • 支持模型:TensorFlow、ONNX负溪、DarkNet合呐、MXNet、NCNN笙以、Caffe淌实、TF-Lite、NCNN
  • 推薦平臺:安卓手機(jī)猖腕、ARM處理器設(shè)備拆祈、RISC-V
  • 入門推薦:嵌入式開發(fā)的小伙伴還等什么,干就完了

Tengine-Lite是個朝氣蓬勃的框架倘感,雖然出的時間并沒有其他框架早放坏,但是框架性能、易用性還是非常適合嵌入式玩家的老玛。

8.NNIE

NNIE 即 Neural Network Inference Engine淤年,是海思 SVP 開發(fā)框架中的處理單元之一,主要針對深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)加速處理的硬件單元蜡豹,可用于圖片分類麸粮、目標(biāo)檢測等 AI 應(yīng)用場景。

image

支持現(xiàn)有大部分公開的卷積神經(jīng)網(wǎng)絡(luò)模型镜廉,如 AlexNet弄诲、VGG16、ResNet18娇唯、ResNet50齐遵、GoogLeNet 等分類網(wǎng)絡(luò),F(xiàn)aster R-CNN塔插、YOLO梗摇、SSD、RFCN 等檢測目標(biāo)網(wǎng)絡(luò)想许,以及 FCN 伶授、SegNet 等分割場景網(wǎng)絡(luò)。目前 NNIE 配套軟件及工具鏈僅支持以 Caffe 框架伸刃,使用其他框架的網(wǎng)絡(luò)模型需要轉(zhuǎn)化為 Caffe 框架下的模型谎砾。

image

華為海思NNIE非常強(qiáng)大,之前移動端真的快霸主捧颅,但是現(xiàn)在受制約芯片停產(chǎn)。

9.RKNN

Rockchip提供RKNN-Toolkit開發(fā)套件進(jìn)行模型轉(zhuǎn)換较雕、推理運行和性能評估碉哑。

  • 模型轉(zhuǎn)換:支持 Caffe挚币、Tensorflow、TensorFlow Lite扣典、ONNX妆毕、Darknet 模型,支持RKNN 模型導(dǎo)入導(dǎo)出贮尖,后續(xù)能夠在硬件平臺上加載使用笛粘。

  • 模型推理:能夠在 PC 上模擬運行模型并獲取推理結(jié)果,也可以在指定硬件平臺RK3399Pro Linux上運行模型并獲取推理結(jié)果湿硝。

  • 性能評估:能夠在 PC 上模擬運行并獲取模型總耗時及每一層的耗時信息薪前,也可以通過聯(lián)機(jī)調(diào)試的方式在指定硬件平臺 RK3399Pro Linux上運行模型,并獲取模型在硬件上運行時的總時間和每一層的耗時信息关斜。

四示括、卷積神經(jīng)網(wǎng)絡(luò) – CNN

https://easyai.tech/ai-definition/cnn/#zuoyong

CNN 的基本原理:

  1. 卷積層 – 主要作用是保留圖片的特征
  2. 池化層 – 主要作用是把數(shù)據(jù)降維,可以有效的避免過擬合
  3. 全連接層 – 根據(jù)不同任務(wù)輸出我們想要的結(jié)果

CNN 的實際應(yīng)用:

  1. 圖像分類痢畜、檢索
  2. 目標(biāo)檢測
  3. 目標(biāo)分割(語義分割垛膝、實例分割、全景分割)
  4. 人臉識別
  5. 骨骼識別

Object detection: speed and accuracy comparison (Faster R-CNN, R-FCN, SSD, FPN, RetinaNet and YOLOv3)

image

1.目標(biāo)檢測模型

判斷是圖片里面有什么丁稀,分別在哪里吼拥。

https://github.com/hoya012/deep_learning_object_detection

image

模型性能對比表

Detector VOC07 (mAP@IoU=0.5) VOC12 (mAP@IoU=0.5) COCO (mAP@IoU=0.5:0.95) Published In
R-CNN 58.5 - - CVPR'14
SPP-Net 59.2 - - ECCV'14
MR-CNN 78.2 (07+12) 73.9 (07+12) - ICCV'15
Fast R-CNN 70.0 (07+12) 68.4 (07++12) 19.7 ICCV'15
Faster R-CNN 73.2 (07+12) 70.4 (07++12) 21.9 NIPS'15
YOLO v1 66.4 (07+12) 57.9 (07++12) - CVPR'16
G-CNN 66.8 66.4 (07+12) - CVPR'16
AZNet 70.4 - 22.3 CVPR'16
ION 80.1 77.9 33.1 CVPR'16
HyperNet 76.3 (07+12) 71.4 (07++12) - CVPR'16
OHEM 78.9 (07+12) 76.3 (07++12) 22.4 CVPR'16
MPN - - 33.2 BMVC'16
SSD 76.8 (07+12) 74.9 (07++12) 31.2 ECCV'16
GBDNet 77.2 (07+12) - 27.0 ECCV'16
CPF 76.4 (07+12) 72.6 (07++12) - ECCV'16
R-FCN 79.5 (07+12) 77.6 (07++12) 29.9 NIPS'16
DeepID-Net 69.0 - - PAMI'16
NoC 71.6 (07+12) 68.8 (07+12) 27.2 TPAMI'16
DSSD 81.5 (07+12) 80.0 (07++12) 33.2 arXiv'17
TDM - - 37.3 CVPR'17
FPN - - 36.2 CVPR'17
YOLO v2 78.6 (07+12) 73.4 (07++12) - CVPR'17
RON 77.6 (07+12) 75.4 (07++12) 27.4 CVPR'17
DeNet 77.1 (07+12) 73.9 (07++12) 33.8 ICCV'17
CoupleNet 82.7 (07+12) 80.4 (07++12) 34.4 ICCV'17
RetinaNet - - 39.1 ICCV'17
DSOD 77.7 (07+12) 76.3 (07++12) - ICCV'17
SMN 70.0 - - ICCV'17
Light-Head R-CNN - - 41.5 arXiv'17
YOLO v3 - - 33.0 arXiv'18
SIN 76.0 (07+12) 73.1 (07++12) 23.2 CVPR'18
STDN 80.9 (07+12) - - CVPR'18
RefineDet 83.8 (07+12) 83.5 (07++12) 41.8 CVPR'18
SNIP - - 45.7 CVPR'18
Relation-Network - - 32.5 CVPR'18
Cascade R-CNN - - 42.8 CVPR'18
MLKP 80.6 (07+12) 77.2 (07++12) 28.6 CVPR'18
Fitness-NMS - - 41.8 CVPR'18
RFBNet 82.2 (07+12) - - ECCV'18
CornerNet - - 42.1 ECCV'18
PFPNet 84.1 (07+12) 83.7 (07++12) 39.4 ECCV'18
Pelee 70.9 (07+12) - - NIPS'18
HKRM 78.8 (07+12) - 37.8 NIPS'18
M2Det - - 44.2 AAAI'19
R-DAD 81.2 (07++12) 82.0 (07++12) 43.1 AAAI'19
ScratchDet 84.1 (07++12) 83.6 (07++12) 39.1 CVPR'19
Libra R-CNN - - 43.0 CVPR'19
Reasoning-RCNN 82.5 (07++12) - 43.2 CVPR'19
FSAF - - 44.6 CVPR'19
AmoebaNet + NAS-FPN - - 47.0 CVPR'19
Cascade-RetinaNet - - 41.1 CVPR'19
HTC - - 47.2 CVPR'19
TridentNet - - 48.4 ICCV'19
DAFS 85.3 (07+12) 83.1 (07++12) 40.5 ICCV'19
Auto-FPN 81.8 (07++12) - 40.5 ICCV'19
FCOS - - 44.7 ICCV'19
FreeAnchor - - 44.8 NeurIPS'19
DetNAS 81.5 (07++12) - 42.0 NeurIPS'19
NATS - - 42.0 NeurIPS'19
AmoebaNet + NAS-FPN + AA - - 50.7 arXiv'19
SpineNet - - 52.1 arXiv'19
CBNet - - 53.3 AAAI'20
EfficientDet - - 52.6 CVPR'20
DetectoRS - - 54.7 arXiv'20

2.圖像分類模型

圖像分類是對圖像判斷出所屬的分類,比如在學(xué)習(xí)分類中數(shù)據(jù)集有人(person)线衫、羊(sheep)扔罪、狗(dog)和貓(cat)四種。

https://github.com/weiaicunzai/awesome-image-classification

ConvNet ImageNet top1 acc ImageNet top5 acc Published In
Vgg 76.3 93.2 ICLR2015
GoogleNet - 93.33 CVPR2015
PReLU-nets - 95.06 ICCV2015
ResNet - 96.43 CVPR2015
PreActResNet 79.9 95.2 CVPR2016
Inceptionv3 82.8 96.42 CVPR2016
Inceptionv4 82.3 96.2 AAAI2016
Inception-ResNet-v2 82.4 96.3 AAAI2016
Inceptionv4 + Inception-ResNet-v2 83.5 96.92 AAAI2016
RiR - - ICLR Workshop2016
Stochastic Depth ResNet 78.02 - ECCV2016
WRN 78.1 94.21 BMVC2016
SqueezeNet 60.4 82.5 arXiv2017(rejected by ICLR2017)
GeNet 72.13 90.26 ICCV2017
MetaQNN - - ICLR2017
PyramidNet 80.8 95.3 CVPR2017
DenseNet 79.2 94.71 ECCV2017
FractalNet 75.8 92.61 ICLR2017
ResNext - 96.97 CVPR2017
IGCV1 73.05 91.08 ICCV2017
Residual Attention Network 80.5 95.2 CVPR2017
Xception 79 94.5 CVPR2017
MobileNet 70.6 - arXiv2017
PolyNet 82.64 96.55 CVPR2017
DPN 79 94.5 NIPS2017
Block-QNN 77.4 93.54 CVPR2018
CRU-Net 79.7 94.7 IJCAI2018
ShuffleNet 75.3 - CVPR2018
CondenseNet 73.8 91.7 CVPR2018
NasNet 82.7 96.2 CVPR2018
MobileNetV2 74.7 - CVPR2018
IGCV2 70.07 - CVPR2018
hier 79.7 94.8 ICLR2018
PNasNet 82.9 96.2 ECCV2018
AmoebaNet 83.9 96.6 arXiv2018
SENet - 97.749 CVPR2018
ShuffleNetV2 81.44 - ECCV2018
IGCV3 72.2 - BMVC2018
MnasNet 76.13 92.85 CVPR2018
SKNet 80.60 - CVPR2019
DARTS 73.3 91.3 ICLR2019
ProxylessNAS 75.1 92.5 ICLR2019
MobileNetV3 75.2 - arXiv2019
Res2Net 79.2 94.37 arXiv2019
EfficientNet 84.3 97.0 ICML2019

3.語義分割模型

語義分割(semantic segmentation)就是需要區(qū)分到圖中每一點像素點桶雀,而不僅僅是矩形框框住了矿酵。但是同一物體的不同實例不需要單獨分割出來。對下圖左矗积,標(biāo)注為人全肮,羊,狗棘捣,草地辜腺。而不需要羊1,羊2乍恐,羊3评疗,羊4,羊5等茵烈。

image
  • FCN
  • SegNet
  • U-Net
  • Dilated Convolutions
  • DeepLab (v1 & v2)
  • RefineNet
  • PSPNet
  • Large Kernel Matters
  • DeepLab v3
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末百匆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子呜投,更是在濱河造成了極大的恐慌加匈,老刑警劉巖存璃,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異雕拼,居然都是意外死亡纵东,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門啥寇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來偎球,“玉大人,你說我怎么就攤上這事辑甜∷バ酰” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵栈戳,是天一觀的道長岂傲。 經(jīng)常有香客問我,道長子檀,這世上最難降的妖魔是什么镊掖? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮褂痰,結(jié)果婚禮上亩进,老公的妹妹穿的比我還像新娘。我一直安慰自己缩歪,他們只是感情好归薛,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著匪蝙,像睡著了一般主籍。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上逛球,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天千元,我揣著相機(jī)與錄音,去河邊找鬼颤绕。 笑死幸海,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的奥务。 我是一名探鬼主播物独,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼氯葬!你這毒婦竟也來了挡篓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤溢谤,失蹤者是張志新(化名)和其女友劉穎瞻凤,沒想到半個月后憨攒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體世杀,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡阀参,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了瞻坝。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蛛壳。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖所刀,靈堂內(nèi)的尸體忽然破棺而出衙荐,到底是詐尸還是另有隱情,我是刑警寧澤浮创,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布忧吟,位于F島的核電站,受9級特大地震影響斩披,放射性物質(zhì)發(fā)生泄漏溜族。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一垦沉、第九天 我趴在偏房一處隱蔽的房頂上張望煌抒。 院中可真熱鬧,春花似錦厕倍、人聲如沸寡壮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽况既。三九已至,卻和暖如春组民,著一層夾襖步出監(jiān)牢的瞬間棒仍,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工邪乍, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留降狠,地道東北人。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓庇楞,卻偏偏與公主長得像榜配,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子吕晌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容