自從AlexNet在2012年贏得ImageNet競(jìng)賽以來,CNN算法已經(jīng)成為很多深度學(xué)習(xí)問題都在用的算法鸥咖,特別是在計(jì)算機(jī)視覺方面。
循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)并不相互排斥啊研。盡管它們似乎被用來解決不同的問題鸥拧,但重要的是這兩個(gè)架構(gòu)都可以處理某些類型的數(shù)據(jù)。例如沟娱,RNN使用序列作為輸入腕柜。值得注意的是矫废,序列并不局限于文本或音樂砰蠢。視頻是圖像的集合,也可以用作序列娩脾。
循環(huán)神經(jīng)網(wǎng)絡(luò)柿赊,如LSTM幻枉,被用于數(shù)據(jù)具有時(shí)間特征的情況(如時(shí)間序列),以及數(shù)據(jù)上下文敏感的情況(如句子補(bǔ)全)熬甫,其中反饋循環(huán)的記憶功能是達(dá)到理想性能的關(guān)鍵。RNN還在計(jì)算機(jī)視覺的下列領(lǐng)域中得到了成功的應(yīng)用:
「日間圖片」與「夜間圖片」是圖像分類的一個(gè)例子(一對(duì)一RNN)瞻颂;
圖像描述(一對(duì)多RNN)是根據(jù)圖像的內(nèi)容為圖像分配標(biāo)題的過程郑象,例如「獅子獵鹿」;
手寫體識(shí)別盖矫;