![240](https://cdn2.jianshu.io/assets/default_avatar/13-394c31a9cb492fcb39c27422ca7d2815.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
VIDEO (LANGUAGE) MODELING: A BASELINE FOR GENERATIVE MODELS OF NATURAL V...
難點(diǎn): 1寿酌、模型必須理解如何傳播運(yùn)動(dòng)以及處理遮擋。 2、短期預(yù)測(cè):從模型改進(jìn)(從預(yù)測(cè)像素值改為預(yù)測(cè)動(dòng)作) 3、模糊:從代價(jià)函數(shù)改進(jìn)(加入GAN)...
計(jì)劃:上午調(diào)試prednet的代碼,完成refine net的訓(xùn)練,以及多幀的訓(xùn)練。 下午: 看有關(guān)光流估計(jì)的paper奇适, 以及在Caltech...
問題:無監(jiān)督學(xué)習(xí)到的特征更好的泛化到監(jiān)督訓(xùn)練分布之外的樣例上坟比。 任務(wù):通過視頻預(yù)測(cè),將預(yù)測(cè)的幀作為分類器的輸入嚷往,從而提高行為預(yù)測(cè)的精度葛账。 通過視...
問題:CNN-based光流預(yù)測(cè)在合成的數(shù)據(jù)上表現(xiàn)很好,但是在真是的場(chǎng)景中表現(xiàn)不好 方法:訓(xùn)練中加入真實(shí)數(shù)據(jù)皮仁,進(jìn)行自監(jiān)督的視頻預(yù)測(cè)任務(wù)籍琳。 改進(jìn)方...
問題: 視頻預(yù)測(cè)需要捕捉:1、pixe-wise appearance. 2贷祈、motion change趋急。然而現(xiàn)在的方法并不對(duì)pixel-wis...
1、給定兩幀的關(guān)節(jié)點(diǎn)位置信息势誊,學(xué)習(xí)到類似光流的轉(zhuǎn)換呜达,應(yīng)用到第一幀的圖像上,生成下一幀粟耻? 2查近、身份信息并沒有保留? 生成過程:通過合理地表示生成的...
任務(wù): 預(yù)測(cè)未來幀的場(chǎng)景分割勋颖,給定視頻幀的輸入序列,預(yù)測(cè)未觀察到的幀的場(chǎng)景圖勋锤。 動(dòng)機(jī): 預(yù)測(cè)像素值與預(yù)測(cè)高層次的場(chǎng)景相比過于復(fù)雜饭玲,然而后者對(duì)于大...
編碼-解碼框架不同于: 1、先解碼再編碼叁执。 2茄厘、每次對(duì)groundtruth和預(yù)測(cè)的幀之間的差進(jìn)行編碼,進(jìn)行下一次預(yù)測(cè)谈宛。 3次哈、多幀預(yù)測(cè)時(shí)對(duì)相鄰兩...