《Two-Stream Convolutional Networks for Action Recognition in Videos》算法詳解

論文鏈接:Two-Stream Convolutional Networks for Action Recognition in Videos

文章由牛津大學(xué)VGG實(shí)驗(yàn)室提出,收錄于NIPS2014。
該文章認(rèn)為視頻的信息可以分為空間信息和時(shí)間信息,所以該文章提出了一種利用普通rgb圖像(代表空間信息)和光流信息(代表時(shí)間信息)來解決視頻的動(dòng)作分類問題求橄。

首先需要了解什么是光流比肄,請看博客《光流估計(jì)——從傳統(tǒng)方法到深度學(xué)習(xí)》

一忿磅、網(wǎng)絡(luò)結(jié)構(gòu)

網(wǎng)絡(luò)有兩種輸入,一種是代表空間信息的視頻幀盏袄,一種是代表時(shí)間信息的特征幀忿峻。所以網(wǎng)絡(luò)也由兩種深度網(wǎng)絡(luò)組成薄啥,兩個(gè)網(wǎng)絡(luò)都是由CNN加softmax組成。最后的輸出也有兩種形式:兩個(gè)網(wǎng)絡(luò)softmax輸出的平均值逛尚、在兩個(gè)網(wǎng)絡(luò)softmax輸出結(jié)果堆疊的基礎(chǔ)上訓(xùn)練一個(gè)SVM垄惧。

對于空間網(wǎng)絡(luò)(輸入為普通rgb圖片的網(wǎng)絡(luò))來說,輸入的是大小為224*224*3的圖像绰寞。
對于時(shí)間網(wǎng)絡(luò)(輸入為光流信息的網(wǎng)絡(luò))來說到逊,輸入的是大小為224*224*2L的光流棧。

1.png

上述講到光流網(wǎng)絡(luò)由代表時(shí)間信息的特征幀作為輸入滤钱,文章實(shí)際上討論了四種輸入形式

討論時(shí)序特征之前還需要定義一個(gè)目前在雙流系列網(wǎng)絡(luò)經(jīng)常會(huì)用到的術(shù)語觉壶,叫snippet,一個(gè)snippet由一幀圖像幀和幾幀光流幀組成

光流棧

計(jì)算每兩幀之間的光流件缸,將多幀光流堆疊起來形成網(wǎng)絡(luò)的輸入铜靶。因?yàn)楣饬靼瑑蓚€(gè)方向,所以每個(gè)光流場是包含x和y方向兩個(gè)通道的特征圖他炊。對于將L個(gè)連續(xù)光流幀作為輸入争剿,那么網(wǎng)絡(luò)的輸入通道數(shù)為2L,即I_{\tau}\in R^{w \times h \times 2L}痊末,\tau表示第\tau個(gè)輸入網(wǎng)絡(luò)的光流棧蚕苇,用snippet來說的話就是第\tau個(gè)snippet的光流輸入。
I_{\tau}光流棧中的某兩個(gè)光流幀在坐標(biāo)點(diǎn)(u,v)位置的值可以用公式表示如下:
I_{\tau}(u, v, 2k-1)=d^x_{\tau+k-1}(u,v),
I_{\tau}(u, v, 2k)=d^y_{\tau+k-1}(u,v), u=[1:w],v=[1:h],k=[1:L]
上面w,h為圖像大小舌胶,L為輸入的光流椑κ瘢總幀數(shù)。

軌跡疊加

軌跡疊加就是假設(shè)第一幀的某個(gè)像素點(diǎn)幔嫂,我們可以通過光流來追蹤它在視頻中的軌跡辆它。而簡單的光流場疊加并沒有追蹤。光流和軌跡的區(qū)別如下圖所示履恩。


2.png

軌跡特征使用公式表示如下锰茉,類似于光流表示:
I_{\tau}(u, v, 2k-1)=d^x_{\tau+k-1}(p_k),
I_{\tau}(u, v, 2k)=d^y_{\tau+k-1}(p_k), u=[1:w],v=[1:h],k=[1:L]
上式中p_k表示在第一個(gè)以(u,v)點(diǎn)為起始點(diǎn),在特征棧中第k幀的坐標(biāo)點(diǎn)位置(即原始的(u,v)點(diǎn)經(jīng)過k幀后到達(dá)的點(diǎn)位置),上式中d表示光流信息切心,其它同光流飒筑。
p_k的計(jì)算公式如下:
p_1=(u,v);
p_k=p_{k-1}+d_{\tau+k-2}(p_{k-1}),k>1.
通俗來說p_k就是從初始位置(u,v)開始根據(jù)光流信息計(jì)算出來的在k幀到達(dá)的位置。

雙向光流

上述講的都是單向光流绽昏,即以某一幀為初始幀协屡,計(jì)算后面的光流。雙向光流是以當(dāng)前幀為中間幀全谤,光流場來源于前面幾幀和后面幾幀計(jì)算出的光流的疊加肤晓。

減去平均值光流

為了減少攝像機(jī)拍攝時(shí)本身的運(yùn)動(dòng)帶來的影響,輸入光流之前減去平均的光流作為網(wǎng)絡(luò)的輸入。

該文章的原理就是這些补憾,具體實(shí)驗(yàn)請參考原文漫萄。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市盈匾,隨后出現(xiàn)的幾起案子腾务,更是在濱河造成了極大的恐慌,老刑警劉巖削饵,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岩瘦,死亡現(xiàn)場離奇詭異,居然都是意外死亡葵孤,警方通過查閱死者的電腦和手機(jī)担钮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來尤仍,“玉大人,你說我怎么就攤上這事狭姨≡桌玻” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵饼拍,是天一觀的道長赡模。 經(jīng)常有香客問我,道長师抄,這世上最難降的妖魔是什么漓柑? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮叨吮,結(jié)果婚禮上辆布,老公的妹妹穿的比我還像新娘。我一直安慰自己茶鉴,他們只是感情好锋玲,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著涵叮,像睡著了一般惭蹂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上割粮,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天盾碗,我揣著相機(jī)與錄音,去河邊找鬼舀瓢。 笑死廷雅,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播榜轿,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼幽歼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了谬盐?” 一聲冷哼從身側(cè)響起甸私,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎飞傀,沒想到半個(gè)月后皇型,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡砸烦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年弃鸦,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片幢痘。...
    茶點(diǎn)故事閱讀 39,785評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡唬格,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出颜说,到底是詐尸還是另有隱情购岗,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布门粪,位于F島的核電站喊积,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏玄妈。R本人自食惡果不足惜乾吻,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望拟蜻。 院中可真熱鬧绎签,春花似錦、人聲如沸瞭郑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽屈张。三九已至擒权,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間阁谆,已是汗流浹背碳抄。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留场绿,地道東北人剖效。 一個(gè)月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親璧尸。 傳聞我的和親對象是個(gè)殘疾皇子咒林,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容