雙流法 (Two-Stream) 以及 C3D卷積

簡(jiǎn)介

雙流法 以及 C3D 算是行為識(shí)別中比較經(jīng)典也是比較基本的兩種方法舷胜,一下就對(duì)這兩種方法進(jìn)行一個(gè)簡(jiǎn)單的記錄。
簡(jiǎn)單來說活翩,其實(shí)雙流法與C3D卷積網(wǎng)絡(luò)所要處理的問題都是在一段視頻中的類別信息(這里的信息根據(jù)數(shù)據(jù)集暫時(shí)都是為單一的信息)烹骨,通過找到這個(gè)類別信息來表明這一段視頻的分類翻伺。

雙流法 (Two-Stream)

雙流法,顧名思義就好像是兩條小溪流各自流動(dòng)最后匯聚到了一塊展氓;其中一條小溪流的名稱為“RGB”圖信息,可以是3通道的信息脸爱,也可以是 RGB-D 的灰度圖信息遇汞; 而另一條小溪流的名稱是“光流”圖的信息,一般的光流圖為2通道的信息簿废,分別為在X軸上的信息變化與Y軸上的信息變化空入。【光流是通過對(duì)兩張圖進(jìn)行梯度計(jì)算得到族檬,抽象層面可以理解成是其關(guān)鍵點(diǎn)的像素點(diǎn)信息移動(dòng)的信息】

如圖所示歪赢,其實(shí)做法非常的簡(jiǎn)單,相當(dāng)于訓(xùn)練兩個(gè)CNN的分類器单料。一個(gè)是專門對(duì)于 RGB 圖的埋凯, 一個(gè)專門對(duì)于光流圖的, 然后將兩者的結(jié)果進(jìn)行一個(gè) fushion 的過程扫尖。RGB圖的選擇白对,是對(duì)于所給的一段視頻隨機(jī)挑選出視頻中的任意一幀;而光流圖是選擇視頻中的任意一幀的時(shí)間然后及其后面的N幀疊合成一個(gè)光流棧進(jìn)入訓(xùn)練换怖∷δ眨【這種光流的訓(xùn)練方式是論文作者認(rèn)為,這樣子的光流疊加可以獲得它的運(yùn)動(dòng)信息流沉颂,但是實(shí)際上光流圖并不是以motion的信息來得到結(jié)果条摸,有興趣可以參看(參考資料2)的內(nèi)容】

P.S: 因?yàn)檫@個(gè)雙流法是訓(xùn)練了兩個(gè)網(wǎng)絡(luò),在最后 softmax 前進(jìn)行了fushion铸屉,顯示效果不錯(cuò)钉蒲。這是一篇14年的開篇之作,在16年時(shí)候彻坛,有人對(duì)fushion的位置進(jìn)行了研究子巾。(有興趣可以去閱讀論文:https://arxiv.org/abs/1604.06573

TSN

這里順便提一下 TSN ,一個(gè)根據(jù) two-stream 改進(jìn)的網(wǎng)絡(luò)框架小压。這一個(gè)框架的改進(jìn)初衷是因?yàn)樽钤及姹镜膖wo-stream對(duì)長(zhǎng)視頻的內(nèi)容分類效果并不好线梗。這里可以簡(jiǎn)單的舉個(gè)例子想象一下,比如各個(gè)學(xué)校都是有運(yùn)動(dòng)會(huì)的怠益,現(xiàn)在我們來到跳遠(yuǎn)場(chǎng)地拍了一段一位選手的跳遠(yuǎn)過程視頻仪搔。然后我們將這段視頻丟給原先的 Two-stream 框架進(jìn)行測(cè)試,結(jié)果得到了一個(gè)跑步的結(jié)果蜻牢。這是為什么呢烤咧?就是因?yàn)槲覀兂槿C(jī)制的方式偏陪,我們隨機(jī)抽取與訓(xùn)練的方式,不能覆蓋的這段視頻的過程煮嫌。因?yàn)樘h(yuǎn)是一個(gè)助跑與跳的過程笛谦,他有比較強(qiáng)烈的時(shí)間序列性質(zhì)。而TSN改進(jìn)的方面非常的簡(jiǎn)單昌阿,它只是將整段視頻切割成了3段(可以是3段)饥脑,然后對(duì)每段進(jìn)行 two-steam的訓(xùn)練,最后再進(jìn)行疊加懦冰。如下圖所示:

C3D 卷積網(wǎng)絡(luò)

C3D 網(wǎng)絡(luò)其實(shí)也非常簡(jiǎn)單灶轰,其實(shí)就是在2D卷積的過程中加上了時(shí)間維度的信息進(jìn)行時(shí)間維度上的卷積。一個(gè)2D的卷積對(duì)于一個(gè)3維的【這里說3維是 一般我們的圖像是 C * W * H 刷钢,這里先解釋成三維來進(jìn)行說明】笋颤,最后得到的是一個(gè)二維的feature map,假設(shè)當(dāng)我們有 K 個(gè)卷積核時(shí)内地,進(jìn)行面的堆疊伴澄,最后就形成一個(gè)三維結(jié)構(gòu) K * W * H (這里默認(rèn)卷積不降維)。同理阱缓, C3D相當(dāng)于是設(shè)計(jì)了一個(gè)3D的卷積對(duì)一個(gè)4維【抽象來看也可以是一個(gè)3維結(jié)構(gòu) (C * L)* W * H 】的結(jié)構(gòu)進(jìn)行卷積最后得到一個(gè)3維的結(jié)構(gòu)秉版。然后假設(shè)當(dāng)我們有K個(gè)卷積核時(shí),其實(shí)也可以算是3維deep時(shí)的疊加茬祷,也可以看做是堆疊成四維向量清焕。【這里你可以想象成祭犯,先進(jìn)行了一步 2D 卷積得到 feature map 后秸妥,對(duì)這些 feature map 再在空間上進(jìn)行卷積】

下圖,我們可以有一個(gè)直觀理解2D卷積和3D卷積的差別沃粗≈嗑澹【摘自論文】

我們可以根據(jù)這個(gè)箭頭的順序信息來理解卷積的過程【這里最好將圖片先看做 RGB-D 來理解,比較容易最盅,因?yàn)檫@種方式它的通道數(shù)是 1 】突雪,先進(jìn)行一個(gè)平面的卷積來得到這張圖的 feature map 之后在其時(shí)間序列上再進(jìn)行卷積。

得到 feature map 后的圖形卷積過程涡贱,可以類似如下圖所示:

筆者個(gè)人認(rèn)為咏删,C3D的卷積過程其實(shí)可以看做時(shí)序序列的附近信息逐步疊合的過程∥蚀剩可以用感受野來去想象督函,他有點(diǎn)類似從散到點(diǎn)的過程(如下圖的類似過程)。筆者個(gè)人認(rèn)為可能在這樣的一個(gè)過程中,對(duì)于動(dòng)作的序列信息比如最開始一張圖片對(duì)于后續(xù)的動(dòng)作影響比重比例稍有欠妥辰狡,可能是可以提升的地方锋叨。【這里也就是個(gè)人的推測(cè)而已宛篇,可以當(dāng)做笑話】

【參考資料】

  1. http://www.reibang.com/p/0b4964261673
  2. https://blog.csdn.net/elaine_bao/article/details/80891173【光流在視頻識(shí)別中的作用】
  3. https://zhuanlan.zhihu.com/p/34929782 【two-stream】
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末娃磺,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子叫倍,更是在濱河造成了極大的恐慌偷卧,老刑警劉巖段标,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異赛糟,居然都是意外死亡璧南,警方通過查閱死者的電腦和手機(jī)师逸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門动知,熙熙樓的掌柜王于貴愁眉苦臉地迎上來员辩,“玉大人,你說我怎么就攤上這事√福” “怎么了爽室?”我有些...
    開封第一講書人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵嘿架,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我啸箫,道長(zhǎng)蝉娜,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任纸镊,我火速辦了婚禮逗威,結(jié)果婚禮上概耻,老公的妹妹穿的比我還像新娘弄贿。我一直安慰自己,他們只是感情好期奔,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開白布肺孤。 她就那樣靜靜地躺著茫叭,像睡著了一般揍愁。 火紅的嫁衣襯著肌膚如雪呐萨。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,036評(píng)論 1 285
  • 那天莽囤,我揣著相機(jī)與錄音谬擦,去河邊找鬼。 笑死朽缎,一個(gè)胖子當(dāng)著我的面吹牛惨远,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播饵沧,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼锨络,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼赌躺!你這毒婦竟也來了狼牺?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤礼患,失蹤者是張志新(化名)和其女友劉穎是钥,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缅叠,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡悄泥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肤粱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弹囚。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖领曼,靈堂內(nèi)的尸體忽然破棺而出鸥鹉,到底是詐尸還是另有隱情,我是刑警寧澤庶骄,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布毁渗,位于F島的核電站,受9級(jí)特大地震影響单刁,放射性物質(zhì)發(fā)生泄漏灸异。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肺樟。 院中可真熱鬧檐春,春花似錦、人聲如沸么伯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蹦狂。三九已至誓篱,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間凯楔,已是汗流浹背窜骄。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留摆屯,地道東北人邻遏。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像虐骑,于是被迫代替她去往敵國(guó)和親准验。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容