SS方法是當(dāng)前region proposal最主流使用的方法叠聋,在這里對(duì)這篇論文做一個(gè)一定程度的學(xué)習(xí)和理解記錄狡恬。
1.Selective Search By Hierarchical Grouping
1.使用Felzenszwalb and Huttenlocher的region算法,創(chuàng)建初始的region
2.然后使用貪心算法逐個(gè)合并region
? ? ? ? ?計(jì)算相鄰region的相似性良拼,最相似的兩個(gè)合并,不斷重復(fù),新的合并后的region繼續(xù)和相鄰region計(jì)算相似性皱炉,直到整個(gè)圖片成為一整個(gè)region (需要注意的是,為了計(jì)算方便狮鸭,當(dāng)兩個(gè)region合并的時(shí)候合搅,新的region的特征應(yīng)當(dāng)從之前的兩個(gè)region的特征直接計(jì)算出,而不是再回到圖片像素來(lái)計(jì)算)
2. Diversification Strategies
1,color similarity 色彩相似度歧蕉,通過(guò)了多種色彩格式和channel
2, texture similarity 紋理相似度
3, size 這里的大小是指區(qū)域中包含像素點(diǎn)的個(gè)數(shù)灾部。使用大小的相似度計(jì)算,主要是為了盡量讓小的區(qū)域先合并
4, fill 判斷兩個(gè)region是否適合合并惯退,其指標(biāo)是合并后的區(qū)域的Bounding Box(能夠框住區(qū)域的最小矩形(沒(méi)有旋轉(zhuǎn)))越小赌髓,其吻合度越高
3,Object Recognition using Selective Search
核心策略:bag-of-words for object detection
系統(tǒng)在實(shí)現(xiàn)過(guò)程中催跪,使用color-SIFT特征以及spatial pyramid divsion方法锁蠕。在一個(gè)尺度下σ=1.2下抽樣提取特征。使用SIFT懊蒸、Extended OpponentSIFT荣倾、RGB-SIFT特征,在四層金字塔模型 1×1骑丸、2×2舌仍、3×3、4×4通危,提取特征铸豁,可以得到一個(gè)維的特征向量。