115.【論文理解】RP2K

RP2K

細(xì)粒度圖像分類的大規(guī)模零售商品數(shù)據(jù)集

核心問題:用物體識(shí)別方法來識(shí)別貨架上商品洛姑。

種類多蒜鸡、同類不同品類(或規(guī)格、角度)但外觀相似纤勒、拍攝角度和光照差異大坯苹。
2000種SKU、真實(shí)零售商品摇天、分級(jí)標(biāo)注(根據(jù)形狀等分成6粹湃、7類)恐仑。

Related

  • 細(xì)粒度圖像分類:

    零售商品的識(shí)別是圖像細(xì)粒度分類的領(lǐng)域問題,因?yàn)椴煌放圃儆蟆⒖谖兜纳唐啡搜劭雌饋砗芟嗨啤?/p>

  • 零售產(chǎn)品數(shù)據(jù)集:

1)RPC數(shù)據(jù)集有200類菊霜,8w+圖片,由于每張圖片中每個(gè)物體都提供了邊界框和標(biāo)簽济赎,因此可提供40w張單物體圖像鉴逞。但光照簡(jiǎn)單、背景干凈司训,不是真實(shí)場(chǎng)景构捡。

2)TGFS: 自主售貨機(jī)真實(shí)場(chǎng)景圖片,3w張圖片只有24類壳猜,3大類勾徽,數(shù)據(jù)為480*640。

3)SKU-110K數(shù)據(jù)集:100w張圖片统扳,但只是密集場(chǎng)景中零售物體檢測(cè)喘帚,只有邊界框沒有提供種類。

4)MVTEC:實(shí)例感知的語義分割數(shù)據(jù)集咒钟,60種吹由,2.1w張圖片,與RPC類似朱嘴,只有受限的攝像頭設(shè)置倾鲫,種類少。

Dataset

  • 組織:

    用RetinaNet在輔助檢測(cè)數(shù)據(jù)集上訓(xùn)練檢測(cè)子萍嬉,后人為篩選乌昔、標(biāo)注每個(gè)邊界框圖
    一般,每個(gè)裁剪出的邊界框圖有六個(gè)SKU屬性壤追。

種類標(biāo)簽有兩種:一種是罐磕道、瓶、袋等7種形狀類別行冰,另一種是通過非酒精飲料捅厂、調(diào)味品、化妝品等6種類別分類资柔。

  • 數(shù)據(jù)收集:

    10個(gè)城市500多個(gè)不同商店收集得到焙贷,一個(gè)圖片中心位置是架子,一個(gè)圖片只有一個(gè)架子贿堰,每個(gè)圖片至少3000*3000像素辙芍。
    使用不同相機(jī),采集到的單個(gè)目標(biāo)大小至少80*80

  • 統(tǒng)計(jì):

    共拍攝1.4w張高清貨架圖,單目標(biāo)圖像有53w+, 一共有2000個(gè)SKU, 平均每個(gè)SKU有267張圖故硅。
    訓(xùn)練/測(cè)試集為0.85/0.15

  • 輔助檢測(cè)數(shù)據(jù)集:

    抽出1400個(gè)貨架圖中的9.6萬張圖(7種形狀類別)訓(xùn)練目標(biāo)檢測(cè)子庶灿。

衡量數(shù)據(jù)集

以上檢測(cè)數(shù)據(jù)集用于衡量RP2K數(shù)據(jù)集,在分類任務(wù)上的效果吃衅。

使用MobileNet和inceptionV3作為分類往踢。

四種訓(xùn)練方式——從頭訓(xùn)練、預(yù)訓(xùn)練徘层、帶增強(qiáng)的從頭訓(xùn)練和帶增強(qiáng)的預(yù)訓(xùn)練——中峻呕,帶有增強(qiáng)的預(yù)訓(xùn)練方式效果較好。

兩千個(gè)商品排序(由多向少排列)趣效、每十個(gè)聚集在一起瘦癌,然后計(jì)算top1分類準(zhǔn)確度,預(yù)測(cè)準(zhǔn)確度隨實(shí)例數(shù)減少而減低跷敬。

以上構(gòu)成細(xì)粒度識(shí)別的長(zhǎng)尾問題讯私。

其他可能的研究問題

  • 對(duì)抗攻擊和防御

    細(xì)粒度特征使得我們得到的數(shù)據(jù)集中兩種類別的圖像之間差異非常不明顯,2000個(gè)的類別數(shù)比傳統(tǒng)的imageNet和CIFAR/MNIST(防御算法基于的數(shù)據(jù)集)西傀,類別更多斤寇,防御問題就更富挑戰(zhàn)。

  • 結(jié)構(gòu)圖片上的生成模型

    提供了真實(shí)的語義輸出布局信息拥褂,用于生成模型

  • 少樣本學(xué)習(xí)

    我們數(shù)據(jù)集的長(zhǎng)尾效應(yīng)提供了100多類實(shí)例數(shù)小于30個(gè)圖片(一共有200大類)娘锁,所以該數(shù)據(jù)集可以用于少量樣本學(xué)習(xí)算法的評(píng)估。

Conclusion

貨架產(chǎn)品識(shí)別任務(wù)激發(fā)下肿仑,提出零售產(chǎn)品識(shí)別數(shù)據(jù)集RP2K致盟,可用于大量AI驅(qū)動(dòng)的零售業(yè)的——圖片檢索碎税、空貨架檢測(cè)和銷售活動(dòng)跟蹤等等尤慰。

作為細(xì)粒度分類數(shù)據(jù)集,RP2K是最多種類的數(shù)據(jù)集雷蹂,但種類中的實(shí)例數(shù)量遞減伟端。

數(shù)據(jù)集中有豐富的屬性信息。

當(dāng)前模型在識(shí)別系統(tǒng)中的改進(jìn)可以有很大的提升空間匪煌,除目標(biāo)識(shí)別外少樣本學(xué)習(xí)责蝠、生成模型等也能用拿到次數(shù)據(jù)集。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末萎庭,一起剝皮案震驚了整個(gè)濱河市霜医,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌驳规,老刑警劉巖肴敛,帶你破解...
    沈念sama閱讀 206,311評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡医男,警方通過查閱死者的電腦和手機(jī)砸狞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來镀梭,“玉大人刀森,你說我怎么就攤上這事”ㄕ耍” “怎么了研底?”我有些...
    開封第一講書人閱讀 152,671評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)笙什。 經(jīng)常有香客問我飘哨,道長(zhǎng),這世上最難降的妖魔是什么琐凭? 我笑而不...
    開封第一講書人閱讀 55,252評(píng)論 1 279
  • 正文 為了忘掉前任芽隆,我火速辦了婚禮,結(jié)果婚禮上统屈,老公的妹妹穿的比我還像新娘胚吁。我一直安慰自己,他們只是感情好愁憔,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評(píng)論 5 371
  • 文/花漫 我一把揭開白布腕扶。 她就那樣靜靜地躺著,像睡著了一般吨掌。 火紅的嫁衣襯著肌膚如雪半抱。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,031評(píng)論 1 285
  • 那天膜宋,我揣著相機(jī)與錄音窿侈,去河邊找鬼。 笑死秋茫,一個(gè)胖子當(dāng)著我的面吹牛史简,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播肛著,決...
    沈念sama閱讀 38,340評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼圆兵,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了枢贿?” 一聲冷哼從身側(cè)響起殉农,我...
    開封第一講書人閱讀 36,973評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎局荚,沒想到半個(gè)月后超凳,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,466評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評(píng)論 2 323
  • 正文 我和宋清朗相戀三年聪建,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了钙畔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,039評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡金麸,死狀恐怖擎析,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情挥下,我是刑警寧澤揍魂,帶...
    沈念sama閱讀 33,701評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站棚瘟,受9級(jí)特大地震影響现斋,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜偎蘸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評(píng)論 3 307
  • 文/蒙蒙 一庄蹋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧迷雪,春花似錦限书、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至赁严,卻和暖如春扰柠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背疼约。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來泰國打工卤档, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人忆谓。 一個(gè)月前我還...
    沈念sama閱讀 45,497評(píng)論 2 354
  • 正文 我出身青樓裆装,卻偏偏與公主長(zhǎng)得像踱承,于是被迫代替她去往敵國和親倡缠。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評(píng)論 2 345