官網(wǎng):cocodataset.org
COCO has five annotation types: for?object detection,?keypoint detection,?stuff segmentation,?panoptic segmentation, and?image captioning. The annotations are stored using?JSON. Please note that the?COCO API?described on the?download?page can be used to access and manipulate all anotations.
????object detection: 目標(biāo)檢測(cè)肄程;
????keypoint detection: 關(guān)鍵點(diǎn)檢測(cè)贯钩;
????stuff segmentation: stuff沒有固定形狀的物體,例如天空畜份、草地等诞帐,分割任務(wù);
????panoptic segmentation: 全景分割漂坏,圖片中things景埃,stuff等全被分割媒至;
????image captioning: “看圖說話”,一個(gè)圖片中的場(chǎng)景描述谷徙;
COCO數(shù)據(jù)集的簡(jiǎn)介
? ? ? ? COCO數(shù)據(jù)集是一個(gè)大型的拒啰、豐富的物體檢測(cè),分割和字幕數(shù)據(jù)集完慧。這個(gè)數(shù)據(jù)集以scene understanding為目標(biāo)谋旦,主要從復(fù)雜的日常場(chǎng)景中截取,圖像中的目標(biāo)通過精確的segmentation進(jìn)行位置的標(biāo)定屈尼。圖像包括91類目標(biāo)册着,328,000影像和2,500,000個(gè)label。
COCO數(shù)據(jù)集有91類脾歧,雖然比ImageNet和SUN類別少甲捏,但是每一類的圖像多,這有利于獲得更多的每類中位于某種特定場(chǎng)景的能力鞭执,對(duì)比PASCAL VOC司顿,其有更多類和圖像。
COCO數(shù)據(jù)集分兩部分發(fā)布兄纺,前部分于2014年發(fā)布大溜,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775?testing images估脆,有270k的segmented people和886k的segmented object钦奋;2015年版本:165,482 train, 81,208 val, and 81,434 test images。
?該數(shù)據(jù)集主要解決3個(gè)問題:目標(biāo)檢測(cè)疙赠,目標(biāo)之間的上下文關(guān)系付材,目標(biāo)的2維上的精確定位。COCO數(shù)據(jù)集有91類棺聊,雖然比ImageNet和SUN類別少伞租,但是每一類的圖像多,這有利于獲得更多的每類中位于某種特定場(chǎng)景的能力限佩,對(duì)比PASCAL VOC葵诈,其有更多類和圖像。
官網(wǎng)地址:http://cocodataset.org/#home
1祟同、COCO數(shù)據(jù)集的特點(diǎn)
COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features:
Object segmentation
Recognition in context
Superpixel stuff segmentation
330K images (>200K labeled)
1.5 million object instances
80 object categories
91 stuff categories
5 captions per image
250,000 people with keypoints
對(duì)象分割作喘;
在上下文中可識(shí)別;
超像素分割晕城;
330K圖像(> 200K標(biāo)記)泞坦;
150萬個(gè)對(duì)象實(shí)例;
80個(gè)對(duì)象類別砖顷;
?91個(gè)類別贰锁;
每張圖片5個(gè)字幕赃梧;
有關(guān)鍵點(diǎn)的250,000人;
2豌熄、數(shù)據(jù)集的大小和版本
大惺卩帧:25 GB(壓縮)
記錄數(shù)量: 330K圖像、80個(gè)對(duì)象類別锣险、每幅圖像有5個(gè)標(biāo)簽蹄皱、25萬個(gè)關(guān)鍵點(diǎn)。
?? ? ? ? COCO數(shù)據(jù)集分兩部分發(fā)布芯肤,前部分于2014年發(fā)布巷折,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775?testing images崖咨,有270k的segmented people和886k的segmented object锻拘;2015年版本:165,482 train, 81,208 val, and 81,434 test images。
(1)掩幢、2014年版本的數(shù)據(jù)逊拍,一共有20G左右的圖片和500M左右的標(biāo)簽文件。標(biāo)簽文件標(biāo)記了每個(gè)segmentation的像素精確位置+bounding box的精確坐標(biāo)际邻,其精度均為小數(shù)點(diǎn)后兩位。
3芍阎、COCO數(shù)據(jù)集的展示
COCO數(shù)據(jù)集的安裝
數(shù)據(jù)集下載地址:
1世曾、2014年
http://msvocds.blob.core.windows.net/coco2014/train2014.zip
2、2017年
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip