COCO 2017数据集下载链接:
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
COCO的 全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。
总共有
COCO数据集现在有3种标注类型:
如下:
上面所述的一共有三种类型,每种类型又包含了训练和验证,所以共6个JSON文件。
coco标注格式如下:
包含5个字段信息:
此外,在实际中,
以目标检测为例,解释下coco标注格式。
- images字段
是包含多个image实例的数组。格式如下:
每一个image的实例是一个dict。
其中最重要的是
其它几个字段一般用不上,例如一个实际的image例子如下:
- annotations字段
包含多个
id字段:指的是这个annotation的一个id
image_id:等同于前面image字段里面的id。
category_id:类别id
segmentation:
area:标注区域面积
bbox:标注框,x,y为标注框的左上角坐标。
iscrowd:决定是RLE格式还是polygon格式。
一个实际例子如下:
- categories字段
一个包含多个category实例的数组,而category结构体描述如下:
id:类别id
name:类别名字
supercatgory:
categories字段的id数,就是类别数。coco一共有80类,即id会递增到80。一个实际例子如下:
参考:
https://zhuanlan.zhihu.com/p/29393415
https://blog.csdn.net/u012609509/article/details/88680841?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2