目标检测/分类常用数据集和评价指标小汇集 - 好文

【人工智能学习总结1】分类、目标检测中的评价指标（一） <https://zhuanlan.zhihu.com/p/33273532>
一：准确率（Accuracy）、错误率（Error rate）

二：混淆矩阵（Confusion Matrix）

三：召回率（Recall）、精确率（Precision）

四： P-R曲线、平均精度（Average-Precision，AP）、F指标

五：受试者工作特征曲线（Receiver Operating
Characteristic，ROC）、AUC（Area Under Curve）、 EER（Equal Error Rate）
六: 平均精度均值(Mean Average Precision，mAP)、

IOU(Intersection Over Union)

目标检测入门（二）：模型的评测与训练技巧 <https://zhuanlan.zhihu.com/p/34179420>

Pascal VOC（Pascal Visual Object Classes）

自2005年起每年举办一次比赛，最开始只有4类，到2007年扩充为20个类，共有两个常用的版本：2007和2012。学术界常用5k的trainval2007和16k的trainval2012作为训练集（07+12），test2007作为测试集，用10k的trainval2007+test2007和和16k的trainval2012作为训练集（07++12），test2012作为测试集，分别汇报结果。

MS COCO（Common Objects in COntext）

相比ImageNet，COCO更加偏好目标与其场景共同出现的图片，即non-iconic
images。这样的图片能够反映视觉上的语义，更符合图像理解的任务要求。而相对的iconic images则更适合浅语义的图像分类等任务。

COCO的检测任务共含有80个类，在2014年发布的数据规模分train/val/test分别为80k/40k/40k，学术界较为通用的划分是使用train和35k的val子集作为训练集（trainval35k），使用剩余的val作为测试集（minival），同时向官方的evaluation
server提交结果（test-dev）。除此之外，COCO官方也保留一部分test数据作为比赛的评测集。

在分布方面，COCO的每个类含有更多实例，分布也较为均衡（上图a），每张图片包含更多类和更多的实例（上图b和c，均为直方图，每张图片平均分别含3.3个类和7.7个实例），相比Pascal
VOC，COCO还含有更多的小物体（下图，横轴是物体占图片的比例）。

深度学习的视觉领域下常用的数据集汇总 <https://blog.csdn.net/ITBigGod/article/details/79734860>

ImageNet

Imagenet数据集有1400多万幅图片，涵盖2万多个类别；其中有超过百万的图片有明确的类别标注和图像中物体位置的标注，具体信息如下：
1）Total number of non-empty synsets: 21841
2）Total number of images: 14,197,122
3）Number of images with bounding box annotations: 1,034,908
4）Number of synsets with SIFT features: 1000
5）Number of images with SIFT features: 1.2 million

COCO

COCO(Common Objects in Context)是一个新的图像识别、分割和图像语义数据集，它有如下特点：
1）Object segmentation
2）Recognition in Context
3）Multiple objects per image
4）More than 300,000 images
5）More than 2 Million instances
6）80 object categories
7）5 captions per image
8）Keypoints on 100,000 people

PASCAL VOC

PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试，提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL
VOC图片集包括20个目录：人类；动物（鸟、猫、牛、狗、马、羊）；交通工具（飞机、自行车、船、公共汽车、小轿车、摩托车、火车）；室内（瓶子、椅子、餐桌、盆栽植物、沙发、电视）。PASCAL
VOC挑战赛在2012年后便不再举办，但其数据集图像质量好，标注完备，非常适合用来测试算法性能。

CIFAR

CIFAR-10包含10个类别，50,000个训练图像，彩色图像大小：32x32，10,000个测试图像。CIFAR-100与CIFAR-10类似，包含100个类，每类有600张图片，其中500张用于训练，100张用于测试；这100个类分组成20个超类。图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集。

热门工具换一换