1. MNIST手写数字分类图像集
地址:
http://yann.lecun.com/exdb/mnist/
手写数字识别图像库,共70000张图片,其中60000张训练集图片,10000张测试集图片,图像大小28×28,黑底白字样式
train-images-idx3-ubyte.gz:训练集图片
train-labels-idx1-ubyte.gz:训练集图片对应数字标签
t10k-images-idx3-ubyte.gz:测试集图片
t10k-labels-idx1-ubyte.gz:测试集图片对应数字标签
下载后需转为lmdb或leveldb格式
2. CIFAR分类图像集
CIFAR-10
图像集包含60000张32×32的彩色图片,共分10个类别,每个类别6000张图片。其中50000张为训练集图片,10000张为测试集图片。训练集中每个类别5000张图片,测试集中每个类别1000张图片,训练集与测试集中图片类别均随机分布。
图片共10个类别,包括:飞机、小汽车(含轿车与SUV)、鸟、猫、鹿、狗、青蛙、马、船、卡车(仅含大卡车,不含皮卡)。
链接中有3个不同格式的版本可下载:
-
CIFAR-10 python version
:适用于Tensorflow、Pytorch等基于Python开发的框架 -
CIFAR-10 Matlab version
:适用于Matlab -
CIFAR-10 binary version (suitable for C programs)
:适用于Caffe,下载后需转为lmdb或leveldb格式
CIFAR-10 binary version (suitable for C programs)
解压后如下所示,训练集图片分为5个包(batch),每个包都为bin后缀,每个包有10000张图片。测试集有1个包,包含10000张图片。训练集中可能有的包的类别中的图片数可能多于其他类别的,但总的来说,所有训练集中每个类别都是5000张图片。
CIFAR-100
包含60000张图片,共100个类别,每个类别600张图片。其中训练集50000张,每个类别500张。测试集10000张,每个类别100张。CIFAR-100的100个类别,又可分为20个大类(superclass),每张图片包含所属的精准类(即100个类别中的类),以及所属的大类的类别。分属的类别如下:
3. Pascal VOC
Pascal VOC挑战赛
是视觉对象分类识别与检测的一个基准测试,从2005年到2012年每年都举行一场图像识别的挑战赛。2012年后不再举办,但其数据质量好,标注完备,非常适合用来测试算法性能。较常用的Pascal VOC数据集有Pascal VOC2007与Pascal VOC2012。
Pascal VOC2007
图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。总共9963张图片包含24640这个标注对象。
待续。。。