TensorFlow MNIST数据集的使用

教程地址:http://www.tensorfly.cn/tfdoc/tutorials/mnist_download.html

首先需要下载input_data.py文件(其实这个input_data文件在TensorFlow中也存在)

将文件放到你的python项目目录下

再使用 以下代码 完成数据集下载:

1
2
import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

关于MNIST数据集的介绍:

MNIST 是一组数据集,其中包括12W个手写数字的图片和正确答案(6W训练图片和答案,6W评估图片和答案)。

其图片格式和答案格式如下:

偏移 数据类型 描述
0000 0x00000803 32位整数 魔数ID (MSB优先,大端模式)
0004 60000 32位整数 后面共有多少个图片
0008 28 32位整数 图片有多少列像素
0012 28 32位整数 图片有多少行像素
0016 ?? 无符号字节 像素
0017 ?? 无符号字节 像素
…….. ?? 无符号字节 像素
xxxxxx ?? 无符号字节 像素
偏移 数据类型 描述
0000 0x00000803 32位整数 魔数ID (MSB优先,大端模式)
0004 60000 32位整数 后面共有多少项标签
0008 ?? 无符号字节 标签
0009 ?? 无符号字节 标签
…….. ?? 无符号字节 标签
xxxxxx ?? 无符号字节 标签

使用方法:

1
2
3
4
batch_xs, batch_ys = mnist.train.next_batch(100)
// 获取100条训练数据。
mnist.test.images mnist.test.labels
//直接使用以上语句获取所有测试数据集