从零开始学TensorFlow - 好文

前言

只有光头才能变强。

文本已收录至我的GitHub仓库，欢迎Star：https://github.com/ZhongFuCheng3y/3y
<https://github.com/ZhongFuCheng3y/3y>

最近在学习TensorFlow的相关知识，了解了TensorFlow一些基础的知识，现在周末有空了，就写写一些笔记，记录一下自己的成长~

总的来说，TensorFlow还是一个比较新的技术，有兴趣的同学不妨跟着我的笔记，一起学学呗(反正没坏处)~

前面回顾：

* 外行人都能看得懂的机器学习，错过了血亏！
<https://mp.weixin.qq.com/s?__biz=MzI4Njg5MDA5NA==&mid=2247484534&idx=1&sn=813981af9fb77c9dee1b399bbde84846&chksm=ebd74577dca0cc617cf326f3f589794eace2dd87a932e7e4a958dc462d45b159a13d286a751a&token=1712662964&lang=zh_CN#rd>
* 这是我看过最好的「机器学习」科普文章了
<https://mp.weixin.qq.com/s?__biz=MzI4Njg5MDA5NA==&mid=2247484911&idx=1&sn=fc2172d52ac306fab19f7c69c0e11718&chksm=ebd744eedca0cdf8012186adb1b4996802e5ba7eac058f50ca2f9184b1ca9e42c8a14e82096f&token=1800133466&lang=zh_CN#rd>
* 神经网络浅讲：从神经元到深度学习
<https://mp.weixin.qq.com/s?__biz=MzI4Njg5MDA5NA==&mid=2247484923&idx=1&sn=1c3637726478be04db55a91ba238e174&chksm=ebd744fadca0cdec7588e1886ea95ace662eacb0a59b149a3b34e8b79afa5b0e9208aca55e5f&token=1032095965&lang=zh_CN#rd>
知识背景：没有Python基础，没有机器学习基础，可以说是真正从零学TensorFlow的了。

一、安装Tensorflow所需要的环境

1.1安装Python环境

使用环境：Mac

Python有好多个版本，在Mac中自带的Python版本是2.7，但相对而言比较老了。现在一般用Python3.x了，本次下载的版本是3.5.6

我安装Python所使用方法的大致步骤：

* 安装Homebrew
* 安装pyenv
* 在.bash_profile添加环境变量
* 让环境变量生效
* 安装3.X版本python
详情可参考如下的链接(总的来说，我根据下面的教程一下子就安装了我想要的Python版本，还是非常不错的。)：

* Mac下安装多版本python：
* https://www.cnblogs.com/webgiser/p/7463974.html
<https://www.cnblogs.com/webgiser/p/7463974.html>
* pyenv相关的命令(常用的pyenv命令):
* https://www.jianshu.com/p/af1f8d7b6b31
<https://www.jianshu.com/p/af1f8d7b6b31>
在安装Python的时候也发现了一个小知识点：

* Mac一般使用bash作为默认的shell，会有好几个环境变量，其中etc/profile是系统级的，还有几个用户级别的环境变量，比如说：
~/.bash_profile
* 如果修改的是系统级别的环境变量，也就是etc/profile，在保存的时候只能是:wq!覆盖，不然会出现readonly错误
(至于TensorFlow和numpy依赖的下载，这里我就不说了，就两条命令就搞掂啦)

1.2PyCharm编辑器

Java有IDEA神器，同样的，Python也有PyCharm，同样是JetBrains出产的。

我在之前从来没使用过PyCharm，也没写过一句的Python代码。

把Pycharm安装好了之后，我想当然就new project去用了，然后就next,next,next，当成IDEA来用。但发现了一个问题：我在之前
明明装好了TensorFlow和numpy的依赖，在PyCharm环境下却识别不出来！在命令行窗口下，依赖是存在的！

后来才发现：如果用PyCharm去new一个project，会默认建一个解析器
在当前的项目目录下。而PyCharm会遵守“就近原则”使用当前项目路径下的解析器。而我们添加的依赖(TensorFlow、numpy)是在我们安装Python的路径下的，这就导致了在命令行下找到依赖，而在PyCharm中找不到依赖。

解决也很简单：在PyCharm指定一下我们安装Python的路径，切换一下就好了。

参考资料：

* 关于pip安装第三方库，但pycharm中却无法识别的问题；以及pycharm安装第三方库的方法解析
* https://blog.csdn.net/weixin_41287260/article/details/83957731
<https://blog.csdn.net/weixin_41287260/article/details/83957731>
二、体验TensorFlow

好的，我们现在已经安装好TensorFlow所需要的环境了！(看起来好简单，但还是花了我不少时间....)

官网的Demo链接(需要科学上网)：

* https://www.tensorflow.org/tutorials/keras/basic_classification
<https://www.tensorflow.org/tutorials/keras/basic_classification>
首先我们来看一下这个例子可以干些什么：我们有非常多张的图片(数据集)，这些图片有不同的类型(比如衣服、鞋子、裤子，一共有10种类型
)，把这些数据集扔进我们的神经网络里头，生成出模型。有了模型以后，当我们再将类似的图片扔进去，这个模型可以帮我们预测这张图片是衣服还是鞋子还是裤子。

随后，我跟着官网的代码跑了一(代码我都只是一步一步复制粘贴)，最后跑起来：
# TensorFlow and tf.keras import tensorflow as tf from tensorflow import keras
# Helper libraries import numpy as np print(tf.__version__) # 加载数据、区分出测试数据和训练数据
# 注意：如果已经下过，重复下载的话，可能会出现EOFError: Compressed file ended before the
end-of-stream marker was reached错误 fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) =
fashion_mnist.load_data() # 分类的列表 class_names = ['T-shirt/top', 'Trouser',
'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
# 查看数据的值 print(train_images.shape) # 样本的shape(可以看出有多少条样本、维度)
print(len(train_labels)) # label的个数，有多少个样本，就应该有多少个label print(train_labels) #
label的值，对应上面分类列表(从0到9) # 对测试数据和训练数据进行预处理(实际上就是归一化) train_images = train_images
/ 255.0 test_images = test_images / 255.0 # 设置层 (初始处理)--- 建立神经层 model =
keras.Sequential([ keras.layers.Flatten(input_shape=(28, 28)),
keras.layers.Dense(128, activation=tf.nn.relu), keras.layers.Dense(10,
activation=tf.nn.softmax) ]) # 损失函数、优化器、指标
model.compile(optimizer=tf.train.AdamOptimizer(),
loss='sparse_categorical_crossentropy', metrics=['accuracy']) #
将训练集丢进去，训练出模型(Model) model.fit(train_images, train_labels, epochs=5) #
将测试数据丢到模型中，评估一下得分(准确率) test_loss, test_acc = model.evaluate(test_images,
test_labels) print('Test accuracy:', test_acc) # 评估完准确率以后，我们可以对测试数据进行预测
predictions = model.predict(test_images) # 选第一个样本预测后的得出最有可能结果
print(np.argmax(predictions[0])) # 对比结果 print(test_labels[0])
跑出来的结果：

(后期注释：这是TensorFlow的版本)

1.12.0

(后期注释：这是TensorFlow下载数据集的日志)
Downloading data from
https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 3us/step Downloading data
from
https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 12s 0us/step Downloading
data from
https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from
https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 2s 0us/step
(后期注释：样本的shape)

(60000, 28, 28)

(后期注释：样本有多少条，对应的label就有多少条)

60000

(后期注释：label的值是从0-9，表示有九种类别)

[9 0 0 ... 3 0 5]

(后期注释：开始训练)
Epoch 1/5 2019-02-19 14:00:46.842852: I
tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports
instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
60000/60000 [==============================] - 4s 65us/step - loss: 0.4995 -
acc: 0.8246 Epoch 2/5 60000/60000 [==============================] - 4s
62us/step - loss: 0.3734 - acc: 0.8655 Epoch 3/5 60000/60000
[==============================] - 4s 63us/step - loss: 0.3346 - acc: 0.8788
Epoch 4/5 60000/60000 [==============================] - 4s 63us/step - loss:
0.3102 - acc: 0.8861 Epoch 5/5 60000/60000 [==============================] -
4s 63us/step - loss: 0.2918 - acc: 0.8916 10000/10000
[==============================] - 0s 36us/step
(后期注释：预测出来的精确度)

Test accuracy: 0.8514

(后期注释：选第一个样本进行预测，并对比实际的结果)
9 9
参考资料：

* TensorFlow官网的例子(需要科学上网才能进..)
* Tensorflow学习笔记之一：训练你的第一个神经网络——基础分类
* https://www.jianshu.com/p/d4fb3a391d22
<https://www.jianshu.com/p/d4fb3a391d22>
2.1总结一下使用TensorFlow的步骤

* 加载数据：使用dataset的api加载数据，并将数据集分成训练数据和测试数据
* 检查数据：检查dataSet的数据有没有问题(例如，样本的记录数、label的记录数等)
* 对数据预处理：对测试数据和训练数据进行归一化处理，目的：减少因为数值的大小所带来的影响(一般我们会将值都缩小在一个小的范围内)
* 建立神经网络：(输入层、隐藏层、输出层)
* 为模型定义损失函数、优化器、指标
* 将训练数据丢进我们的神经网络中，生成出Model
* 将测试数据丢进我们生成好的Model进行评估，预测出我们的准确率
三、TensorFlow介绍

3.1什么是TensorFlow

如果去Google搜关键字“TensorFlow”，那可能你会看到这么一句话：

An open source machine learning framework for everyone.

没错，TensorFlow就是一个机器学习的框架
。至于框架，相信大家也比较好理解了；类比到Java，比如说我们的Spring框架给我们封装了好多好用的API，简化我们的开发(想想当年写Servlet的时候！)

TensorFlow作为机器学习的框架，同样也给我们封装了好多好用的API，能够降低学习机器学习的门槛。

* 就拿上面的例子来说，没想到那么少的代码就可以跑机器学习的“HelloWorld”了！
至于机器学习和神经网络的相关基础，我强烈建议读读这两篇文章！通俗易懂的科普文章：

* 这是我看过最好的「机器学习」科普文章了
<https://mp.weixin.qq.com/s?__biz=MzI4Njg5MDA5NA==&mid=2247484911&idx=1&sn=fc2172d52ac306fab19f7c69c0e11718&chksm=ebd744eedca0cdf8012186adb1b4996802e5ba7eac058f50ca2f9184b1ca9e42c8a14e82096f&token=1800133466&lang=zh_CN#rd>
* 神经网络浅讲：从神经元到深度学习
<https://mp.weixin.qq.com/s?__biz=MzI4Njg5MDA5NA==&mid=2247484923&idx=1&sn=1c3637726478be04db55a91ba238e174&chksm=ebd744fadca0cdec7588e1886ea95ace662eacb0a59b149a3b34e8b79afa5b0e9208aca55e5f&token=1032095965&lang=zh_CN#rd>
3.2TensorFlow的架构

我们可以发现上面的Demo所用的基础语言是Python，但不要认为TensorFlow就是Python的一个框架。我看到过一个比喻，觉得写得挺好的，粘贴一下：

Python 和 Tensorflow 之间的联系，可以类比 Javascript 和 HTML 之间的关系。Javascript
是一种全功能的编程语言，可以实现各种出色的效果。HTML 是用于表示某种类型的实用计算抽象（这里指的是可由 Web
浏览器呈现的内容）的框架。Javascript 在交互式网页中的作用是组装浏览器看到的 HTML 对象，然后在需要时通过将其更新为新的 HTML 来与其交互。

* 作者：AI前线
* 链接：https://juejin.im/post/5b345a49f265da599c561b25
<https://juejin.im/post/5b345a49f265da599c561b25>
下面再来看看TensorFlow的架构图(Python只是对TensorFlow进行了封装)

TensorFlow的引擎也是分了很多模块的(这里我们简单了解一下)：

最后

总结一下这篇文章：

* 安装TensorFlow必要的环境
* 跟着官方文档，体验一下TensorFlow(机器学习)的“HelloWorld”
* 根据给出的例子，猜出使用TensorFlow(机器学习)时需要做哪些步骤
* TensorFlow就是一个机器学习(深度学习)的框架，提供了很多实用的API方便我们去玩机器学习(深度学习)。
相信看到这里，很多人都跟我之前一样，一脸懵逼。对官方给出的例子中的API不熟悉，去查阅相关资料的时候又发现有好多机器学习相关的术语
，对这些术语又不了解。然后就循环懵逼..
while(true){ // 循环懵逼.. }
其实回想刚学Java的时候，也是这么一个过程，当你从屏幕看到“HelloWorld”了以后，大概率
来说也是不了解相关的API具体做了什么事(甚至连API都不知道是啥意思)。但花一段时间去学习了以后，就会发现，原来HelloWorld是真的简单！
public static void main(String[] args) { System.out.println("Hello World"); }
后续我会继续更新我学习TensorFlow时的一些笔记，有兴趣的小伙伴不妨跟着我一起学习~

另外，从文章的开头我也已经说了，我对Python、机器学习都是没有相关基础的，如果有写错的地方不妨在评论区留言指正。

下一篇预告：TensorFlow是什么意思？Tensor？Flow？介绍TensorFlow一些最基础的知识以及常见的机器学习术语。

乐于输出干货的Java技术公众号：Java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图，不妨来关注一下！

觉得我的文章写得不错，不妨点一下赞！

热门工具换一换