监督学习、无监督学习、半监督学习和强化学习 - 好文

Author: LiChong0309
Lable: Reinforcement learning、Artificial intelligence、Deep learning、Machine
learning

* 1.Machine learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#1machine-learning>
* 2.Classification of Machine learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#2classification-of-machine-learning>
* 2.1. Supervised learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#21-supervised-learning>
* 2.2. Unsupervised learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#22-unsupervised-learning>
* 2.3. Semi-Supervised learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#23-semi-supervised-learning>
* 2.4 Reinforcement Learning
<https://blog.csdn.net/qq_38630100/article/details/80848334#24-reinforcement-learning>
* 3. Reference
<https://blog.csdn.net/qq_38630100/article/details/80848334#3-reference>

1.Machine learning

机器学习—>模拟人的学习方式—>获取新的知识和技能—>重组已有的知识结构—>改善自身的性能。
Machine learning是Artificial intelligence的核心，是让计算机具有智能的根本途径。

比如，中学阶段通过大量的习题训练，学习解题方法，为的是能够在高考的时候取得好的成绩，但是高考的题目是之前没有见过的，但是这并不说明高考的题目是不能做出来的，我们可以通过对之前做过的习题的分析，找到解题的方法。

机器学习的原理和上面的例子差不多，利用一些已知的数据训练机器（做习题），然后机器分析数据，找到内在联系（学习解题方法）,从而对未知的数据进行做出判断和决策（做高考题）。

根据训练方法的不同，可以将机器学习分为四类：
①：Supervised learning 监督学习
②：Unsupervised learning 无监督学习
③：Semi-Supervised learning 半监督学习

2.Classification of Machine learning

2.1. Supervised learning

Supervised
Learning的数据是有特征(feature)和标签(label)的。机器可以寻找到标签和特征之间的联系，当面对只有特征而没有标签的数据时，可以判断出标签。

用上面的高考题的例子：所谓的Supervised
Learning，就是高考前的做的所有的题目都是有标准答案的，在学习和做题的过程中，可以对照答案，分析问题找出方法。在高考没有答案的时候，也能够正确的解决。这和我们大多数人在中学时的学习方法是一样的。

2.2. Unsupervised learning

与Supervised Learning（监督学习）相对的是Unsupervised
Learning（无监督学习）。Supervised的数据只有特征（feature），没有标签（label）。

再举高中做练习题的例子，就是所做的练习题没有标准答案，换句话说，你也不知道自己做的是否正确，没有参照。但是就算不知道答案，我们还是可以大致的将语文，数学，英语这些题目分开，因为这些问题内在还是具有一定的联系。
这种问题在机器学习领域中就被称作聚类(Clustering)。在只有特征没有标签的训练数据集中，通过数据之间的内在联系和相似性将他们分成若干类。

2.3. Semi-Supervised learning

处在监督学习和无监督学习之间的是半监督学习。Semi-Supervised
Learning中使用的数据，有一部分是标记过的，而大部分是没有标记的。因此和监督学习相比，半监督学习的成本较低，但是又能达到较高的准确度。

2.4 Reinforcement Learning

强化学习也是使用未标记的数据，但是可以通过某种方法知道你是离正确答案越来越近还是越来越远（即奖惩函数）。可以把奖惩函数想象成正确答案的一个延迟的、稀疏的形式。在监督学习中，能直接得到每个输入的对应的输出。强化学习中，训练一段时间后，你才能得到一个延迟的反馈，并且只有一点提示说明你是离答案越来越远还是越来越近。

3. Reference

机器如何学习？5分钟弄懂监督学习、无监督学习、半监督学习与强化学习：
https://www.sohu.com/a/150444351_697750
<https://www.sohu.com/a/150444351_697750>
机器学习入门,监督学习和无监督学习：
https://blog.csdn.net/bahuia/article/details/68926915
<https://blog.csdn.net/bahuia/article/details/68926915>

热门工具换一换