监督学习、非监督学习、半监督学习（主动学习） - 好文

统计学习通常包括监督学习、非监督学习、半监督学习以及强化学习，在机器学习的领域中前三种研究的比较多的，也是运用的比较广泛的技术。

监督学习

监督学习的任务是学习一个模型，使模型对给定的任意的一个输入，对其都可以映射出一个预测结果。这里模型就相当于我们数学中一个函数，输入就相当于我们数学中的X，而预测的结果就相当于数学中的Y。对于每一个X我们都可以通过一个映射函数映射出一个结果。

非监督学习

直接对没有标记的训练数据进行建模学习，注意在这里的数据是没有标记的数据，与监督学习的最基本的区别是建模的数据一个有标签一个是没有标签的。其中聚类就是一种典型的非监督学习，分类就是一种典型的监督学习。

半监督学习

当我们拥有标记的数据很少，但是未被标记的数据很多，但是人工标注又比较昂贵的时候。我们可以根据一些条件（查询算法）查询（query）一些数据，让专家进行标记。这是半监督学习与其他算法的本质的区别。所以说对主动学习的研究主要是设计一种框架模型，运用新的查询算法查询需要专家来认为标注的数据。最后用查询到的样本训练分类模型来提高模型的精确度.

接下来我们将对主动学习作详细的解释：
主动学习的模型如下：

A=(C,Q,S,L,U)

其中C指的是一个或者多个分类器，Q指的是一些查询函数，也就是一些查询算法，S指的是监督者，通常指的是专家，L是少量标记的样本，U指的是大量未被标记的额样本。学习者利用少量标记的样本L，通过一些基本的机器学习算法学习一个或者多个机器学习模型C，然后通过查询算法，按照查询算法查询出一批最有用的样本，交给专家，让专家进行标记，最后将新学到的标记数据加入到少量样本中，继续训练模型。一直循环，直到达到一个准则为止。流程如下所示：

热门工具换一换