介绍

机器学习和深度学习风靡一时!突然之间,每个人都在谈论他们 - 无论他们是否理解差异!无论您是否积极关注数据科学 - 您都会听说过这些术语。

只是为了向您展示他们获得的关注,以下是这些关键字的Google趋势:




如果您经常想知道机器学习和深度学习之间的区别,请继续阅读以简单的外行语言进行详细比较。我已经详细解释了这些术语。然后我继续比较它们并解释了我们可以在哪里使用它们。

目录

* 什么是机器学习和深度学习?
* 什么是机器学习?
* 什么是深度学习?
* 机器学习与深度学习的比较
* 数据依赖性
* 硬件依赖
* 解决问题的方法
* 特色工程
* 执行时间处理时间
* 解释性
* 机器学习和深度学习现在在哪里应用?
* 突击测验
* 未来的趋势
 

1.什么是机器学习和深度学习?

让我们从基础开始 - 什么是机器学习和什么是深度学习。如果您已经知道这一点,请随时转到第2部分。

 

1.1什么是机器学习?

Tom Mitchell广泛引用的机器学习定义最好地解释了机器学习。这是它说的:

“据说计算机程序可以从经验E中学习某些任务T和绩效测量P,如果它在T中的任务中的表现,由P测量,随着经验E而提高”

这听起来令人费解或令人困惑吗?让我们用简单的例子来解决这个问题。

 

示例1 - 机器学习 - 根据高度预测权重


我们假设您要创建一个系统,该系统根据人的身高来告诉预期的体重。可能有几个原因可能会让人感兴趣。您可以使用它来过滤掉任何可能的欺诈或数据捕获错误。你要做的第一件事是收集数据。让我们说这就是您的数据的样子:



图表上的每个点代表一个数据点。首先,我们可以绘制一条简单的线来预测基于身高的体重。例如一个简单的行:
重量(kg)=高度(cm) - 100
可以帮助我们做出预测。虽然该生产线做得不错,但我们需要了解其性能。在这种情况下,我们可以说我们希望减少预测和实际之间的差异。这是衡量绩效的方法。

此外,我们收集的数据点越多(体验),我们的模型就越好。我们还可以通过添加更多变量(例如性别)并为它们创建不同的预测线来改进我们的模型。

例2 - 风暴预测系统

我们来看一些稍微复杂的例子。假设您正在构建风暴预测系统。您将获得过去发生的所有风暴的数据,以及这些风暴发生前三个月的天气状况。

考虑一下,如果我们要手动建立风暴预测系统,我们该怎么办?



我们必须首先搜索所有数据并找到此数据中的模式。我们的任务是搜索导致风暴的条件。

我们可以模拟条件,如果温度大于40摄氏度,湿度在80到100之间,等等。并将这些'功能'手动输入我们的系统。

或者,我们可以使我们的系统从数据中理解这些特征的适当值。


现在要找到这些值,您将浏览所有以前的数据并尝试预测是否会有风暴。根据我们系统设置的特征值,我们评估系统的执行方式,即系统正确预测风暴发生的次数。我们可以进一步多次迭代上述步骤,将性能作为反馈给我们的系统。


让我们采用我们的正式定义并尝试定义我们的风暴预测系统:我们的任务'T'是找出引发风暴的大气条件。在提供给系统的所有条件中,性能'P'将是正确预测风暴的次数。经验'E'将是我们系统的重复。

1.2什么是深度学习?


深度学习的概念并不新鲜。它已经存在了几年了。但是现在随着所有的炒作,深度学习越来越受到关注。正如我们在机器学习中所做的那样,我们将查看深度学习的正式定义,然后通过示例对其进行细分。


“深度学习是一种特殊的机器学习,它通过学习将世界表示为嵌套的概念层次结构来实现强大的功能和灵活性,每个概念都是根据更简单的概念定义的,而更抽象的表示是根据较不抽象的概念计算的。


现在 - 那会让人感到困惑。让我们用简单的例子来打破它。

示例1 - 形状检测

让我从一个简单的例子开始,它解释了事情在概念层面的发生。让我们试着理解我们如何识别其他形状的正方形。




我们眼睛做的第一件事就是检查是否有4条线与一个图形相关联(简单概念)。如果我们找到4条线,我们进一步检查它们是否连接,闭合,垂直以及它们是否相等(概念的嵌套层次结构)。

因此,我们采取了一项复杂的任务(确定一个正方形)并在简单的不那么抽象的任务中打破它。深度学习基本上是大规模的。

例2 - Cat vs. Dog

让我们举一个动物识别器的例子,我们的系统必须识别给定的图像是猫还是狗。


如果我们将此解决为典型的机器学习问题,我们将定义诸如动物是否有胡须,动物是否有耳朵以及是否有耳朵等特征,然后如果它们是尖头的。简而言之,我们将定义面部特征,并让系统识别哪些特征在对特定动物进行分类时更为重要。

现在,深度学习领先一步。深度学习会自动找出对分类很重要的功能,在机器学习中我们必须手动提供功能。深度学习的工作原理如下:

深度学习的工作原理如下:

* 它首先确定哪些边缘与找到猫或狗最相关
* 然后,它以层次结构为基础,找到我们可以找到的形状和边缘的组合。例如,是否存在胡须,或是否存在耳朵等。
* 在对复杂概念进行连续分层识别之后,它决定哪个特征负责找到答案。
2.机器学习与深度学习的比较

现在您已经了解了机器学习和深度学习的概述,我们将采取一些重点并比较这两种技术。

2.1数据依赖性


深度学习与传统机器学习之间最重要的区别在于其随着数据规模的增加而表现出来。当数据很小时,深度学习算法表现不佳。这是因为深度学习算法需要大量数据才能完美理解。另一方面,在这种情况下,传统的机器学习算法及其手工制作的规则占主导地位。下图总结了这一事实。



2.2硬件依赖性


深度学习算法在很大程度上依赖于高端机器,这与传统的机器学习算法相反,后者可以在低端机器上运行。这是因为深度学习算法的要求包括GPU,它是其工作的一个组成部分。深度学习算法固有地执行大量矩阵乘法运算。可以使用GPU有效地优化这些操作,因为GPU是为此目的而构建的。

2.3特征工程

特征工程是将领域知识放入特征提取器的创建过程中的过程,以降低数据的复杂性并使模式对于学习算法更加可见。就时间和专业知识而言,这个过程既困难又昂贵。

在机器学习中,大多数应用的功能需要由专家识别,然后根据域和数据类型进行手动编码。

例如,特征可以是像素值,形状,纹理,位置和方向。大多数机器学习算法的性能取决于识别和提取特征的准确程度。


深度学习算法尝试从数据中学习高级特征。这是深度学习的一个非常独特的部分,是传统机器学习的重要一步。因此,深度学习减少了为每个问题开发新特征提取器的任务。就像,Convolutional
NN将尝试学习低层特征,例如早期层中的边缘和线条,然后是人脸的部分面部,然后是面部的高级表示。



2.4问题解决方法

当使用传统的机器学习算法解决问题时,通常建议将问题分解为不同的部分,单独解决它们并将它们组合起来得到结果。相反,深度学习主张端到端地解决问题。

我们举一个例子来理解这一点。

假设您有多个对象检测任务。任务是确定对象是什么以及它在图像中的位置。




在典型的机器学习方法中,您可以将问题分为两个步骤:对象检测和对象识别。首先,您将使用像grabcut这样的边界框检测算法来浏览图像并查找所有可能的对象。然后,在所有已识别的对象中,您将使用对象识别算法(如带有HOG的SVM)来识别相关对象。

相反,在深度学习方法中,您将完成端到端的过程。例如,在YOLO网 <https://pjreddie.com/darknet/yolo/>
(这是一种深度学习算法)中,您将传入一个图像,它将给出该位置以及对象的名称。

2.5执行时间


通常,深度学习算法需要很长时间才能进行训练。这是因为深度学习算法中有如此多的参数,训练它们需要比平时更长的时间。最先进的深度学习算法ResNet大约需要两周时间才能从头开始训练。虽然机器学习相对需要更少的时间进行训练,但从几秒到几小时不等。


这在测试时间完全颠倒了。在测试时,深度学习算法运行时间要少得多。然而,如果将其与k近邻(一种机器学习算法)进行比较,则测试时间会随着数据大小的增加而增加。虽然这不适用于所有机器学习算法,但其中一些算法的测试时间也很短。

2.6可解释性

最后但并非最不重要的是,我们将可解释性作为比较机器学习和深度学习的一个因素。这个因素是深度学习在用于工业之前仍被认为10次的主要原因。


我们来举个例子吧。假设我们使用深度学习来为论文提供自动评分。它在得分方面的表现非常出色,接近人类表现。但这是一个问题。它没有揭示为什么它给出了这个分数。事实上,你可以通过数学方法找出深层神经网络的哪些节点被激活,但我们不知道神经元应该建模的是什么以及这些神经元层共同做了什么。所以我们无法解释结果。


另一方面,像决策树这样的机器学习算法为我们提供了清晰的规则,为什么它选择了它所选择的内容,因此特别容易理解其背后的推理。因此,决策树和线性/逻辑回归等算法主要用于工业中的可解释性。

3.机器学习和深度学习现在在哪里应用?

维基文章概述了应用机器学习的所有领域。这些包括:

* 计算机视觉:适用于车牌识别和面部识别等应用。
* 信息检索:适用于搜索引擎,文本搜索和图像搜索等应用程序。
* 营销:用于自动电子邮件营销,目标识别等应用
* 医疗诊断:用于癌症鉴定,异常检测等应用
* 自然语言处理:用于情感分析,照片标记等应用
* 在线广告等


上面给出的图像恰当地总结了机器学习的应用领域。虽然它涵盖了更广泛的机器智能主题。

使用机器学习/深度学习的公司的一个主要例子是Google。



在上图中,您可以看到Google如何在其各种产品中应用机器学习。机器学习/深度学习的应用是无止境的,您只需要寻找合适的机会!

4.流行测验

为了评估您是否真正了解其中的差异,我们将进行测验。您可以在此主题中
<https://discuss.analyticsvidhya.com/t/discussion-for-pop-quiz/17271?u=jalfaizy>
发布您的答案。
<https://discuss.analyticsvidhya.com/t/discussion-for-pop-quiz/17271?u=jalfaizy>

请提及以下步骤以完全回答它。

* 您如何使用机器学习解决以下问题?
* 您如何使用深度学习解决以下问题?
* 结论:哪种方法更好?
场景1:

你必须为自动驾驶汽车构建一个软件组件。您构建的系统应该从摄像机获取原始像素数据,并预测您应该驾驶车轮的角度。

场景2:

根据一个人的证书和背景信息,您的系统应评估一个人是否有资格获得贷款。

场景3:

您必须创建一个系统,可以将用俄语写成的信息翻译成印地语,以便俄罗斯代表能够解决当地群众问题。

5.未来趋势

上面的文章将概述机器学习和深度学习以及它们之间的区别。在本节中,我将分享我对机器学习和深度学习将来如何发展的看法。

*
首先,看到在行业中使用数据科学和机器学习的日益增长的趋势,对于每个想要生存的公司来说,在其业务中灌输机器学习将变得越来越重要。此外,每个人都应该了解基本术语。
* 深度学习每天都令我们惊讶,并将在不久的将来继续这样做。这是因为深度学习被证明是用最先进的表演发现的最佳技术之一。
*
研究在机器学习和深度学习方面持续不断。但与往年不同的是,研究仅限于学术界,机器学习和深度学习的研究在工业界和学术界都在爆炸式增长。随着可用资金的增加,它更有可能成为整体人类发展的基调。

我个人密切关注这些趋势。我通常会从机器学习/深度学习新闻通讯中获取一些信息,这些新闻通讯会让我了解最近发生的事情。除此之外,我还关注每天发布的arxiv论文及其各自的代码。

结束说明

在本文中,我们对深度学习和机器学习技术进行了高级概述和比较。我希望我能激励你进一步学习机器学习和深度学习。下面是机器学习和深度学习的学习路径  
机器学习的学习路径
<https://www.analyticsvidhya.com/learning-path-learn-machine-learning/>  和  
深学习学习路径 <https://www.analyticsvidhya.com/blog/2016/08/deep-learning-path/>。

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:637538335
关注微信