三者是相辅相成的关系,
有了大数据才能去数据挖掘,数据分析的结果促进了机器学习的发展。机器学习是指一种自动学习的机器,是一种自动化数据分析方法。计算机能够分析数据并自动从该数据构建模型的科学。该机器可以提供数据并适应自身,以进行更精确的预测并相应地进行操作。所谓的数据挖掘,就是利用各种技术与统计方法,将大量的历史数据进行分析、归纳与整合等工作,找出有意义的,有价值的数据,加以运用。


数据挖掘的前提就是有充足的数据为前提,这里的数据是“大量的、不完全的、有噪声的、模糊的、随机的实际应用数据”,信息指的是“隐含的、规律性的、人们事先未知的、但又是潜在有用的。大部分的核心功能的实现,都以计量和统计分析方法作为支撑。主要包括,聚类、估计、预测、关联分组以及分类。