* 前言 <https://blog.csdn.net/sty945/article/details/79832045#前言>
* 概括 <https://blog.csdn.net/sty945/article/details/79832045#概括>
* 1 学习语言 <https://blog.csdn.net/sty945/article/details/79832045#1-学习语言>
* 2 工具:数据挖掘,数据科学和可视化软件
<https://blog.csdn.net/sty945/article/details/79832045#2-工具数据挖掘数据科学和可视化软件>
* 3 教科书 <https://blog.csdn.net/sty945/article/details/79832045#3-教科书>
* 4 教育:网络研讨会,课程,证书和学位
<https://blog.csdn.net/sty945/article/details/79832045#4-教育网络研讨会课程证书和学位>
* 5 数据 <https://blog.csdn.net/sty945/article/details/79832045#5-数据>
* 6 比赛 <https://blog.csdn.net/sty945/article/details/79832045#6-比赛>
* 7 互动:会议,团体和社交网络
<https://blog.csdn.net/sty945/article/details/79832045#7-互动会议团体和社交网络>
* more <https://blog.csdn.net/sty945/article/details/79832045#more>


前言

最近一直一再学习数据挖掘的相关知识,这是一篇国外的文章,我添加了自己的一些理解,大概的翻译过来,供大家一起学习参考。

概括

* 语言:学习R,Python和SQL
* 工具:了解如何使用数据挖掘和可视化工具
* 教科书:阅读入门教科书以了解基本原理
* 教育:观看网络研讨会,参加课程并考虑证书或数据科学学位
* 数据:检查可用的数据资源并在那里找到
* 比赛:参加数据挖掘比赛
* 通过社交网络,团体和会议与其他数据科学家进行交流
1 学习语言

现用于数据挖掘的最流行的语言是R,Python和SQL。
每种资源都有很多

* Free e-book on Data Science with R
<https://www.kdnuggets.com/2013/02/free-e-book-on-data-science-with-r.html>
* Python for Data Analysis: Agile Tools for Real World Data 下载链接
<https://download.csdn.net/download/sty945/10329958>
* An indispensable Python : Data sourcing to Data science
<https://www.datasciencecentral.com/profiles/blogs/an-indispensable-python-data-sourcing-to-data-science>
* W3 Schools Learning SQL <https://www.w3schools.com/sql/>
2 工具:数据挖掘,数据科学和可视化软件

对于不同的任务有许多数据挖掘工具 <https://www.kdnuggets.com/software/index.html>
,但最好使用支持整个数据分析过程的数据挖掘套件进行学习。

您可以从开源(免费)工具开始,如KNIME <https://www.knime.com/> , RapidMiner
<http://rapid-i.com/content/view/181/190/>和Weka
<http://www.cs.waikato.ac.nz/ml/weka/> 。

但是,对于许多分析工作,您需要了解SAS <http://www.sas.com/> ,这是领先的商业工具并得到广泛应用。

其他流行的分析和数据挖掘软件
<https://www.kdnuggets.com/polls/2013/analytics-big-data-mining-data-science-software.html>
包括MATLAB,StatSoft STATISTICA,Microsoft SQL Server,Tableau,IBM SPSS
Modeler和Rattle。

可视化是任何数据分析的重要组成部分 - 了解如何使用Microsoft Excel(适用于许多更简单的任务), R图形
<http://cran.r-project.org/web/views/Graphics.html> (特别是ggplot2
<http://cran.r-project.org/web/packages/ggplot2/index.html> )以及Tableau
<http://www.tableau.com/> - 一个用于可视化的出色软件包。 其他好的可视化工具包括TIBCO Spotfire和Miner3D。
国内百度的Echarts <http://echarts.baidu.com/>也是相当好用的

3 教科书

有许多数据挖掘和数据科学教科书可用,但你可以检查这些

* 数据挖掘和分析:基本概念和算法,免费PDF下载(草案)
<https://www.kdnuggets.com/2013/09/data-mining-analysis-fundamental-concepts-algorithms-download-pdf-draft.html>
,由Mohammed Zaki和Wagner Meira Jr.提供。
* 数据挖掘:实用机器学习工具和技术“ <http://www.cs.waikato.ac.nz/ml/weka/book.html>
,来自Weka作者的Ian Witten,Eibe Frank和Mark
Hall,以及广泛使用Weka的例子。
* 统计学习 ,数据挖掘,推理和预测的元素 <http://www-stat.stanford.edu/~tibs/ElemStatLearn/>
,Trevor Hastie,Robert Tibshirani,Jerome Friedman,数学导向的重要介绍
* LIONbook:学习和智能优化 <http://www.lionsolver.com/LIONbook/> ,Roberto
Battiti和Mauro Brunato,可以在网上免费下载,逐章阅读。
* 大量数据集的挖掘Book
<https://www.kdnuggets.com/2012/08/mining-massive-datasets-book-revised.html>
,A. Rajaraman,J. Ullman。
* StatSoft Electronic Statistics Textbook™(免费)
<http://www.statsoft.com/textbook/>包含许多数据挖掘主题
4 教育:网络研讨会,课程,证书和学位

您可以从关于分析,大数据,数据挖掘和数据科学领域最新主题的许多免费网络研讨会和网络直播
<https://www.kdnuggets.com/webcasts/index.html>开始。

也有很多在线课程,其中很多都是免费的 - 请参阅KDnuggets在线教育目录
<https://www.kdnuggets.com/education/index.html> 。

特别检查这些课程:

* 机器学习 <https://www.coursera.org/course/ml> ,在Coursera由Andrew Ng教授
* 在加州理工学院教授Yaser Abu-Mostafa的指导下, 在 edX 学习learning from data
<https://www.kdnuggets.com/2013/09/edx-learning-from-data-free-online-course.html>

* 从Syracuse iSchool 开放应用数据科学在线课程
<http://ischool.syr.edu/future/cas/datascience.aspx>
* 使用Weka进行数据挖掘 <https://weka.waikato.ac.nz/> ,免费在线课程。
最后,考虑在数据挖掘,数据科学或高级学位
<https://www.kdnuggets.com/education/analytics-data-mining-certificates.html>
获得证书 ,例如数据科学中的MS - 请参阅KDnuggets目录中的教育分析,数据挖掘和数据科学 。

5 数据

你需要分析数据 - 请参阅数据挖掘的数据集的 KDnuggets目录
<https://www.kdnuggets.com/datasets/index.html>,其中包括

* 政府,联邦,州,市,地方和公共数据网站和门户
<https://www.kdnuggets.com/datasets/government-local-public.html>
* 数据API,集线器,市场,平台,门户和搜索引擎 。
<https://www.kdnuggets.com/datasets/api-hub-marketplace-platform.html>
* 免费的公共数据集 <https://www.kdnuggets.com/2011/02/free-public-datasets.html>
6 比赛

再一次,你最好通过练习来学习,所以参加Kaggle比赛 <http://www.kaggle.com/> - 从初学者比赛开始,比如
使用机器学习预测泰坦尼克号生存
<https://www.kdnuggets.com/2012/10/beginner-competition-titanic-survival-via-machine-learning.html>

7 互动:会议,团体和社交网络

您可以加入许多同行组 - 查看前30名LinkedIn分组,大数据,数据挖掘和数据科学组
<https://translate.googleusercontent.com/translate_c?depth=1&hl=zh-CN&prev=search&rurl=translate.google.com.hk&sl=en&sp=nmt4&u=https://www.kdnuggets.com/2013/04/top-30-linkedin-groups-analytics-big-data-data-mining-data-science.html&xid=17259,15700023,15700124,15700149,15700168,15700173,15700186,15700201&usg=ALkJrhjRHHFu1_Ea9Zdp0CRKx2Fc09f4Hw>


AnalyticBridge
<https://translate.googleusercontent.com/translate_c?depth=1&hl=zh-CN&prev=search&rurl=translate.google.com.hk&sl=en&sp=nmt4&u=http://www.analyticbridge.com/&xid=17259,15700023,15700124,15700149,15700168,15700173,15700186,15700201&usg=ALkJrhg3FqnRQ7t1YkWFqjaI69GDNQnHgw>
是分析和数据科学的活跃社区。

您可以参加关于分析,大数据,数据挖掘,数据科学和知识发现的众多会议和会议
<https://www.kdnuggets.com/meetings/index.html> 。

另外,考虑加入组织年度KDD会议 <http://www.sigkdd.org/> - 领域领先的研究会议的ACM SIGKDD 。

more

* 如何从数据科学入门 <http://hortonworks.com/blog/how-to-get-started-in-data-science/>
,Hortonworks
* 一个实用的数据科学简介
<http://blog.zipfianacademy.com/post/46864003608/a-practical-intro-to-data-science>
,Zipfian学院
* 成为数据科学家 - 通过Metromap进行课程设置
<http://nirvacana.com/thoughts/becoming-a-data-scientist/> ,这是一个数据科学家之旅的视觉地图。
* 获得免费的数据科学教育
<http://inside-bigdata.com/2013/09/19/getting-free-data-science-education/>
,Daniel Gutierrez
原文链接
这里跳转
<https://www.kdnuggets.com/2013/10/7-steps-learning-data-mining-data-science.html>

转载请注明出处:
CSDN:楼上小宇__home:http://blog.csdn.net/sty945 <http://blog.csdn.net/sty945>
简书:楼上小宇:http://www.jianshu.com/u/1621b29625df
<http://www.jianshu.com/u/1621b29625df>