备注:
请参考最新版本的《数据科学概论》教学大纲。Link
<http://blog.sina.com.cn/s/blog_55d99cc20102yd23.html>
前言
知识是有架构的,这就是所谓的知识体系。学习是有路线图的(对学生而言),对老师来讲就是教学计划。
《数据科学概论》的知识体系
数据科学概论,由理论部分和应用部分构成。形成两条线索,两个T型,如图所示。
理论部分,先由浅入深,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。
应用(实践)部分,先宽度展开,再深入量化交易领域(可选择其它应用领域的案例),旨在培养学生的动手能力和浓厚兴趣。
理论部分解决“所以然”的问题,而应用部分解决“然”的问题。我们既要知其然,还要知其所以然。
《数据科学概论》的教学计划(学习路线图)
教学计划对教师而言就是教学的行动指南,对学生而言,则是学习的路线图。
知识点具有一环扣一环的紧密联系,我们需要一个合理的路线图,把它组织起来,遵循该路线图,把各个知识点学到手,建立内化的知识架构。
《数据科学概论》的教与学
教学(学习)的过程,需要教师和学生共同努力。
教师要把关键的知识点讲清楚,把知识的联系,勾勒清楚。
学生学习的时候,要发挥主动性,要超越老师讲的东西,触类旁通。学习了A,能不能主动跨越出去,把A'、A''搞清楚呢?学习了A、B、C,能不能把A、B、C结合起来,解决实际问题呢?
《数据科学概论》的教学计划
备注:
数据科学概论网上资源
http://blog.sina.com.cn/s/blog_55d99cc20102yapo.html
<http://blog.sina.com.cn/s/blog_55d99cc20102yapo.html>
下表中的教学计划按照每周两次课(每次2学分),每周有一次上机(2学分)进行安排,若非如此,请自行裁剪即可。
周次
第一次课
第二次课
上机
备注
教师指引
学生指引
1
课程介绍、数据科学概论、数据科学案例(选讲)
OLTP与数据服务
不上机
第一周,没有准备,不用上机
2
OLAP与结构化数据分析
Mysql 与oltp demo,包括data model和sql queries
oltp demo
发布在教学网站上
通过理论和实验指导的讲解,使得学生对关系数据库等技术有初步的认识
通过实例,学习mysql 安装、配置、和SQL增删改查、事务处理,加深对关系数据库和OLTP技术的理解(SQL易学易用)
按照老师精心设计的demo照抡一遍,并开动脑筋,同学们一定达到上述目的
3
数据清洗与数据集成
Mysql 与olap demo,包括data model和sql queries
olap demo
发布在教学网站上
通过理论和实验指导的讲解,使得学生对ROLAP技术有初步的认识
通过简单的星型模型实例,加深对ROLAP技术的了解
按照老师精心设计的demo照抡一遍,并开动脑筋,同学们一定达到上述目的
4
数据的深度分析1
Python与数据科学basic
Python basic
课本实例
一边开始讲理论,一边开始学习python
对python快速入门
5
数据的深度分析2
Python与数据科学之pandas/sklearn/matplotlib/nltk/networkx/keras and theano or
tensorflow
Python simple examples
课本实例,从网站下载
一边开始讲理论,一边讲编程语言与实例
备注:每个库的功能,并展示一两个实例。
真正的掌握,靠后续不断的学习和练习。
也就是除了这里的基本实例之外,后续还有大量的实例。
6
数据的深度分析3
Python与数据科学
More examples
Python more examples
更多实例,从网站下载
可以按照两个路线图进行讲解:(1)十大算法的路线图;(2)分类、聚类、回归、关联规则、推荐、参数优化、降维/预处理/特征选择…的路线图
7
数据的深度分析4
Python与数据科学
More examples
Python More examples
更多实例,从网站下载
同上
8
流数据处理
文本分析
Python more examples
更多实例,从网站下载
同上
9
文本分析
Python TEXT examples,在这里讲实例
Python TEXT examples,这里是上机
更多实例,从网站下载
10
社交网络
社交网络
Python NETWORK examples
更多实例,从网站下载
11
Python NETWORK examples,在这里讲实例
知识图谱
Python
TEXT &NETWORK examples,这里是上机
更多实例,从网站下载
12
数据可视化
云计算
数据科学大作业
大作业可以选择金融领域中的量化交易、自动驾驶中的ojbect detection
学习了A、B、C,能不能把A、B、C结合起来,解决实际问题?
13
Hadoop
spark
数据科学大作业
鼓励同学们自己把hadoop和spark玩起来
hadoop和spark的实践放在本课程之外
网站上有《hadoop/spark入门》free book
这里仅仅对hadoop和spark基本原理进行讲解
学习了A、B、C,能不能把A、B、C结合起来,解决实际问题?
14
评测基准
数据科学实践——量化交易或者object detection
数据科学大作业
学习了A、B、C,能不能把A、B、C结合起来,解决实际问题?
15
数据科学实践——量化交易或者object detection
复习
数据科学大作业
学习了A、B、C,能不能把A、B、C结合起来,解决实际问题?
16
大作业展示
大作业展示
/
Presentation的能力
17
考试周
闭卷考试
备注:大作业采用3人小组完成,可选的题目包括kaggle大赛题目、国内大数据大赛题目、量化交易、自动驾驶(选择某个方面、规模适中)、图像检索……
热门工具 换一换