当前标签: RDD
Stata: 两本断点回归分析 (RDD) 易懂教程
……Stata 连享会精彩推文…… <https://blog.csdn.net/arlionn/article/details/82746992> 文章目录 * 作者提供的完整资料 (Stata 范例数据和命令) <https://blog.csdn.net/arlionn/article/detail...
2018-09-19 10:38
阅读(1104)
Spark 创建RDD、DataFrame各种情况的默认分区数
我的原创地址:https://dongkelun.com/2018/08/13/sparkDefaultPartitionNums/ <https://dongkelun.com/2018/08/13/sparkDefaultPartitionNums/> 前言 熟悉Spark的分区对于Spark性能调优很重...
2018-08-14 10:55
阅读(193)
Spark系列--SparkCore(四)RDD的依赖关系及运行规划
本篇以WordCount为例,去分析RDD的依赖关系和任务切分机制,分析样例如下: sc.textFile(“xx") .flatMap(_.split(" ")) .map((_,1)) .reduceByKey(_+_) .saveAsTextFile(“xx") 一、RDD的依赖关系 RDD的依赖分为两种...
2018-07-19 14:55
阅读(189)