第十周 第4章 transformation与action实战
创建RDD
1 | RDD是Spark编程的核心,在进行Spark编程时,首要任务是创建一个初始的RDD |
使用集合创建RDD
1 | 首先来看一下如何使用集合创建RDD |
scala
1 | package com.imooc.scala |
1 | 注意: |

java
1 | package com.imooc.java; |
使用本地文件(Linux也算本地)和HDFS文件创建RDD
scala
1 | 下面我们来看一下使用本地文件和HDFS文件创建RDD |
1 | package com.imooc.scala |
java
1 | package com.imooc.java; |
Transformation和Action
1 | 接下来我们详细分析一下Spark中对RDD的操作 |
1 | //第一步:创建SparkContext |
常用Transformation介绍
1 | 那下面我们先来看一下Spark中的Transformation算子 |


1 | 这里面列出了Spark支持的所有的transformation算子 |

1 | 在这里我们先讲一些目前常见的transformation算子,个别transformation算子会在后面针对具体的应用场景分析的时候再涉及 |
1 | 算子 介绍 |
Transformation操作开发实战
1 | 下面我们来针对常见的Transformation来具体写一些案例 |
scala



1 | package com.imooc.scala |
1 | groupBy |
1 | joinop直接打印joinRDD.foreach(_) |


java
1 | package com.imooc.java; |
常用Action介绍

1 | 算子 介绍 |
Action操作开发实战
1 | 下面针对常见的Action算子来写一些具体案例 |
scala
1 | package com.imooc.scala |
java
1 | package com.imooc.java; |