本文主要是介绍Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
下面看下union的使用:
使用collect操作查看一下执行结果:
再看下groupByKey的使用:
执行结果:
join操作就是一个笛卡尔积操作的过程,如下示例:
对rdd3和rdd4执行join操作:
使用collect查看执行结果:
可以看出join操作完全就是一个笛卡尔积的操作;
reduce本身在RDD操作中属于一个action类型的操作,会导致job的提交和执行:
下面我们看下lookup的使用:
执行结果:
这篇关于Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!