zl程序教程

您现在的位置是:首页 >  云平台

当前栏目

Spark 常用行动算子使用总结

Spark 总结 常用 算子 行动 使用
2023-09-27 14:28:03 时间

前言

Spark RDD 中提供了丰富的 行动算子可以帮助我们完成对RDD数据的一些常用统计、聚合等业务的操作,下面将常用的行动算子进行使用总结;

reduce

函数签名

def reduce(f: (T, T) => T ): T

函数说明

聚集 RDD 中的所有元素,先聚合分区内数据,再聚合分区间数据

案例操作

import org.apache.spark.{SparkConf, SparkContext}
imp