Spark Count函式


在Spark中,count函式返回資料集中存在的元素數。

count函式的範例

在此範例中,計算資料集中存在的元素數量。使用並行化集合建立RDD。

scala> val data = sc.parallelize(List(1,2,3,4,5))

現在,可以使用以下命令讀取生成的結果。

scala> data.collect

count函數

應用count()函式來計算元素數。

scala> val countfunc = data.count()