在Spark中,count函式返回資料集中存在的元素數。
count
在此範例中,計算資料集中存在的元素數量。使用並行化集合建立RDD。
scala> val data = sc.parallelize(List(1,2,3,4,5))
現在,可以使用以下命令讀取生成的結果。
scala> data.collect
應用count()函式來計算元素數。
count()
scala> val countfunc = data.count()