Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0

Spark中的每个RDD一般情况下是由()个分区组成的。

A.无数

B.多

C.1

D.0


相关考题:

Spark只有键值对类型的RDD才能设置分区方式。() 此题为判断题(对,错)。

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

以下关于Spark的描述正确的是?A.克服MapReduce在迭代式计算和交互式计算方面的不足。B.Mlib是Spark的机器学习库。C.Spark streaming是一个真正的实时计算框架。D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。

5、假设有一个RDD的名称为words,包含9个元素,分别是:(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1),(”Spark”,1),(”is”,1),(”better”,1)。则语句words.groupByKey()的执行结果得到的新的RDD中,所包含的元素是A.(”Hadoop”,1),(”is”,(1,1,1)),(”good”,1),(”Spark”,(1,1)),(”fast”,1),(”better”,1)B.(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1)C.(”good”,(1,1)),(”Spark”,(1,1,1)),(”is”,1),(”fast”,1)D.(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1)

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.keys操作得到的RDD中所包含的元素是A.”Hadoop”,”Spark”,”Hive”,”Spark”B.”Hadoop”,”Spark”,”Hive”C.(”Hadoop”,1),(”Spark”,1),(”Hive”,1)D.("Spark",1)、("Hive",1)和("Spark",1)

5、Spark的核心是RDD,分为两种,分别是 RDD和 RDD。

有一个键值对RDD,名称为pairRDD,它包含4个元素,分别是(“Hadoop”,1)、(“Spark”,1)、(“Hive”,1)和(“Spark”,1),则pairRDD.reduceByKey((a,b)=>a+b)执行结果得到的RDD,它里面包含的元素是A.(“Hadoop”,2),(“Spark”,1),(“Hive”,1)B.(“Hadoop”,1),(“Spark”,2),(“Hive”,1)C.(“Hadoop”,2),(“Spark”,2),(“Hive”,2)D.(“Hadoop”,1),(“Spark”,2),(“Hive”,2)

假设有一个RDD的名称为words,包含9个元素,分别是:(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1),(”Spark”,1),(”is”,1),(”better”,1)。则语句words.groupByKey()的执行结果得到的新的RDD中,所包含的元素是A.(”Hadoop”,1),(”is”,(1,1,1)),(”good”,1),(”Spark”,(1,1)),(”fast”,1),(”better”,1)B.(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1)C.(”good”,(1,1)),(”Spark”,(1,1,1)),(”is”,1),(”fast”,1)D.(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1)

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.mapValues(x => x+1)操作得到的RDD中所包含的元素是A.("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)B.1,1,1,1C.2,2,2,2D.("Spark",2)、("Hive",2)和("Spark",2)