Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0
Spark中的每个RDD一般情况下是由()个分区组成的。
A.无数
B.多
C.1
D.0
相关考题:
以下关于Spark的描述正确的是?A.克服MapReduce在迭代式计算和交互式计算方面的不足。B.Mlib是Spark的机器学习库。C.Spark streaming是一个真正的实时计算框架。D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。
5、假设有一个RDD的名称为words,包含9个元素,分别是:(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1),(”Spark”,1),(”is”,1),(”better”,1)。则语句words.groupByKey()的执行结果得到的新的RDD中,所包含的元素是A.(”Hadoop”,1),(”is”,(1,1,1)),(”good”,1),(”Spark”,(1,1)),(”fast”,1),(”better”,1)B.(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1)C.(”good”,(1,1)),(”Spark”,(1,1,1)),(”is”,1),(”fast”,1)D.(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1)
有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.keys操作得到的RDD中所包含的元素是A.”Hadoop”,”Spark”,”Hive”,”Spark”B.”Hadoop”,”Spark”,”Hive”C.(”Hadoop”,1),(”Spark”,1),(”Hive”,1)D.("Spark",1)、("Hive",1)和("Spark",1)
有一个键值对RDD,名称为pairRDD,它包含4个元素,分别是(“Hadoop”,1)、(“Spark”,1)、(“Hive”,1)和(“Spark”,1),则pairRDD.reduceByKey((a,b)=>a+b)执行结果得到的RDD,它里面包含的元素是A.(“Hadoop”,2),(“Spark”,1),(“Hive”,1)B.(“Hadoop”,1),(“Spark”,2),(“Hive”,1)C.(“Hadoop”,2),(“Spark”,2),(“Hive”,2)D.(“Hadoop”,1),(“Spark”,2),(“Hive”,2)
假设有一个RDD的名称为words,包含9个元素,分别是:(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1),(”Spark”,1),(”is”,1),(”better”,1)。则语句words.groupByKey()的执行结果得到的新的RDD中,所包含的元素是A.(”Hadoop”,1),(”is”,(1,1,1)),(”good”,1),(”Spark”,(1,1)),(”fast”,1),(”better”,1)B.(”good”,1),(”Spark”,1),(”is”,1),(”fast”,1)C.(”good”,(1,1)),(”Spark”,(1,1,1)),(”is”,1),(”fast”,1)D.(”Hadoop”,1),(”is”,1),(”good”,1),(”Spark”,1),(”is”,1)
有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.mapValues(x => x+1)操作得到的RDD中所包含的元素是A.("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)B.1,1,1,1C.2,2,2,2D.("Spark",2)、("Hive",2)和("Spark",2)