Spark只有键值对类型的RDD才能设置分区方式。() 此题为判断题(对,错)。

Spark只有键值对类型的RDD才能设置分区方式。()

此题为判断题(对,错)。


相关考题:

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0

键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。() 此题为判断题(对,错)。

下列说法错误的是A.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARNB.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架StormC.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换D.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算

4、关于RDD的叙述错误的是?A.RDD是不可变的B.RDD支持两种类型的操作:转换(Transformation) 和动作(Actions)C.RDD是Spark的核心概念D.以上均正确

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.keys操作得到的RDD中所包含的元素是A.”Hadoop”,”Spark”,”Hive”,”Spark”B.”Hadoop”,”Spark”,”Hive”C.(”Hadoop”,1),(”Spark”,1),(”Hive”,1)D.("Spark",1)、("Hive",1)和("Spark",1)

5、Spark的核心是RDD,分为两种,分别是 RDD和 RDD。

有一个键值对RDD,名称为pairRDD,它包含4个元素,分别是(“Hadoop”,1)、(“Spark”,1)、(“Hive”,1)和(“Spark”,1),则pairRDD.reduceByKey((a,b)=>a+b)执行结果得到的RDD,它里面包含的元素是A.(“Hadoop”,2),(“Spark”,1),(“Hive”,1)B.(“Hadoop”,1),(“Spark”,2),(“Hive”,1)C.(“Hadoop”,2),(“Spark”,2),(“Hive”,2)D.(“Hadoop”,1),(“Spark”,2),(“Hive”,2)

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.mapValues(x => x+1)操作得到的RDD中所包含的元素是A.("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)B.1,1,1,1C.2,2,2,2D.("Spark",2)、("Hive",2)和("Spark",2)