Spark只有键值对类型的RDD才能设置分区方式。() 此题为判断题(对，错)。

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

查看答案

Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0

查看答案

键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。() 此题为判断题(对，错)。

查看答案

下列说法错误的是A．Spark支持三种类型的部署方式：Standalone，Spark on Mesos，Spark on YARNB．在选择Spark Streaming和Storm时，对实时性要求高（比如要求毫秒级响应）的企业更倾向于选择流计算框架StormC．RDD提供的转换接口既适用filter等粗粒度的转换，也适合某一数据项的细粒度转换D．RDD采用惰性调用，遇到“转换(Transformation)”类型的操作时，只会记录RDD生成的轨迹，只有遇到“动作(Action)”类型的操作时才会触发真正的计算

查看答案

4、关于RDD的叙述错误的是？A．RDD是不可变的B．RDD支持两种类型的操作：转换(Transformation) 和动作(Actions)C．RDD是Spark的核心概念D．以上均正确

查看答案

有一个键值对RDD，名称为pairRDD，包含4个元素，分别是（"Hadoop",1)、（"Spark",1)、（"Hive",1)和（"Spark",1)，则pairRDD.keys操作得到的RDD中所包含的元素是A．”Hadoop”,”Spark”,”Hive”,”Spark”B．”Hadoop”,”Spark”,”Hive”C．(”Hadoop”,1),(”Spark”,1),(”Hive”,1)D．("Spark",1)、("Hive",1)和("Spark",1)

查看答案

5、Spark的核心是RDD，分为两种，分别是 RDD和 RDD。

查看答案

有一个键值对RDD，名称为pairRDD，它包含4个元素，分别是（“Hadoop”,1)、（“Spark”,1)、（“Hive”,1)和（“Spark”,1),则pairRDD.reduceByKey（（a,b)=＞a+b)执行结果得到的RDD，它里面包含的元素是A．(“Hadoop”,2),(“Spark”,1),(“Hive”,1)B．(“Hadoop”,1),(“Spark”,2),(“Hive”,1)C．(“Hadoop”,2),(“Spark”,2),(“Hive”,2)D．(“Hadoop”,1),(“Spark”,2),(“Hive”,2)

查看答案

有一个键值对RDD，名称为pairRDD，包含4个元素，分别是（"Hadoop",1)、（"Spark",1)、（"Hive",1)和（"Spark",1)，则pairRDD.mapValues（x =＞ x+1)操作得到的RDD中所包含的元素是A．("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)B．1,1,1,1C．2,2,2,2D．("Spark",2)、("Hive",2)和("Spark",2)

查看答案

51题库考试学习网

51tk.com

Spark只有键值对类型的RDD才能设置分区方式。() 此题为判断题(对，错)。

相关考题：