RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。() 此题为判断题(对,错)。

RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。()

此题为判断题(对,错)。


相关考题:

RDD的intersection方法用于求出两个RDD的共同元素。() 此题为判断题(对,错)。

RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。() 此题为判断题(对,错)。

以下哪个函数可以求两个RDD差集()。 A.unionB.substractC.intersectionD.cartesian

SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup

请问RDD的()操作把RDD所有元素转换成数组并返回到Driver端。 A.zipB.joinC.combineByKeyD.collect

以下哪个函数可以对两个RDD进行合并()。 A.unionB.substractC.intersectionD.cartesian

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.keys操作得到的RDD中所包含的元素是A.”Hadoop”,”Spark”,”Hive”,”Spark”B.”Hadoop”,”Spark”,”Hive”C.(”Hadoop”,1),(”Spark”,1),(”Hive”,1)D.("Spark",1)、("Hive",1)和("Spark",1)

有一个键值对RDD,名称为pairRDD,它包含4个元素,分别是(“Hadoop”,1)、(“Spark”,1)、(“Hive”,1)和(“Spark”,1),则pairRDD.reduceByKey((a,b)=>a+b)执行结果得到的RDD,它里面包含的元素是A.(“Hadoop”,2),(“Spark”,1),(“Hive”,1)B.(“Hadoop”,1),(“Spark”,2),(“Hive”,1)C.(“Hadoop”,2),(“Spark”,2),(“Hive”,2)D.(“Hadoop”,1),(“Spark”,2),(“Hive”,2)

有一个键值对RDD,名称为pairRDD,包含4个元素,分别是("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1),则pairRDD.mapValues(x => x+1)操作得到的RDD中所包含的元素是A.("Hadoop",1)、("Spark",1)、("Hive",1)和("Spark",1)B.1,1,1,1C.2,2,2,2D.("Spark",2)、("Hive",2)和("Spark",2)