( 难度:中等)关于spark中RDD说法错误的是:A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的C.宽依赖中会有shuffle的产生D.窄依赖中会有shuffle的产生

( 难度:中等)关于spark中RDD说法错误的是:
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生

相关考题:

Spark只有键值对类型的RDD才能设置分区方式。() 此题为判断题(对,错)。

RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。() 此题为判断题(对,错)。

SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0

GraphX中()是存放着Edg对象的RDD。 A.VertexRDDB.RDD[VertexId,VD]C.RDD[Edge]D.EdgeRDD

Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统。() 此题为判断题(对,错)。

下面哪个不是RDD的特点()A、可分区B、可序列化C、可修改D、可持久化

interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成

union算子对源RDD和参数RDD求并集后返回一个新的RDD

spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

以下选项属于rdd特性的是()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

RDD之间宽窄依赖关系的主要依据哪个的对应关系来划分的()A、partitionB、workerC、masterD、数据

以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

rdd是spark中个哪个架构提出的概念()A、spark coreB、spark streamingC、mlbaseD、Grophx

描述Spark集群计算中RDD的含义和作用。

描述Spark集群计算中RDD的含义和作用。

RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

spark框架中,机器学习库的框架是哪个()A、hadoopB、spark?streamingC、mlbaseD、RDD

RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

单选题RDD有哪两种依赖关系()。A长依赖和短依赖B高依赖和低依赖C宽依赖和窄依赖D左依赖和右依赖

问答题试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。

问答题描述Spark集群计算中RDD的含义和作用。