spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

spark在进行数据切分的时候,决定了partition的哪些属性()

  • A、冗余性
  • B、一致性
  • C、rdd之间具有依赖性
  • D、每个rdd都会提供一批最优的计算位置

相关考题:

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

Spark中的每个RDD一般情况下是由()个分区组成的。 A.无数B.多C.1D.0

以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

partition的哪些属性是在spark进行数据切分的时候决定的()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

spark中的rdd是一个()数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

spark中以下哪些特性是rdd的特性()A、计算移动B、数据不移动C、数据移动D、计算不移动

spark在进行数据切分的时候,下列哪些属性和partition划分有关()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

以下选项属于rdd特性的是()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

rdd是spark中个哪个架构提出的概念()A、spark coreB、spark streamingC、mlbaseD、Grophx

描述Spark集群计算中RDD的含义和作用。

RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

spark中的rdd相当于java中的()概念A、类B、接口C、方法D、内部类

spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致

spark框架中,机器学习库的框架是哪个()A、hadoopB、spark?streamingC、mlbaseD、RDD

RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑

SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD

判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A对B错

问答题描述Spark集群计算中RDD的含义和作用。

( 难度:中等)关于spark中RDD说法错误的是:A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的C.宽依赖中会有shuffle的产生D.窄依赖中会有shuffle的产生