spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

spark在进行数据切分的时候,决定了partition的哪些属性()

  • A、冗余性
  • B、一致性
  • C、rdd之间具有依赖性
  • D、每个rdd都会提供一批最优的计算位置

相关考题:

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性

spark切分完的partition的数量和block一致的

Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算

以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

partition的哪些属性是在spark进行数据切分的时候决定的()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

spark中以下哪些特性是rdd的特性()A、计算移动B、数据不移动C、数据移动D、计算不移动

spark架构中哪些架构可以相互转化()A、spark coreB、spark sqlC、spark streamingD、spark R

下列spark算子中可以将数据持久化到硬盘上的算子是哪些()A、persistB、checkpointC、cacheD、map

spark中如果想要获取hdfs中的数据,则需要使用哪个系统()A、spark?coreB、spark?streamingC、mapreduceD、Grophx

spark在进行数据切分的时候,下列哪些属性和partition划分有关()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

spark读取hdfs数据是调用哪个技术实现的()A、spark?coreB、spark?streamingC、mapreduceD、Grophx

Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

spark能够通过jdbc读取mysql数据库中的数据

以下选项中可以在spark中编写sql的框架是()A、spark coreB、spark streamingC、mlbaseD、spark sql

spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致

spark架构中cache算子应具有以下哪些特性?()A、spark?coreB、spark?streamingC、GrophxD、spark?sql

下列关于kafka中的partition说法正确的是()A、partition是逻辑存在的B、partition是最小的逻辑单元C、topic是真正数据存储的地方D、partition不存储数据

worker组件在spark的任务调度中具有以下哪个作用()A、计算数据B、存储数据C、运送数据D、心跳检测

spark切分完的partition的大小必须和block一致

spark架构在整个计算过程中,其partition个数是不可变的

spark本身自带读取hdfs数据的方法

决策树的生长过程就是不断把数据进行切分的过程,对每个切分都要求所分成的组间“差异”最小。

问答题Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。

判断题决策树的生长过程就是不断把数据进行切分的过程,对每个切分都要求所分成的组间“差异”最小。A对B错

多选题华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?()AYARNBHDFSCHiveDHBase

单选题大数据中spark生态支持的组件有:()和spark streaming。AeMBBBspark SQLCETCDspark streaming