以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。 A.resetpartitionB.repartitonC.coalesceD.Partition
Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性
spark切分完的partition的数量和block一致的
Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算
以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
partition的哪些属性是在spark进行数据切分的时候决定的()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
spark中以下哪些特性是rdd的特性()A、计算移动B、数据不移动C、数据移动D、计算不移动
spark架构中哪些架构可以相互转化()A、spark coreB、spark sqlC、spark streamingD、spark R
下列spark算子中可以将数据持久化到硬盘上的算子是哪些()A、persistB、checkpointC、cacheD、map
spark中如果想要获取hdfs中的数据,则需要使用哪个系统()A、spark?coreB、spark?streamingC、mapreduceD、Grophx
spark在进行数据切分的时候,下列哪些属性和partition划分有关()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
spark读取hdfs数据是调用哪个技术实现的()A、spark?coreB、spark?streamingC、mapreduceD、Grophx
Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
spark能够通过jdbc读取mysql数据库中的数据
以下选项中可以在spark中编写sql的框架是()A、spark coreB、spark streamingC、mlbaseD、spark sql
spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致
spark架构中cache算子应具有以下哪些特性?()A、spark?coreB、spark?streamingC、GrophxD、spark?sql
下列关于kafka中的partition说法正确的是()A、partition是逻辑存在的B、partition是最小的逻辑单元C、topic是真正数据存储的地方D、partition不存储数据
worker组件在spark的任务调度中具有以下哪个作用()A、计算数据B、存储数据C、运送数据D、心跳检测
spark切分完的partition的大小必须和block一致
spark架构在整个计算过程中,其partition个数是不可变的
决策树的生长过程就是不断把数据进行切分的过程,对每个切分都要求所分成的组间“差异”最小。
问答题Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。
判断题决策树的生长过程就是不断把数据进行切分的过程,对每个切分都要求所分成的组间“差异”最小。A对B错
多选题华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?()AYARNBHDFSCHiveDHBase
单选题大数据中spark生态支持的组件有:()和spark streaming。AeMBBBspark SQLCETCDspark streaming