spark中弹性分布式数据集指的是哪个()A、RDDB、DriverC、MasterD、Map

spark中弹性分布式数据集指的是哪个()

  • A、RDD
  • B、Driver
  • C、Master
  • D、Map

相关考题:

Spark可以从()分布式文件系统中读取数据。 A.TachyonB.HiveC.HbaseD.HDFS

SQL Server的登录账户信息保存在哪个数据库中?()A、modelB、msdbC、masterD、tempdb

spark程序中可以有一个或多个()组成A、jobB、driverC、ageD、worker

以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

一个或多个()组成了spark程序A、jobB、driverC、ageD、worker

Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算

spark中的rdd是一个()数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

spark中的弹性分布式数据集相当于java中的()概念A、类B、接口C、方法D、内部类

下列spark算子中可以将数据持久化到硬盘上的算子是哪些()A、persistB、checkpointC、cacheD、map

spark支持的分布式部署方式中哪个是错误的()A、standaloneB、spark on mesosC、spark on YARND、spark on local

spark中如果想要获取hdfs中的数据,则需要使用哪个系统()A、spark?coreB、spark?streamingC、mapreduceD、Grophx

spark中,可以运行sql脚本的框架是哪个()A、spark?coreB、hdfsC、hadoopD、spark?sql

spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

spark内部集成的资源调度框架是哪个()A、driverB、standaloneC、masterD、yarn

spark读取hdfs数据是调用哪个技术实现的()A、spark?coreB、spark?streamingC、mapreduceD、Grophx

spark中map算子具有以下哪个特性()A、懒执行B、立即执行C、一致性D、冗余性

spark中的实时计算系统是哪个()A、spark?coreB、spark?streamingC、mlbaseD、Grophx

spark中有向无环图指的是哪个()A、MasterB、TaskC、DriverD、DAG

rdd是由以下哪个选项中结果组成的()A、jobB、driverC、partitionD、worker

RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

worker组件在spark的任务调度中具有以下哪个作用()A、计算数据B、存储数据C、运送数据D、心跳检测

spark程序中由一个或多个以下哪个选项组成()A、jobB、driverC、ageD、worker

spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL

Google的分布式数据存储管理系统是()?A、GFSB、ChubbyC、Big TableD、Map Reduce

SQL Server系统中的所有服务器级系统信息存储于哪个数据库()。A、modelB、tempdbC、masterD、msdb

SQL server安装程序安装了4个系统数据库,下面哪个是系统数据库。()A、msdbB、modlC、masterD、pub

判断题Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集A对B错