spark架构计算速度比mapreduce计算速度快单纯因为内存
以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构
spark切分完的partition的数量和block一致的
以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
partition的哪些属性是在spark进行数据切分的时候决定的()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
以下选项中属于spark架构中的图计算框架的是()A、spark coreB、spark streamingC、mlbaseD、Grophx
spark架构中哪些架构可以相互转化()A、spark coreB、spark sqlC、spark streamingD、spark R
spark架构在运行过程中是通过driver完成资源申请
spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置
spark在进行数据切分的时候,下列哪些属性和partition划分有关()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
standalone架构是spark架构内部集成的()A、任务调度框架B、任务模式C、资源调度框架D、任务整合
Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切
spark切分完的partition的个数必须与block一致
spark中的实时计算系统是哪个()A、spark?coreB、spark?streamingC、mlbaseD、Grophx
Spark架构提供了大量的库,其中包含SQL、DataFrames、MLlib、GraphX、SparkStreaming等架构
rdd是spark中个哪个架构提出的概念()A、spark coreB、spark streamingC、mlbaseD、Grophx
spark架构中的persist算子在源码中最多有()备份A、2B、3C、4D、1
spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致
spark架构中cache算子应具有以下哪些特性?()A、spark?coreB、spark?streamingC、GrophxD、spark?sql
spark架构中会出现控制算子的原因是以下哪个选项()A、spark备份的安全原因B、spark用户的要求C、兼容hiveD、兼容hbase
RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
spark切分完的partition的大小必须和block一致
spark的组件不包含哪个()A、spark coreB、hdfsC、GraphxD、spark streaming
spark中的图计算框架是()A、spark coreB、spark streamingC、mlbaseD、Grophx
问答题Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。
判断题Spark是基于内存的计算,所有的Spark程序运行过程中的数据只能存储在内存中。A对B错
问答题从Hadoop+Storm架构转向Spark架构可带来哪些好处?