spark的源码是由哪几种语言编写完成的（）A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

spark的源码是由哪几种语言编写完成的（）

A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集
C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费
D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

相关考题：

目前,()等分布式处理方式已经成为大数据处理各环节的通用处理方法。 A、NameNodeB、HadoopC、MapReduceD、Spark

查看答案

MapReduce和Spark都属于大数据批处理计算的产品。() 此题为判断题(对，错)。

查看答案

在将数据源经过分析挖掘到最终获得价值的大数据处理过程中，MapReduce是在（）阶段应用分布式并行处理关键技术的常用工具。A.数据采集B.数据管理C.数据存储D.数据分析与挖掘

查看答案

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性

查看答案

以下关于sparkstreaming说法正确的是（）A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

查看答案

spark中弹性分布式数据集指的是哪个（）A、RDDB、DriverC、MasterD、Map

查看答案

Spark Streaming数据输入后可以用Spark的高度抽象原语如：map、reduce、join、window等进行运算

查看答案

spark中的rdd是一个（）数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

查看答案

spark中的弹性分布式数据集相当于java中的（）概念A、类B、接口C、方法D、内部类

查看答案

spark支持的分布式部署方式中哪个是错误的（）A、standaloneB、spark on mesosC、spark on YARND、spark on local

查看答案

spark中如果想要获取hdfs中的数据，则需要使用哪个系统（）A、spark？coreB、spark？streamingC、mapreduceD、Grophx

查看答案

spark中可以整合机器学习库，并可以对外提供接口的框架是（）A、spark coreB、spark streamingC、mlbaseD、spark sql

查看答案

spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据

查看答案

spark框架中，整合机器学习库，并对外提供接口的框架是（）A、spark coreB、spark streamingC、mlbaseD、spark sql

查看答案

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询（SparkSQL）、实时流处理（SparkStreaming）、机器学习（SparkMLlib）和图计算（GraphX）

查看答案

下面对于spark的特点描述正确的是（）A、良好的容错性：在分布式数据集计算时通过checkpoint来实现容错，当某个运算环节失败时，不需要从头开始重新计算B、开发便捷性：spark通过scala，java，pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作：Spark的运算是面向集合的，不适用于需要异步细粒度更新状态的应用，例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性

查看答案

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

查看答案

SparkSQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

查看答案

Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab

查看答案

spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集A、单机B、集中式C、分布式D、NOSQL

查看答案

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS

查看答案

问答题Spark是基于内存计算的大数据计算平台，试述Spark的主要特点。

查看答案

判断题Spark是基于内存的计算，所有的Spark程序运行过程中的数据只能存储在内存中。A对B错

查看答案

多选题关于Spark和Mapreduce，下列说法正确的是（）。A性能上提升高于100倍（全内存计算）BSpark的中间数据放在内存中，对于迭代运算、批处理计算的效率更高，延迟更低。C提供更多的数据集操作类型，编程模型更灵活，开发效率更高。D更低的容错能力（血统机制）。ESpark用十分之一的资源，获得10倍与Mapreduce的性能。

查看答案

判断题Spark是一个类似于MapReduce的分布式计算框架，其核心是弹性分布式数据集A对B错

查看答案

多选题以下哪些场景是Spark应用场景？（）A机器学B交互式分析C增量修改D流处理

查看答案

单选题大数据中spark生态支持的组件有：（）和spark streaming。AeMBBBspark SQLCETCDspark streaming

查看答案

热门标签

51题库考试学习网

51tk.com

相关考题：