spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集A、单机B、集中式C、分布式D、NOSQL

目前,()等分布式处理方式已经成为大数据处理各环节的通用处理方法。 A、NameNodeB、HadoopC、MapReduceD、Spark

查看答案

Spark可以从()分布式文件系统中读取数据。 A.TachyonB.HiveC.HbaseD.HDFS

查看答案

Spark是一个()计算框架。 A.快速B.容错C.可扩展D.分布式

查看答案

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性

查看答案

以下关于sparkstreaming说法正确的是（）A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

查看答案

spark中弹性分布式数据集指的是哪个（）A、RDDB、DriverC、MasterD、Map

查看答案

spark中的rdd是一个（）数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

查看答案

spark中的弹性分布式数据集相当于java中的（）概念A、类B、接口C、方法D、内部类

查看答案

spark支持的分布式部署方式中哪个是错误的（）A、standaloneB、spark on mesosC、spark on YARND、spark on local

查看答案

spark的源码是由哪几种语言编写完成的（）A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

查看答案

spark可以编写sql脚本的框架是（）A、spark coreB、spark streamingC、mlbaseD、spark sql

查看答案

spark中可以整合机器学习库，并可以对外提供接口的框架是（）A、spark coreB、spark streamingC、mlbaseD、spark sql

查看答案

spark框架中，整合机器学习库，并对外提供接口的框架是（）A、spark coreB、spark streamingC、mlbaseD、spark sql

查看答案

spark的核心框架是（）A、spark coreB、spark streamingC、mlbaseD、Grophx

查看答案

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询（SparkSQL）、实时流处理（SparkStreaming）、机器学习（SparkMLlib）和图计算（GraphX）

查看答案

下面对于spark的特点描述正确的是（）A、良好的容错性：在分布式数据集计算时通过checkpoint来实现容错，当某个运算环节失败时，不需要从头开始重新计算B、开发便捷性：spark通过scala，java，pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作：Spark的运算是面向集合的，不适用于需要异步细粒度更新状态的应用，例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性

查看答案

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

查看答案

SparkSQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

查看答案

SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做（）的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD

查看答案

云计算是（）。A、为解决气象数据处理服务的B、用于移动通讯服务的C、只为一个集团提供通讯服务的D、将网络资源集中管理和调度，并以虚拟化方式为用户提供服务的

查看答案

对传统的分布式程序设计相比，Mapreduce封装了（）等细节，还提供了一个简单而强大的接口。A、并行处理B、容错处理C、数据分布D、负载均衡

查看答案

大数据处理框架-Spark诞生于（）A、伯克利大学AMPLabB、Apache孵化器项目C、Apache顶级项目D、开源项目

查看答案

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。

查看答案

判断题Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。A对B错

查看答案

填空题Agent的（）、互操作性、反应性、移动性为分布式应用提供方便、高效和鲁棒的执行框架。

查看答案

判断题Spark是一个类似于MapReduce的分布式计算框架，其核心是弹性分布式数据集A对B错

查看答案

单选题云计算是（）。A为解决气象数据处理服务的B用于移动通讯服务的C只为一个集团提供通讯服务的D将网络资源集中管理和调度，并以虚拟化方式为用户提供服务的

查看答案

51题库考试学习网

51tk.com

spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集A、单机B、集中式C、分布式D、NOSQL

相关考题：