spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL

spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

  • A、单机
  • B、集中式
  • C、分布式
  • D、NOSQL

相关考题:

目前,()等分布式处理方式已经成为大数据处理各环节的通用处理方法。 A、NameNodeB、HadoopC、MapReduceD、Spark

Spark可以从()分布式文件系统中读取数据。 A.TachyonB.HiveC.HbaseD.HDFS

Spark是一个()计算框架。 A.快速B.容错C.可扩展D.分布式

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性

以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构

spark中弹性分布式数据集指的是哪个()A、RDDB、DriverC、MasterD、Map

spark中的rdd是一个()数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

spark中的弹性分布式数据集相当于java中的()概念A、类B、接口C、方法D、内部类

spark支持的分布式部署方式中哪个是错误的()A、standaloneB、spark on mesosC、spark on YARND、spark on local

spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

spark可以编写sql脚本的框架是()A、spark coreB、spark streamingC、mlbaseD、spark sql

spark中可以整合机器学习库,并可以对外提供接口的框架是()A、spark coreB、spark streamingC、mlbaseD、spark sql

spark框架中,整合机器学习库,并对外提供接口的框架是()A、spark coreB、spark streamingC、mlbaseD、spark sql

spark的核心框架是()A、spark coreB、spark streamingC、mlbaseD、Grophx

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)

下面对于spark的特点描述正确的是()A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性

RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合

SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD

云计算是()。A、为解决气象数据处理服务的B、用于移动通讯服务的C、只为一个集团提供通讯服务的D、将网络资源集中管理和调度,并以虚拟化方式为用户提供服务的

对传统的分布式程序设计相比,Mapreduce封装了()等细节,还提供了一个简单而强大的接口。A、并行处理B、容错处理C、数据分布D、负载均衡

大数据处理框架-Spark诞生于()A、伯克利大学AMPLabB、Apache孵化器项目C、Apache顶级项目D、开源项目

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。

判断题Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。A对B错

填空题Agent的()、互操作性、反应性、移动性为分布式应用提供方便、高效和鲁棒的执行框架。

判断题Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集A对B错

单选题云计算是()。A为解决气象数据处理服务的B用于移动通讯服务的C只为一个集团提供通讯服务的D将网络资源集中管理和调度,并以虚拟化方式为用户提供服务的