判断题Spark和Hadoop都不使用于迭代计算。A对B错
判断题
Spark和Hadoop都不使用于迭代计算。
A
对
B
错
参考解析
解析:
暂无解析
相关考题:
使用Amazon云环境部署Hadoop的说法中错误的是()。 A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中D.Amazon EC2为Hadoop提供了存储服务
关于大数据及应用的描述,不正确的是( )A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高
以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构
hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为maptask和reducetask,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)
hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为map?task和reduce?task,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
下面对于spark的特点描述正确的是()A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性
问答题描述Spark集群计算中RDD的含义和作用。