spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
spark的源码是由哪几种语言编写完成的()
- A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
- B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
- C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
- D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
相关考题:
以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构
Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)
下面对于spark的特点描述正确的是()A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性
多选题关于Spark和Mapreduce,下列说法正确的是()。A性能上提升高于100倍(全内存计算)BSpark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。C提供更多的数据集操作类型,编程模型更灵活,开发效率更高。D更低的容错能力(血统机制)。ESpark用十分之一的资源,获得10倍与Mapreduce的性能。
单选题大数据中spark生态支持的组件有:()和spark streaming。AeMBBBspark SQLCETCDspark streaming