大数据智能办公系统知识 - 51题库考试学习网

Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器，并且可以处理所有Hadoop支持的数据，包括HDFS、HBase和Cassandra等

查看答案

flume架构中的sink组纪检能够将数据存储到hbase中

查看答案

flume是个什么系统？（）A、消息中间件B、日志收集系统C、缓冲组件D、反向代理

查看答案

使用scala语言编写的源程序时的文件扩展名是：（.scala）

查看答案

Spark的运算是面向集合的，不适用于需要异步细粒度更新状态的应用

查看答案

在scala中定义方法使用关键字（）A、defB、mainC、objectD、class

查看答案

函数可以作为其他函数的参数

查看答案

Spark是一种快速、通用、可扩展的大数据分析引擎，2009年诞生于加州大学伯克利分校AMPLab

查看答案

在大数据系统中的日志收集系统flume现在使用的版本是（）A、OGB、NGC、MGD、BG

查看答案

在scala中所有值类型的父类型是（）A、AnyRefB、AnyValC、ObjectD、object

查看答案

saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统

查看答案

和spark中执行算子相对应的那个（）A、jobB、taskC、driverD、stage

查看答案

关于scala中的类和它的伴生对象，以下说法不正确的是（）A、类和它的伴生对象定义在同一个文件中B、类和它的伴生对象可以有不同的名称C、类和它的伴生对象的名称必须相同D、类和它的伴生对象可以互相访问私有特性

查看答案

distinct算子对源RDD进行去重后返回一个新的RDD

查看答案

下面算子中哪个是宽依赖的（）A、mapB、flatmapC、reducebykeyD、sample

查看答案

51题库考试学习网