大数据智能办公系统知识 题目列表
Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等

flume架构中的sink组纪检能够将数据存储到hbase中

flume是个什么系统?()A、消息中间件B、日志收集系统C、缓冲组件D、反向代理

使用scala语言编写的源程序时的文件扩展名是:(.scala)

Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用

在scala中定义方法使用关键字()A、defB、mainC、objectD、class

函数可以作为其他函数的参数

Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab

在大数据系统中的日志收集系统flume现在使用的版本是()A、OGB、NGC、MGD、BG

在scala中所有值类型的父类型是()A、AnyRefB、AnyValC、ObjectD、object

saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统

和spark中执行算子相对应的那个()A、jobB、taskC、driverD、stage

关于scala中的类和它的伴生对象,以下说法不正确的是()A、类和它的伴生对象定义在同一个文件中B、类和它的伴生对象可以有不同的名称C、类和它的伴生对象的名称必须相同D、类和它的伴生对象可以互相访问私有特性

distinct算子对源RDD进行去重后返回一个新的RDD

下面算子中哪个是宽依赖的()A、mapB、flatmapC、reducebykeyD、sample