大数据智能办公系统知识 题目列表
spark的组件不包含哪个()A、spark coreB、hdfsC、GraphxD、spark streaming

日志收集系统Flume现在使用的是哪个版本?()A、NG版本B、OG版本C、DG版本D、MG版本

sparkSql是基于hive的

spark本身自带读取hdfs数据的方法

分区是kafka消息队列的最小单位

下面哪个操作是窄依赖()A、reducebykeyB、filterC、groupD、reduce

SparkSQL有如下优点()A、最基本也是最常用的单元B、都是通过new出来的C、其实例保存在spring容器中D、在spring技术中是基于组件的

scala中val定义的变量,赋值后不能改变

Set集合是无序不重复的集合

spark架构在整个计算过程中,其partition个数是不可变的

通过如下程序块可以知道其输出结果为varlist=List(1,2,99,4,100)varjs=list.reduceRight(_min_)println(js)()A、100B、1C、206D、以上答案都不对

在spark中一个application实质就是一个spark程序

collect算子在驱动程序中,以数组的形式返回数据集的所有元素,要谨慎使用

跟在类名后面的是主构造器

以下选项哪些不是hive表存储结构?()A、内表存储B、外表存储C、混合存储D、内存存储