RDD中的所有转换都是通过转化算子延迟加载的,也就是说,它们并不会直接计算结果

RDD中的所有转换都是通过转化算子延迟加载的,也就是说,它们并不会直接计算结果


相关考题:

请问RDD的()操作把RDD所有元素转换成数组并返回到Driver端。 A.zipB.joinC.combineByKeyD.collect

checkpoint算子是action类算子,不会延迟加载

groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD

大数据计算原则是()A、延迟加载B、不能立即接action算子C、立即执行D、需要action算子触发

spark中的count算子属于什么算子()A、action算子B、转换算子C、控制算子D、触发算子

reduceByKey算子在一个(K,V)的RDD上调用,返回一个(K,V)的RDD,使用指定的reduce函数,将相同key的值聚合到一起

一个spark程序如果想正常运行,则至少需要哪个算子()A、转换算子,action算子B、转换算子,控制算子C、转换算子,tracform算子D、转换算子

RDD可以转化为DataFrames,但是DataFrames不能转化为RDD

spark中的程序必须有以下哪几种算子构成()A、转换算子,action算子B、转换算子,控制算子C、转换算子,tracform算子D、转换算子

count算子返回RDD的元素个数

interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成

union算子对源RDD和参数RDD求并集后返回一个新的RDD

以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

spark架构中的任务调度中的driver具有以下哪些作用()A、action算子B、转换算子C、控制算子D、触发算子

以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

join算子在类型为(K,V)和(K,W)的RDD上调用,返回一个相同key对应的所有元素对在一起的(K,(V,W))的RDD

reduce动作算子通过func函数聚集RDD中的所有元素,这个功能必须是可交换且可并联的

spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

sortByKey算子在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDD

以下哪些是rdd的特性()A、cache算子是persist算子的一个子集B、persist算子是cache算子的一个子集C、persist算子包含cache算子D、cache算子包含persist算子

cogroup算子在类型为(K,V)和(K,W)的RDD上调用,返回一个(K,(Iterable,Iterable))类型的RDD

filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成

distinct算子对源RDD进行去重后返回一个新的RDD

判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A对B错

多选题关于spark说法正确的是()。A调用RDD的Transformation算子可以立即发起jobBNodeManager负责整个集群的资源统一调度和分配。CYarn-client适合测试,Yarn-cluster适合生产。DDataset具有RDD和DataFrame的优点,又避免它们的缺点。