RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)
RDD特性包含如下哪些?()
- A、一组分片(Partition),即数据集的基本组成单位
- B、一个计算每个分区的函数
- C、RDD之间的依赖关系
- D、一个列表,存储存取每个Partition的优先位置(preferredlocation)
相关考题:
SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup
创建rdd可以有如下几种?()A、由外部存储系统的数据集创建,包括本地的文件系统B、由一个已经存在的Scala集合创建C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、HbaseD、以上说法都不对
以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
在使用Ghost时,下列菜单中叙述错误的是:()。A、Partition To Partition表示将一个分区的数据复制到另一个分区B、Partition To Image表示将一个分区的数据复制到一个磁盘文件C、Partition From Image表示将一个Image文件的数据恢复到一个分区上D、Disk To Disk表示将一个磁盘的数据移动到另一个磁盘上
单选题下列有关RDD的说法中错误的是()。ARDD是一个只读的,可分区的分布式数据集。BRDD默认存储在磁盘,当磁盘不足时,溢写到内存。CRDD数据以分区的形式在集群中存储。DRDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
( 难度:中等)关于spark中RDD说法错误的是:A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的C.宽依赖中会有shuffle的产生D.窄依赖中会有shuffle的产生