SparkStreaming中的Dstream可以看作是在RDD上面又封了一层的数据结构
SparkStreaming中的Dstream可以看作是在RDD上面又封了一层的数据结构
相关考题:
SparkStreaming中时间片也可称为批处理时间间隔batchinterval,时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。() 此题为判断题(对,错)。
Dstream输出操作中()方法在Driver中打印出DStream中数据的前10个元素。 A.saveAsTextFilesB.saveAsObjectFilesC.saveAsHadoopFilesD.print
SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup
Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream。 A.windowB.reduceByWindowC.reduceByKeyAndWindowD.countByWindow
SparkStreming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的Dstream。 A.unionB.mapC.flatMapD.filter
SparkStreming中()函数当被调用的两个DStream分别含有K,V和K,W键值对时,返回一个K,Seq[V],Seq[W]类型的新的DStream。 A.unionB.reduceC.joinD.cogroup
SparkStreming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。 A.unionB.reduceC.joinD.cogroup
Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统。() 此题为判断题(对,错)。
以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
在什么条件下,普通物体可以看作是灰体?()A、发出热辐射的金属表面可以看作是灰体B、出红外辐射的表面均可看作是灰体C、普通物体表面在高温条件下的热辐射可以看作是灰体D、普通物体表面在常温条件下的热辐射可以看作是灰体
多选题关于spark说法正确的是()。A调用RDD的Transformation算子可以立即发起jobBNodeManager负责整个集群的资源统一调度和分配。CYarn-client适合测试,Yarn-cluster适合生产。DDataset具有RDD和DataFrame的优点,又避免它们的缺点。
判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A对B错