关于mapreduce中mapTask的并行度说法正确的有?A.将待处理数据执行逻辑切片,按切片的个数来确定并行度。B.mapTask的并行度越高,job的执行效率就越高。C.mapTask的并行度决定map阶段的任务处理并发度。D.mapTask的并行度越低,job的执行效率就越高。
关于mapreduce中mapTask的并行度说法正确的有?
A.将待处理数据执行逻辑切片,按切片的个数来确定并行度。
B.mapTask的并行度越高,job的执行效率就越高。
C.mapTask的并行度决定map阶段的任务处理并发度。
D.mapTask的并行度越低,job的执行效率就越高。
参考答案和解析
将待处理数据执行逻辑切片,按切片的个数来确定并行度。;mapTask的并行度决定map阶段的任务处理并发度。
相关考题:
MapReduce与传统并行计算框架的对比中,说法正确的是()。 A.MapReduce属于共享式集群架构,容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型
下列关于MapReduce说法不正确的是( )。 A.MapReduce是一种计算框架B.MapReduce来源于google的学术论文C.MapReduce程序只能用java语言编写D.MapReduce隐藏了并行计算的细节,方便使用
在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是() A.Job和JobControl类可以管理非线性作业之间的依赖B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高
MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()A、实时性B、高容错性C、易于扩展D、易于编程
hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为maptask和reducetask,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
关于MapReduce容错机制,下面说法正确的是()A、JobTracker可以有多个,因此不存在单点故障问题B、TaskTracker通过周期性心跳向JobTracker表明自己还活着C、MapTask失败后,能够被重新调度到其他节点上执行D、ReduceTask失败后,能够被重新调度到其他节点上执行
单选题下面关于Storm和SparkStreaming说法正确的是()。AStrom实时计算延迟度为毫秒级BStrom吞吐量高CSparkStreaming支持且完善事务机制DSparkStreaming支持动态调整并行度
多选题下面关于Storm和Spark Streaming说法正确的是()。AStrom实时计算延迟度为毫秒级BStrom吞吐量高CSparkStreaming不支持且完善事务机制DSparkStreaming支持动态调整并行度
多选题关于Spark和Mapreduce,下列说法正确的是()。A性能上提升高于100倍(全内存计算)BSpark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。C提供更多的数据集操作类型,编程模型更灵活,开发效率更高。D更低的容错能力(血统机制)。ESpark用十分之一的资源,获得10倍与Mapreduce的性能。