关于mapreduce中mapTask的并行度说法正确的有?A.将待处理数据执行逻辑切片,按切片的个数来确定并行度。B.mapTask的并行度越高,job的执行效率就越高。C.mapTask的并行度决定map阶段的任务处理并发度。D.mapTask的并行度越低,job的执行效率就越高。

关于mapreduce中mapTask的并行度说法正确的有?

A.将待处理数据执行逻辑切片,按切片的个数来确定并行度。

B.mapTask的并行度越高,job的执行效率就越高。

C.mapTask的并行度决定map阶段的任务处理并发度。

D.mapTask的并行度越低,job的执行效率就越高。


参考答案和解析
将待处理数据执行逻辑切片,按切片的个数来确定并行度。;mapTask的并行度决定map阶段的任务处理并发度。

相关考题:

MapReduce用于()的大规模数据集的并行运算。 A.大于1KBB.大于1MBC.大于1GBD.大于1TB

MapReduce模型中,程序员不必关心并行计算、容错、数据分布、负载均衡等复杂的细节。() 此题为判断题(对,错)。

MapReduce与传统并行计算框架的对比中,说法正确的是()。 A.MapReduce属于共享式集群架构,容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型

下列关于MapReduce说法不正确的是( )。 A.MapReduce是一种计算框架B.MapReduce来源于google的学术论文C.MapReduce程序只能用java语言编写D.MapReduce隐藏了并行计算的细节,方便使用

在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是() A.Job和JobControl类可以管理非线性作业之间的依赖B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高

并行计算系统MapReduce适用于哪种场景? A.任意应用程序B.任意可在windows servet2008上运行的程序C.可以串行处理的应用程序D.可以并行处理的应用程序

MapReduce是一个什么类型的并行计算系统? A.专门为MPI设计的系统B.图计算C.流计算D.作业批处理

与传统的分布式程序设计相比,Mapreduce封装了()单而强大的接口。A、并行处理B、容错处理C、本地化计算D、负载均衡

MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()A、实时性B、高容错性C、易于扩展D、易于编程

hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为maptask和reducetask,每个task都是在自己的进程中运行的,当task结束时,进程也会结束

MapReduce适用于()。A、任意应用程序B、任意可在Windows Server 2008上的应用程序C、可以串行处理的应用程序D、可以并行处理的应用程序

MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。A、通常大于1GBB、通常大于1ZBC、通常大于1TBD、通常大于1PB

下列关于流程中工序的说法。正确的是()A、工序串行能节省工期B、工序并行能节省工期C、工序并行一定节约成本D、工序串行一定节约成本

Mapreduce适用于()A、任意应用程序B、任意可在windowsservet2008上运行的程序C、可以串行处理的应用程序D、可以并行处理的应用程序

关于MapReduce容错机制,下面说法正确的是()A、JobTracker可以有多个,因此不存在单点故障问题B、TaskTracker通过周期性心跳向JobTracker表明自己还活着C、MapTask失败后,能够被重新调度到其他节点上执行D、ReduceTask失败后,能够被重新调度到其他节点上执行

并行计算系统MapReduce适用于哪种场景?A、任意应用程序B、任意可在windows servet2008上运行的程序C、可以串行处理的应用程序D、可以并行处理的应用程序

与传统的分布式程序设计相比,MapReduce封装了以下哪些细节?A、并行处理B、负载均衡C、容错处理D、本地化计算

MapReduce是一个什么类型的并行计算系统?A、专门为MPI设计的系统B、图计算C、流计算D、作业批处理

并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。A、百度B、谷歌C、脸谱D、腾讯

单选题在MapReduce计算过程中的Shuffle阶段,以下哪个不是对MapTask的处理()。A分区B排序C分离D合并

单选题并行数据处理技术MapReduce是由哪家公司最先提出的()。A谷歌公司B百度公司C雅虎公司D脸谱公司

单选题MapReduce是一个什么类型的并行计算系统?A专门为MPI设计的系统B图计算C流计算D作业批处理

单选题下面关于Storm和SparkStreaming说法正确的是()。AStrom实时计算延迟度为毫秒级BStrom吞吐量高CSparkStreaming支持且完善事务机制DSparkStreaming支持动态调整并行度

多选题下面关于Storm和Spark Streaming说法正确的是()。AStrom实时计算延迟度为毫秒级BStrom吞吐量高CSparkStreaming不支持且完善事务机制DSparkStreaming支持动态调整并行度

多选题MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。A分布B映射C分析D化简

单选题MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。A通常大于1GBB通常大于1ZBC通常大于1TBD通常大于1PB

单选题并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。A百度B谷歌C脸谱D腾讯

多选题关于Spark和Mapreduce,下列说法正确的是()。A性能上提升高于100倍(全内存计算)BSpark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。C提供更多的数据集操作类型,编程模型更灵活,开发效率更高。D更低的容错能力(血统机制)。ESpark用十分之一的资源,获得10倍与Mapreduce的性能。