下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行,输入分片应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().

  • A、FSDataInputStream扩展了DataInputStream以支持随机读
  • B、为实现细粒度并行,输入分片应该越小越好
  • C、一台机器可能被指派从输入文件的任意位置开始处理一个分片
  • D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

相关考题:

下面哪个程序负责 HDFS 数据存储?()ANameNodeBJobtrackerCDatanodeDsecondaryNameNodeEtasktracker

在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据()。A.存储技术B.分析技术C.并行分析技术D.挖掘技术

关于Block和Split两个概念,下面说法错误的是()。 A、Block是HDFS中最小的数据存储单位B、Split是MapReduce中最小的计算单元C、Block与Split是一一对应关系D、Block和Split之间对应关系是任意的,可由用户控制

MapReduce与传统并行计算框架的对比中,说法正确的是()。 A.MapReduce属于共享式集群架构,容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型

关于并行数据库系统的叙述中,错误的是A.无共享的结构是支持并行数据库系统的最好的并行结构B.在并行处理中,许多操作是同时执行的,而不是串行处理的C.共享主存储器系统有时又称作群机D.并行系统通过并行的使用多个CPU和磁盘来提高处理速度

下列关于MapReduce说法不正确的是( )。 A.MapReduce是一种计算框架B.MapReduce来源于google的学术论文C.MapReduce程序只能用java语言编写D.MapReduce隐藏了并行计算的细节,方便使用

在将数据源经过分析挖掘到最终获得价值的大数据处理过程中,MapReduce是在( )阶段应用分布式并行处理关键技术的常用工具。A.数据采集B.数据管理C.数据存储D.数据分析与挖掘

MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()A、实时性B、高容错性C、易于扩展D、易于编程

MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。A、分布B、映射C、分析D、化简

MapReduce将传统的查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理(),因此具有更强的并行处理能力。A、模块B、节点C、集群D、工作流

并行数据处理技术MapReduce是由哪家公司最先提出的()。A、谷歌公司B、百度公司C、雅虎公司D、脸谱公司

spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致

MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。A、通常大于1GBB、通常大于1ZBC、通常大于1TBD、通常大于1PB

与传统的分布程序设计相比,MapReduce封装了()等细节,还提供了一个简单而强大的接口A、并行处理B、容错处理C、数据分布D、负载均衡

MapReduce执行过程中,数据存储位置不是在GFS上的是()A、Map处理结果B、Reduce处理结果C、日志

并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。A、百度B、谷歌C、脸谱D、腾讯

()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS

单选题关于Hive和Hadoop其他组件的关系,以下描述错误的是?()AHive最终将数据存储在HDFS中BHiveSQL其本质是执行MapReduce任务CHive是Hadoop平台的数据仓库工具DHive对HBase有强依赖

单选题下面关于HDFS架构关键设计要点错误的是()。A支持回收站机制,以及副本数的动态设置机制B数据存储以数据块为单位,存储在操作系统的HDFS文件系统上C提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据DHDFS对外仅呈现多个统一的文件系统

单选题MapReduce执行过程中,数据存储位置不是在GFS上的是()AMap处理结果BReduce处理结果C日志

判断题适合用MapReduce来处理的数据集(或任务)有一个基本要求:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。( )A对B错

单选题文件上传到HDFS时,文件切分成数据块的工作是在?()ANamenode完成的BDatanode完成的Cclient完成的DSecondaryNamenode完成的

多选题MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。A分布B映射C分析D化简

单选题MapReduce是一种处理海量数据的并行编程模式,用于()大规模数据集的并行运算。A通常大于1GBB通常大于1ZBC通常大于1TBD通常大于1PB

单选题并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。A百度B谷歌C脸谱D腾讯

单选题Hadoop中哪个模块负责HDFS的数据存储?()ANameNodeBDataNodeCZooKeeperDJobTraoker

单选题下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().AFSDataInputStream扩展了DataInputStream以支持随机读B为实现细粒度并行,输入分片应该越小越好C一台机器可能被指派从输入文件的任意位置开始处理一个分片D输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割