MapReduce将传统的查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理(),因此具有更强的并行处理能力。A、模块B、节点C、集群D、工作流
MapReduce将传统的查询、分解及数据分析进行分布式处理,将处理任务分配到不同的处理(),因此具有更强的并行处理能力。
- A、模块
- B、节点
- C、集群
- D、工作流
相关考题:
在计算F统计量的是,需要分解和方分解,分为()A、将总体的和方分解为处理内的各部分B、将总体的和方分解为处理间C、将总体的和方分解为处理内和处理间D、将处理间的和方分解为各因素及交互作用E、将处理内的和方分解为各因素及交互作用
关于大数据的描述,不正确的是()。 A、大数据分析相比传统的数据仓库应用,具有查询及分析简单的特点B、大数据的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化的处理C、大数据主要依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术D、大数据具有类型繁多、结构化多样、处理速度快、时效性强的特点
分布式数据库系统中查询处理的一般过程是:由全局数据库管理系统在查询产生结点时对查询进行词法和语法分析,生成(17);(17)进行变换,查询分解,把全局查询分解成若干个子查询,确定处理子查询结果的运算次序和结点;对子查询进行优化和执行:最后是子查询结果的汇总和处理。A.查询语句B.子查询模式C.全局查询树D.查询视图
以下关于大数据的叙述中,不正确的是( )。A.大数据的意义是对数据进行专业化处理,实现数据的“增值”B.大数据的4个特点是数据类型多、数据量大、价值密度高和处理速度快C.大数据需要依托云计算的分布式处理、分布式数据库和云存储等D.与传统的数据仓库应用相比,大数据分析具有数据量大、查询分析更复杂等特点
spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
下列关于方差分析说法,错误的是()A、方差分析的基本思想是将变异进行分解B、方差分析直接将SS进行分解C、方差分析直接将υ进行分解D、方差分析直接将MS进行分解E、方差分析直接将总变异进行分解
下列关于Oracle数据库的描述,正确的是()A、分布式处理功能,将一个查询分解成多个子查询,再在不同的CPU上同时执行这些子查询B、支持多种系统平台(HPUX、SUNOS、OSF/1、VMS、WINDOWS、WINDOWS/NT、OS/2)C、数据安全级别为C2级(最高级)D、性能最高,保持开放平台下的TPC-D和TPC-C的世界纪录
单选题hive是基于Hadoop的一个()工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运算。A数据库B数据仓库C表格D文字
问答题MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。