关于大数据及应用的描述,不正确的是( )A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高

关于大数据及应用的描述,不正确的是( )

A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统
B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)
C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息
D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高

参考解析

解析:Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map:(映射)”和“Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的。:它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上,从而实现对'HDFS和HBase上的海量数据分析
Kafka是一种高吞吐量的分布式发布订阅消息系统
Producer
负责发布消息到Kafka broker
Consumer
消息消费者,向Kafka broker读取消息的客户端。
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Spark是在Scala语言中实现的,它将Scala用作其应用程序框架。与Hadoop不同,Spark和Scala能够紧密集成,其中的Scala可以像操作本地集合对象一样轻松地操作分布式数据集。
尽管创建Spark是为了支持分布式数据集上的迭代作业,但是实际上它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark由加州大学伯克利分校AMP实验室(Algorithms,Machines,and People Lab)开发,可用来构建大型的、低延迟的数据分析应用程序。

相关考题:

()是关于数据、操作数据的进程、应用程序的结构和意义的描述信息。 A、数据源B、数据建模C、元数据

关于数据库概念设计阶段的工作目标,下列说法错误的是______。A.定义和描述应用系统设计的信息结构和范围B.定义和描述应用系统中数据的属性特征和数据之间的联系C.描述应用系统的数据需求D.描述需要存储的记录及其数量

以下关于数据字典的描述中,不正确的是( )。A.数据字典是系统分析阶段的工具B.数据字典有助于改进分析人员和用户间的通信C.数据字典是应用系统中数据库设计的基础D.数据字典是系统物理模型的一个重要组成部分

( 4 )关于数据库概念设计阶段的工作目标,下列说法错误的是A )定义和描述应用系统涉及的信息结构和范围B )定义和描述应用系统中数据的属性特征和数据之间的联系C )描述应用系统的数据需求D )描述需要存储的记录及其数量

关于大数据的描述,不正确的是()。 A、大数据分析相比传统的数据仓库应用,具有查询及分析简单的特点B、大数据的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化的处理C、大数据主要依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术D、大数据具有类型繁多、结构化多样、处理速度快、时效性强的特点

以下关于数据报工作方式的描述中,不正确的是( )

关于企业应用集成(EAI)技术,描述不正确的是()A.EAI可以实现表示集成、数据集成、控制集成、应用集成等B.表示集成和数据集成是白盒集成,控制集成是黑盒集成C.EAI技术适用于大多数实施电子商务的企业以及企业之间的应用集成D.在做数据集成之前必须首先对数据进行标识并编成目录

下列关于数据库重构的描述中,不正确的是——一。A.数据库的重构就是对数据库的逻辑结构作必要的小范围改变B.数据库重构包括重新设计数据库及其应用程序C.当存储空间的分配过于零散,导致存取效率下降,所以必须重构数据库D.如果能够重构数据库,尽量不要重新设计数据库及相应的应用程序

华为FusionStorage推荐应用场景,描述正确的是?( ) A、云资源池场景B、数据库以及关键应用场景C、视频及文件服务器场景D、数据备份及归档场景

关于服务器选型的描述,不正确的是:( )A.应考虑应用服务器和数据服务器的运算指标和性能B.在关键业务应用中数据库和应用服务器应支持群集和高可用性处理C.服务器的处理能力只需满足关键业务应用和当前用户规模的需求D.服务器的硬盘、网络接口、网络连接及电源均应考虑足够的冗余

关于数据库管理优势的描述中,不正确的是(  )。A.存储数据大,但建立、修改等复杂操作均需专业人员操作B.数据共享好,冗余少,能够存储海量信息C.数据统计检索又快又准,降低了数据库的使用成本D.数据维护简便、易行

下列哪项是数据字典所包含的内容的最准确描述?A.关于数据库中数据项目及它们的含义的有组织的描述B.应用程序所使用的记录显示格式的描述C.管理数据库用户优先权和安全规则的描述D.数据库中记录更新之前和之后的映象

以下关于数据模型描述不正确的是()。A、数据模型表示的是数据库本身B、数据模型是客观事物及其联系的描述C、数据模型能以一定结构形式表示出各种不同数据及数据间的关系D、数据模型是对现实世界的抽象

下列关于数据的描述中不正确的是()A、按照一定的数据模型来组织和存储B、数据库就是大量相关联的数据的集合C、为所有的应用业务共享D、在计算机系统中建立起来的相互关联的数据的集合

下来描述数据仓库不正确的是()A、数据仓库是面向主题的B、数据仓库是集成的C、数据仓库是频繁更新的D、数据仓库是大容量的

以下关于文件管理的特点描述不正确的是()。A、数据可以长期保存B、通过文件系统管理数据,应用程序和数据之间不存在独立性C、数据共享性差、冗余量大D、数据的独立性较强,灵活性较高

下列关于数据库管理优势的描述中,正确的是()。A、数据库安全性低B、数据共享应用,提高数据的使用效率C、管理操作繁琐D、存储数据少

采用文件系统方式管理数据的特点描述不正确的是()。A、数据联系弱B、数据冗余大C、数据不共享D、数据联系强可共享

下列关于管理信息系统综合结构的描述不正确的是()A、可以做到数据的完全集中统一B、各功能子系统都有自己的专用数据库和应用程序C、不同层次的信息处理分别由不同功能子系统实现D、各功能子系统可以共享公用数据库的数据,并调用公用的应用程序和模型

关于OLAP和OLTP的区别描述,不正确的是()A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统

下面关于数据库管理描述不正确的是()。A、能够存储大量的数据B、方便、经济C、检索统计准确、迅速、高效D、数据应用共享性能好

Google云计算应用场景的特点,以下描述不正确的是()。A、Google的所有应用都是远程应用,而不是本地应用。B、Google本身应用软件的功能在云端。C、Google存储数据在云端。D、Google计算在终端。

多选题以下关于文件管理的特点描述不正确的是()。A数据可以长期保存B通过文件系统管理数据,应用程序和数据之间不存在独立性C数据共享性差、冗余量大D数据的独立性较强,灵活性较高

单选题下列关于数据的描述中不正确的是()A按照一定的数据模型来组织和存储B数据库就是大量相关联的数据的集合C为所有的应用业务共享D在计算机系统中建立起来的相互关联的数据的集合

单选题以下关于数据模型描述不正确的是()。A数据模型表示的是数据库本身B数据模型是客观事物及其联系的描述C数据模型能以一定结构形式表示出各种不同数据及数据间的关系D数据模型是对现实世界的抽象

单选题关于OLAP和OLTP的区别描述,不正确的是()AOLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务COLAP的特点在于事务量大,但事务内容比较简单且重复率高DOLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统

单选题下面关于数据库管理描述不正确的是()。A能够存储大量的数据B方便、经济C检索统计准确、迅速、高效D数据应用共享性能好

单选题采用文件系统方式管理数据的特点描述不正确的是()。A数据联系弱B数据冗余大C数据不共享D数据联系强可共享