()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS
()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。
- A、Spark
- B、Hive
- C、Haystack
- D、HDFS
相关考题:
spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
基于机器学习的系统跟基于人工识别的系统有什么差异?()A、机器学习系统节省人力,更自动化B、机器学习比较适合排序、简单逻辑判断C、机器学习比较适合复杂的聚类和分类算法D、机器学习可以从海量的数据中获取经验,而不受限于具体维度
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行,输入分片应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
单选题下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是().AFSDataInputStream扩展了DataInputStream以支持随机读B为实现细粒度并行,输入分片应该越小越好C一台机器可能被指派从输入文件的任意位置开始处理一个分片D输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割