saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统,对于每个元素,Spark将会调用toString方法,将它装换为文件中的文本
saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统,对于每个元素,Spark将会调用toString方法,将它装换为文件中的文本
相关考题:
Windows XP支持多种文件系统,以管理不同类型的外部存储器。在下列有关叙述中,错误的是A.FAT文件系统适用于多种外部存储器,包含软盘、硬盘和U盘等B.目前所有的光盘只能采用一种文件系统,即CDFS文件系统C.与FAT文件系统相比,NTFS文件系统有许多优点,例如对磁盘根目录中可存储的文件数量没有限定D.系统提供了将硬盘分区由FAT文件系统转换为NTFS文件系统的工具
对于操作系统Windows 2000/XP,下列说法中不正确的一项是(53)。A.Windows 2000/XP不支持传统的FAT文件系统B.NTFS文件系统是Windows 2000/XP本身的文件系统C.NTFS文件系统具有可恢复性D.NTFS文件系统比FAT文件系统能更有效地支持大磁盘和大文件
假如你不能umount一个文件系统,可能由()原因引起A、有用户登陆系统,并且该用户当前目录在该文件系统下B、该文件系统忙C、有该文件系统的目录树下挂接有其他的文件系统D、一个进程正在调用该文件系统下的文件E、该文件系统所在的卷处于打开状态
创建rdd可以有如下几种?()A、由外部存储系统的数据集创建,包括本地的文件系统B、由一个已经存在的Scala集合创建C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、HbaseD、以上说法都不对
华为9000大数据解决方案的主要特点包括()。A、集大数据存储、备份、分析为一体化B、9000解决方案采用HDFS文件系统C、支持多种接口与数据类型D、用户可以根据不同的商业性能和容量的需求,灵活的配置不同节点的数量
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括().A、利用利用SequenceFile、MapFile、Har等方式归档小文件B、多Master设计C、Block大小适当调小D、调大namenode内存或将文件系统元数据存到硬盘里
单选题以下对于HDFS描述不正确的是()。AHDFS是一个使用Java编写的分布式系统文件BHDFS由NameNode、DataNode、Client组成CHDFS不支持标准的POSIX文件系统接口DHDFS支持对已有的数据进行修改
单选题下面关于HDFS架构关键设计要点错误的是()。A支持回收站机制,以及副本数的动态设置机制B数据存储以数据块为单位,存储在操作系统的HDFS文件系统上C提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据DHDFS对外仅呈现多个统一的文件系统
( 难度:中等)下列关于Hadoop API的说法正确的是A.Hadoop的文件API不是通用的,只用于HDFS文件系统B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的C.FileStatus对象存储文件和目录的元数据D.FSDataInputStream是javio.DataInputStream的子类