5、在实际环境下,很多数据集都包含缺失数据,对于缺失数据的处理常用的方法包括以下哪几种?A.缺失作为属性的一个取值B.利用模型预测缺失值C.用最少的属性值填充D.用最大值填充
5、在实际环境下,很多数据集都包含缺失数据,对于缺失数据的处理常用的方法包括以下哪几种?
A.缺失作为属性的一个取值
B.利用模型预测缺失值
C.用最少的属性值填充
D.用最大值填充
参考答案和解析
缺失作为属性的一个取值;利用模型预测缺失值
相关考题:
若处理调查数据时发现有缺失数据,且样本量很大,有缺失数据的个案比例较小,有缺失数据的个案与无缺失数据的个案在分布上无显著差异时,可以( )。 A. 将有缺失的个案整个删除B. 将有缺失的个案保留,仅在计算时删除相应变量的缺失值C. 使用均值代替、回归估计、随机抽取、最近距离确定等方法代替缺失值D. 通过对调查中的回答数据使用加权因子,对数据进行调整,减少缺失值的影响
对于脱落/缺失数据的应对,以下说法错误的是()。 A、在方案或者SAP中提前考虑缺失数据的处理B、医学监查,数据审核,统计师参与判断受试者,能否进入最终的分析集C、在统计分析时候,根据缺失数据的缺失机制,考虑数据的填补规则D、基于原方案的设计,揭盲后评价追加样本量
在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A、违反了建模的假设条件B、加大了处理的难度C、无法针对分区后各个数据集的特征分别做数据清洗D、无法对不同数据清理的方法进行比较,以选择最优方法
单选题在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A违反了建模的假设条件B加大了处理的难度C无法针对分区后各个数据集的特征分别做数据清洗D无法对不同数据清理的方法进行比较,以选择最优方法