()通过将属性域划分为区间,从而减少给定连续值的个数。A 概念分层B 离散化C 分箱D 直方图

()通过将属性域划分为区间,从而减少给定连续值的个数。

A 概念分层

B 离散化

C 分箱

D 直方图


相关考题:

例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的() A、简单函数变换B、规范化C、属性构造D、连续属性离散化

例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()。 A.连续属性离散化B.规范化C.简单函数变换D.属性构造

8、通过离散化操作可以将连续属性转化为序数属性

下列关于基于分箱的数据平滑化方法说法不正确的是()A.等频分箱扩展性不好。B.等宽分箱就是将属性x的取值范围划分为Z个等宽的区间。C.等宽分箱的特点是比较直观,容易操作;不适用于有尾分布的数据,可能出现很多空箱。D.等频分箱又称等深分箱,它将属性值分成几个区间,每个区间包含的样本点的个数(大致)相同。

使用等距离分箱法进行数据离散化,数据范围为20, 40, 50, 58, 65, 80, 80, 82, 86, 90, 96, 105, 120, 200,区间个数为4。下列属于4个箱的区间是()。A.[110,155)B.[20,65]C.(65,110)D.(155,200]

13、在结构化数据中进行关联分析发现其中的频繁模式和关联规则。对于取值连续的属性,首先将其离散化,然后将每个取值区间作为一个值,继而转化为“属性=值”的形式。

4、下面关于直方图的说法中,错误的是_________。A.直方图的横坐标按区间个数等分B.每个区间上长方形的高度表示该区间样本的频率C.分箱的数量与数据集的分布无关D.直方图可用来描述总体的频数分布情况

使用等距离分箱法进行数据离散化,数据范围为20, 40, 50, 58, 65, 80, 80, 82, 86, 90, 96, 105, 120, 200,区间个数为4。下列属于4个箱的区间是()。A.[20,65]B.(65,110)C.[110,155)D.(155,200]

在结构化数据中进行关联分析发现其中的频繁模式和关联规则。对于取值连续的属性,首先将其离散化,然后将每个取值区间作为一个值,继而转化为“属性=值”的形式。