8、假定一个数据集: 有m个点,K个簇; 一半的点和簇在"较稠密的"区域; 一半的点和簇在"不太稠密的"区域; 两个区域之间是明显分离的 对给定的数据集,下面哪种情况可以最小化寻找K个簇时的平方误差?A.在较稠密和不太稠密的区域质心分布应当相同B.不太稠密的区域应当分配更多的质心C.较稠密的区域应当分配更多的质心D.以上都可以

8、假定一个数据集: 有m个点,K个簇; 一半的点和簇在"较稠密的"区域; 一半的点和簇在"不太稠密的"区域; 两个区域之间是明显分离的 对给定的数据集,下面哪种情况可以最小化寻找K个簇时的平方误差?

A.在较稠密和不太稠密的区域质心分布应当相同

B.不太稠密的区域应当分配更多的质心

C.较稠密的区域应当分配更多的质心

D.以上都可以


参考答案和解析
不太稠密的区域应当分配更多的质心。

相关考题:

给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员不可以相同。() 此题为判断题(对,错)。

给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。() 此题为判断题(对,错)。

K-means聚类是发现给定数据集的K个簇的算法。() 此题为判断题(对,错)。

给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。() 此题为判断题(对,错)。

一个单克隆抗体分子A.只和相应的一个抗原决定簇结合B.能和两个抗原决定簇结合C.能和三个抗原决定簇结合D.能和三个以上抗原决定簇结合E.不能和任何抗原决定簇结合

“簇”是系统为文件分配磁盘时的分配单元,其特征叙述不正确的是______。A.每个簇在FAT中都有对应的表项,簇号即为表项的序号B.FAT中,每个表项记录信息用于表示该簇是“使用”、“空闲”或者“坏”。C.坏簇在磁盘格式化过程中发现和登记,如果有一个扇区损坏时,该簇还可以使用。D.FAT中,每个文件存储位置都有表示为一个“数字链”,其给出该文件的各个部分被存储在磁盘哪些簇中。

在一个磁盘表面有很多磁道,并且磁道是在()内被划分的。 A.扇区B.簇C.FRUsD.磁点

关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以

一个单克隆抗体分子A:只和相应的一个抗原决定簇结合B:能和两个抗原决定簇结合C:能和三个抗原决定簇结合D:能和三个以上抗原决定簇结合E:不能和任何抗原决定簇结合

给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。

从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

关于K均值和DBSCAN的比较,以下说法不正确的是()。A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇

关于簇和页的说法正确的是()。A、页由相邻的簇组成B、簇和页的大小无法由用户设置C、在控制台工具Console中可以查看数据库中的簇和页大小D、DM数据库中的数据以簇为最小存储单位

在一个磁盘表面有很多磁道,并且磁道是在()内被划分的。A、扇区B、簇C、FRUsD、磁点

关于混合模型聚类算法的优缺点,下面说法正确的是()A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布C、混合模型很难发现不同大小和椭球形状的簇D、混合模型在有噪声和离群点时不会存在问题

目的是将数据对象划分为多个类或簇,在同一个簇中的对象之间具有高的相似度,而不同簇中的对象差别较大指的是()。A、描述B、关联分析C、聚类分析

在RF优化前要划分好簇,簇划分有以下哪几项原则()。A、簇的数量原则:根据实际情况,18-25个基站为一簇,不宜过多或过少B、站点的疏密原则:根据站点排布情况,尽量将相对密集站群归为一簇C、行政区域划分原则:城市规划的行政区一般都是中心密集逐渐外扩,或者外扩存在一定的方向性,这样将分割区域放在行政区外延区域便于簇与簇之间的衔接D、地形因素原则

关于簇优化启动条件的说法,通常不包含()。A、簇内基站无硬件告警和传输故障B、簇内已开通站点个数达到计划开通站点数的80%C、簇测试区域内无明显外部干扰问题D、簇内商用用户已经放号

为每簇假定了一个模型,寻找数据对给定模型的最佳拟合是基于网格的方法。

单选题()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。AMIN(单链)BMAX(全链)C组平均DWard方法

单选题关于簇优化启动条件的说法,通常不包含()。A簇内基站无硬件告警和传输故障B簇内已开通站点个数达到计划开通站点数的80%C簇测试区域内无明显外部干扰问题D簇内商用用户已经放号

判断题给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。A对B错

单选题关于K均值和DBSCAN的比较,以下说法不正确的是()AK均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象BK均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念CK均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇DK均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇

单选题目的是将数据对象划分为多个类或簇,在同一个簇中的对象之间具有高的相似度,而不同簇中的对象差别较大指的是()。A描述B关联分析C聚类分析

判断题从点作为个体簇开始每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。A对B错

多选题在RF优化前要划分好簇,簇划分有以下哪几项原则()。A簇的数量原则:根据实际情况,18-25个基站为一簇,不宜过多或过少B站点的疏密原则:根据站点排布情况,尽量将相对密集站群归为一簇C行政区域划分原则:城市规划的行政区一般都是中心密集逐渐外扩,或者外扩存在一定的方向性,这样将分割区域放在行政区外延区域便于簇与簇之间的衔接D地形因素原则

判断题为每簇假定了一个模型,寻找数据对给定模型的最佳拟合是基于网格的方法。A对B错

单选题关于混合模型聚类算法的优缺点,下面说法正确的是()A当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理B混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布C混合模型很难发现不同大小和椭球形状的簇D混合模型在有噪声和离群点时不会存在问题