K-Means聚类算法的实现及实验测试
K-Means聚类算法的实现及实验测试
参考答案和解析
Given k, the k-means algorithm is implemented in four steps: 1选择一个含有随机选择样本的k个簇的初始划分,计算这些簇的质心。 2根据欧氏距离把剩余的每个样本分配到距离它最近的簇质心的一个划分。 3计算被分配到每个簇的样本的均值向量,作为新的簇的质心。 4重复2,3直到k个簇的质心点不再发生变化或平方误差准则最小。
相关考题:
以下对k-means聚类算法解释正确的是()A.能自动识别类的个数,随即挑选初始点为中心点计算B.能自动识别类的个数,不是随即挑选初始点为中心点计算C.不能自动识别类的个数,随即挑选初始点为中心点计算D.不能自动识别类的个数,不是随即挑选初始点为中心点计算
关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以
K-means算法叙述正确的是()A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目D、从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的
K-means算法的叙述正确的是()A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目的新的聚类心,因此当数据量非常大时,算法的时间开销是非常大的
K-Means聚类法要求自变量之间不存在共线性,是因为()A、变量存在多重共线性时无法得到聚类结果B、变量存在多重共线性时无法解释聚类结果C、变量存在多重共线性时,相关变量会在距离计算中占据很高的权重,从而对聚类结果有负面的影响D、变量存在多重共线性时,得到的聚类结果是完全错误的
多选题K-means算法叙述正确的是()A在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目D从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的
单选题K-means算法的缺点不包括()AK必须是事先给定的B选择初始聚类中心C对于“噪声”和孤立点数据是敏感的D可伸缩、高效