关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以
关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。
A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系
B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析
C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以
B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析
C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以
参考解析
解析:本题考查数据挖掘的基础知识。K-Means和DBSCAN是两个经典的聚类算法,将相似的数据对象归类一组,不相似的数据对象分开。K-means算法基于对象之间的聚类进行聚类,需要输入聚类的个数。DBSCAN算法基于密度进行聚类,需要确定阈值,两者的聚类结果均与输入参数关系很大。DBSCAN可以处理不同大小和不同形状的簇,而K-means算法则不适合。若数据分布密度变化大,则这两种算法都不适用。
相关考题:
K-means算法叙述正确的是()A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目D、从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的
K-means算法的叙述正确的是()A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目的新的聚类心,因此当数据量非常大时,算法的时间开销是非常大的
K-Means聚类法要求自变量之间不存在共线性,是因为()A、变量存在多重共线性时无法得到聚类结果B、变量存在多重共线性时无法解释聚类结果C、变量存在多重共线性时,相关变量会在距离计算中占据很高的权重,从而对聚类结果有负面的影响D、变量存在多重共线性时,得到的聚类结果是完全错误的
单选题下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。AJP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇BJP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇CJP聚类是基于SNN相似度的概念DJP聚类的基本时间复杂度为O(m)
多选题K-means算法叙述正确的是()A在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的B在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化C对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目D从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的
单选题关于K均值和DBSCAN的比较,以下说法不正确的是()AK均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象BK均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念CK均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇DK均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
单选题K-means算法的缺点不包括()AK必须是事先给定的B选择初始聚类中心C对于“噪声”和孤立点数据是敏感的D可伸缩、高效