简述聚类分析的基本思想及相似度度量的方法
简述聚类分析的基本思想及相似度度量的方法
参考答案和解析
基本思想:认为所研究的样品或指标(变量)之间是存在着程度不同的相似性(亲疏关系)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另外一类, ... 。关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏 关系表示出来。
相关考题:
数据挖掘方法中的聚类分析也被称为无制导学习。一个好的聚类分析算法应该使得所得到的______。A.聚簇问的相似性很高,而不同的聚簇内的相似性很低B.聚簇内的相似性很低,而不同的聚簇间的相似性很高C.聚簇间的相似性很低,而不同的聚簇内的相似性很低D.聚簇内的相似性很高,而不同的聚簇间的相似性很低A.B.C.D.
以下对信用风险分析中的聚类分析(cluster analysis)方法的描述不正确的是( )。A.聚类分析法属于一种非参数统计方法B.聚类分析中Q 型聚类分析是对结果进行分类处理C.聚类分析中R 型聚类分析是对变量进行分类处理D.聚类分析法是研究分类的一种多元统计方法
问答题聚类分析法的分类依据和基本思想是什么?