基于邻近度的异常检测算法的局限性有哪些?A.对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点B.参数k选择困难C.高维空间里,数据是稀疏的,邻近度变得没意义D.对于高维数据难以估算其真实分布

基于邻近度的异常检测算法的局限性有哪些?

A.对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点

B.参数k选择困难

C.高维空间里,数据是稀疏的,邻近度变得没意义

D.对于高维数据难以估算其真实分布


参考答案和解析
对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点;高维空间里,数据是稀疏的,邻近度变得没意义

相关考题:

传模校正时,通常选择待校正的模型参数有() A.地物损耗因子B.K1C.K2D.K3

对于k折交叉验证,以下对k的说法正确的是()A.k越大,不一定越好,选择大的k会加大评估时间B.选择更大的k,就会有更小的bias(因为训练集更加接近总数据集)C.在选择k时,要最小化数据集之间的方差D.以上所有

数据结构被形式地定义为(K,R),其中K是( )的有限集,R是K上的关系有限集。A.算法B.数据元素C.数据操作D.逻辑结构

数据结构被形式地定义为(K,R),其中K是(34)的有限集合,R是K上(35)的有限集合。A.算法B.数据元素C.数据操作D.逻辑结构

对某个小区的载波功率参数BSPWRBBSPWRT修改后采用()一定要对参考点功率参数BSPWRBSTXPWR作相应的修改。 A.上行K算法B.下行K算法C.L算法

使用估算模式计算点源影响时,一般情况下,需输入( )。A. 点源参数 B. 气象数据C. 烟囱出口处的环境温度 (K) D. 计算点的高度E. 地形类型的选择

异质性检验的统计量服从何种分布(k为研究的个数n为第i个研究的样本量):A.自由度为∑n-k的卡方分布B.自由度为k-1的卡方分布C.自由度为k-1的F分布D.自由度为∑n-k的F分布E.自由度为k-1的t分布

使用估算模式计算点源影响时,一般情况下,需输入下列哪些参数?()A:点源参数B:气象数据C:烟囱出口处的环境温度(K)D:计算点的高度E:地形类型的选择

关于K空间的性质描述,下面叙述哪些是正确的().A、图像的对比度特征由填充到K空间中心的数据制造方法和参数决定B、K空间必须填充到一定的程度才能有足够的信息得到有利用价值的图像C、K空间不同位置的数据对最终图像的贡献是不同的D、K空间必须填满数据后才能得到一幅MRI图像

基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。

在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A、曼哈顿距离B、平方欧几里德距离C、余弦距离D、Bregman散度

齐次坐标(x,y,z,k)表示()。A、二维空间点(x,y)B、二维空间点(x/k,y/k)C、三维空间点(x,y,z)D、三维空间点(x/k,y/k,z/k)

K-means算法的缺点不包括()A、K必须是事先给定的B、选择初始聚类中心C、对于“噪声”和孤立点数据是敏感的D、可伸缩、高效

一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A、概率B、邻近度C、密度D、聚类

()这些数据特性都是对聚类分析具有很强影响的。A、高维性B、规模C、稀疏性D、噪声和离群点

关于混合模型聚类算法的优缺点,下面说法正确的是()A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布C、混合模型很难发现不同大小和椭球形状的簇D、混合模型在有噪声和离群点时不会存在问题

对于一个有向图,若一个顶点的入度为k1、出度为k2,则对应邻接表中该顶点单链表中的结点数为()。A、k1B、k2C、k1-k2D、k1+k2

检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。A、聚类技术B、邻近度C、密度D、统计方法

单选题在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A曼哈顿距离B平方欧几里德距离C余弦距离DBregman散度

单选题一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A概率B邻近度C密度D聚类

判断题基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。A对B错

多选题使用估算模式计算点源影响时,一般情况下,需输入下列哪些参数?()A点源参数B气象数据C烟囱出口处的环境温度(K)D计算点的高度E地形类型的选择

单选题齐次坐标(x,y,z,k)表示()。A二维空间点(x,y)B二维空间点(x/k,y/k)C三维空间点(x,y,z)D三维空间点(x/k,y/k,z/k)

单选题检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测A统计方法B邻近度C密度D聚类技术

单选题K-means算法的缺点不包括()AK必须是事先给定的B选择初始聚类中心C对于“噪声”和孤立点数据是敏感的D可伸缩、高效

单选题对于一个有向图,若一个顶点的度为k1,出度为k2,则对应邻接表中该顶点单链表中的边结点数为()。A k1B k2C k1-k2D k1+k2

多选题()这些数据特性都是对聚类分析具有很强影响的。A高维性B规模C稀疏性D噪声和离群点

单选题关于混合模型聚类算法的优缺点,下面说法正确的是()A当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理B混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布C混合模型很难发现不同大小和椭球形状的簇D混合模型在有噪声和离群点时不会存在问题