分散的措施

的目的分散的措施是要找出传播出来的数据值是如何在数轴上。这些统计数据的另一个术语是传播的措施。

下表给出了函数的名称和说明。

功能名称

描述

IQR

四分位距

平均绝对偏差

时刻

所有阶的中心矩

范围

范围

STD

标准差

VAR

方差

的范围(最大值和最小值之间的差)是传播的最简单的措施。但如果对数据的异常值,这将是最低或最高值。因此,该范围为不健壮到异常值。

标准偏差和方差蔓延流行的措施是最佳的正态分布样本。样本方差是正常参数σ的最小方差无偏估计器(MVUE)2。的标准偏差是方差的平方根,并且具有相同的单位作为数据是所期望的属性。也就是说,如果数据是以米为单位,标准偏差是在几米远。方差为米2,这是比较难以解释。

无论是标准偏差,也不方差是稳健的异常值。这是分开的数据的主体的数据值可以通过任意大的量增加的统计信息的值。

均值绝对偏差(MAD)也是异常敏感。可是MAD不动相当多的响应坏数据的标准偏差或方差。

四分位数间距(IQR)是百分数据的第75和25之间的差异。因为只有数据的中间50%的影响这一措施,具有较强的抗异常值。

比较分散的度量

这个例子显示了如何计算并比较包含一个离群样本数据分散的措施。

生成包含一个离群值的样本数据。

X = [一(1,6),100]
X =1×71 1 1 1 1 1 100

计算四分位范围,平均绝对偏差,范围,标准差的采样数据的。

统计= [IQR(X),狂(X),范围(x)中,STD(x)]的
统计=1×40 24.2449 99.0000 37.4185

四分位距(IQR)是百分样本数据的第75和25之间的差,并且是稳健的离群值。范围 (范围)是数据的最大和最小值之间的差,并且通过异常值的存在的强烈影响。

无论是平均绝对偏差()和标准偏差(STD)是对异常值敏感。然而,平均绝对偏差大于标准偏差不敏感。

相关的话题