分散的措施
的目的分散的措施是找出分散的数据值在数轴上。这些统计数据的另一个术语是传播的措施。
表给出了函数的名称和描述。
范围(最大和最小值之间的差异)是最简单的传播。但是如果有局外人的数据,这将是最小或最大价值。因此,不健壮的异常值范围。
标准差和方差的传播流行的措施是正态分布样本的最优选择。样本方差的最小方差无偏估计量(MVUE)的正常参数σ2。标准差是方差的平方根和有理想的产权单位相同的数据。也就是说,如果数据是米,标准差是米。方差是米2更加难以解释。
标准差和方差都不是健壮的异常值。独立于身体的数据值的数据的值可以增加任意大量的统计数据。
的意思是绝对偏差对离群值(疯狂)也敏感。但疯狂并不完全一样的标准差或方差响应错误数据。
的四分位范围(差)的区别是75和25百分位的数据。因为只有中间50%的数据影响这一指标,是健壮的离群值。
比较分散的措施
这个例子展示了如何计算和比较分散的措施包含一个异常值的示例数据。
生成样本数据,其中包含一个异常值。
x =((1,6), 100年)
x =1×71 1 1 1 1 1 100
计算四分位范围、平均绝对偏差范围和标准偏差的样本数据。
统计=[差(x)疯狂(x)范围(x)性病(x))
统计=1×40 24.2449 99.0000 37.4185
四分位范围(位差
)之间的区别是75和25百分位的样本数据,并健壮的离群值。的范围(范围
)中的最大和最小值之间的差异数据,和强烈的影响存在一个局外人。
平均绝对偏差(疯了
)和标准差(性病
对异常值)敏感。然而,平均绝对偏差比标准偏差不敏感。