箱形图

盒形图提供对样本数据汇总统计信息的可视化,并包含下列特征:

  • 的顶部和每个“盒子”的底部是样品的25和第75百分位数,分别。顶部和底部之间的距离是四分位距。您可以使用计算四分位范围的值IQR

  • 在每个框中的中间线是样品中位数。如果中间没有盒子的中心,它显示偏度。您可以使用计算位数的值中位数功能。

  • 晶须是每个盒子的上方和下方延伸的线。晶须从四分位数间距到最远观察的晶须长度内的端部抽出(该相邻值)。

  • 超越须长度观察被标记为离群值。缺省情况下,异常值是超过1.5倍的四分位距离箱的顶部或底部的值,但该值可以与附加的输入参数来调整。离群值都将显示一个红色的+号。

  • 凹口显示样本之间的中值的可变性。凹口的宽度被计算,使得箱线图,其凹口不重叠(如上)具有在5%的显着性水平不同位数。显着性水平是基于正态分布的假设,但中位数的比较是对其他分布合理稳健。比较箱线图中位数就像一个视觉假设检验,类似于Ť用于测试手段。

由于箱线图显示的细节较少比直方图,它们是并排侧两个分布的比较,最有用的。

比较分组数据使用箱线图

加载费希尔虹膜样本数据。数据中包含的长度和从所述萼片宽度测量和三个物种的虹膜花花瓣。存储花瓣长度数据为花斑癣如虹膜S1为锦葵虹膜,且将花瓣长度数据S2

加载fisheririsS1 = MEAS(51:100,3);S2 = MEAS(101:150,3);

创建使用示例数据箱线图。包括对剧情的缺口和标记每个框,它代表虹膜物种名称。

图箱线图([S1 S2],'缺口''上'...'标签'{“花斑癣”“弗吉尼亚”})

两个箱形图的凹口不重叠,这表明云芝和锦葵虹膜的平均花瓣长度是在5%的显着性水平显著不同。

在云芝情节中线不出现的方块中,这表明该样品是稍微倾斜的内部为中心。此外,花斑癣数据包含一个离群值,而锦葵数据不包含任何异常值。

也可以看看

||

相关话题