飞度概率分布对象分组数据

此示例示出了如何以符合概率分布对象分组样本数据,并创建一个情节直观地比较各组的PDF文件。

步骤1.加载样本数据。

加载样本数据。

加载carsmall;

该数据包含英里每加仑(MPG)用于测量不同品牌和汽车型号,由原籍国分组(起源),车型年(Model_Year),以及其它车辆特性。

步骤2.创建分类数组。

转变起源成分类数组。

原点=分类(cellstr(原点));

步骤3适合内核分布到每个组。

fitdist以适应内核分布在起源组的每个国家MPG数据。

[KerByOrig,国家] = fitdist(MPG,'核心''通过',起源)
KerByOrig =1×6单元阵列列1至2 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}列3至4 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}列5至6 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}
国家=6x1的细胞{ '法国'} { '德国'} { '意大利'} { '日本'} { '瑞典'} { 'USA'}

单元阵列KerByOrig包含六个内核分发对象,一个用于在采样数据表示的每个国家。每个对象都包含性质有关的数据,分配,和参数保持信息。数组国家列出原产国为每个组中的相同的顺序的分配对象存储在KerByOrig

步骤4计算的PDF为每个组。

提取德国,日本和美国的概率分布的对象。使用每个国家的位置上KerByOrig在步骤3中,这表明德国是第二个国家中所示,日本是第四个国家和美国是第六个国家。计算每个组的PDF。

德国= KerByOrig {2};日本= KerByOrig {4};美国= KerByOrig {6};X = 0:1:50;USA_pdf = PDF(美国,X);Japan_pdf = PDF(日本,X);Germany_pdf = PDF(德国,X);

步骤5.绘制每组的PDF文件。

绘制每个组在同一图中的PDF文件。

图(X,USA_pdf,'R-')保持图(X,Japan_pdf,'B-'。)情节(X,Germany_pdf,'K:')图例({'美国''日本''德国'},'位置''NW')标题(“MPG通过原产地”)xlabel('MPG'

所得的情节展示了如何英里每加仑(MPG)业绩来源国不同(起源)。利用这些数据,美国具有最广泛的分布,其峰值为最低MPG这三个来源值。日本有一个稍重的左尾部最经常分布,其峰值是在最高MPG这三个来源值。对于德国的峰是在美国和日本,和近44英里第二凸块之间每加仑表明,有可能在数据的多个模式。

也可以看看

|

相关话题