此示例示出了如何以符合概率分布对象分组样本数据,并创建一个情节直观地比较各组的PDF文件。
加载样本数据。
加载carsmall;
该数据包含英里每加仑(MPG
)用于测量不同品牌和汽车型号,由原籍国分组(起源
),车型年(Model_Year
),以及其它车辆特性。
转变起源
成分类数组。
原点=分类(cellstr(原点));
用fitdist
以适应内核分布在起源组的每个国家MPG
数据。
[KerByOrig,国家] = fitdist(MPG,'核心','通过',起源)
KerByOrig =1×6单元阵列列1至2 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}列3至4 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}列5至6 {的1x1 prob.KernelDistribution} {的1x1 prob.KernelDistribution}
国家=6x1的细胞{ '法国'} { '德国'} { '意大利'} { '日本'} { '瑞典'} { 'USA'}
单元阵列KerByOrig
包含六个内核分发对象,一个用于在采样数据表示的每个国家。每个对象都包含性质有关的数据,分配,和参数保持信息。数组国家
列出原产国为每个组中的相同的顺序的分配对象存储在KerByOrig
。
提取德国,日本和美国的概率分布的对象。使用每个国家的位置上KerByOrig
在步骤3中,这表明德国是第二个国家中所示,日本是第四个国家和美国是第六个国家。计算每个组的PDF。
德国= KerByOrig {2};日本= KerByOrig {4};美国= KerByOrig {6};X = 0:1:50;USA_pdf = PDF(美国,X);Japan_pdf = PDF(日本,X);Germany_pdf = PDF(德国,X);
绘制每个组在同一图中的PDF文件。
图(X,USA_pdf,'R-')保持上图(X,Japan_pdf,'B-'。)情节(X,Germany_pdf,'K:')图例({'美国','日本','德国'},'位置','NW')标题(“MPG通过原产地”)xlabel('MPG')
所得的情节展示了如何英里每加仑(MPG
)业绩来源国不同(起源
)。利用这些数据,美国具有最广泛的分布,其峰值为最低MPG
这三个来源值。日本有一个稍重的左尾部最经常分布,其峰值是在最高MPG
这三个来源值。对于德国的峰是在美国和日本,和近44英里第二凸块之间每加仑表明,有可能在数据的多个模式。