这个示例展示了如何将概率分布对象与分组的样本数据相匹配,并创建一个图来直观地比较每个组的pdf。
加载样例数据。
负载carsmall;
该数据包含每加仑汽油行驶的英里数(英里/加仑
)按原产国分组,为不同的汽车制造及型号进行测量(起源
)、型号年份(Model_Year
)及其他车辆特性。
变换起源
放入一个分类数组。
起源=分类(cellstr(起源));
使用fitdist
拟合各来源国群体的核分布英里/加仑
数据。
[KerByOrig、国家]= fitdist(英里/加仑,“内核”,“通过”起源)
KerByOrig =1×6单元阵列列1到2 {1x1问题。KernelDistribution} {1 x1概率。KernelDistribution}Columns 3 through 4 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution} Columns 5 through 6 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}
细胞数组KerByOrig
包含6个内核分布对象,每个对象对应示例数据中表示的国家。每个对象都包含包含有关数据、分布和参数信息的属性。数组国家
按存储分布对象的顺序列出每个组的原产国KerByOrig
.
提取德国、日本、美国的概率分布对象。利用每个国家的位置KerByOrig
如图3所示,表示德国是第二国家,日本是第四国家,美国是第六国家。计算每个组的pdf。
德国= KerByOrig {2};日本= KerByOrig {4};美国= KerByOrig {6};x = 0:1:50;USA_pdf = pdf(美国x);Japan_pdf = pdf(日本,x);Germany_pdf = pdf(德国,x);
在同一图上绘制每组的pdf。
情节(x, USA_pdf,的r -)举行在情节(x, Japan_pdf,b -。)情节(x, Germany_pdf凯西:”)({传奇“美国”,“日本”,“德国”},“位置”,“西北”)标题(“按原产国划分的MPG”)包含(“英里”)
由此得到的图显示了每加仑汽油(英里/加仑
)的表现因来源国而异(起源
).从这个数据来看,美国的分布最广,峰值最低英里/加仑
价值的三个起源。日本的分布最为规律,左尾略重,峰值也最高英里/加仑
价值的三个起源。德国的峰值是在美国和日本之间,第二个峰值是每加仑44英里,这表明数据中可能存在多种模式。