主要内容

Fitdist.

适合数据的概率分布对象

描述

例子

pd= fitdist (Xdistname.通过拟合指定的分布来创建概率分布对象distname.到列向量中的数据X

例子

pd= fitdist (Xdistname.名称,价值使用由一个或多个名称-值对参数指定的附加选项创建概率分布对象。例如,可以为迭代拟合算法指定审查数据或控制参数。

例子

[pdcaGN.GL.) = fitdist (Xdistname.“通过”,groupvar通过拟合指定的分布来创建概率分布对象distname.的数据X基于分组变量groupvar.它返回一个拟合概率分布对象的单元阵列,pdca,一个小组标签的细胞阵列,GN.,以及分组变量级别的单元格数组,GL.

例子

[pdcaGN.GL.) = fitdist (Xdistname.“通过”,groupvar名称,价值使用由一个或多个名称-值对参数指定的附加选项返回上述输出参数。例如,可以为迭代拟合算法指定审查数据或控制参数。

例子

全部收缩

加载示例数据。创建一个包含患者权重数据的向量。

加载医院x = hospital.Weight;

通过拟合数据来创建一个正态分布对象。

pd = fitdist (x,'普通的'
正态分布mu = 154 [148.728, 159.272] sigma = 26.5714 [23.3299, 30.8674]

参数估计旁边的区间是分布参数的95%置信区间。

绘制分布图的pdf。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values y“线宽”, 2)

图中包含一个坐标轴。轴包含一个线型对象。

加载示例数据。创建一个包含患者权重数据的向量。

加载医院x = hospital.Weight;

通过将内核分布对象与数据拟合来创建内核分布对象。使用epannichikov核函数。

pd = fitdist (x,'核心''核心'“埃帕内切尼科夫”
pd = KernelDistribution Kernel = epanechnikov Bandwidth = 14.3792 万博1manbetxSupport = unbounded

绘制分布图的pdf。

x_values = 50:1:250;y = pdf (pd, x_values);情节(x_values, y)

图中包含一个坐标轴。轴包含一个线型对象。

加载示例数据。创建一个包含患者权重数据的向量。

加载医院x = hospital.Weight;

通过将它们拟合到数据来创建正常分布对象,由患者性别分组。

性别=医院.Sex;[pdca,gn,gl] = fitdist(x,'普通的''经过'、性别)
pdca =1×2个单元阵列{1x1 prob.normaldistribution} {1x1 prob.normaldistribution}
gn =2 x1细胞{'女人男人' }
德国劳埃德船级社=2 x1细胞{'女人男人' }

细胞阵列pdca包含两个概率分布对象,每个性别组都是一个。细胞阵列GN.包含两个组标签。细胞阵列GL.包含两个组级别。

查看单元格数组中的每个分布pdca为了比较平均值,μ和标准偏差,Sigma.,按患者性别分组。

女= pdca {1}%女性的分布
正态分布mu = 130.472 [128.183, 132.76] sigma = 8.30339 [6.96947, 10.2736]
男性= PDCA {2}%男性分布情况
正态分布mu = 180.532 [177.833, 183.231] sigma = 9.19322 [7.63933, 11.5466]

计算每个分发版的pdf。

x_值=50:1:250;femalepdf=pdf(女性,x_值);malepdf=pdf(男性,x_值);

绘制PDF,以便按性别直观比较体重分布。

图绘制(x_values femalepdf,“线宽”,2)持有情节(x_values malepdf,“颜色”'r'“线条样式”“:”“线宽”,2)传奇(GN,“位置”“东北”)举行

图中包含一个坐标轴。轴线包含2个线型对象。这些物品代表女性,男性。

加载示例数据。创建一个包含患者权重数据的向量。

加载医院x = hospital.Weight;

通过将它们与数据进行拟合,创建内核分布对象,并按患者性别分组。使用三角核函数。

性别=医院.Sex;[pdca,gn,gl] = fitdist(x,'核心''经过'、性别、'核心''三角形');

查看单元格数组中的每个分布pdca查看每种性别的内核发行版。

女= pdca {1}%女性的分布
女性= kerneldistribution kernel =三角带宽= 4.25894支持=无限制万博1manbetx
男性= PDCA {2}%男性分布情况
男性=内核分布内核=三角形带宽=5.08961支持=无限万博1manbetx

计算每个分发版的pdf。

x_值=50:1:250;femalepdf=pdf(女性,x_值);malepdf=pdf(男性,x_值);

绘制PDF,以便按性别直观比较体重分布。

图绘制(x_values femalepdf,“线宽”,2)持有情节(x_values malepdf,“颜色”'r'“线条样式”“:”“线宽”,2)传奇(GN,“位置”“东北”)举行

图中包含一个坐标轴。轴线包含2个线型对象。这些物品代表女性,男性。

输入参数

全部收缩

输入数据,指定为列向量。Fitdist.忽略X.此外,任何截尾向量或频率向量中的值导致Fitdist.忽略中的相应值X

数据类型:

分发名称,指定为以下字符向量或字符串标量之一。指定的分布distname.确定返回的概率分布对象的类型。

分布的名字 描述 分布对象
“β” 贝塔分布 BetaDistribution
'二重子' 二项分布 二元分布
“BirnbaumSaunders” Birnbaum-Saunders分销 BirnbaumSaundersDistribution
“毛刺” 毛刺分布 BurrDistribution
'指数' 指数分布 ExponentialDistribution
'extremevalue' 极端值分布 extremevaluepistribution.
“伽马” 伽马分布 伽玛分布
“GeneralizedExtremeValue” 广义极值分布 GeneralizedExtremeValueDistribution
“GeneralizedPareto” 广义帕累托分布 GeneralizedParetoDistribution
“HalfNormal” 半正态分布 半正态分布
'Inversegaussian' 逆高斯分布 InverseGaussianDistribution
'核心' 内核分配 核分布
'逻辑' 物流分布 LogisticDistribution.
“Loglogistic” LogLogistic分布 对数分布
对数正态的 对数正态分布 LognormalDistribution
“Nakagami” Nakagami分布 nakagamidistribution.
“NegativeBinomial” 负二项分分布 负性矛盾
'普通的' 正态分布 NormalDistribution
“泊松” 泊松分布 PoissonDistribution
“瑞利” 瑞利分布 雷氏分布
'riician' Rician分布 RicianDistribution
“稳定” 稳定分布 稳定性分布
“tLocationScale” T.Location-Scale分布 Tlocationscaledistribution.
“威布尔” 威布尔分布 威布尔分布

分组变量,指定为分类阵列,逻辑或数字矢量,字符数组,字符串数组或字符向量阵列。分组变量中的每个唯一值都定义了一个组。

例如,如果性别是具有值的字符向量的单元格数组'男性''女性', 您可以使用性别作为分组变量,以按性别拟合到数据的分发。

通过指定分组变量的单元格数组,可以使用多个分组变量。如果观察值具有所有指定分组变量的公共值,则将它们放在同一组中。

例如,如果吸烟者逻辑向量有值吗0.不吸烟人士及1对于吸烟者,然后指定单元格数组{性别、吸烟}将观察分为四组:男性吸烟者,男性不吸烟者,女性吸烟者和女性不吸烟者。

例子:{性别、吸烟}

数据类型:分类|逻辑|||字符|字符串|细胞

名称值对参数

指定可选的逗号分离对名称,价值参数。的名字是参数名称和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1,值1,…,名称,值

例子:fitdist (x,“仁”,“仁”,“三角形”)中的数据拟合内核分布对象X使用三角核函数。

审查数据的逻辑标志,指定为逗号分隔对,由“审查”和输入向量大小相同的逻辑值向量X.价值是1当相应的元素中X是经过右翼审查的观察和0.当对应的元素是精确的观测值时。默认值是的向量0.S,表明所有的观测结果都是准确的。

Fitdist.忽略任何一个这个截尾向量的值。此外,任何X或者是频率矢量引起的Fitdist.忽略截尾向量中对应的值。

此参数仅当distname.“BirnbaumSaunders”“毛刺”'指数''extremevalue'“伽马”'Inversegaussian''核心''逻辑'“Loglogistic”对数正态的“Nakagami”'普通的''riician'“tLocationScale”,或“威布尔”

数据类型:逻辑

观察频率,指定为逗号分隔对,包括“频率”和输入向量大小相同的非负整数值向量X.频率向量中的每个元素指定了中相应元素的频率X.默认值是的向量1s、 指示中的每个值X只出现一次。

Fitdist.忽略任何一个这个频率向量的值。此外,任何X还是审查向量的原因Fitdist.忽略频率向量中相应的值。

数据类型:|

控制参数为迭代拟合算法,指定为逗号分隔对组成“选项”以及你创建的结构statset

数据类型:塑造

二项分布的试验次数,指定为逗号分隔对组成“NTrials”和一个正整数。您必须指定distname.作为'二重子'使用此选项。

数据类型:|

广义帕累托分布的阈值参数,指定为逗号分隔对组成'theta'和标量值。您必须指定distname.作为“GeneralizedPareto”使用此选项。

数据类型:|

半正态分布的位置参数,指定为逗号分隔对“亩”和标量值。您必须指定distname.作为“HalfNormal”使用此选项。

数据类型:|

内核平滑类型,指定为逗号分隔对组成'核心'和以下之一:

  • '普通的'

  • “盒子”

  • '三角形'

  • “埃帕内切尼科夫”

您必须指定distname.作为'核心'使用此选项。

内核密度支持,指定为逗号分隔对万博1manbetx组成'万博1manbetx支持'“无限”“积极”,或二元素向量。

“无限” 密度可以延伸到整个实线。
“积极” 密度仅限于正值。

或者,您可以指定两个元素向量,为密度的支撑提供有限的下限和上限。万博1manbetx

您必须指定distname.作为'核心'使用此选项。

数据类型:||字符|字符串

内核平滑窗口的带宽,指定为逗号分隔的配对组成“宽度”和标量值。使用的默认值Fitdist.是估计正常密度的最佳值,但您可能希望选择一个较小的值来显示特征,如多个模式。您必须指定distname.作为'核心'使用此选项。

数据类型:|

输出参数

全部收缩

概率分布,作为概率分布对象返回。指定的分布distname.确定返回的概率分布对象的类类型。查阅distname.值和相应的概率分布对象,参见distname.

指定类型的概率分布对象distname.,作为单元格数组返回。查阅distname.值和相应的概率分布对象,参见distname.

组标签,作为字符向量的单元格数组返回。

分组变量级别,作为字符向量的单元格数组返回,每个分组变量包含一列。

算法

Fitdist.函数使用极大似然估计拟合大多数分布。两个例外是正态分布和对数正态分布与未删失数据。

  • 对于非截尾数正态分布,参数的估计值是方差无偏估计的平方根。

  • 对于非截尾对数正态分布,参数的估计值为数据对数方差的无偏估计的平方根。

选择功能

应用程序

分布更健康应用程序打开一个图形用户界面,你可以从工作空间导入数据,并交互式地匹配数据的概率分布。然后,您可以将该分布保存为概率分布对象到工作区中。打开分布钳工应用程序使用分配器,或单击“应用程序”选项卡上的“分发Fitter”。

工具书类

约翰逊,n.l., S. Kotz和N. Balakrishnan。连续单变量分布.第1卷,霍博肯,新泽西州:Wiley-Interscience, 1993。

约翰逊,n.l., S. Kotz和N. Balakrishnan。连续单变量分布.卷。2,Hoboken,NJ:Wiley-Interscience,1994。

鲍曼,A. W.和阿扎里尼。应用平滑技术进行数据分析. 纽约:牛津大学出版社,1997。

扩展功能

在R2009A介绍