主要内容

使用分布Fitter应用程序建模数据

配送钳工应用程序提供了拟合单变量分布到数据的视觉,交互式方法。

交互式地探索概率分布

您可以使用分配钳工应用程序来交互式拟合概率分布到从MATLAB导入的数据®工作区。您可以从22个内置的概率分布中进行选择,或者创建您自己的自定义分布。该应用程序显示在经验分布图上的拟合分布,包括pdf、cdf、概率图和幸存者函数。您可以将拟合数据(包括拟合参数值)导出到工作空间以进行进一步分析。

分布钳工应用程序工作流

要适应样本数据的概率分布:

  1. 在MATLAB工具条上,单击“应用程序”选项卡。在数学、统计和优化组中,打开Distribution Fitter应用程序。或者,在命令提示符处,输入distributionFitter

  2. 导入样本数据,或直接在应用程序中创建数据矢量。您还可以管理数据集,然后选择要适合的数据集。看到创建和管理数据集

  3. 创建一个新的适合您的数据。看到创建新的适合度

  4. 显示适合的结果。您可以选择显示密度(pdf)、累积概率(cdf)、分位数(反cdf)、概率图(从几个分布中选择一个)、幸存者函数和累积风险。看到显示结果

  5. 你可以创建额外的适合,并在应用程序中管理多个适合管理适合

  6. 评估拟合的概率函数。您可以选择评估密度(pdf)、累积概率(cdf)、分位数(反cdf)、幸存者函数和累积危险。看到评价适合

  7. 通过排除某些数据来提高拟合度。您可以指定要排除的数据的范围,或者可以使用示例数据中的值的图形来排除数据。看到排除数据

  8. 保存您当前的分发绑定应用程序会话,以便稍后打开它。看到保存和加载会话

创建和管理数据集

要打开“数据”对话框,请单击数据按钮在配送钳工应用程序中。

导入数据

从MATLAB工作空间中导入向量来创建数据集导入工作空间向量窗格。

  • 数据——在数据字段,下拉列表包含所有矩阵和向量的名称,但不包括MATLAB工作空间中的1 × 1矩阵(标量)。选择包含要匹配的数据的数组。您导入的实际数据必须是一个矢量。如果你选择一个矩阵数据字段时,默认情况下将导入矩阵的第一列。要选择矩阵的不同列或行,请单击选择列或行.矩阵显示在Variables编辑器中。您可以通过突出显示来选择行或列。

    或者,您可以输入任何有效的MATLAB表达式数据字段。

    当您选择一个向量时数据字段中,数据的直方图将出现在数据预览窗格。

  • 审查—如果数据集中的某些点被删失,则输入与数据向量大小相同的布尔向量,指定该数据的删失项。一个1在截尾向量中指定数据向量对应的条目被截尾。一个0指定不审查该条目。如果您输入一个矩阵,您可以通过单击来选择列或行选择列或行.如果你没有被审查的数据,离开审查字段空白。

  • 频率—输入与数据向量大小相同的正整数向量,指定数据向量对应项的频率。例如,值为7在频率向量的第15项中,指定有7个数据点对应于数据向量的第15项中的值。如果数据向量的所有项的频率为1,则离开频率字段空白。

  • 数据集名称—输入从工作区导入的数据集的名称,例如我的数据

在您输入了前一个字段中的信息后,单击创建数据集创建数据集我的数据

管理的数据集

属性创建的数据集的视图和管理管理的数据集窗格。创建数据集时,它的名称显示在数据集列表。下图显示了管理的数据集窗格我的数据

的每个数据集数据集列表,您可以:

  • 选择阴谋复选框,以便在主Distribution Fitter应用程序窗口中显示数据图。当您创建一个新的数据集时,阴谋默认选择。清除阴谋复选框将从主窗口中的图中删除数据。控件中显示的图形类型显示类型字段。

  • 如果阴谋被选中时,也可以选择界限在主窗口中显示绘图的置信区间界限。这些边界是关于这些函数的经验估计的点向置信边界。边界仅在您设置时显示显示类型在主窗口中的其中一个:

    • 累积概率(CDF)

    • 幸存者函数

    • 累积危险

配送钳工应用无法显示密度的置信度(PDF.)、分位数(逆CDF实验组的)或概率图。清除界限复选框从主窗口中的绘图中删除置信度界限。

当您从列表中选择一个数据集时,您可以访问以下按钮:

  • 视图—在新窗口中显示表格中的数据。

  • 本规则集-定义密度(PDF)图中使用的直方图容器。

  • 重命名—重命名数据集。

  • 删除—删除数据集。

本规则集

为数据集的直方图设置bin规则,单击本规则集打开设置仓宽规则对话框。

您可以选择以下规则:

  • Freedman-Diaconis规则-基于样本大小和数据的分布,自动选择bin宽度和位置的算法。该规则是默认的,适用于许多类型的数据。

  • 斯科特规则-用于近似正态数据的算法。算法自动选择仓宽和位置。

  • 数量的垃圾箱—输入箱体数量。所有箱子的宽度都相同。

  • 容器以整数为中心- 指定以整数为中心的bins。

  • 本宽度- 输入每个垃圾箱的宽度。如果选择此选项,还可以选择:

    • 自动箱放置- 将箱的边缘放置在整数倍数下本宽度

    • 本界—输入标量来指定容器的边界。每个箱子的边界等于这个标量加上本宽度

您还可以:

  • 应用于所有现有数据集- 将规则应用于所有数据集。否则,该规则仅应用于“数据”对话框中当前选择的数据集。

  • 保存为默认—将当前规则应用于您创建的任何新数据集。通过选择,可以设置默认的仓宽规则设置默认Bin规则工具主窗口的菜单。

创建新的适合度

单击新健康按钮,以打开“New Fit”对话框。如果您创建了数据集我的数据,它出现在数据字段。

字段名 描述
适合的名字 输入适合的名称。
数据

从下拉列表中选择要适合分布的数据集。

分配

选择适合的分布类型分配下拉列表。

中只显示应用于所选数据集值的分布分配字段。例如,当数据包括为零或否定的值时,不显示正分布。

你可以指定一个参数分布或一个非参数分布。当您从下拉列表中选择一个参数分布时,将显示其参数的描述。分布拟合器估计这些参数以将分布拟合到数据集。如果选择二项分布或广义极值分布,则必须为其中一个参数指定一个固定值。窗格包含一个文本字段,您可以在其中指定该参数。

当您选择非参数符合,适合的选项出现在窗格中,如图所示非参数拟合的进一步选项

排除规则 指定排除某些数据的规则。通过单击创建排除规则排除要了解更多信息,请参见排除数据

应用新的Fit

点击应用来适应分布。对于参数拟合,结果窗格显示估计参数的值。对于非参数拟合,结果窗格显示有关适合的信息。

当你点击应用,则会显示分布图和相应的数据。

请注意

当你点击应用时,对话框的标题更改为“编辑适合”。现在,您可以对刚刚创建的适合进行更改并单击应用再次拯救他们。关闭“编辑适合”对话框后,您可以随时从“适合管理器”对话框重新打开它以编辑适合。

应用拟合后,您可以通过单击使用概率分布对象将信息保存到工作区保存到工作空间

可用的分布

Distribution Fitter应用程序中提供的所有发行版都在Statistics和Machine Learning Toolbox™万博1manbetx软件中得到支持。你可以使用fitdist功能来适应应用程序支持的任何发行版。许多发行版也有专门的适合功能。万博1manbetx这些函数计算Distribution Fitter应用程序中的大多数适配项,并在下面列表中引用。其他适合度是使用Distribution Fitter应用程序内部的函数计算的。

并不是所有的分布都对所有的数据集可用。Distribution Fitter应用程序确定数据的范围(非负、单位间隔等),并在分配下拉列表。分布数据范围在下表中括号内给出。

非参数拟合的进一步选项

当您选择非参数分配字段中显示一组选项非参数窗格,如下图所示。

非参数分布的选项有:

  • 核心-要使用的内核函数类型。

    • 正常的

    • 盒子

    • 三角形

    • Epanechnikov

  • 带宽—核平滑窗口的带宽。选择汽车为一个默认值,该默认值是估计正常密度的最佳值。你点击后应用,此值显示在合适的结果窗格。选择指定并输入较小的值来显示功能,如多个模式,或输入较大的值,以使适合更平滑。

  • ——允许x-密度的值。

    • 无限-密度延伸到整条实线。

    • 积极的—密度限制为正值。

    • 指定—输入密度域的下界和上界。

    当您选择积极的指定时,非参数拟合在指定区域外的概率为零。

显示结果

Distribution Fitter应用窗口显示如下图:

  • 您选择的数据集阴谋在“数据”对话框中。

  • 适合你选择的阴谋在“适用经理”对话框中。

  • 信心范围:

    • 您选择的数据集界限在“数据”对话框中。

    • 适合你选择的界限在“适用经理”对话框中。

以下字段可用。

显示类型

控件指定要显示的绘图类型显示类型字段在主应用程序窗口中。每种类型对应一个概率函数,例如,一个概率密度函数。您可以选择以下显示类型:

  • 密度(PDF)- 显示拟合分布的概率密度函数(PDF)曲线。主窗口使用概率直方图显示数据集,其中每个矩形的高度是位于垃圾箱中的数据点的分数除以箱的宽度。这使得矩形的区域的总和等于1。

  • 累积概率(CDF)- 显示数据的累积概率图。主窗口使用累积概率步长功能显示数据集。每个步骤的高度是概率直方图中矩形的高度的累积总和。

  • 分位数(CDF)逆-显示分位数(反CDF)图。

  • 概率图-显示数据的概率图。中用于构造概率图的分布类型分配字段。此字段仅在您选择时可用概率图.分配的选择有:

    • 指数

    • 极值

    • 物流

    • Log-Logistic

    • 对数正态

    • 正常的

    • 瑞利

    • 威布尔

    你也可以根据参数拟合创建一个概率图新健康窗格。当您创建这些适合,它们被添加在底部分配下拉列表。

  • 幸存者函数- 显示数据的SURVIVOR函数图。

  • 累积危险—显示数据的累积危险图。

    请注意

    如果绘制的数据包括0或负值,某些分布不可用。

信心界限

您可以显示数据集和拟合的置信界限显示类型累积概率(CDF)幸存者函数累积危险,或者,只为适合,分位数(CDF)逆

  • 要显示数据集的界限,请选择界限的数据集旁边数据集窗格中的。

  • 若要显示适合的边界,请选择界限在“适合管理器”对话框中的适合旁边。并不是所有适合类型的置信范围都可用。

选择界限的置信水平,选择置信水平视图菜单,并从选项中进行选择。

管理适合

单击管理适合打开配合经理对话框。

符合表显示您创建的适合列表,具有以下选项:

  • 阴谋-在Distribution Fitter应用程序的主窗口中显示适合的图形。阴谋默认选择。清除阴谋复选框从主窗口中的绘图中移除拟合。

  • 界限-如果您选择阴谋,您也可以选择界限在图中显示置信范围。边界将在设置时显示显示类型在主窗口中的其中一个:

    • 累积概率(CDF)

    • 分位数(CDF)逆

    • 幸存者函数

    • 累积危险

    配送钳工应用无法显示密度的置信度(PDF.)或概率图。对于非参数拟合和某些参数拟合不万博1manbetx支持边界。

    清除界限复选框将从主窗口中的图中删除置信区间。

    当你选择一个适合的时候符合表,表下启用了以下按钮:

    • 新健康-打开New Fit窗口。

    • 复制—创建选择的副本。

    • 编辑-打开“编辑适合度”对话框,编辑适合度。

      请注意

      您只能在“编辑适合”对话框中编辑当前选择的适合。要编辑一个不同的适合度,请在符合表并点击编辑打开另一个编辑适合对话框。

    • 保存到工作空间-将选择的fit保存为分布对象。

    • 删除—删除选中的适配项。

评价适合

使用评估对话框来评估您所选择的任意数据点上的拟合分布。要打开对话框,请单击评估按钮。

评估对话框中,从下列项目中进行选择:

  • 适合窗格-显示现有适合的名称。选择一个或多个要评估的匹配项。使用平台特定的功能,您可以选择多个适合。

  • 函数-选择您想要评估适合的概率函数的类型。可用的功能有:

    • 密度(PDF)—计算概率密度函数。

    • 累积概率(CDF)—计算累积概率函数。

    • 分位数(CDF)逆-计算分位数(反CDF)函数。

    • 幸存者函数- 计算幸存者功能。

    • 累积危险—计算累积风险函数。

    • 故障率- 计算危险率。

  • 在x =-输入一个点的向量,或一个工作区变量的名称,该变量包含要计算分布函数的点的向量。如果你改变函数分位数(CDF)逆,字段名称更改为在p =,然后输入概率值的向量。

  • 计算置信界限-选择此框来计算所选匹配的置信范围。只有当您设置时,复选框才会被启用函数致下列人士之一:

    • 累积概率(CDF)

    • 分位数(CDF)逆

    • 幸存者函数

    • 累积危险

    分布拟合器应用程序不能计算非参数拟合和某些参数拟合的置信界限。在这些情况下,它会返回的界限。

  • 水平—设置置信度。

  • 绘制函数- 选择此框以显示分发功能的绘图,在您输入的点处进行评估在x =字段,在新窗口中。

    请注意

    的设置计算置信界限水平,绘制函数不会影响Distribution Fitter应用程序主窗口中显示的图形。这些设置仅适用于通过单击绘制函数在“评估”窗口。

要将这些评估设置应用于选定的适合度,请单击应用.下图显示了对拟合的累积密度函数的评估结果我的健康,在向量中的点5:4:45

的右边的表列适合窗格显示以下值:

  • X -你输入的向量的分量在x =字段。

  • F(X) - CDF在X项上对应的值。

  • LB -置信区间的下界,如果您选择的话计算置信界限

  • UB -置信区间的上界(如果您选择的话)计算置信界限

若要将表中显示的数据保存到MATLAB工作空间中的一个矩阵中,请单击出口到工作区

排除数据

若要排除适合的值,请打开排除窗口,单击排除按钮。在排除窗口,您可以创建排除指定数据值的规则。当您创建新的拟合时新健康窗口,您可以使用这些规则将数据排除在适合的范围之外。

创建排除规则:

  1. 排除规则名称—输入排除规则的名称。

  2. 排除部分—指定排除数据的边界:

    • 下限:排除数据下拉列表中,选择< =<然后在右边的字段中输入一个标量值。根据您选择的操作符,应用程序将分别排除小于或等于标量值或小于标量值的任何数据值。

    • 上限:排除数据下拉列表中,选择>=>然后在右边的字段中输入一个标量值。根据您选择的操作符,应用程序将分别排除大于或等于标量值或大于标量值的任何数据值。

    单击排除图形按钮来定义排除规则,方法是显示数据集中值的图并选择排除数据的边界。例如,如果您创建了数据集我的数据如创建和管理数据集所述,请从旁边的下拉列表中选择它排除图形,然后单击排除图形按钮。该应用程序显示值我的数据在一个新窗口中。

    若要设置被排除区域边界的下限,请单击添加下限.该应用程序在绘图窗口的左侧显示垂直线。将行移动到您希望下限的位置,如下图所示。

    中显示的值可移动垂直线下限:排除数据字段排除窗口。

    显示的值对应于x-垂直线的坐标。

    类似地,您可以通过单击设置被排除区域边界的上限增加上限,然后移动显示在情节窗口右侧的垂线。设置下限和上限后,单击关闭并返回Exclude窗口。

  3. 创建排除规则-设置了排除数据的上限和下限后,单击创建排除规则创建新规则。新规则的名称出现在现有的排除规则窗格。

    中选择排除规则现有的排除规则窗格启用以下按钮:

    • 复制- 创建规则的副本,然后可以修改该规则。要在不同名称下保存修改规则,请单击创建排除规则

    • 视图-打开一个新窗口,可以看到被规则排除的数据点。典型示例如下图所示。

      图中的阴影区域以图形方式显示哪些数据点被排除在外。右边的表格列出了所有的数据点。阴影部分表示被排除的点。

    • 重命名—重命名规则。

    • 删除—删除规则。

    在定义排除规则之后,可以在将分布适合于数据时使用它。该规则不排除数据集的显示。

保存和加载会话

将您的工作保存在当前会话中,然后将其加载到后续会话中,以便您可以在停止的地方继续工作。

保存一个会话

保存当前会话,从中文件菜单在主窗口中,选择保存会议.例如,会打开一个对话框,提示您输入文件名my_session.dfit.点击保存保存当前会议中创建的下列项目:

  • 数据集

  • 适合

  • 排除规则

  • 情节的设置

  • 本宽度规则

加载一个会话

要加载以前保存的会话,请从文件菜单在主窗口中,选择加载会话.输入以前保存的会话的名称。点击开放将信息从保存的会话恢复到当前会话。

生成适合和绘制分布的文件

使用生成代码选项文件创建一个文件:

  • 适合当前会话中的分布到MATLAB工作区中的任何数据向量。

  • 绘制数据和适合。

结束当前会话后,可以使用该文件在标准MATLAB图形窗口中创建图形,而无需重新打开Distribution Fitter应用程序。

例如,如果您创建了创建新的适合度,执行以下步骤:

  1. 文件菜单,选择生成代码

  2. 在Matlab编辑器窗口中,选择文件>另存为.将文件保存为romang_fit.m.在MATLAB路径的一个文件夹中。

然后,您可以应用该功能normal_fit.到MATLAB工作空间中的任意数据向量。例如,以下命令:

new_data = normrnd(4.1,12.5,100,1);newfit = normal_fit(new_data)图例(“新数据”“我的健康”

生成newfit,数据的拟合正态分布。这些命令还会生成数据和匹配图。

正态分布mu = 5.63857 [2.7555, 8.52163] sigma = 14.53 [12.7574, 16.8791]

请注意

默认情况下,文件使用与配送绑定应用程序中的数据集相同的名称标记图例中的数据。您可以使用使用的标签传说命令,如前面的例子所示。

另请参阅

相关的话题