主要内容

交互式装配

基本装配UI

matlab.®Basic Fitting UI允许你交互:

  • 模型数据使用样条插值,形状保持插值,或十次多项式

  • 将一个或多个与数据一起绘制

  • 画出拟合的残差

  • 计算模型系数

  • 计算残差的范数(一个可以用来分析模型与数据吻合程度的统计数据)

  • 使用模型来插入或推断数据外部

  • 将系数保存到MATLAB工作空间中的计算值以用于对话框外部

  • 生成MATLAB代码以重新计算与新数据重新计算

请注意

基本拟合UI仅适用于2-D图。有关更先进的拟合和回归分析,请参阅曲线拟合工具箱™文档和统计和机器学习工具箱™文档。

基本装配准备

基本拟合UI在拟合之前按升序排序您的数据。如果您的数据集很大并且这些值不按升序排序,则基本拟合UI需要更长的时间在拟合之前预处理数据。

您可以通过首先排序您的数据来加快基本拟合UI。创建排序向量x_sorted.y_sorted来自数据向量xy,使用matlab种类功能:

[x_sorted, i] = sort(x);y_sorted = y(我);

打开基本拟合UI

要使用基本拟合UI,必须首先使用生成(仅限)的任何MATLAB绘图命令绘制数据窗口中的数据xy数据。

打开基本拟合UI,选择工具>基本配件从图形窗口顶部的菜单。

示例:使用基本拟合UI

此示例显示如何使用基本拟合UI适合,可视化,分析,保存和生成多项式回归的代码。

装载并绘制人口普查数据

该文件普氏.Mat.在10年间隔内包含1790年至1990年的美国人口数据。

要加载和绘制数据,请在MATLAB提示符下键入以下命令:

加载人口普查情节(Cdate,Pop,“罗”

加载命令将以下变量添加到MATLAB Workspace:

  • Cdate.-列向量,以10为增量,包含从1790年到1990年的年份。它是预测变量。

  • 流行-列向量与美国人口每年在Cdate..它是响应变量。

数据向量按年份按升序排序。情节显示人口作为一年的职能。

现在,您可以随着时间的推移拟合数据来建模人口增长。

预测立方体多项式合适的人口普查数据

  1. 通过选择打开基本装配对话框工具>基本配件在图形窗口中。

  2. 在里面适合的类型基本拟合对话框的区域,选择立方体复选框以适合数据的立方多项式。

    MATLAB使用您的选择来拟合数据,并如下所示将立方回归线添加到图表中。

    在计算拟合时,Matlab遇到问题并发出以下警告:

    这一警告表明,模型的计算系数对响应(测量总体)中的随机误差很敏感。它还建议你做一些事情来获得更好的适合。

  3. 继续使用立方匹配。由于不能向人口普查数据添加新的观察值,因此可以通过转换必须的值来提高适合度Z分数在重新计算适合之前。选择居中并缩放x轴数据复选框,以使基本装配工具执行转换。

    要了解数据如何定心和缩放,请参见了解基本配件工具如何计算适合

  4. 误差估计(残差),选择规范的残差复选框。选择酒吧随着情节风格

选择这些选项创建作为条形图的残差子图。

立方体契合是1790年之前的预测器,其中表示人口减少。该模型似乎在1790后合理地近似数据。然而,残差中的模式表明该模型不符合正常误差的假设,这是最小二乘拟合的基础。的数据1在图例中识别的线是观察到的xCdate.) 和y流行)数据值。的立方体回归线置于居中和缩放数据值之后的拟合。请注意,该图显示了原始数据单元,即使工具使用变换的Z分数计算拟合。

为了比较,尝试通过选择它来将另一个多项式方程拟合到人口普查数据适合的类型区域。

查看并保存立方拟合参数

在“基本装配”对话框中,单击扩展结果按钮显示估计系数和残差范数。

将拟合数据保存到MATLAB工作区,单击导出到工作区数字结果面板上的按钮。将打开“保存适合”工作区对话框。

选中所有复选框,请单击将适合参数保存为MATLAB结构适合

适合
Fit =带有字段的结构:类型:'多项式3'Coeff:[0.9210 25.1834 73.8598 61.7444]

现在,您可以在MATLAB编程中使用拟合结果,在基本拟合UI之外。

R2,决定系数

通过计算,你可以得到多项式回归预测观测数据的指示确定系数,要么R-Square(写为r2).R2统计量,范围从0到1,衡量自变量在预测因变量值方面的作用:

  • 一个R.2近0附近的值表明拟合并不大于模型y =常数

  • 一个R.2值接近1表示自变量解释了因变量的大部分变异性。

R2从中计算残差,即观察到的相关值与适合度预测值之间的有符号差异。

残差= Y.观察到的- y安装 (1)

R2本例中立方拟合的编号0.9988位于适合结果在基本装配对话框中。

为了比较R2数立方拟合为线性最小二乘拟合,选择线性适合的类型并获得r2号码,0.921。该结果表明,人口数据的线性最小二乘拟合解释了其方差的92.1%。随着该数据的立方体拟合解释了99.9%的方差,后者似乎是一个更好的预测因素。但是,因为立方拟合预测使用三个变量(xx2, 和x3.),一个基本的r2价值没有完全反映合适的稳健程度。评估多变量适合的善良的更适当的措施是调整R.2.有关计算和使用调整后的R2,请参阅剩余和健康的善良

插入和外推人口价值

假设您想使用立方模型来插值1965年(原始数据中未提供的日期)的美国人口。

在基本装配对话框中,在插入/外推数据, 输入X价值1965并检查情节评估数据盒子。

请注意

使用未划算和未被纳米X值。您不需要先居中和缩放,即使您选择了缩放X值来获得系数预测立方体多项式合适的人口普查数据.基本拟合工具使幕后的必要调整。

X值和相应的值f(x)根据拟合计算,并绘制如下图:

生成代码文件以重现结果

在完成Basic Fitting会话后,可以生成MATLAB代码,重新计算fit并使用新数据重新绘制图。

  1. 在Figure窗口中,选择文件>生成代码

    这会创建一个函数并将其显示在MATLAB编辑器中。该代码向您展示如何以基本拟合对话框以交互方式以编程方式编程方式重现。

  2. 更改第一行的函数的名称创作者更具体的东西,就像斯肯萨镜头.使用文件名将代码文件保存到当前文件夹中Censusplot.m.该功能始于:

    函数censusplot(X1, Y1, valuesToEvaluate1)

  3. 生成一些新的随机扰动的人口普查数据:

    RNG('默认') randpop = pop + 10*randn(size(pop));
  4. 用新数据重新绘制图,并重新计算适合度:

    Censusplot(Cdate,Randpop,1965)

    你需要三个输入参数:x, y值(数据1)绘制在原始图中,加上一个x- 用于标记的值。

    下图显示生成的代码产生的曲线。新绘图与您生成的图形的外观相匹配,除了y数据值,立方拟合的等式,以及栏图中的残余值,如预期。

了解基本配件工具如何计算适合

基本装配工具调用polyfit计算多项式适合的功能。它致电多尔函数来评估适合。polyfit分析其输入以确定数据是否适合所要求的合适程度。

当它发现严重条件数据时,polyfit计算回归以及它可以,但它也返回了可以提高拟合的警告。基本配件例子预测立方体多项式合适的人口普查数据显示此警告。

提高模型可靠性的一种方法是添加数据点。但是,向数据集添加观察并不总是可行的。替代策略是将预测器变量转换为标准化其中心和比例。(在该示例中,预测器是人口普查日期的向量。)

polyfit函数通过计算进行规范化Z分数

z x μ. σ.

在哪里x是预测的数据,μ.是卑鄙的x, 和σ.的标准差是x.的z-Scores将数据提供0的均值和标准偏差为1.在基本拟合UI中,将预测器数据转换为z选择通过选择居中并缩放x轴数据复选框。

居中和缩放后,计算模型系数y数据作为一个函数z.这些是不同的(更强大的),而不是计算的系数y作为一个函数x.模型的形式和残差的范数不变。基本装配UI自动缩放z-scores使适合绘制与原始相同的绘图x数据。

要了解所居中和缩放数据用作中介以创建最终图的方式,请在“命令”窗口中运行以下代码:

近装人口普查x = cdate;y =流行;z = (x-mean (x) /性病(x);%计算x数据的z-scores绘图(x,y,“罗”%用红色标记标记数据持有%准备轴以接受顶部的新图形zfit = linspace (z(1)、z(结束),100);pz = polyfit (z, y, 3);%Compute条件合身yfit = polyval (pz、zfit);xfit = linspace (x(1),(结束),100);情节(xfit yfit,'B-'%绘制条件拟合与x数据

居中并缩放的三次多项式以蓝线表示,如下所示:

在代码中,计算z说明了如何正常化数据。的polyfit如果在调用函数时提供三个返回参数,则函数会自己执行转换:

[p,s,mu] = polyfit(x,y,n)
返回的回归参数p,现在是基于规范化的x.返回向量,,包含平均值和标准偏差x.有关更多信息,请参见polyfit参考页面。