主要内容

剩余分析

绘制和分析残差

来自拟合模型的残差定义为在每个预测变量值处的响应数据与拟合响应数据之间的差异。

剩余的=数据-合身

您可以通过单击在曲线钳工应用中显示残差残差图在里面可视化部分曲线钳工标签。

从数学上讲,特定预测值值的残差是响应值之间的差异y和预测的响应值ŷ

r=y-ŷ

假设您适合数据的模型是正确的,则残差近似随机错误。因此,如果残差似乎是随机的,则表明该模型非常适合数据。但是,如果残差显示系统的模式,则显然表明该模型符合数据差。始终牢记,如果模型严重不适合数据,许多模型拟合结果(例如置信界)将无效。

下面显示了一级多项式拟合的残差的图形显示。顶部图显示,残差是从数据点到拟合曲线的垂直距离计算的。底部图显示了相对于拟合的残差,即零线。

一级多项式拟合的残差图

残差似乎随机散布在零附近,表明该模型很好地描述了数据。

下面显示了二级多项式拟合的残差的图形显示。该模型仅包括二次项,不包括线性或常数项。

二级多项式拟合的残差图

残差在许多数据范围内系统地呈阳性,表明该模型适合数据。

示例:剩余分析

该示例拟合了几个多项式模型来生成数据,并评估了这些模型如何适应数据以及它们可以预测的方式。数据是从立方曲线生成的,并且在X不存在数据的变量。

x = [1:0.1:3 9:0.1:10]';C = [2.5 -0.5 1.3 -0.1];y = c(1) + c(2)*x + c(3)*x。^2 + c(4)*x。^3 +(rand(size(x))-0.5);

使用立方多项式和第五度多项式将数据拟合到曲线钳工应用中。数据,拟合和残差如下所示。您可以通过单击在曲线钳工应用中显示残差残差图在里面可视化部分曲线钳工标签。

立方多项式拟合和第五度多项式拟合的图

两种模型似乎都很好地符合数据,并且残差似乎随机分布在零左右。因此,对拟合的图形评估并未揭示两个方程之间的明显差异。

查看数值拟合结果结果窗格并比较系数的置信界。

结果表明,立方拟合系数是准确已知的(边界很小),而五重拟合系数尚不清楚。不出所料,适合结果poly3是合理的,因为生成的数据遵循立方曲线。拟合系数的95%置信度范围表明它们是可接受的。但是,95%的置信度范围poly5表明拟合系数不确定。

拟合优度统计在适合表窗格。默认情况下,表中显示了调整后的R平方和RMSE统计信息。统计数据没有揭示两个方程之间的实质性差异。要选择显示或隐藏的统计信息,请右键单击列标题。

新观察结果的95%非匹配预测范围如下所示。要在曲线钳工应用中显示预测范围,请选择95%来自预测范围列表可视化部分曲线钳工标签。

拟合具有两个多项式拟合的预测边界的图

预测范围poly3表明在整个数据范围内可以用微小的不确定性预测新的观察结果。事实并非如此poly5。它在不存在数据的区域中具有更广泛的预测界限,显然是因为数据不包含足够的信息来准确估计更高程度的多项式项。换句话说,五度多项式过度贴合数据。

使用拟合功能的95%预测范围poly5如下所示。如您所见,在数据中心预测功能的不确定性很大。因此,您将得出结论,必须收集更多数据,然后才能使用第五度多项式进行精确的预测。

总之,您应该在确定最适合您目的的合适措施之前检查所有可用的合适措施。对拟合和残差的图形检查始终是您的初始方法。但是,仅通过数值拟合结果,统计和预测范围才能揭示某些拟合特性。