主要内容

DELETE-1统计

删除1协方差的变化(covratio

目的

删除1协方差的变化(covratio)确定在回归拟合中影响的观察结果。有影响力的观察是其排除在模型之外的观察结果可能会显着改变回归函数。值covratio大于1 + 3*p/n或小于1 - 3*p/n指示有影响力的点p是回归系数的数量,并且n是观察的数量。

定义

covratio统计量是系数协方差矩阵的决定因素与观察一世已删除为完整模型的协方差矩阵的决定因素:

covratio = det { m s e (( 一世 [[ X ' (( 一世 X (( 一世 这是给予的 - 1 } det [[ m s e (( X ' X - 1 这是给予的

covratio是一个n-1矢量诊断合适的桌子线性模型目的。当使用所有数据将相应的元素删除到系数的广义方差时,每个元素都是估计系数的广义方差的比率。

如何

在获得合适的模型后,说,MDL, 使用fitlm或者Stepwiselm, 你可以:

  • 显示covratio通过使用点表示法索引到属性

    mdl.diagnostics.covratio

  • 使用使用

    PlotDiagnostics(MDL,“ Covratio')
    有关详细信息,请参阅PlotDiangnostics方法的方法线性模型班级。

确定有影响力的观察covratio

此示例显示了如何使用covratio统计数据以确定数据中的影响点。加载样品数据并定义响应和预测变量。

加载医院y =医院。布洛德压(:,1);x = double(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm(x,y);

绘制covratio统计数据。

PlotDiengnostics(MDL,'covratio'

图包含一个轴对象。带有标题案例顺序图的轴对象的协方差比包含2个类型行的对象。这些对象代表协方差比,参考线。

在此示例中,阈值限制为1 + 3*5/100 = 1.15和1-3*5/100 = 0.85。超出了限制的几点,这可能是有影响力的点。

找到超出限制的观察结果。

查找((mdl.diagnostics.covratio)> 1.15 |(mdl.diagnostics.covratio)<0.85)
ans =5×12 14 84 93 96

系数估计值的删除1缩放差异(dfbetas

目的

系数估算中删除1缩放差异的符号(dfbetas)用于系数j和观察一世指示该观察结果是否会导致回归系数的估计值增加或减少。一个的绝对价值dfbetas指示相对于回归系数的估计标准偏差的差异。一个dfbetas大于3/sqrt的值(n)绝对值表明该观察结果对相应的系数有很大影响。

定义

dfbetas用于系数j和观察一世是系数估计的差异之比j使用所有观察和通过删除观察获得的观测值一世,以及通过删除观察结果获得的系数估计的标准误差一世。这dfbetas用于系数j和观察一世

d F b e t 一个 s 一世 j = b j - b j (( 一世 m s e (( 一世 (( 1 - H 一世 一世 ,,,,

在哪里bj是系数的估计值j,,,,bj((一世是系数的估计值j通过去除观察一世,,,,MSE((一世是通过删除观察结果的平均平方误差一世, 和Hii是观察的杠杆价值一世dfbetas是一个n-经过-p矩阵中的矩阵诊断合适的桌子线性模型目的。每个单元格dfbetas对应于dfbetas通过删除相应的观测值获得的相应系数的值。

如何

在获得合适的模型后,说,MDL, 使用fitlm或者Stepwiselm,您可以获得dfbetas值为一个n-经过-p通过使用点表示法将矩阵索引到属性,

mdl.diagnostics.dfbetas

确定对系数影响的观察结果dfbetas

此示例显示了如何确定对系数影响很大影响的观测值dfbetas。加载样品数据并定义响应和自变量。

加载医院y =医院。布洛德压(:,1);x = double(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm(x,y);

找出dfbetas绝对值高的值。

[row,col] = find(abs(mdl.diagnostics.dfbetas)> 3/sqrt(100));disp([Row col])
2 1 28 1 84 1 93 1 2 2 13 3 84 3 2 4 84 4

delete-1缩放拟合值的更改(dffits

目的

delete-1缩放拟合值的变化(dffits)显示每个观察结果对拟合响应值的影响。dffits绝对值大于2*sqrt的值(p/n)可能具有影响力。

定义

dffits观察一世

dffits 一世 = s r 一世 H 一世 一世 1 - H 一世 一世 ,,,,

在哪里Sr一世是学生的残留物,并且Hii是合适的杠杆价值线性模型目的。dffits是一个n-1列列向量诊断合适的桌子线性模型目的。每个元素中的元素dffits是通过删除标准误差删除相应的观察和缩放而引起的拟合值的变化。

如何

在获得合适的模型后,说,MDL, 使用fitlm或者Stepwiselm, 你可以:

  • 显示dffits通过使用点符号索引到属性的值

    mdl.diagnostics.dffits

  • 使用使用删除值的删除-1缩放的变化在拟合值中使用

    PlotDiengnostics(MDL,'dffits')
    有关详细信息,请参阅PlotDiangnostics方法的方法线性模型课程以获取详细信息。

确定对拟合响应影响的观察结果dffits

此示例显示了如何确定对拟合响应值有影响的观测值dffits值。加载样品数据并定义响应和自变量。

加载医院y =医院。布洛德压(:,1);x = double(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm(x,y);

绘制dffits值。

PlotDiengnostics(MDL,'dffits'

图包含一个轴对象。带有标题案例订单的轴对象拟合中的变更曲线包含2个类型行的对象。这些对象表示拟合,参考线的缩放变化。

绝对值的影响阈值极限dffits在此示例中为2*SQRT(5/100)= 0.45。同样,有一些观察dffits超出推荐限制的值。

找出dffits绝对值大的值。

查找(abs(mdl.diagnostics.dffits)> 2*sqrt(4/100))
ans =10×12 13 28 44 58 70 71 84 93 95

删除1方差(s2_i

目的

delete-1差异(s2_i)说明当从数据集中删除观察值时,平均平方误差将如何变化。你可以比较s2_i具有均方根误差值的值。

定义

s2_i是通过依次删除每个观察值获得的一组残余方差估计值。这s2_i观察值一世

s 2 _ 一世 = m s e (( 一世 = j 一世 n [[ y j - y ^ j (( 一世 这是给予的 2 n - p - 1 ,,,,

在哪里yj是个j观察到的响应值。s2_i是一个n-1矢量诊断合适的桌子线性模型目的。每个元素中的元素s2_i是通过删除该观察结果获得的回归的平均平方误差。

如何

在获得合适的模型后,说,MDL, 使用fitlm或者Stepwiselm, 你可以:

  • 显示s2_i通过使用点符号将向量索引到属性

    mdl.diagnostics.s2_i

  • 使用

    PlotDiagnostics(MDL,'S2_I')
    有关详细信息,请参阅PlotDiangnostics方法的方法线性模型班级。

计算并检查Delete-1方差值

此示例显示了如何计算和绘制S2_I值以检查从数据中删除观察值时均方误差的变化。加载样品数据并定义响应和自变量。

加载医院y =医院。布洛德压(:,1);x = double(医院(:,2:5));

拟合线性回归模型。

mdl = fitlm(x,y);

显示模型的MSE值。

mdl.mse
ANS = 23.1140

绘制S2_i值。

PlotDiengnostics(MDL,'s2_i'

图包含一个轴对象。带有标题案例顺序图的轴对象包含2个类型行的对象。这些对象代表剩余的差异,均方根误差。

该图使得将S2_I值与水平虚线指示的23.114的MSE值进行比较。您可以看到删除一个观察如何改变误差差异。

也可以看看

||||

相关话题