解释线性回归结果

打开直播脚本

此示例显示了如何显示和解释线性回归输出统计信息。

适合线性回归模型

加载Carsmall.数据集，矩阵输入数据集。

加载Carsmall.x = [重量，马力，加速];

使用线性回归模型Fitlm.。

lm = fitlm（x，mpg）

LM =线性回归模型：Y〜1 + X1 + X2 + X3估计系数：估计系数PVALUE __________ ___________________________0.8957e-217.8785 12.37 0.024313 0.024313 0.024313 0.024313-1.7663 0.08078 x3 -0.111583 0.1111583 0.19333 -0.059913 0.95236观测数量：93，误差自由度：89根均匀误差：4.09 r断层：0.752，调整R线：0.744 F统计与常数型号：90，p值= 7.38e-27

模型显示包括型号公式，估计系数和模型摘要统计信息。

显示屏中的型号公式，Y〜1 + x1 + x2 + x3，对应于 $y = β_{0.} + β_{1} X_{1} + β_{2} X_{2} + β_{3.} X_{3.} + ε.$ 。

模型显示屏显示了存储在中的估计系数信息系数财产。显示系数财产。

LM.COEFFICERS.

ans =.4×4表估算率SE TSTAT PVALUE __________ _________ ____________________________________________0.0065416 0.023 0.0.080330.024313 0.01933 -1.0.01133 -20.024313 0.0233330.03958/03023 0.0.04313 0.023 0.0.04313 0.023 0.0.042943

这系数属性包含这些列：

估计- 模型中每个对应术语的系数估计。例如，常数项的估计值（截距）是47.977。
SE.- 系数的标准误差。
Tstat.-T.对于每个系数来测试NULL假设的间距，即，在模型中的其他预测器中，相应的系数与其不同的替代是零的零。注意tstat =估计/ se。例如，T.截距的间距为47.977 / 3.8785 = 12.37。
pvalue.-P.- 为valueT.对相应系数等于零的假设测试。例如，P.- 左边的价值T.- 艺术性X2大于0.05，因此该术语在5％的意义水平上没有显着鉴于模型中的其他术语。

模型的摘要统计数据是：

观察次数- 没有任何行的行数南价值观。例如，观察次数是93因为MPG.数据向量有六个南价值观和马力数据矢量有一个南不同观察的值，其中行数X和MPG.是100。
误差自由度-N-P.，在哪里N是观察人数，和P.是模型中的系数数量，包括截距。例如，该模型有四个预测因子，所以误差自由度是93 - 4 = 89。
根均匀误差- 平均方形误差的平方根，估计错误分布的标准偏差。
r-平方和调整的R角- 分别测定系数和调整的测定系数。例如，r-平方值表明，该模型解释了响应变量中大约75％的变化MPG.。
F统计与常量模型- 测试统计F- 在回归模型上，这测试模型是否比仅由恒定术语组成的简并模型更好。
p值-P.- 为valueF- 在模型上。例如，该模型与a具有重要意义P.- 7.3816E-27的价值。

Anova.

对模型进行方差分析（ANOVA）。

Anova（LM，'概括'）

ans =.3×5表SUMSQ DF均衡Q _____________________________________总共6004.8 92 65.269型号4516 3 1505.3 89.987 7.3816E-27剩余1488.8 89 16.728

这Anova.显示屏显示以下内容。

SUMSQ.- 回归模型的平方和，模型，错误术语，剩余的以及总数，全部的。
DF.- 每个术语的自由度。自由度是 $N - 1$ 总计， $P. - 1$ 对于模型，和 $N - P.$ 对于错误项，在哪里 $N$ 是观察人数，和 $P.$ 是模型中的系数数量，包括截距。例如，MPG.数据向量有六个南值和数据向量之一，马力，有一个南不同观察的值，因此自由度总量为93 - 1 = 92.模型中有四个系数，因此模型DF.是4 - 1 = 3，和DF.错误项是93 - 4 = 89。
介绍- 每个术语的平均平方误差。注意均衡Q = SUMSQ / DF。例如，误差项的平均平方误差为1488.8 / 89 = 16.728。这个值的平方根是根均匀误差在线性回归显示屏中，或4.09。
F-F- 职位值，与之相同F统计与常量模型在线性回归显示。在此示例中，它是89.987，并且在线性回归显示F- 级值舍入为90。
pvalue.-P.- 为valueF- 在模型上。在这个例子中，它是7.3816e-27。

如果回归模型中有高阶项，Anova.分区模型SUMSQ.进入由高阶项和其余的术语解释的部分。相应的F- 效果用于测试线性术语和高阶项作为单独组的重要性。

如果数据包括复制，或者在相同的预测值值下的多个测量，则Anova.分区错误SUMSQ.进入复制和其余部分。相应的F- 静态是为了通过比较复制上计算的无模型方差估计的模型残差来测试缺乏契合。

分解ANOVA表以进行模型术语。

ANOVA（LM）

ans =.4×5表SUMSQ DF MeanSq˚Fp值________ __ ________ _________ __________ X1 563.18 1 563.18 33.667 9.8742e-08 X2 52.187 1 52.187 3.1197 0.08078×3 0.060046 0.060046 1 0.95236 0.0035895错误1488.8 89 16.728

这Anova.显示屏显示以下内容：

第一列 - 模型中包含的术语。
SUMSQ.- 除常数外，每个术语的平方误差之和。
DF.- 自由程度。在这个例子中，DF.模型中的每个术语为1 $N - P.$ 对于错误项，在哪里 $N$ 是观察人数，和 $P.$ 是模型中的系数数量，包括截距。例如，DF.对于此模型中的错误项为93 - 4 = 89.如果模型中的任何变量是分类变量，则DF.对于该变量是为其类别创建的指示变量的数量（类别 - 1）。
介绍- 每个术语的平均平方误差。注意均衡Q = SUMSQ / DF。例如，误差项的平均平方误差为1488.8 / 89 = 16.728。
F-F- 每个系数的值。这F-Value是每个术语和均方误差的平均平均值的比率，即f =均衡（xi）/均衡（错误）。每个F- 斯塔蒂斯有一个F分布，具有分析器自由度，DF.相应术语的价值，以及分母自由度， $N - P.$ 。 $N$ 是观察人数，和 $P.$ 是模型中的系数数。在这个例子中，每个F- 斯塔蒂斯有一个 $F_{（ 1 那 8. 9. ）}$ 分配。
pvalue.-P.- 对于线性模型中对应术语系数的每个假设检验的value。例如，P.- 为valueF- 史密的系数X2是0.08078，在模型中的其他术语中，在5％的意义水平下不显着。

系数置信区间

显示系数置信区间。

COEFCI（LM）

ans =.4×240.2702 55.6833 -0.0088 -0.0043 -0.0913 0.0054 -0.3957 0.3726

对于系数的默认95％置信区间，每行中的值分别是较低和上置信限制。例如，第一行显示截距的下限和上限，40.2702和55.6833， $β_{0.}$ 。同样，第二行显示了限制 $β_{1}$ 等等。置信区间提供了线性回归系数估计的精度的量度。一种 $1 0. 0. （ 1 - α. ）％$ 置信区间给出了相应的回归系数的范围 $1 0. 0. （ 1 - α. ）％$ 置信度。

您也可以改变置信水平。找到系数99％的置信区间。

COEFCI（LM，0.01）

ans =.4×237.7677 58.1858 -0.0095 -0.0036 -0.1069 0.0211 -0.5205 0.4973

结构的假设试验

测试所有预测器变量系数等于零的空假设与替代假设相对于零点不同。

[p，f，d] = colealtest（lm）

P = 7.3816e-27

f = 89.9874.

d = 3.

这里，colealt执行A.F- 测试所有回归系数（截距除外）为零，至少一个与零不同，这基本上是模型上的假设。它返回 $P.$ ，这P.-价值，F，这F- 艺术，和D.，分子自由度。这F- 术和P.-Value与线性回归显示器中的值相同Anova.对于模型。自由度是4 - 1 = 3，因为模型中有四个预测器（包括拦截）。

现在，对第一和第二预测变量的系数执行假设测试。

H = [0 1 0 0;0 0 1 0];[p，f，d] = colealt（lm，h）

P = 5.1702E-23

f = 96.4873.

d = 2

分子自由度是测试的系数的数量，在该示例中是2。结果表明至少有一个 $β_{2}$ 和 $β_{3.}$ 与零不同。

也可以看看

Anova.|Fitlm.|linearmodel.|步骤行程

解释线性回归结果

适合线性回归模型

Anova.

系数置信区间

结构的假设试验

也可以看看

相关例子

更多关于

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习：使用MATLAB逐步指南