主要内容

什么是线性回归模型?

线性回归模型描述了A因变量y,一个或多个独立变量X.因变量也称为反应变量.自变量也被称为说明预测变量.连续预测变量也被称为协变量,分类预测变量也被称为因素.矩阵X对预测变量的观察通常被称为设计矩阵

多元线性回归模型为

y β 0 + β 1 X 1 + β 2 X 2 + + β p X p + ε 1 n

在哪里

  • y响应。

  • βkkth系数,β0是模型中的常数项。有时,设计矩阵可能包含有关常数项的信息。然而,fitlmstepwiselm默认情况下,模型中包含常数项,因此您不能在设计矩阵中输入1列X

  • Xijj预测变量,j= 1,…,p

  • ε噪声项,即随机误差。

如果一个模型只包含一个预测变量(p= 1),则该模型称为简单线性回归模型。

一般来说,线性回归模型可以是模型的形式

y β 0 + k 1 K β k f k X 1 X 2 X p + ε 1 n

在哪里f(.)是自变量的标量值函数,Xij年代。功能,fX),可以是任何形式,包括非线性函数或多项式。线性回归模型中的线性是指系数的线性βk.也就是响应变量,y,是系数,βk

线性模型的一些例子是:

y β 0 + β 1 X 1 + β 2 X 2 + β 3. X 3. + ε y β 0 + β 1 X 1 + β 2 X 2 + β 3. X 1 3. + β 4 X 2 2 + ε y β 0 + β 1 X 1 + β 2 X 2 + β 3. X 1 X 2 + β 4 日志 X 3. + ε

然而,由于它们在未知系数中不是线性的,因此,下面的模型不是线性的,βk

日志 y β 0 + β 1 X 1 + β 2 X 2 + ε y β 0 + β 1 X 1 + 1 β 2 X 2 + e β 3. X 1 X 2 + ε

线性回归模型的一般假设是:

  • 噪音方面,ε是不相关的。

  • 噪音方面,ε,有独立和相同的正态分布均值零和恒定的方差,σ2.因此,

    E y E k 0 K β k f k X 1 X 2 X p + ε k 0 K β k f k X 1 X 2 X p + E ε k 0 K β k f k X 1 X 2 X p

    V y V k 0 K β k f k X 1 X 2 X p + ε V ε σ 2

    所以方差y所有级别都一样吗Xij

  • 的响应y是不相关的。

拟合线性函数为

y k 0 K b k f k X 1 X 2 X p 1 n

在哪里 y 估计的反应是什么bkS是拟合系数。对这些系数进行估计,使预测向量之间的均方差最小 y 和真正的响应向量 y ,这是 y y .此方法称为最小二乘法.在噪声项的假设下,这些系数也使预测向量的可能性最大化。

在线性回归模型的形式yβ1X1+β2X2+……+βpXp,系数βk表示一个单位变化对预测变量的影响,Xj,在响应E(y),前提是所有其他变量保持不变。系数的符号给出了效果的方向。例如,线性模型为E(y) = 1.8 - 2.35X1+X2,则-2.35表示平均响应下降2.35个单位,增加一个单位X1,鉴于X2是保持不变的。如果模型为E(y) = 1.1 + 1.5X12+X2,的系数X12表示的平均值增加1.5个单位Y增加一个单位X12假设所有其他的都保持不变。然而,对于E(y) = 1.1 + 2.1X1+ 1.5X12,很难用类似的方法来解释这些系数,因为它不可能持有X1常数时X12改变,反之亦然。

参考文献

Neter, J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman。应用线性统计模型.IRWIN, McGraw-Hill公司,1996。

[2] Seber, g.a.f。线性回归分析.概率与数理统计中的威利级数。John Wiley父子公司,1977年。

另请参阅

||

相关的话题