什么是线性回归模型?- MATLAB & 万博1manbetxSimulink - MathWorks한국

什么是线性回归模型?

一个线性回归模型描述的是因变量，y，以及一个或多个独立变量，X．因变量也称为反应变量．自变量也称为自变量说明或预测变量．连续预测变量也称为连续预测变量协变量，也称为分类预测变量因素．矩阵X对预测变量的观察通常称为设计矩阵．

多元线性回归模型为

$y_{我} ＝ β_{0} + β_{1} X_{我 1} + β_{2} X_{我 2} + \dots + β_{p} X_{我 p} + ε_{我} ，我＝ 1 ， \dots ， n ，$

在哪里

y_我是我响应。
β_k是kTh系数，其中β₀是模型中的常数项。有时，设计矩阵可能包含常数项的信息。然而,fitlm或stepwiselm默认情况下，模型中包含常数项，因此您不能在设计矩阵中输入1列X．
X_ij是我观察到j预测变量，j= 1，…p．
ε_我是我噪声项，即随机误差。

如果模型只包含一个预测变量(p= 1)，则该模型称为简单线性回归模型。

一般来说，线性回归模型可以是模型的形式

$y_{我} ＝ β_{0} + \sum_{k ＝ 1}^{K} β_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ） + ε_{我} ，我＝ 1 ， \dots ， n ，$

在哪里f(.)为自变量的标量值函数，X_ijs，函数，f（X)，可以是任何形式，包括非线性函数或多项式。线性回归模型中的线性是指系数的线性程度β_k．也就是响应变量，y，为系数的线性函数，β_k．

线性模型的一些例子是:

$\begin{array}{l} y_{我} ＝ β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{3. 我} + ε_{我} \\ y_{我} ＝ β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{1 我}^{3.} + β_{4} X_{2 我}^{2} + ε_{我} \\ y_{我} ＝ β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{1 我} X_{2 我} + β_{4} 日志 X_{3. 我} + ε_{我} \end{array}$

然而，下面的模型不是线性模型，因为它们在未知系数中不是线性的，β_k．

$\begin{array}{l} 日志 y_{我} ＝ β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + ε_{我} \\ y_{我} ＝ β_{0} + β_{1} X_{1 我} + \frac{1}{β_{2} X_{2 我}} + e^{β_{3.} X_{1 我} X_{2 我}} + ε_{我} \end{array}$

线性回归模型的通常假设是:

噪声项，ε_我，是不相关的。
噪声项，ε_我，具有独立且相同的正态分布，均值为零，方差为常数σ²．因此,

$\begin{array}{l} E （ y_{我} ）＝ E （ \sum_{k ＝ 0}^{K} β_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ） + ε_{我} ） \\ ＝ \sum_{k ＝ 0}^{K} β_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ） + E （ ε_{我} ） \\ ＝ \sum_{k ＝ 0}^{K} β_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ） \end{array}$

而且

$V （ y_{我} ）＝ V （ \sum_{k ＝ 0}^{K} β_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ） + ε_{我} ）＝ V （ ε_{我} ）＝ σ^{2}$

的方差y_我所有层次都是一样的吗X_ij．
的响应y_我是不相关的。

拟合的线性函数为

${\overset{＾}{y}}_{我} ＝ \sum_{k ＝ 0}^{K} b_{k} f_{k} （ X_{我 1} ， X_{我 2} ， \dots ， X_{我 p} ），我＝ 1 ， \dots ， n ，$

在哪里 ${\overset{＾}{y}}_{我}$ 估计的响应和b_kS是拟合系数。对系数进行估计，以使预测向量之间的均方差最小化 $\overset{＾}{y}$ 和真正的响应向量 $y$ 也就是说 $\overset{＾}{y} - y$ ．这个方法称为最小二乘法．在对噪声项的假设下，这些系数也使预测向量的似然最大化。

在线性回归模型的形式y＝β₁X₁+β₂X₂+……+β_pX_p，系数β_k表示预测变量中一个单位变化的影响，X_j为响应E(y)，只要所有其他变量保持不变。系数的符号给出了效应的方向。例如，如果线性模型为E(y) = 1.8 - 2.35X₁+X₂，则-2.35表示平均响应增加1个单位，平均响应减少2.35个单位X₁,鉴于X₂保持不变。如果模型为E(y) = 1.1 + 1.5X₁²+X₂，的系数X₁²的平均值增加了1.5个单位Y增加了一个单位X₁²在其他条件不变的情况下。然而，在E(y) = 1.1 + 2.1X₁+ 1.5X₁²，很难以类似的方式解释系数，因为不可能保持不变X₁常数时X₁²变化，反之亦然。

参考文献

[1]内特，J.， M. H.库特纳，C. J.纳赫茨海姆和W.沃瑟曼。应用线性统计模型．《麦克劳-希尔公司》，1996年。

[2] Seber g.a.f.线性回归分析．概率与数理统计中的威利级数。约翰·威利父子公司，1977年。

另请参阅

LinearModel|fitlm|stepwiselm