什么是线性回归模型?- MATLAB＆S万博1manbetximulink的 - MathWorks的美洲拉丁

什么是线性回归模型?

线性回归模型描述了A和b之间的关系因变量,y，以及一个或多个独立变量,X。因变量也被称为反应变量。自变量也叫自变量说明要么预测变量。连续预测变量也被称为连续预测变量协变量，分类预测变量也被称为因素。矩阵X对预测变量的观测通常称为设计矩阵。

多元线性回归模型为

$y_{我} = β_{0} + β_{1} X_{我 1} + β_{2} X_{我 2} + \dots + β_{p} X_{我 p} + ε_{我}, 我 = 1, \dots, n,$

在哪里

y_我是个我响应。
β_k是个kth系数,β₀是模型中的常数项。有时，设计矩阵可能包含有关常数项的信息。然而,fitlm要么stepwiselm默认情况下，包括模型中的常数项，所以你不得进入1秒的一列到你的设计矩阵X。
X_ij是个我对…的观察j预测变量,j= 1,…,p。
ε_我是个我噪声项，即随机误差。

如果一个模型只包含一个预测变量(p= 1，则该模型称为简单线性回归模型。

一般来说，线性回归模型可以是模型的一种形式

$y_{我} = β_{0} + \sum_{k = 1}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}, 我 = 1, \dots, n,$

在哪里f（·）是自变量的标量值函数，X_ij年代。功能,f(X），可能是任何形式的，包括非线性函数或多项式。线性，在线性回归模型，是指系数的线性β_k。也就是响应变量，y为系数的线性函数，β_k。

线性模型的一些例子是:

$\begin{array}{l} y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{3. 我} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{1 我}^{3.} + β_{4} X_{2 我}^{2} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + β_{3.} X_{1 我} X_{2 我} + β_{4} 日志 X_{3. 我} + ε_{我} \end{array}$

下面，不过，不是线性的模型，因为它们不是线性的未知系数，β_k。

$\begin{array}{l} 日志 y_{我} = β_{0} + β_{1} X_{1 我} + β_{2} X_{2 我} + ε_{我} \\ y_{我} = β_{0} + β_{1} X_{1 我} + \frac{1}{β_{2} X_{2 我}} + e^{β_{3.} X_{1 我} X_{2 我}} + ε_{我} \end{array}$

线性回归模型的一般假设是:

噪音方面,ε_我是不相关的。
噪音方面,ε_我有独立且相同的正态分布均值为零,方差不变,σ²。因此,

$\begin{array}{l} E (y_{我}) = E (\sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}) \\ = \sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + E (ε_{我}) \\ = \sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) \end{array}$

和

$V (y_{我}) = V (\sum_{k = 0}^{K} β_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}) + ε_{我}) = V (ε_{我}) = σ^{2}$

所以y_我所有级别的都是一样的吗X_ij。
的响应y_我是不相关的。

拟合线性函数为

${\hat{y}}_{我} = \sum_{k = 0}^{K} b_{k} f_{k} (X_{我 1}, X_{我 2}, \dots, X_{我 p}), 我 = 1, \dots, n,$

在哪里 ${\hat{y}}_{我}$ 估计的反应和b_ks是拟合系数。对这些系数进行估计，以最小化预测向量之间的均方差 $\hat{y}$ 和真实的响应向量 $y$ ,这是 $\hat{y} - y$ 。此方法称为最小二乘法。在噪声项的假设下，这些系数也使预测向量的似然最大。

在线性回归模型的形式y=β₁X₁+β₂X₂+……+β_pX_p,系数β_k表示预测变量单单位变化的影响，X_j，求响应E(y），前提是所有其他变量保持不变。系数的符号给出了效果的方向。例如，如果线性模型是E（y) = 1.8 - 2.35X₁+X₂，则-2.35表示平均响应下降2.35个单位，增加1个单位X₁,鉴于X₂是保持不变的。如果模型是E(y) = 1.1 + 1.5X₁²+X₂，的系数X₁²表示的平均值增加了1.5个单位Y增加了一个单位X₁²给予一切保持不变。然而，在E的情况下（y) = 1.1 + 2.1X₁+ 1.5X₁²，由于不可能保持不变，因此很难用类似的方法解释系数X₁常数时X₁²变化或反之亦然。

参考

[1] Neter, J.， M. H. Kutner, C. J. Nachtsheim，和W. Wasserman。应用线性统计模型。欧文，麦格劳-希尔公司，1996。

[2] Seber, g.a.f。线性回归分析。威利系列在概率论与数理统计。John Wiley和Sons公司，1977年。

另请参阅

LinearModel|fitlm|stepwiselm

什么是线性回归模型?

参考

另请参阅

相关话题

统计和机器学习工具箱文件

万博1manbetx

掌握机器学习:用MATLAB逐步指导