什么是线性回归模型？-Matlab＆Sim万博1manbetxulink -Mathworks Italia

什么是线性回归模型？

线性回归模型描述了因变量，，，，y，一个或多个自变量，，，，X。因变量也称为响应变量。自变量也称为解释性或者预测变量。连续预测变量也称为协变量，也称为分类预测变量因素。矩阵X关于预测变量的观察通常称为设计矩阵。

多个线性回归模型是

$y_{一世} = β_{0} + β_{1} X_{一世 1} + β_{2} X_{一世 2} + \dots + β_{p} X_{一世 p} + ε_{一世} ，，，，一世 = 1 ，，，， \dots ，，，， n ，，，，$

在哪里

y_一世是个一世反应。
β_k是个k该系数，其中β₀是模型中的恒定术语。有时，设计矩阵可能包括有关恒定术语的信息。然而，fitlm或者Stepwiselm默认情况下，在模型中包含一个恒定术语，因此您不得在设计矩阵中输入1列X。
X_IJ是个一世关于jTH预测变量，j= 1，...，，，p。
ε_一世是个一世噪声项，即随机错误。

如果模型仅包含一个预测变量（p= 1），然后将模型称为简单的线性回归模型。

通常，线性回归模型可以是形式的模型

$y_{一世} = β_{0} + \sum_{k = 1}^{k} β_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ） + ε_{一世} ，，，，一世 = 1 ，，，， \dots ，，，， n ，，，，$

在哪里F（。）是自变量的标量值函数，X_IJs。功能，F（（X），可能是任何形式，包括非线性函数或多项式。线性回归模型中的线性性是指系数的线性性β_k。也就是说，响应变量，y，是系数的线性函数，β_k。

线性模型的一些示例是：

$\begin{array}{l} y_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{3 一世} + ε_{一世} \\ y_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{1 一世}^{3} + β_{4} X_{2 一世}^{2} + ε_{一世} \\ y_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + β_{3} X_{1 一世} X_{2 一世} + β_{4} 日志 X_{3 一世} + ε_{一世} \end{array}$

但是，以下不是线性模型，因为它们在未知系数中不是线性的，而是线性模型。β_k。

$\begin{array}{l} 日志 y_{一世} = β_{0} + β_{1} X_{1 一世} + β_{2} X_{2 一世} + ε_{一世} \\ y_{一世} = β_{0} + β_{1} X_{1 一世} + \frac{1}{β_{2} X_{2 一世}} + e^{β_{3} X_{1 一世} X_{2 一世}} + ε_{一世} \end{array}$

线性回归模型的通常假设是：

噪音术语，ε_一世，不相关。
噪音术语，ε_一世，具有平均零和恒定方差的独立和相同的正常分布，σ²。因此，

$\begin{array}{l} e （（ y_{一世} ） = e （（ \sum_{k = 0}^{k} β_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ） + ε_{一世} ） \\ = \sum_{k = 0}^{k} β_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ） + e （（ ε_{一世} ） \\ = \sum_{k = 0}^{k} β_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ） \end{array}$

和

$v （（ y_{一世} ） = v （（ \sum_{k = 0}^{k} β_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ） + ε_{一世} ） = v （（ ε_{一世} ） = σ^{2}$

因此y_一世所有级别都相同X_IJ。
回答y_一世是不相关的。

拟合的线性函数是

${\hat{y}}_{一世} = \sum_{k = 0}^{k} b_{k} F_{k} （（ X_{一世 1} ，，，， X_{一世 2} ，，，， \dots ，，，， X_{一世 p} ），，，，一世 = 1 ，，，， \dots ，，，， n ，，，，$

在哪里 ${\hat{y}}_{一世}$ 是估计的响应和b_kS是合适的系数。估计系数以最大程度地减少预测矢量之间的平方差 $\hat{y}$ 和真实的响应向量 $y$ ，那是 $\hat{y} - y$ 。此方法称为最小二乘的方法。根据噪声项的假设，这些系数还最大程度地提高了预测向量的可能性。

在形式的线性回归模型中y=β₁X₁+β₂X₂+ ... +β_pX_p，系数β_k表达一个单位变化在预测变量中的影响，X_j，根据响应的平均值e（y），前提是所有其他变量均保持恒定。系数的符号给出了效果的方向。例如，如果线性模型为e（y）= 1.8 - 2.35X₁+X₂，然后–2.35表示平均响应的2.35单位随着单位增加而减少X₁，给予X₂保持不变。如果模型是e（y）= 1.1 + 1.5X₁²+X₂，系数X₁²表示平均值增加1.5单位y随着单位的增加X₁²鉴于其他所有人保持不变。但是，如果是y）= 1.1 + 2.1X₁+ 1.5X₁²，很难类似地解释系数，因为不可能保持X₁何时恒定X₁²更改，反之亦然。

参考

[1] Neter，J。，M。H. Kutner，C。J. Nachtsheim和W. Wasserman。应用线性统计模型。Irwin，McGraw-Hill Companies，Inc.，1996年。

[2] Seber，G。A. F.线性回归分析。Wiley系列概率和数学统计。John Wiley and Sons，Inc.，1977年。

也可以看看

线性模型|fitlm|Stepwiselm

什么是线性回归模型？

参考

也可以看看

相关话题