主要内容

什么是线性回归模型?

线性回归模型描述了因变量,,,,y,一个或多个自变量,,,,X。因变量也称为响应变量。自变量也称为解释性或者预测变量。连续预测变量也称为协变量,也称为分类预测变量因素。矩阵X关于预测变量的观察通常称为设计矩阵

多个线性回归模型是

y 一世 = β 0 + β 1 X 一世 1 + β 2 X 一世 2 + + β p X 一世 p + ε 一世 ,,,, 一世 = 1 ,,,, ,,,, n ,,,,

在哪里

  • y一世是个一世反应。

  • βk是个k该系数,其中β0是模型中的恒定术语。有时,设计矩阵可能包括有关恒定术语的信息。然而,fitlm或者Stepwiselm默认情况下,在模型中包含一个恒定术语,因此您不得在设计矩阵中输入1列X

  • XIJ是个一世关于jTH预测变量,j= 1,...,,,p

  • ε一世是个一世噪声项,即随机错误。

如果模型仅包含一个预测变量(p= 1),然后将模型称为简单的线性回归模型。

通常,线性回归模型可以是形式的模型

y 一世 = β 0 + k = 1 k β k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p + ε 一世 ,,,, 一世 = 1 ,,,, ,,,, n ,,,,

在哪里F(。)是自变量的标量值函数,XIJs。功能,F((X),可能是任何形式,包括非线性函数或多项式。线性回归模型中的线性性是指系数的线性性βk。也就是说,响应变量,y,是系数的线性函数,βk

线性模型的一些示例是:

y 一世 = β 0 + β 1 X 1 一世 + β 2 X 2 一世 + β 3 X 3 一世 + ε 一世 y 一世 = β 0 + β 1 X 1 一世 + β 2 X 2 一世 + β 3 X 1 一世 3 + β 4 X 2 一世 2 + ε 一世 y 一世 = β 0 + β 1 X 1 一世 + β 2 X 2 一世 + β 3 X 1 一世 X 2 一世 + β 4 日志 X 3 一世 + ε 一世

但是,以下不是线性模型,因为它们在未知系数中不是线性的,而是线性模型。βk

日志 y 一世 = β 0 + β 1 X 1 一世 + β 2 X 2 一世 + ε 一世 y 一世 = β 0 + β 1 X 1 一世 + 1 β 2 X 2 一世 + e β 3 X 1 一世 X 2 一世 + ε 一世

线性回归模型的通常假设是:

  • 噪音术语,ε一世,不相关。

  • 噪音术语,ε一世,具有平均零和恒定方差的独立和相同的正常分布,σ2。因此,

    e (( y 一世 = e (( k = 0 k β k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p + ε 一世 = k = 0 k β k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p + e (( ε 一世 = k = 0 k β k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p

    v (( y 一世 = v (( k = 0 k β k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p + ε 一世 = v (( ε 一世 = σ 2

    因此y一世所有级别都相同XIJ

  • 回答y一世是不相关的。

拟合的线性函数是

y ^ 一世 = k = 0 k b k F k (( X 一世 1 ,,,, X 一世 2 ,,,, ,,,, X 一世 p ,,,, 一世 = 1 ,,,, ,,,, n ,,,,

在哪里 y ^ 一世 是估计的响应和bkS是合适的系数。估计系数以最大程度地减少预测矢量之间的平方差 y ^ 和真实的响应向量 y , 那是 y ^ - y 。此方法称为最小二乘的方法。根据噪声项的假设,这些系数还最大程度地提高了预测向量的可能性。

在形式的线性回归模型中y=β1X1+β2X2+ ... +βpXp,系数βk表达一个单位变化在预测变量中的影响,Xj,根据响应的平均值e(y),前提是所有其他变量均保持恒定。系数的符号给出了效果的方向。例如,如果线性模型为e(y)= 1.8 - 2.35X1+X2,然后–2.35表示平均响应的2.35单位随着单位增加而减少X1,给予X2保持不变。如果模型是e(y)= 1.1 + 1.5X12+X2,系数X12表示平均值增加1.5单位y随着单位的增加X12鉴于其他所有人保持不变。但是,如果是y)= 1.1 + 2.1X1+ 1.5X12,很难类似地解释系数,因为不可能保持X1何时恒定X12更改,反之亦然。

参考

[1] Neter,J。,M。H. Kutner,C。J. Nachtsheim和W. Wasserman。应用线性统计模型。Irwin,McGraw-Hill Companies,Inc.,1996年。

[2] Seber,G。A. F.线性回归分析。Wiley系列概率和数学统计。John Wiley and Sons,Inc.,1977年。

也可以看看

||

相关话题