什么是线性回归模型?
线性回归模型描述了因变量,,,,y,一个或多个自变量,,,,X。因变量也称为响应变量。自变量也称为解释性或者预测变量。连续预测变量也称为协变量,也称为分类预测变量因素。矩阵X关于预测变量的观察通常称为设计矩阵。
多个线性回归模型是
在哪里
y一世是个一世反应。
βk是个k该系数,其中β0是模型中的恒定术语。有时,设计矩阵可能包括有关恒定术语的信息。然而,
fitlm
或者Stepwiselm
默认情况下,在模型中包含一个恒定术语,因此您不得在设计矩阵中输入1列X。XIJ是个一世关于jTH预测变量,j= 1,...,,,p。
ε一世是个一世噪声项,即随机错误。
如果模型仅包含一个预测变量(p= 1),然后将模型称为简单的线性回归模型。
通常,线性回归模型可以是形式的模型
在哪里F(。)是自变量的标量值函数,XIJs。功能,F((X),可能是任何形式,包括非线性函数或多项式。线性回归模型中的线性性是指系数的线性性βk。也就是说,响应变量,y,是系数的线性函数,βk。
线性模型的一些示例是:
但是,以下不是线性模型,因为它们在未知系数中不是线性的,而是线性模型。βk。
线性回归模型的通常假设是:
噪音术语,ε一世,不相关。
噪音术语,ε一世,具有平均零和恒定方差的独立和相同的正常分布,σ2。因此,
和
因此y一世所有级别都相同XIJ。
回答y一世是不相关的。
拟合的线性函数是
在哪里 是估计的响应和bkS是合适的系数。估计系数以最大程度地减少预测矢量之间的平方差 和真实的响应向量 , 那是 。此方法称为最小二乘的方法。根据噪声项的假设,这些系数还最大程度地提高了预测向量的可能性。
在形式的线性回归模型中y=β1X1+β2X2+ ... +βpXp,系数βk表达一个单位变化在预测变量中的影响,Xj,根据响应的平均值e(y),前提是所有其他变量均保持恒定。系数的符号给出了效果的方向。例如,如果线性模型为e(y)= 1.8 - 2.35X1+X2,然后–2.35表示平均响应的2.35单位随着单位增加而减少X1,给予X2保持不变。如果模型是e(y)= 1.1 + 1.5X12+X2,系数X12表示平均值增加1.5单位y随着单位的增加X12鉴于其他所有人保持不变。但是,如果是y)= 1.1 + 2.1X1+ 1.5X12,很难类似地解释系数,因为不可能保持X1何时恒定X12更改,反之亦然。
参考
[1] Neter,J。,M。H. Kutner,C。J. Nachtsheim和W. Wasserman。应用线性统计模型。Irwin,McGraw-Hill Companies,Inc.,1996年。
[2] Seber,G。A. F.线性回归分析。Wiley系列概率和数学统计。John Wiley and Sons,Inc.,1977年。