回归

多元线性回归

描述

b=回归(ÿX返回一个矢量b的系数估计用于在载体中的响应的多元线性回归ÿ在基质中的预测X。为了计算系数估计用于与常数项(截距)的模型,包括那些在矩阵的列X

[b宾特] =回归(ÿX也返回一个矩阵宾特95%的置信区间系数估计。

[b宾特[R] =回归(ÿX还返回一个附加矢量[R的残留物。

[b宾特[RRINT] =回归(ÿX也返回一个矩阵RINT的可用于诊断异常值的时间间隔。

[b宾特[RRINT统计] =回归(ÿX也返回一个向量统计包含[R2统计中,Ft-统计和其p- 值,误差方差的估计。矩阵X必须包括构成的列的软件,正确计算模型的统计数据。

[___] =回归(ÿXα使用100 *(1-α)%的置信水平计算宾特RINT。指定任何在前面的语法的输出参数的组合。

例子

全部收缩

加载carsmall数据集。识别重量和马力作为预测和里程作为响应。

加载carsmallX1 =重量;X2 =马力;%包含数据的NaNY = MPG;

计算回归系数用于与交互项的线性模型。

X = [酮(大小(X1))X1 X2 X1 * X2。];B =回归(Y,X)%移除了数据的NaN
b =4×160.7104 -0.0102 -0.1882 0.0000

图中的数据和模型。

scatter3(X1,X2,Y,'填充')保持x1fit =分钟(X1):100:MAX(X1);x2fit =分钟(2次):10:最大(2次);[X1FIT,X2FIT] = meshgrid(x1fit,x2fit);YFIT = B(1)+ B(2)* + X1FIT B(3)* + X2FIT B(4)* * X1FIT X2FIT。目(X1FIT,X2FIT,YFIT)xlabel('重量')ylabel('马力')zlabel('MPG')视图(50,10)保持

加载examgrades数据集。

加载examgrades

使用最后的考试成绩作为应答数据与前两个考试成绩的预测数据。

Y =等级(:,5);X = [酮(大小(等级(:,1)))等级(:,1:2)];

执行与阿尔法= 0.01多重线性回归。

[〜,〜,R,RINT] =回归(Y,X,0.01);

通过发现残留的间隔诊断异常值RINT不包含0。

contain0 =(RINT(:,1)<0&RINT(:,2)> 0);IDX =查找(contain0 ==假)
IDX =2×153 54

意见5354有可能的异常值。

创建残差的散点图。填写对应离群点。

保持散射(Y,R)散射(Y(IDX)中,r(IDX),'B''填充')xlabel(“最后的考试成绩”)ylabel(“残差”)保持

加载哈尔德数据集。用作为响应变量和配料作为预测数据。

加载哈尔德Y =热;X1 =配料;X1 =酮(大小(X1,1),1);X = [X1 X1];%包括那些列

进行多元线性回归和生成模型的统计数据。

[〜,〜,〜,〜,统计] =回归(Y,X)
统计=1×40.9824 111.4792 0.0000 5.9830

由于 [R 2 的价值0.9824接近1,并且P-的价值0.0000小于0.05的默认显着性水平,响应之间存在显著线性回归关系ÿ并预测变量X

输入参数

全部收缩

响应数据,指定为ñ×1数值向量。行ÿ对应于不同的观测。ÿ必须具有相同的行数为X

数据类型:|

预测数据,指定为ñ-通过-p数字矩阵。行X对应于观察,列对应于预测变量。X必须具有相同的行数为ÿ

数据类型:|

显着性水平,指定为正标量。α必须在0和1之间。

数据类型:|

输出参数

全部收缩

系数估计多元线性回归,返回为数值向量。bp×1向量,其中p是预测的在数X。如果列X是线性相关的,回归设置的元件的最大数b零。

数据类型:

下和系数估计值上的置信区间,返回一个数字矩阵。宾特p-by-2矩阵,其中p是预测的在数X。第一列宾特包含每个系数估计的较低的置信界限;第二列包含上置信区间。如果列X是线性相关的,回归返回零在元件宾特对应于所述非零元素b

数据类型:

残差,返回一个数值向量。[R是一个ñ×1向量,其中ñ是观察,或行的数目,在X

数据类型:|

间隔诊断异常,返回一个数字矩阵。RINT是一个ñ-by-2矩阵,其中ñ是观察,或行的数目,在X。如果间隔RINT(I,:)观察一世不包含零,相应的残留较大比预期100 *(1-α)%的新的观察结果,这意味着一个异常。欲了解更多信息,请参阅算法

数据类型:|

模型统计,返回一个数字载体包括[R2统计中,Ft-统计和其p- 值,误差方差的估计。

  • X必须包括构成的列,因此模型包含常数项。该Ft-统计和其p- 值在此假设下计算的,并不适用机型不正确的常数。

  • Ft-统计是的检验统计F- 测试的回归模型。该F-test验看响应变量和预测器变量之间显著线性回归关系。

  • [R2统计可以是用于模型负而不恒定,表明该模型不适合的数据。

数据类型:|

提示

  • 回归对待为NaN价值观X要么ÿ为缺失值。回归遗漏观察从回归拟合缺失值。

算法

全部收缩

剩余间隔

在一个线性模型,观察到的值ÿ和它们的残差是随机变量。残差具有零均值,但与在预测的不同的价值观不同的方差的正态分布。为了把残留在可比的规模,回归“Studentizes”残差。那是,回归可以通过标准偏差的估计是独立于它们的值的分割的残差。学生化残差有Ť-distributions与已知的自由度。该时间间隔在返回RINT是的转变100 *(1-α)这些%置信区间Ť-distributions,居中在残差。

另类功能

回归当你只需要简单函数的输出参数,当你想在循环中重复的模型多次拟合是非常有用的。如果您需要进一步调查拟合回归模型,建立一个线性回归模型对象线性模型通过使用fitlm要么stepwiselm。一个线性模型对象提供了比更多的功能回归

  • 使用的属性线性模型调查拟合线性回归模型。对象属性包括关于系数的估计,汇总统计,拟合方法,和输入数据信息。

  • 使用的目标函数线性模型预测响应和修改,评估和可视化的线性回归模型。

  • 不像回归中,fitlm功能不需要那些在输入数据的列。通过创建一个模型fitlm总是包括截距项,除非您指定不使用包括它'截距'名称 - 值对的参数。

  • 您可以在输出信息回归使用特性和对象的功能线性模型

    输出回归 在等效值线性模型
    b 查看估计的列系数属性。
    宾特 使用coefCI功能。
    [R 查看生的的列残差属性。
    RINT 不支持。万博1manbetx相反,使用学生化残差(残差属性)和观察诊断(诊断属性)发现异常。
    统计 请参见在命令窗口中的模型显示。您可以在模型属性的统计(MSERsquared),并通过使用方差分析功能。

参考

[1] Chatterjee的,S.,和A. S.哈迪。“有影响力的意见,高杠杆点,与粗线性回归。”统计科学。卷。1,1986年,第379-416。

R2006a前推出