主要内容gydF4y2Ba

协变量线性回归和分类gydF4y2Ba

这个例子展示了如何执行使用分类数组和协变量的回归和分类gydF4y2BafitlmgydF4y2Ba。gydF4y2Ba

加载示例数据。gydF4y2Ba

负载gydF4y2BacarsmallgydF4y2Ba

的变量gydF4y2Ba英里/加仑gydF4y2Ba包含测量样本100英里每加仑的汽车。每辆车的年型变量gydF4y2BaModel_YeargydF4y2Ba,gydF4y2Ba重量gydF4y2Ba包含每辆车的重量。gydF4y2Ba

数据分组的阴谋。gydF4y2Ba

画一个散点图gydF4y2Ba英里/加仑gydF4y2Ba对gydF4y2Ba重量gydF4y2Ba,按模型分组。gydF4y2Ba

图()gscatter(重量、MPG Model_Year,gydF4y2Ba“bgr”gydF4y2Ba,gydF4y2Ba“x.o”gydF4y2Ba)标题(gydF4y2Ba“MPG和重量,按年型分组”gydF4y2Ba)gydF4y2Ba

分组变量,gydF4y2BaModel_YeargydF4y2Ba,有三个独特的价值观,gydF4y2Ba70年gydF4y2Ba,gydF4y2Ba76年gydF4y2Ba,gydF4y2Ba82年gydF4y2Ba,对应于模型1970年、1976年和1982年。gydF4y2Ba

创建表和分类数组。gydF4y2Ba

创建一个表,其中包含的变量gydF4y2Ba英里/加仑gydF4y2Ba,gydF4y2Ba重量gydF4y2Ba,gydF4y2BaModel_YeargydF4y2Ba。把变量gydF4y2BaModel_YeargydF4y2Ba分类数组。gydF4y2Ba

汽车=表(MPG、重量、Model_Year);汽车。米odel_Year = categorical(cars.Model_Year);

适合一个回归模型。gydF4y2Ba

适合一个回归模型使用gydF4y2BafitlmgydF4y2Ba与gydF4y2Ba英里/加仑gydF4y2Ba作为因变量,gydF4y2Ba重量gydF4y2Ba和gydF4y2BaModel_YeargydF4y2Ba作为独立变量。因为gydF4y2BaModel_YeargydF4y2Ba与三个层次是一个绝对的协变量,它应进入模型两个指标变量。gydF4y2Ba

散点图显示的斜率gydF4y2Ba英里/加仑gydF4y2Ba对gydF4y2Ba重量gydF4y2Ba为每个模型可能不同。评估,包括weight-year交互方面。gydF4y2Ba

该模型是gydF4y2Ba

EgydF4y2Ba (gydF4y2Ba 米gydF4y2Ba PgydF4y2Ba GgydF4y2Ba )gydF4y2Ba =gydF4y2Ba βgydF4y2Ba 0gydF4y2Ba +gydF4y2Ba βgydF4y2Ba 1gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba +gydF4y2Ba βgydF4y2Ba 2gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1976年gydF4y2Ba ]gydF4y2Ba +gydF4y2Ba βgydF4y2Ba 3gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1982年gydF4y2Ba ]gydF4y2Ba +gydF4y2Ba βgydF4y2Ba 4gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba ×gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1976年gydF4y2Ba ]gydF4y2Ba +gydF4y2Ba βgydF4y2Ba 5gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba ×gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1982年gydF4y2Ba ]gydF4y2Ba ,gydF4y2Ba

在哪里gydF4y2Ba我gydF4y2Ba[1976]和gydF4y2Ba我gydF4y2Ba[1982]是虚拟变量指示模型1976年和1982年,分别。gydF4y2Ba我gydF4y2Ba[1976]的值1如果模型是1976年,值0如果不是。gydF4y2Ba我gydF4y2Ba[1982]的值1如果模型是1982年,值0如果不是。在这个模型中,1970是参考。gydF4y2Ba

适合= fitlm(汽车,gydF4y2Ba“MPG ~ * Model_Year重量”gydF4y2Ba)gydF4y2Ba
适合=线性回归模型:MPG ~ 1 +重量* Model_Year估计系数:估计SE ___________ __________(拦截)4.6903 - 2.8538 -0.0058437 - 0.00061765 37.399 - 2.1466重量Model_Year_76 Model_Year_82 21.051 - 4.157重量:Model_Year_76 -0.00082009 - 0.00085468重量:-0.0050551 - 0.0015636 Model_Year_82 tStat pValue ________ __________(拦截)17.423 2.8607 e-30体重-9.4612 - 4.6077 e15汽油Model_Year_76 5.0641 - 2.2364 1.6435 - 0.10384 Model_Year_82 e-06重量:Model_Year_76 -0.95953 - 0.33992重量:-3.2329 - 0.0017256 Model_Year_82观测数量:94年,错误自由度:88根均方误差:2.79平方:0.886,调整平方:0.88 f统计量与常数模型:137年,假定值= 5.79 e-40gydF4y2Ba

回归输出显示:gydF4y2Ba

  • fitlmgydF4y2Ba认识到gydF4y2BaModel_YeargydF4y2Ba作为分类变量,构造所需的指示器(虚拟)变量。默认情况下,第一级,gydF4y2Ba70年gydF4y2Ba,是参照群体(使用gydF4y2BareordercatsgydF4y2Ba改变参考集团)。gydF4y2Ba

  • 模型的规范,gydF4y2Ba英里/加仑~ * Model_Year重量gydF4y2Ba,指定了一阶条件gydF4y2Ba重量gydF4y2Ba和gydF4y2BaModel_YeargydF4y2Ba,所有的交互。gydF4y2Ba

  • 该模型gydF4y2BaRgydF4y2Ba2gydF4y2Ba英里每加仑= 0.886,这意味着差异当你考虑重量减少了88.6%,模型,和他们的相互作用。gydF4y2Ba

  • 拟合模型gydF4y2Ba

    米gydF4y2Ba PgydF4y2Ba ^gydF4y2Ba GgydF4y2Ba =gydF4y2Ba 37.4gydF4y2Ba −gydF4y2Ba 0.006gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba +gydF4y2Ba 4.7gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1976年gydF4y2Ba ]gydF4y2Ba +gydF4y2Ba 21.1gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1982年gydF4y2Ba ]gydF4y2Ba −gydF4y2Ba 0.0008gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba ×gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1976年gydF4y2Ba ]gydF4y2Ba −gydF4y2Ba 0.005gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba ×gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 1982年gydF4y2Ba ]gydF4y2Ba 。gydF4y2Ba

    因此,估计回归方程为模型如下。gydF4y2Ba

    模型一年gydF4y2Ba 预测MPG对体重gydF4y2Ba
    1970年gydF4y2Ba

    米gydF4y2Ba PgydF4y2Ba ^gydF4y2Ba GgydF4y2Ba =gydF4y2Ba 37.4gydF4y2Ba −gydF4y2Ba 0.006gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba

    1976年gydF4y2Ba

    米gydF4y2Ba PgydF4y2Ba ^gydF4y2Ba GgydF4y2Ba =gydF4y2Ba (gydF4y2Ba 37.4gydF4y2Ba +gydF4y2Ba 4.7gydF4y2Ba )gydF4y2Ba −gydF4y2Ba (gydF4y2Ba 0.006gydF4y2Ba +gydF4y2Ba 0.0008gydF4y2Ba )gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba

    1982年gydF4y2Ba

    米gydF4y2Ba PgydF4y2Ba ^gydF4y2Ba GgydF4y2Ba =gydF4y2Ba (gydF4y2Ba 37.4gydF4y2Ba +gydF4y2Ba 21.1gydF4y2Ba )gydF4y2Ba −gydF4y2Ba (gydF4y2Ba 0.006gydF4y2Ba +gydF4y2Ba 0.005gydF4y2Ba )gydF4y2Ba WgydF4y2Ba egydF4y2Ba 我gydF4y2Ba ggydF4y2Ba hgydF4y2Ba tgydF4y2Ba

之间的关系gydF4y2Ba英里/加仑gydF4y2Ba和gydF4y2Ba重量gydF4y2Ba有一个越来越负斜率随着车型的增加。gydF4y2Ba

情节上回归。gydF4y2Ba

图数据和拟合回归直线。gydF4y2Ba

w = linspace (min(重量),max(重量));图()gscatter(重量、MPG Model_Year,gydF4y2Ba“bgr”gydF4y2Ba,gydF4y2Ba“x.o”gydF4y2Ba)线(w函数宏指令(健康,w,gydF4y2Ba“70”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba“b”gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)线(w函数宏指令(健康,w,gydF4y2Ba“76”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba‘g’gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)线(w函数宏指令(健康,w,gydF4y2Ba“82”gydF4y2Ba),gydF4y2Ba“颜色”gydF4y2Ba,gydF4y2Ba“r”gydF4y2Ba,gydF4y2Ba“线宽”gydF4y2Ba2)标题(gydF4y2Ba“拟合回归模型年行”gydF4y2Ba)gydF4y2Ba

测试不同的斜坡。gydF4y2Ba

测试斜坡之间的显著差异。这相当于测试假说gydF4y2Ba

HgydF4y2Ba 0gydF4y2Ba :gydF4y2Ba βgydF4y2Ba 4gydF4y2Ba =gydF4y2Ba βgydF4y2Ba 5gydF4y2Ba =gydF4y2Ba 0gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba :gydF4y2Ba βgydF4y2Ba 我gydF4y2Ba ≠gydF4y2Ba 0gydF4y2Ba 为gydF4y2Ba 在gydF4y2Ba 至少gydF4y2Ba 一个gydF4y2Ba 我gydF4y2Ba 。gydF4y2Ba

方差分析(适合)gydF4y2Ba
ans = SumSq DF MeanSq F pValue体重2050.2 - 1 2050.2 263.87 3.2055即使Model_Year 807.69 - 2 403.84 51.976 1.2494 e15汽油重量:Model_Year 81.219 - 2 683.74 88 7.7698 40.609 5.2266 0.0071637错误gydF4y2Ba
该输出显示gydF4y2BapgydF4y2Ba测试的价值gydF4y2Ba0.0072gydF4y2Ba(从交互行,gydF4y2Ba重量:Model_YeargydF4y2Ba),所以零假设被拒绝在0.05显著性水平。检验统计量的值gydF4y2Ba5.2266gydF4y2Ba。测试是分子的自由度gydF4y2Ba2gydF4y2Ba系数的数量的零假设。gydF4y2Ba

有足够的证据表明这三个模型的斜坡上是不平等的年。gydF4y2Ba

另请参阅gydF4y2Ba

|gydF4y2Ba|gydF4y2Ba|gydF4y2Ba

相关的例子gydF4y2Ba

更多关于gydF4y2Ba