该示例示出了如何使用分类阵列以执行与分类协变量回归和GydF4y2BafitlmGydF4y2Ba
。GydF4y2Ba
加载GydF4y2BacarsmallGydF4y2Ba
变量GydF4y2BaMPGGydF4y2Ba
包含每100台车加仑英里数的测量。每节车厢的车型年在变量GydF4y2BaModel_YearGydF4y2Ba
和GydF4y2Ba重量GydF4y2Ba
包含每辆车的重量。GydF4y2Ba
画出散点图GydF4y2BaMPGGydF4y2Ba
反对GydF4y2Ba重量GydF4y2Ba
通过车型年分组。GydF4y2Ba
图()gscatter(重量,MPG,Model_Year,GydF4y2Ba'BGR'GydF4y2Ba,GydF4y2Ba'X.O'GydF4y2Ba)标题(GydF4y2Ba“MPG与重量,车型年份分组”GydF4y2Ba)GydF4y2Ba
分组变量,GydF4y2BaModel_YearGydF4y2Ba
,有三个独特的价值观,GydF4y2Ba70GydF4y2Ba
,GydF4y2Ba76GydF4y2Ba
和GydF4y2Ba82GydF4y2Ba
,对应于模型1970年,1976年,和1982年。GydF4y2Ba
创建包含变量表GydF4y2BaMPGGydF4y2Ba
,GydF4y2Ba重量GydF4y2Ba
和GydF4y2BaModel_YearGydF4y2Ba
。转换变量GydF4y2BaModel_YearGydF4y2Ba
到一个分类数组。GydF4y2Ba
汽车=表(MPG,重量,Model_Year);cars.Model_Year =分类(cars.Model_Year);GydF4y2Ba
使用适合回归模型GydF4y2BafitlmGydF4y2Ba
同GydF4y2BaMPGGydF4y2Ba
作为因变量,和GydF4y2Ba重量GydF4y2Ba
和GydF4y2BaModel_YearGydF4y2Ba
作为独立变量。因为GydF4y2BaModel_YearGydF4y2Ba
是三个层次分类协变量,它应该进入模型的两个指标变量。GydF4y2Ba
散点图显示,斜率GydF4y2BaMPGGydF4y2Ba
反对GydF4y2Ba重量GydF4y2Ba
可能每个模型一年有所不同。为了评估这一点,包括重量年相互作用项。GydF4y2Ba
该模型是GydF4y2Ba
哪里GydF4y2Ba一世GydF4y2Ba[1976]和GydF4y2Ba一世GydF4y2Ba[1982]是指示车型年1976年分别和1982年虚拟变量。GydF4y2Ba一世GydF4y2Ba[1976]取值为1,如果车型年是1976年,取值0,如果事实并非如此。GydF4y2Ba一世GydF4y2Ba[1982]取值为1,如果车型年是1982年,取值0,如果事实并非如此。在这个模型中,1970年为基准年。GydF4y2Ba
适合= fitlm(汽车,GydF4y2Ba'MPG〜重量* Model_Year'GydF4y2Ba)GydF4y2Ba
适合=线性回归模型:MPG〜1个+重量* Model_Year估计系数:估计SE ___________ __________(截距)37.399 2.1466重量-0.0058437 0.00061765 Model_Year_76 4.6903 2.8538 Model_Year_82 21.051 4.157重量:Model_Year_76 -0.00082009 0.00085468重量:Model_Year_82 -0.0050551 0.0015636 TSTAT p值__________________(截距)17.423 2.8607e-30重量-9.4612 4.6077e-15 Model_Year_76 1.6435 0.10384 Model_Year_82 5.0641 2.2364e-06重量:Model_Year_76 -0.95953 0.33992重量:Model_Year_82 -3.2329 0.0017256观测数:94,错误自由度:88根均方误差:2.79 R平方:0.886,调整R平方:0.88 F统计与常数模型:137,p值= 5.79e-40GydF4y2Ba
回归输出显示:GydF4y2Ba
fitlmGydF4y2Ba
识别GydF4y2BaModel_YearGydF4y2Ba
作为分类变量,和构建体所需的指示器(虚设)变量。默认情况下,第一个层次,GydF4y2Ba70GydF4y2Ba
,是参照组(使用GydF4y2BareordercatsGydF4y2Ba
改变参考组)。GydF4y2Ba
该模型规范,GydF4y2BaMPG〜重量* Model_YearGydF4y2Ba
时,指定用于第一阶项GydF4y2Ba重量GydF4y2Ba
和GydF4y2BaModel_YearGydF4y2Ba
和所有交互。GydF4y2Ba
该模型GydF4y2Ba[RGydF4y2Ba2GydF4y2Ba= 0.886,这意味着在每加仑英里的变化由88.6%,当你考虑重量,车型年,和它们之间的相互作用降低。GydF4y2Ba
拟合模型是GydF4y2Ba
因此,估计回归方程模型多年如下。GydF4y2Ba
型号年份GydF4y2Ba | 预计MPG反对重量GydF4y2Ba |
---|---|
1970年GydF4y2Ba |
|
1976年GydF4y2Ba |
|
1982年GydF4y2Ba |
|
之间的关系GydF4y2BaMPGGydF4y2Ba
和GydF4y2Ba重量GydF4y2Ba
有越来越多的负斜率为模型按年升幅。GydF4y2Ba
图中的数据和拟合回归线。GydF4y2Ba
W = linspace(分钟(重量),最大值(重量));图()gscatter(重量,MPG,Model_Year,GydF4y2Ba'BGR'GydF4y2Ba,GydF4y2Ba'X.O'GydF4y2Ba)线(W,feval(配合,W,GydF4y2Ba'70'GydF4y2Ba)GydF4y2Ba'颜色'GydF4y2Ba,GydF4y2Ba'B'GydF4y2Ba,GydF4y2Ba'行宽'GydF4y2Ba,2)行(W,feval(配合,W,GydF4y2Ba'76'GydF4y2Ba)GydF4y2Ba'颜色'GydF4y2Ba,GydF4y2Ba'G'GydF4y2Ba,GydF4y2Ba'行宽'GydF4y2Ba,2)行(W,feval(配合,W,GydF4y2Ba'82'GydF4y2Ba)GydF4y2Ba'颜色'GydF4y2Ba,GydF4y2Ba'R'GydF4y2Ba,GydF4y2Ba'行宽'GydF4y2Ba,2)标题(GydF4y2Ba“拟合回归线按型号年份”GydF4y2Ba)GydF4y2Ba
试验的山坡之间显著的差异。这相当于检验的假设GydF4y2Ba
方差分析(FIT)GydF4y2Ba
ANS = SUMSQ DF MeanSq˚Fp值重量2050.2 1 2050.2 263.87 3.2055e-28 Model_Year 807.69 2 403.84 51.976 1.2494e-15重量:Model_Year 81.219 2 40.609 5.2266 0.0071637错误683.74 88 7.7698GydF4y2Ba
0.0072GydF4y2Ba
(从相互作用行,GydF4y2Ba重量:Model_YearGydF4y2Ba
),所以零假设是在0.05显着性水平拒绝。检验统计量的值是GydF4y2Ba5.2266GydF4y2Ba
。用于测试的分子自由度是GydF4y2Ba2GydF4y2Ba
,这是在零假设系数的数量。GydF4y2Ba
有足够的证据表明斜率不等于所有三个车型年。GydF4y2Ba
方差分析GydF4y2Ba
|GydF4y2Ba明确的GydF4y2Ba
|GydF4y2BafitlmGydF4y2Ba
|GydF4y2BareordercatsGydF4y2Ba