进行逐步回归
逐步回归是一种系统的方法,在解释响应变量时,根据线性或广义线性模型的统计显著性添加和删除项。该方法从一个初始模型开始,使用指定的modelspec
,然后比较逐渐增大和减小的模型的解释能力。
的stepwiselm
函数使用向前和向后逐步回归来确定最终模型。在每一步中,函数都会根据“标准”
名称-值对的论点。
的默认值“标准”
对于线性回归模型上交所的
. 在这种情况下,,stepwiselm
和一步
的线性模型
使用p价值的F-统计来测试模型在每个步骤中有或没有潜在的项。如果一项目前不在模型中,则零假设是,如果将该项添加到模型中,其系数将为零。如果有足够的证据拒绝零假设,该函数将该项添加到模型中。相反,如果一项目前在模型中,零假设是该项系数为零。如果没有足够的证据来拒绝原假设,该函数将从模型中删除该术语。
逐步回归采用这些步骤时“标准”
是上交所的
:
适合初始模型。
检查一组不在模型中的可用术语。如果有任何条款p-值小于入口公差(也就是说,如果将一项添加到模型中不太可能有零系数),则添加最小的一项p-值并重复此步骤;否则,请转至步骤3。
如果模型中的任何可用条款p-值大于退出公差(即不能拒绝系数为零的假设),删除最大的项p-值并返回到步骤2;否则,结束该过程。
在任何阶段,如果模型不包括作为高阶项子集的所有低阶项,则函数都不会添加高阶项。例如,函数不会尝试添加该项X1:X2^2
除非两者都有X1
和X2 ^ 2
已经在模型中了。类似地,该函数不会删除模型中保留的高阶项子集的低阶项。例如,函数不会尝试删除X1
或X2 ^ 2
如果X1:X2^2
保持在模型中。
的默认值“标准”
对于一个广义线性模型“异常”
.stepwiseglm
和一步
的GeneralizedLinearModel
按照类似的程序添加或删除术语。
您可以使用“标准”
名称-值对的论点。例如,您可以指定Akaike信息标准、贝叶斯信息标准、r平方或调整的r平方的值的更改作为添加或删除项的标准。
根据初始模型中包含的术语以及函数添加和删除术语的顺序,函数可能会从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时,函数终止。但是,不同的初始模型或不同的步骤顺序不能保证更好的拟合。从这个意义上讲,逐步模型是局部最优的,但可能不是全局最优的。
stepwiselm
对分类预测器的处理如下:
一个有绝对预测器的模型l包括水平(类别)l– 1指标变量。模型使用第一个类别作为参考级别,因此不包含参考级别的指标变量。如果分类预测器的数据类型为分类
,然后您可以使用类别
并使用重装猫
自定义参考级别。创建指标变量的详细信息请参见虚拟变量的自动创建.
stepwiselm
治疗组l– 1指标变量作为单个变量。如果要将指标变量视为不同的预测变量,请使用手动创建指标变量dummyvar
. 然后,在拟合模型时,使用指标变量,但与分类变量的参考级别相对应的变量除外。对于分类预测器X
,如果指定dummyvar(X)
和截距项作为预测器,则设计矩阵变得秩亏。
连续预测器和分类预测器之间的交互项l层次由元素的乘积组成l– 1具有连续预测器的指标变量。
两个分类预测因子之间的相互作用项l和米级别包括(l– 1)*(米- 1)指标变量包括两个分类预测水平的所有可能组合。
不能为绝对预测器指定高阶项,因为指示器的平方等于它本身。
因此,如果stepwiselm
添加或删除一个分类预测器,该函数实际上在一个步骤中添加或删除一组指示器变量。类似地,如果stepwiselm
添加或删除带有分类预测器的交互项,该函数实际添加或删除包含分类预测器的交互项组。
stepwiselm
认为南
,”
(空字符向量),""
(空字符串),< >失踪
,<未定义>
值资源描述
,X
,Y
将丢失值。stepwiselm
不使用拟合中缺少值的观测值。这个ObservationInfo
拟合模型的属性表示是否stepwiselm
在fit中使用每个观察值。
您可以使用fitlm
,然后手动调整模型使用一步
,addTerms
,或removeTerms
.