主要内容

步骤行程

执行逐步回归

描述

例子

MDL.=逐步(TBL.为表或数据集数组中的变量创建一个线性模型TBL.使用逐步回归从恒定模型开始添加或删除预测器。步骤行程使用最后一变量TBL.作为响应变量。步骤行程使用向前和向后的逐步回归来确定最终模型。在每个步骤中,函数根据值的值搜索术语以将模型添加到模型或从模型中删除'标准'争论。

例子

MDL.=逐步(Xy创建响应的线性模型y到数据矩阵中的预测器变量X

例子

MDL.=逐步(___Modelspec.指定启动模型Modelspec.使用以前的语法中的任何输入参数组合。

例子

MDL.=逐步(___名称,价值使用一个或多个名称值对参数指定其他选项。例如,您可以指定在模型中使用的最小或最大术语集的分类变量,采用的最大步数或标准步骤行程用于添加或删除术语。

例子

全部收缩

加载hal数据集,测量水泥组合物对硬化热量的影响。

加载hal

此数据集包括变量成分. 矩阵成分包含水泥中四种化学成分的百分比。向量含有每个水泥样品180天后热硬化的值。

适合数据的逐步线性回归模型。将0.06指定为标准为模型添加术语的阈值。

mdl =步骤(成分,热,'penter',0.06)
1.添加x4,fstat = 22.7985,pvalue = 0.000576232 2.添加x1,fstat = 108.2239,pvalue = 1.105281e-06 3.添加x2,fstat = 5.0259,pvalue = 0.051687 4.去除x4,fstat = 1.8633,pvalue =0.2054
MDL =线性回归模型:Y〜1 + X1 + X2估计系数:估计系数PVALUE ________ ______________________(拦截)52.577 2.2862 22.998 5.4566E-10 x1 1.4683 0.1213 12.105 2.69225 0.045855 14.442 0.045855 14.442 5.029E-08观察次数:13,自由度误差:10根均匀误差:2.41 R线:0.979,调整R线:0.974 F统计与常数型号:230,P值= 4.41e-09

默认情况下,启动模型是常量模型。步骤行程执行前进选择并添加X4X1, 和X2术语(按此顺序),因为相应的P.- 值得小于p价值0.06。步骤行程然后使用后向消除并删除X4从模型中,因为,一次X2在模型中,P.-的价值X4大于的默认值主体,0.1。

使用存储在数据集数组中的变量执行逐步回归。使用Wilkinson表示法指定启动模型,并使用可选参数标识响应和预测器变量。

加载样本数据。

加载医院

医院数据集阵列包括患者的性别,年龄,体重和吸烟状态。

用恒定术语的起始模型适合线性模型吸烟者作为预测变量。指定响应变量,重量,以及分类预测变量,性别年龄, 和吸烟者

mdl = stepwiselm(医院,'重量〜1 +吸烟者'...'responsevar''重量''predictorvars',{“性”'年龄'“吸烟者”},...'patoricalvar',{“性”“吸烟者”})
1.添加性别,FSTAT = 770.0158,PVALUE = 6.262758E-48 2.拆除吸烟者,FSTAT = 0.21224,PVALUE = 0.64605
MDL =线性回归模型:重量〜1 +性别估计系数:估计e________________________(拦截)130.47 1.1995 108.77 5.2762E-104 SEX_MALE 50.06 1.7496 28.612 2.2464E-49观察数:100,误差自由度:98根均方误差:8.73 R线:0.893,调整R线:0.892 F统计与常数型号:819,P值= 2.25E-49

在每一步,步骤行程搜索术语要添加和删除。在第一步,逐步算法添加性别用一个模型 P. - 6.26E-48的价值。然后,从给出的模型中移除吸烟者性别在模型中,变量吸烟者变得多余。步骤行程只包括性别在最终的线性模型中。根据年龄或吸烟状况,患者的体重似乎没有显著差异。

加载样本数据集并定义预测器的矩阵。

加载Carsmall.x = [加速,重量];

使用术语矩阵定义起始模型和上层模型。

t_starting = [0 0 0]%常量模型
t_starting =.1×3.0 0 0.
T_Upper = [0 0 0; 1 0 0; 0 1 0; 1 1 0]百分比与交互的线性模型
托普=4×30 0 0 1 0 0 0 1 0 1 1 0

使用逐步回归创建线性回归模型。使用术语矩阵指定起始模型和模型的上限,并指定'verbose'作为2显示评估过程和每一步所采取的决定。

mdl = stepwiselm(x,mpg,t_starting,'上',t_upper,'verbose',2)
添加X1的pvalue是4.0973e-06添加X2的pvalue是1.6434E-28 1.添加x2,fstat = 259.3087,pvalue = 1.643351e-28添加x1 pvalue是0.18493无候选条款删除
MDL =线性回归模型为:y〜1个+ X2估计系数:估计SE TSTAT p值__________ _________ _______ __________(截距)49.238 1.6411 30.002 2.7015e-49 X2 -0.0086119 0.0005348 -16.103 1.6434e-28编号的观察:94,错误度自由:92根均匀误差:4.13 R线:0.738,调整R线:0.735 F统计与常数型号:259,P值= 1.64E-28

使用逐步回归使用分类预测器的线性回归模型。步骤行程在一步中添加或删除一组指示器变量以添加或删除分类预测器。此示例还显示了如何手动创建指示器变量并将其传递给步骤行程以便步骤行程将每个指标变量视为单独的预测值。

加载Carsmall.数据集,并使用该表创建一个表重量model_year., 和MPG变量。

加载Carsmall.年=分类(model_year);TBL1 =表(MPG,重量,年);

适合线性回归模型MPG采用逐步回归法。将起始模型指定为的函数重量。将模型的上限设置为'poly21',这意味着模型最多可以包含一个常量和术语重量重量^ 2., 和重量*一年。指定'verbose'作为2显示评估过程和每一步所采取的决定。

mdl1 = stepwiselm(tbl1,'mpg〜weight''上''poly21''verbose',2)
添加年份的Pvalue是8.2284E-15加入重量^ 2为0.15454 1.加入年份,Fstat = 47.5136,Pvalue = 8.22836E-15加入重量的pvalue ^ 2为0.0022303百分比加入重量:年为0.0071637 2。添加重量^ 2,fstat = 9.9164,pvalue = 0.0022303加入重量的pvalue:年份为0.19519 Pvalue,用于去除年份为2.9042E-16
MDL1 =线性回归型号:MPG〜1 +重量+重量+重量^ 2估计系数:估计系数pvalue __________ ______________________________________________________________________________________________________7114 11.505.016404 0.0031249 -5.2493 1.0283E-06.2493 1.0283E-06年份0.71491 2.9215 0.0044137年_ 81210 0.041 2.6364E-16重量^ 2 1.5573E-06 4.149 0.0022303观察数:94,误差自由度:89根均匀误差:2.78 R线:0.885,调整r-SQUARED:0.88 F统计与常数型号:172,P值= 5.52E-41

步骤行程创建两个指标变量,年份.76年份.82, 因为包括三个不同的值。

因为'verbose'是2,步骤行程显示评估过程:

  • 步骤行程创建模型作为一个函数重量

  • 步骤行程计算P.-用于添加的值要么重量^ 2.。这P.- value不到两者P.- value重量^ 2.默认阈值0.05;所以,步骤行程补充.到模型。

  • 步骤行程计算P.-用于添加的值体重:年要么重量^ 2.。因为这P.- value重量^ 2.低于P.- value体重:年, 这步骤行程功能补充说重量^ 2.到模型。

  • 加上二次项之后,步骤行程计算P.- 加入的价值体重:年再次,但是P.-Value大于阈值。所以,步骤行程不将术语添加到模型中。步骤行程不检查添加重量^ 3.由于'上'名称值对参数。

  • 步骤行程寻找删除的条款。步骤行程已经检查过重量^ 2.,所以它只计算P.- 删除value.。因为这P.-Value小于默认阈值0.10,步骤行程不删除该术语。

  • 虽然允许的最大步骤数为5,但是步骤行程在两个步骤之后终止过程,因为模型不会通过添加或移除术语来改善。

步骤行程将两个指示器变量视为一个预测变量并添加一步。将两个指示器变量视为两个不同的预测变量,使用戴维尔创建单独的分类变量。

温度年=dummyvar(年);年份=逻辑(临时年份(:,2));年份82=逻辑(临时年份(:,3));

创建一个包含的表MPG重量年份.76, 和年份.82

TBL2 =表(MPG,重量,年份,年份,年份);

从用于的相同启动模型创建逐步线性回归模型MDL1

mdl2=逐步LM(tbl2,'mpg〜weight''上''poly211'
1.添加年份_82,fstat = 83.1956,pvalue = 1.76163E-14 2.添加重量:年份_82,fstat = 8.0641,pvalue = 0.0055818 3.添加年份= 0.0055818 3.添加年份_76,fstat = 8.1284,pvalue = 0.0054157
MDL2 =线性回归模型:MPG〜1 +年_76 +重量*年份估计系数:估计系数:估计SE TSTAT PVALUE __________ ___________________________1.5294 25.397 1.503220-25岁__1.76_1 2.0395 0.71537 2.0395 0.71537 2.8510.0054157年_82_1 19.6.0623 2.21623 2.21623 2.21623 2.21623 2.21632-06重量:年份_ 8.0880 0.00114979 -3.0888 0.00114979 -3.0888 0.0026806观察数:94,误差自由度:89根均匀误差:2.79 r断层:0.885,调整R线:0.88统计与常量型号:171,p值= 6.54e-41

模型MDL2.包括互动项重量:年份_82_1代替重量^ 2.,术语包含在MDL1

输入参数

全部收缩

输入数据包括预测器和响应变量,指定为表或数据集数组。预测变量可以是数字,逻辑,分类,字符或字符串。响应变量必须是数字或逻辑的。

  • 默认情况下,步骤行程将最后一个变量作为响应变量和其他变量作为预测变量。

  • 要将不同的列设置为响应变量,请使用响应官员名称值对参数。

  • 要使用列的子集作为预测器,请使用预测orvars名称值对参数。

  • 要定义模型规范,请设置Modelspec.参数使用公式或术语矩阵。公式或术语矩阵指定要用作预测器或响应变量的列。

表中的变量名称不必有效MATLAB®身份标识。但是,如果名称无效,则在适合或调整模型时,您不能使用公式;例如:

  • 不能指定Modelspec.使用公式。

  • 使用时,不能使用公式指定要添加或删除的术语addterms.功能或者removeterms.功能分别。

  • 您无法使用公式指定当您使用时模型的下限和上限要么步骤行程使用名称值对参数的函数'降低''上', 分别。

您可以验证变量名称TBL.通过使用isvarname.功能。如果变量名称无效,则可以使用使用的转换它们matlab.lang.makevalidname.功能。

预测变量,指定为一个N.-借-P.矩阵,其中N.是观察人数和P.是预测变量的数量。每列X表示一个变量,每行代表一个观察。

默认情况下,模型中存在一个常量术语,除非您显式删除它,因此不包含1S的列X

数据类型:单身的|双重的

响应变量,指定为一个N.-1 vector,在哪里N.是观察人数。每个条目y是对应行的响应X

数据类型:单身的|双重的|逻辑

逐步回归启动模型,指定为以下之一:

  • 字符向量或字符串标量命名模型。

    价值 模型类型
    “常数” 模型仅包含一个常数(拦截)术语。
    '线性' 模型包含每个预测器的截距和线性术语。
    '互动' 该模型包含一个截距、每个预测器的线性项以及不同预测器对的所有乘积(无平方项)。s manbetx 845
    'purequadratic' 模型包含每个预测器的截距项和线性和平方术语。
    '二次' 模型包含每个预测器的截距,线性和平方术语,以及所有不同预测器的所有产品。s manbetx 845
    'Poly.IJK.' 模型是一种多项式,所有条款均可获得程度一世在第一个预测器中,度j在第二个预测因子,等等。通过使用数字来指定每个预测器的最大程度。但是模型包含交互术语,但每个交互项的程度不超过指定度的最大值。例如,“poly13”有一个拦截和X1X2X22X23.X1*X2, 和X1*X22条件,在哪里X1X2是第一和第二预测因子。
  • 一种T.-借-(P.+ 1)矩阵,或者术语矩阵,在模型中指定术语,在哪里T.是术语数量和数量P.是预测变量的数量,+1表示响应变量。当预测器的数量很大并且您希望以编程方式生成术语时,术语矩阵非常方便。

  • 字符矢量或字符串标量公式在形式

    'Y〜术语'

    那里术语Wilkinson表示法。公式中的变量名称必须是变量名称TBL.或指定的可变名称varnames.。此外,变量名称必须是有效的MATLAB标识符。

    该软件通过使用术语顺序确定拟合模型中的术语顺序TBL.要么X。因此,模型中的术语顺序可以与指定公式中的术语顺序不同。

如果要在模型中指定最小或最大的术语步骤行程适合,使用降低名称值对参数。

数据类型:烧焦|一串|单身的|双重的

名称值对参数

指定可选的逗号分离对名称,价值论点。名称是参数名称和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:'标准','aiC','上','互动','verbose',1指导步骤行程要使用Akaike Information标准,请在每个步骤中显示其需要的操作,并在模型中的大多数交互术语中包含。

分类变量列表,指定为逗号分隔的配对组成'pationalvars'以及包含表或数据集数组中的分类变量名称的字符数阵列或单元格数组TBL.或指示哪个列是分类的逻辑或数字索引矢量。

  • 如果数据位于表或数据集数组中TBL.然后,默认情况下,步骤行程将字符向量的所有分类值、逻辑值、字符数组、字符串数组和单元格数组视为分类变量。

  • 如果数据处于矩阵中X,然后是默认值'pationalvars'是一个空矩阵[]。也就是说,除非您将其指定为分类,否则没有变量是分类的。

例如,您可以使用以下任一分类指定六个中的第二个和第三变量:

例子:'patoricalvars',[2,3]

例子:“CategoricalVars”,逻辑([0 1 1 0 0 0])

数据类型:单身的|双重的|逻辑|一串|细胞

添加或删除术语的标准,指定为逗号分隔对组成'标准'和其中一个值:

  • “上世纪”-P.- value forF-由于添加或删除项而导致的误差平方和变化的测试

  • 'AIC'- 改变Akaike信息标准(AIC)

  • 'BIC'- 改变贝叶斯信息标准(BIC)的价值

  • “rsquared”- 增加价值R.2

  • 'adjrsquared'- 增加调整的值R.2

例子:'标准','bic'

从拟合中排除的观察,指定为逗号分隔的配对'排除'以及逻辑或数字索引向量,指示要从拟合中排除哪些观测值。

例如,您可以使用以下任一实施例排除6个中的观察2和3。

例子:'排除',[2,3]

例子:'排除',逻辑([0 1 1 0 0 0])

数据类型:单身的|双重的|逻辑

符合术语(拦截)的指示符,指定为逗号分隔对组成'截距'和任何一种真的包括或者错误的从模型中删除常数项。

采用'截距'仅在使用字符向量或字符串标量指定模型时,而不是公式或矩阵。

例子:'拦截',假

模型规范描述无法从模型中删除的术语,指定为包括的逗号分隔对'降低'和其中一个选择Modelspec.命名模型。

例子:'下','线性'

以逗号分隔的配对指定的最大步数次数'nsteps'和一个正整数。

例子:'nsteps',5

数据类型:单身的|双重的

添加术语的标准的阈值,指定为包括的逗号分隔对'penter'和标量值,如本表中所述。

标准 默认值 决定
“上世纪” 0.05 如果是P.- 左边的价值F- 职业少于pP.-Value进入),将术语添加到模型中。
'AIC' 0. 如果模型的AIC的变化小于p,将术语添加到模型中。
'BIC' 0. 如果模型的BIC的变化小于p,将术语添加到模型中。
'rsquared' 0.1 如果模型R平方值的增加大于p,将术语添加到模型中。
'adjrsquared' 0. 如果模型的调整R平方值的增加大于p,将术语添加到模型中。

有关更多信息,请参阅标准名称值对参数。

例子:'penter',0.075

要在拟合中使用的预测变量,指定为逗号分隔对,由'predictorvars'以及表或数据集数组中变量名称的字符数阵列或单元格数组TBL.或指示哪个列是预测变量的逻辑或数字索引向量。

字符串值或字符向量应在名称中TBL.或者使用您使用的名称'varnames'名称值对参数。

默认值是所有变量X,或所有变量TBL.除了响应官员

例如,您可以使用以下任一示例指定作为预测器变量的第二个和第三变量。

例子:'predictorvars',[2,3]

例子:'predictorvars',逻辑([0 1 1 0 0 0])

数据类型:单身的|双重的|逻辑|一串|细胞

删除术语的标准的阈值,指定为逗号分隔的对组成'premove'和标量值,如本表中所述。

标准 默认值 决定
“上世纪” 0.10 如果是P.- 左边的价值F- 术大于主体P.- 要删除),从模型中删除术语。
'AIC' 0.01 如果模型的AIC的变化大于主体,从模型中删除术语。
'BIC' 0.01 如果模型的BIC的变化大于主体,从模型中删除术语。
'rsquared' 0.05 如果模型的R平方值的增加小于主体,从模型中删除术语。
'adjrsquared' -0.05 如果模型的调整R平方值的增加小于主体,从模型中删除术语。

在每一步中步骤行程功能还检查当前模型中的其他术语是否冗余(线性依赖)。当任意术语与当前模型中的其他术语线性依赖时,步骤行程功能删除冗余项,无论标准值如何。

有关更多信息,请参阅标准名称值对参数。

例子:'memoove',0.05

用于适合的响应变量,指定为逗号分隔的对组成'responsevar'以及包含表或数据集数组中的变量名称的字符向量或字符串标量TBL.,或指示哪列是响应变量的逻辑或数字索引向量。您通常需要使用'responsevar'拟合表或数据集数组时TBL.

例如,您可以指定第四个变量,例如屈服,作为六个变量的响应,以下列方式之一。

例子:'Responalvar','收益'

例子:'ResponalVar',[4]

例子:'ResponalVar',逻辑([0 0 0 1 0 0])

数据类型:单身的|双重的|逻辑|烧焦|一串

描述拟合中最大术语集的模型规范,指定为逗号分隔对,由'上'和其中一个选择Modelspec.命名模型。

例子:'上','二次'

变量的名称,指定为逗号分隔的配对组成'varnames'和字符串数组或字符向量的单元数组,包括列的名称X首先,以及响应变量的名称y最后的。

'varnames'不适用于表格或数据集数组中的变量,因为这些变量已经有名称。

变量名称不必是有效的MATLAB标识符。但是,如果名称无效,则在适合或调整模型时,您不能使用公式;例如:

  • 使用时,不能使用公式指定要添加或删除的术语addterms.功能或者removeterms.功能分别。

  • 您无法使用公式指定当您使用时模型的下限和上限要么步骤行程使用名称值对参数的函数'降低''上', 分别。

在指定之前'varnames',varnames,您可以验证变量名称varnames.通过使用isvarname.功能。如果变量名称无效,则可以使用使用的转换它们matlab.lang.makevalidname.功能。

例子:‘VarNames’、{‘马力’、‘加速’、‘车型年’、‘MPG’}

数据类型:一串|细胞

控制信息显示,指定为逗号分隔的对'verbose'和其中一个值:

  • 0.- 禁止所有显示。

  • 1-显示在每个步骤中执行的操作。

  • 2- 显示评估过程和每个步骤所采取的动作。

例子:“冗长”,2

观察权重,指定为逗号分隔的配对组成'重量'N.- 1个非负标量值矢量,在哪里N.是观察人数。

数据类型:单身的|双重的

输出参数

全部收缩

表示对数据响应的最小二乘拟合的线性模型,作为a返回linearmodel.目的。

对于线性模型对象的属性和方法,MDL.,请参阅linearmodel.类页面。

更多关于

全部收缩

术语矩阵

术语矩阵T.是A.T.-借-(P.+ 1)矩阵指定模型中的术语,其中T.是术语数量,P.是预测变量的数量,+1帐户响应变量。的价值T(i,j)是变量的指数j术语一世

例如,假设输入包括三个预测变量X1X2, 和X3和响应变量y按顺序X1X2X3, 和y。每一排T.代表一个术语:

  • [0 0 0 0]- 常数术语或拦截

  • [0 1 0 0]-X2;同等,x1 ^ 0 * x2 ^ 1 * x3 ^ 0

  • [1 0 1 0]-x1 * x3

  • [2 0 0 0]-x1 ^ 2

  • [0 1 2 0]-x2*(x3^2)

0.在每个术语的末尾表示响应变量。通常,术语矩阵中零的列向量表示响应变量的位置。如果您在矩阵和列向量中有预测器和响应变量,则必须包含0.对于每行的最后一列中的响应变量。

公式

模型规范的公式是表单的字符向量或字符串标量'y术语'

  • y是响应名称。

  • 术语表示使用Wilkinson表示法的模型中的预测术语。

要表示预测器和响应变量,请使用表输入的变量名称TBL.或使用的变量名称VarNames。默认值VarNames{'x1','x2',...,'xn','y'}

例如:

  • “y~x1+x2+x3”指定具有截距的三个可变线性模型。

  • 'y〜x1 + x2 + x3 - 1'指定一个无拦截的三变线性模型。请注意,默认情况下,公式包括常量(拦截)术语。要从模型中排除常量术语,您必须包含–1在公式。

公式包括常数术语,除非您明确地删除术语–1

Wilkinson表示法

Wilkinson表示法描述了模型中存在的术语。符号涉及模型中存在的术语,而不是那些术语的乘法器(系数)。

Wilkinson表示法使用这些符号:

  • +意味着包括下一个变量。

  • -意味着不包括下一个变量。

  • 定义交互,这是术语的份额。

  • *定义交互和所有低阶项。

  • ^将预测器提升到电力,完全如此*重复,所以^也包括低阶术语。

  • ()群体条款。

此表显示了Wilkinson表示法的典型示例。

Wilkinson表示法 标准符号术语
1 常数(拦截)术语
X1 ^ K.哪里K.是一个正整数 X1X12,......,X1K.
x1 + x2 X1X2
x1 * x2 X1X2x1 * x2
x1:x2 x1 * x2只要
-x2 不包括X2
x1*x2+x3 X1X2X3x1 * x2
x1+x2+x3+x1:x2 X1X2X3x1 * x2
x1*x2*x3–x1:x2:x3 X1X2X3x1 * x2x1 * x3x2 * x3
x1 *(x2 + x3) X1X2X3x1 * x2x1 * x3

有关详细信息,请参阅Wilkinson表示法

提示

  • 您不能使用逐步回归使用强大的回归。使用前检查您的异常值步骤行程

  • 对于其他方法,如Anova.或者属性linearmodel.对象,参见linearmodel.

  • 培训模型后,您可以生成C / C ++代码,该代码预测新数据的响应。生成C / C ++代码需要Matlab Coder™。有关详细信息,请参阅代码生成简介

算法

  • 逐步回归是基于解释响应变量的统计学意义,从线性或广义线性模型添加和移除术语的系统方法。该方法以初始模型开始,指定使用Modelspec.,然后比较逐渐更大且较小模型的解释性。

    步骤行程函数使用向前和向后逐步回归来确定最终模型。在每个步骤中,函数搜索术语以基于该值添加到模型或从模型中删除'标准'名称值对参数。

    默认值'标准'对于线性回归模型“上世纪”。在这种情况下,步骤行程linearmodel.使用P.- A.F- 在每个步骤中使用和没有潜在术语的测试模型。如果术语当前不是该模型中,则返回null假设是如果添加到模型中,术语将具有零系数。如果有足够的证据来拒绝零假设,则该函数将术语添加到模型中。相反,如果术语当前在模型中,则空假设是该术语具有零系数。如果没有足够的证据来拒绝空假设,则该函数从模型中删除术语。

    逐步回归何时采取这些步骤'标准'“上世纪”

    1. 适合初始模型。

    2. 检查模型中的一组可用术语。如果任何条款都有P.-Values小于入射容差(即,如果在模型中添加了零系数的术语不太可能的,则,如果添加到模型中,则添加最小的术语P.- value并重复这一步;否则,转到第3步。

    3. 如果模型中的任何可用术语都有P.-Values大于退出公差(即,不能拒绝零系数的假设),删除最大的术语P.- 留下并返回步骤2;否则,结束过程。

    在任何阶段,如果该模型也不包括较高阶项的子集的所有低阶项,则该函数将不会添加高阶项。例如,该函数不会尝试添加该术语x1:x2 ^ 2除非两者都是X1x2 ^ 2已经在模型中。类似地,该功能不会删除是留在模型中的高阶项的子集的低阶项。例如,该函数不会尝试删除X1要么x2 ^ 2如果x1:x2 ^ 2仍然在模型中。

    默认值'标准'对于广义的线性模型是'偏见'挺身油GeneralizedLinearModel.遵循类似的过程来添加或删除术语。

    您可以使用使用方法指定其他标准'标准'名称值对参数。例如,您可以指定Akaike信息标准的值,贝叶斯信息标准,R线或调整的R线为标准作为添加或删除术语的标准。

    根据初始模型中包含的术语以及函数添加和删除术语的顺序,函数可能会从同一组潜在术语构建不同的模型。当没有单个步骤改进模型时,函数终止。但是,不同的初始模型或不同的步骤顺序不能保证更好的拟合。从这个意义上讲,逐步模型是局部最优的,但可能不是全局最优的。

  • 步骤行程处理分类预测器,如下所示:

    • 具有分类预测指标的模型L.级别(类别)包括L.– 1指示器变量。该模型使用第一类作为参考级别,因此它不包括参考级别的指示灯。如果分类预测器的数据类型是分类,然后您可以通过使用查看类别的顺序类别并通过使用重新排序类别雷德斯自定义参考级别。有关创建指示器变量的更多详细信息,请参阅自动创建虚拟变量

    • 步骤行程对待一组L.– 1指示器变量作为单个变量。如果要将指示器变量视为不同的预测器变量,请通过使用手动创建指示器变量戴维尔。然后使用指示器变量,除了适合模型时对应于分类变量的参考级别的字符。对于分类预测因子X,如果指定dummyvar(x)并且作为预测器的截距术语,然后设计矩阵变为缺陷。

    • 连续预测因子与分类预测器之间的交互术语L.级别由元素 - 明智的产品组成L.– 1具有连续预测器的指标变量。

    • 两个分类预测因子之间的相互作用项L.m级别包括L.- 1)*(m- 1)指示器变量包括两个分类预测器级别的所有可能组合。

    • 您无法为分类预测器指定高阶项,因为指示符的平方等于其自身。

    因此,如果步骤行程添加或删除分类预测器,函数实际上在一步中添加或删除指示器变量组。同样,如果步骤行程通过分类预测器添加或删除交互项,该功能实际地添加或删除包括分类预测器的交互术语。

  • 步骤行程考虑''(空字符向量),(空字符串),<缺失>, 和<未定义>价值TBL.X, 和y缺少值。步骤行程不使用符合缺失值的观察结果。这观察税收拟合模型的属性表示是否步骤行程使用适合的每个观察。

替代功能

介绍在R2013B.