主要内容

stepwiselm

进行逐步回归

描述

例子

mdl= stepwiselm (资源描述)表中创建一个线性模型的变量或数组的数据集资源描述使用逐步回归来添加或删除预测,从一个常数模型。stepwiselm使用的最后一个变量资源描述作为反应变量。stepwiselm使用向前和向后逐步回归来确定最终的模型。在每个步骤中,函数搜索术语来添加或删除从模型的模型,基于价值的“标准”论点。

例子

mdl= stepwiselm (X,y)创建一个线性模型的响应y预测变量的数据矩阵X

例子

mdl= stepwiselm (___,modelspec)指定起始模型modelspec使用任何输入参数组合在以前的语法。

例子

mdl= stepwiselm (___,名称,值)使用一个或多个指定附加选项名称-值对参数。例如,您可以指定分类变量,最小或最大的一组术语使用模型中,步骤的最大数目,或标准stepwiselm用来添加或删除。

例子

全部折叠

加载哈尔德数据集的措施在其硬化水泥成分热的影响。

负载哈尔德

这个数据集包含的变量成分。矩阵成分包含四个化学物质的百分比组成的水泥。向量包含的值为每个水泥样品加热硬化后180天。

适合逐步线性回归模型的数据。指定标准的0.06作为阈值项添加到模型。

mdl = stepwiselm(成分、热、“囚禁”,0.06)
1。添加x4, FStat = 22.7985, pValue = 0.000576232 - 2。添加x1, FStat = 108.2239, pValue = 1.105281 e-06 3。添加x2, FStat = 5.0259, pValue = 0.051687 - 4。删除x4, FStat = 1.8633, pValue = 0.2054
mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue说______ __________(拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整平方:0.974 f统计量与常数模型:230年,假定值= 4.41 e-09

默认情况下,模型是一个常数模型开始。stepwiselm执行选择和添加x4,x1,x2(依次),因为相应的p值小于被关闭的值为0.06。stepwiselm然后使用落后的取消和删除x4从模型中,因为一次x2在模型中,p价值的x4大于的默认值吗PRemove0.1点。

使用变量存储在一个数据集执行逐步回归数组。指定起始模型使用威尔金森符号和识别和预测变量使用可选参数的响应。

加载示例数据。

负载医院

医院数据集阵列包括性别、年龄、体重、吸烟状态的病人。

符合线性模型与模型的常数项和开始吸烟者作为预测变量。指定响应变量,重量分类预测变量,,年龄,吸烟者

mdl = stepwiselm(医院,的体重~ 1 +抽烟',“ResponseVar”,“重量”,“PredictorVars”,{“性”,“年龄”,“抽烟”},“CategoricalVar”,{“性”,“抽烟”})
1。添加性、函数= 770.0158 pValue = 6.262758 e-48 2。去除抽烟,FStat = 0.21224, pValue = 0.64605
mdl =线性回归模型:体重~ 1 +性估计系数:估计SE tStat pValue ________交___________(拦截)130.47 1.1995 108.77 5.2762 e - 104 Sex_Male 50.06 1.7496 28.612 2.2464 e-49数量的观察:100年,错误自由度:98根均方误差:8.73平方:0.893,调整平方:0.892 f统计量与常数模型:819年,假定值= 2.25 e-49

在每个步骤中,stepwiselm搜索术语来添加和删除。在第一步,逐步算法补充道与一个模型 p 6.26 e-48的价值。然后,从模型中删除吸烟者,因为在模型中,变量吸烟者成为多余的。stepwiselm只包括在最后的线性模型。病人的重量似乎并不显著差异根据年龄和吸烟的状态。

加载一个样本数据集和预测的定义矩阵。

负载carsmallX =(加速度、重量);

使用条款定义起始模型和上层模型矩阵。

T_starting = [0 0 0]%一个常数模型
T_starting =1×30 0 0
T_upper = [0 0 0、1 0 0 0 1 0; 1 1 0)%线性模型与交互
T_upper =4×30 0 0 1 0 0 0 1 0 1 1 0

创建一个线性回归模型使用逐步回归。指定起始模型和矩阵模型的上限使用条款,并指定“详细”2显示评价过程和决策采取每一步。

T_starting mdl = stepwiselm (X,英里/加仑,“上”T_upper,“详细”,2)
pValue添加x1是4.0973 e-06 pValue添加x2是1.6434即使1。添加x2, FStat = 259.3087, pValue = 1.643351即使pValue添加x1是0.18493没有候选人条款删除
mdl =线性回归模型:y ~ 1 + x2估计系数:估计SE tStat pValue __________ _____ _________ __________(拦截)e-49 x2 -0.0086119 0.0005348 -16.103 2.7015 49.238 1.6411 30.002 1.6434即使数量的观察:94年,错误自由度:92根均方误差:4.13平方:0.738,调整平方:0.735 f统计量与常数模型:259年,即使假定值= 1.64

适合一个线性回归模型分类使用逐步回归预测。stepwiselm添加或删除的一组指标变量在一个步骤来添加或删除分类预测。这个示例还展示了如何手动创建指标变量,通过他们stepwiselmstepwiselm对待每一个指标变量作为一个独立的预测因素。

加载carsmall使用数据集,并创建一个表重量,Model_Year,英里/加仑变量。

负载carsmall年=分类(Model_Year);tbl1 =表(MPG、重量、年);

适应的线性回归模型英里/加仑利用逐步回归。指定起始模型的函数重量。设置模型的上界“poly21”,这意味着模型可以包括(最多)一个常数和条款重量,体重^ 2,一年,重量*年。指定“详细”2显示评价过程和决策采取每一步。

mdl1 = stepwiselm (tbl1,英里/加仑~体重的,“上”,“poly21”,“详细”,2)
pValue添加一年是8.2284 e15汽油pValue添加重量^ 2是0.15454 - 1。增加一年,FStat = 47.5136, pValue = 8.22836 e15汽油pValue添加重量^ 2 = 0.0022303 pValue添加重量:0.0071637 - 2。增加体重^ 2,FStat = 9.9164, pValue = 0.0022303 pValue添加重量:0.19519年e-16 pValue消除年是2.9042
mdl1 =线性回归模型:MPG ~体重重量1 + +年+ ^ 2估计系数:估计SE tStat pValue __________ __________和__________(拦截)e-19重量-0.016404 0.0031249 -5.2493 2.6648 54.206 4.7117 11.505 1.0283 e-06 Year_76 Year_82 0.0044137 2.0887 0.71491 2.9215 8.1864 0.81531 10.041 1.5573 2.6364 e-16体重^ 2 e-06 4.9454 e-07 3.149 - 0.0022303的观察:94年,错误自由度:89根均方误差:2.78平方:0.885,调整平方:0.88 f统计量与常数模型:172年,假定值= 5.52 e-41

stepwiselm创建两个指标变量,Year_76Year_82,因为一年包括三个不同的值。

因为“详细”是2,stepwiselm显示了评估过程:

  • stepwiselm创建一个模型的函数重量

  • stepwiselm计算p值添加一年体重^ 2。的p值为一年小于两个吗p值为体重^ 2和0.05的默认阈值;因此,stepwiselm增加了一年到模型中。

  • stepwiselm计算p值添加重量:一年体重^ 2。因为p值为体重^ 2小于p值为重量:一年,stepwiselm功能补充道体重^ 2到模型中。

  • 在添加二次项之后,stepwiselm计算p价值增加重量:一年再次,但p值大于阈值。因此,stepwiselm不将项添加到模型。stepwiselm不检查添加体重^ 3因为指定的上限“上”名称-值对的论点。

  • stepwiselm查找删除。stepwiselm已经检查了体重^ 2,所以它只计算p值为删除一年。因为p值小于0.10的默认阈值,stepwiselm不移除项。

  • 虽然步骤的最大允许数是5,stepwiselm终止该过程后两个步骤,因为模型不改善通过添加或删除一个术语。

stepwiselm将两个指标变量作为一个预测变量和补充道一年在一个步骤。把两个指标变量作为两种不同的预测变量,使用dummyvar创建单独的分类变量。

temp_Year = dummyvar(年);Year_76 =逻辑(temp_Year (:, 2));Year_82 =逻辑(temp_Year (:, 3));

创建一个表包含英里/加仑,重量,Year_76,Year_82

tbl2 =表(MPG、重量、Year_76 Year_82);

创建一个逐步线性回归模型用于开始从相同的模型mdl1

mdl2 = stepwiselm (tbl2,英里/加仑~体重的,“上”,“poly211”)
1。添加Year_82 FStat = 83.1956, pValue = 1.76163 e-14 2。增加体重:Year_82 FStat = 8.0641, pValue = 0.0055818 3。添加Year_76, FStat = 8.1284, pValue = 0.0054157
mdl2 =线性回归模型:MPG ~ 1 + Year_76 +重量* Year_82估计系数:估计SE tStat pValue __________ __________和__________(拦截)e-42重量-0.006272 0.00042673 -14.698 1.503 38.844 1.5294 25.397 1.5622 e-25 Year_76_1 Year_82_1 0.0054157 2.0395 0.71537 2.851 19.607 3.8731 5.0623 2.2163 e-06重量:Year_82_1 -0.0046268 0.0014979 -3.0888 0.0026806的观测数量:94年,错误自由度:89根均方误差:2.79平方:0.885,调整平方:0.88 f统计量与常数模型:171年,假定值= 6.54 e-41

该模型mdl2包括交互项重量:Year_82_1而不是体重^ 2,包括在这个词mdl1

输入参数

全部折叠

输入数据包括预测和响应变量指定为一个表或数据集的数组。预测变量可以是数字、逻辑、直言,字符或字符串。响应变量必须是数字或逻辑。

  • 默认情况下,stepwiselm以最后一个变量作为响应变量和其他预测变量。

  • 不同的列设置为响应变量,使用ResponseVar名称-值对的论点。

  • 使用列的一个子集作为预测因子,使用PredictorVars名称-值对的论点。

  • 定义一个模型规范,设置modelspec参数使用公式或矩阵。公式或计算矩阵指定列作为预测或响应变量。

表中的变量名称不需要有效的MATLAB®标识符,但名称必须不包含前导或尾随空格。如果名称是无效的,你适合时不能使用一个公式或调整模型;例如:

  • 你不能指定modelspec使用一个公式。

  • 你不能用一个公式来指定术语来添加或删除当你使用addTerms函数或removeTerms函数,分别。

  • 你不能用一个公式来指定模型的上下边界时使用一步stepwiselm函数的名称-值对参数“低”“上”,分别。

您可以验证变量名资源描述通过使用isvarname函数。如果变量名是无效的,那么您可以将其转换使用matlab.lang.makeValidName函数。

预测变量指定为一个n——- - - - - -p矩阵,n是观察和的数量吗p是预测变量的数量。每一列的X代表一个变量,每一行代表一个观察。

默认情况下,模型中的常数项,除非你显式地删除它,所以不包括1 s的一列X

数据类型:|

响应变量指定为一个n1的向量,n是观测的数量。中的每个条目y的响应相应的行吗X

数据类型:||逻辑

开始逐步回归模型,指定为以下之一:

  • 一个特征向量或字符串标量命名模型。

    价值 模型类型
    “不变” 模型只包含一个常数(拦截)。
    “线性” 模型包含一个为每个预测拦截和线性项。
    “互动” 模型包含一个拦截,为每个预测线性项,和所有的产品对不同的预测(无平方项)。s manbetx 845
    “purequadratic” 模型包含一个截距项为每个预测和线性平方项。
    “二次” 模型包含一个拦截的术语,为每个预测线性和平方项,和所有的产品对不同的预测。s manbetx 845
    “聚ijk 模型是一个多项式与学位的所有条款在第一个预测,学位j在第二个预测,等等。为每个预测指定最大程度利用数字0到9。模型包含交互条款,但每个交互项的程度不超过指定的度的最大值。例如,“poly13”有一个拦截和x1,x2,x22,x23,x1*x2,x1*x22条款,x1x2分别是第一和第二预测。
  • 一个t————(p+ 1)矩阵,或计算矩阵在模型中指定条件,t的条款和数量吗p预测变量的数量,+ 1占响应变量。矩阵是方便当预测的数量很大,你想以编程方式生成条件。

  • 一个特征向量或字符串标量公式在表单中

    “y ~条款”,

    在哪里条款威尔金森符号。公式中的变量名必须是变量名资源描述或指定的变量名Varnames。另外,变量名必须是有效MATLAB标识符。

    软件决定的条款在拟合模型通过使用条款的顺序资源描述X。因此,模型中的条款的顺序可以不同于条款的顺序在指定的公式。

如果你想指定最小或最大的条款在模型中stepwiselm适合,使用较低的名称-值对参数。

数据类型:字符|字符串||

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:另类投资会议”、“标准”、“‘上’,‘互动’,‘详细’,1指示stepwiselm使用Akaike信息标准,显示每一步的行动,包括最多的交互模型中。

类别变量列表中,指定为逗号分隔组成的“CategoricalVars”和字符串数组或单元阵列特征向量包含分类表中的变量名或数据集的数组资源描述、逻辑或数字索引向量显示哪些列直言。

  • 如果表中的数据或数据集的数组资源描述那么,在默认情况下,stepwiselm将所有分类值、逻辑值,字符数组,字符串数组和细胞特征向量作为分类变量的数组。

  • 如果数据矩阵X的默认值“CategoricalVars”是一个空矩阵[]。即不变量分类,除非你指定分类。

例如,您可以指定第二个和第三个变量的分类使用下列六:

例子:“CategoricalVars”, [2,3]

例子:“CategoricalVars”、逻辑([0 1 1 0 0 0])

数据类型:||逻辑|字符串|细胞

标准添加或删除项,指定为逗号分隔组成的“标准”这些值之一:

  • 上交所的- - - - - -p价值的F以及变化的平方误差的总和,结果添加或删除

  • “另类投资会议”——改变Akaike信息的价值标准(AIC)

  • “bic”贝叶斯信息准则的价值变化(BIC)

  • “rsquared”——增加的价值R2

  • “adjrsquared”——增加价值的调整R2

例子:“标准”、“bic”

观察从健康,排除指定为逗号分隔组成的“排除”和逻辑或数字索引向量表示,从适合观测,以排除。

例如,您可以排除观测2和3的6使用下面的例子。

例子:“排除”,[2,3]

例子:“排除”,逻辑([0 1 1 0 0 0])

数据类型:||逻辑

为常数项指标(拦截),指定为逗号分隔组成的“拦截”,要么真正的包括或去除模型中的常数项。

使用“拦截”只有当指定模型使用一个特征向量或字符串标量,不是一个公式或矩阵。

例子:“拦截”,假的

模型规范描述术语不能从模型中删除,指定为逗号分隔组成的“低”其中一个选项modelspec命名模型。

例子:“低”,“线性”

最大数量的步骤,指定为逗号分隔组成的“NSteps”和一个正整数。

例子:“NSteps”, 5

数据类型:|

阈值标准添加项,指定为逗号分隔组成的“囚禁”和一个标量值,在这个表中描述。

标准 默认值 决定
上交所的 0.05 如果p价值的F统计量小于被关闭的(p输入值),将项添加到模型中。
“另类投资会议” 0 如果模型的AIC的变化小于被关闭的词添加到模型。
“BIC” 0 如果模型的BIC的变化小于被关闭的词添加到模型。
“Rsquared” 0.1 如果模型的平方值的增加大于被关闭的词添加到模型。
“AdjRsquared” 0 如果增加模型的平方值大于调整被关闭的词添加到模型。

有关更多信息,请参见标准名称-值对的论点。

例子:“囚禁”,0.075

预测变量用于配合,指定为逗号分隔组成的“PredictorVars”和字符串数组或单元阵列特征向量的变量名称的表或数据集的数组资源描述、逻辑或数字索引向量显示哪些列预测变量。

字符串值或特征向量应该名称中资源描述,或者您指定的名称使用“VarNames”名称-值对的论点。

默认是所有变量X或所有变量资源描述除了ResponseVar

例如,您可以指定第二个和第三个变量作为预测变量使用下面的例子。

例子:“PredictorVars”, [2,3]

例子:“PredictorVars”、逻辑([0 1 1 0 0 0])

数据类型:||逻辑|字符串|细胞

阈值标准删除一个术语,指定为逗号分隔组成的“PRemove”和一个标量值,在这个表中描述。

标准 默认值 决定
上交所的 0.10 如果p价值的F统计量大于PRemove(p值删除),从模型中删除这个词。
“另类投资会议” 0.01 如果模型的AIC的变化大于PRemove从模型中,删除这个词。
“BIC” 0.01 如果模型的BIC的变化大于PRemove从模型中,删除这个词。
“Rsquared” 0.05 如果模型的平方值的增加小于PRemove从模型中,删除这个词。
“AdjRsquared” -0.05 如果增加模型的平方值小于调整PRemove从模型中,删除这个词。

在每一步,stepwiselm函数也检查是否一个术语是多余的(线性相关的)与其他条款在当前的模型。当任何一项是线性相关与其他条款在当前模型,stepwiselm函数删除冗余项,无论价值标准。

有关更多信息,请参见标准名称-值对的论点。

例子:“PRemove”, 0.05

反应变量在适合使用,指定为逗号分隔组成的“ResponseVar”和一个特征向量或字符串标量数据集包含表中的变量名或数组资源描述、逻辑或数字索引向量表示哪个列变量的响应。你通常需要使用“ResponseVar”当配件表或数据集的数组资源描述

例如,您可以指定第四变量,说收益率六个变量的响应,在下列方式之一。

例子:“ResponseVar”、“收益”

例子:“ResponseVar”, [4]

例子:“ResponseVar”、逻辑([0 0 0 1 0 0])

数据类型:||逻辑|字符|字符串

模型规范描述最大的组条件适合时,指定为逗号分隔组成的“上”其中一个选项modelspec命名模型。

例子:“上”、“二次”

变量的名字,指定为逗号分隔组成的“VarNames”和一个字符串数组或单元阵列的特征向量,包括的列的名称X首先,和响应变量的名称y最后一次。

“VarNames”不适用于变量数据集在一个表格或数组,因为这些变量已经有名字。

变量名不需要有效的MATLAB标识符,但名称必须不包含前导或尾随空格。如果名称是无效的,你适合时不能使用一个公式或调整模型;例如:

在指定VarNames, VarNames,您可以验证的变量名varNames通过使用isvarname函数。如果变量名是无效的,那么您可以将其转换使用matlab.lang.makeValidName函数。

例子:VarNames,{“马力”,“加速”,“Model_Year”,“英里”}

数据类型:字符串|细胞

控制显示的信息,指定为逗号分隔组成的“详细”这些值之一:

  • 0——抑制所有显示。

  • 1——显示每一步的行动。

  • 2——显示评估过程和每一步的行动。

例子:“详细”,2

观察体重、指定为逗号分隔组成的“重量”和一个n1负的标量值的向量,n是观测的数量。

数据类型:|

输出参数

全部折叠

代表一个最小二乘线性模型的响应数据,作为一个返回LinearModel对象。

对线性模型对象的属性和方法,mdl,请参阅LinearModel类页面。

更多关于

全部折叠

计算矩阵

一个条件矩阵T是一个t————(p+ 1)矩阵指定术语在一个模型中,在那里t术语的数量,p预测变量的数量,+ 1占响应变量。的价值T (i, j)是变量的指数吗j在术语

例如,假设一个输入包括三个预测变量x1,x2,x3和响应变量y的顺序x1,x2,x3,y。每一行的T代表一个术语:

  • [0 0 0 0]——常数项或拦截

  • [0 1 0 0]- - - - - -x2;同样,x1 ^ 0 * x2 ^ 1 * x3 ^ 0

  • (1 0 1 0)- - - - - -x1 * x3

  • (2 0 0 0)- - - - - -x1 ^ 2

  • [0 1 2 0]- - - - - -x2 * (x3 ^ 2)

0的每一项代表了响应变量。一般来说,一个列向量的零矩阵代表反应变量的位置。如果你有预测和响应变量在一个矩阵列向量,然后你必须包括0为响应变量在每一行的最后一列。

公式

规范是一个特征向量公式模型或字符串标量的形式y~条款

  • y是响应的名字。

  • 条款威尔金森代表了预测计算模型中使用符号。

代表预测和响应变量,使用的变量名称表输入资源描述或通过使用指定的变量名VarNames。的默认值VarNames{x1, x2,…,‘xn’,‘y’}

例如:

  • “y ~ x1 + x2 + x3”指定一个有三线性模型与拦截。

  • “y ~ x1 + x2 + x3 - 1”指定一个有三线性模型没有拦截。注意公式包括一个常数(拦截)默认项。排除一个常数项的模型中,您必须包括1的公式。

一个公式包括常数项,除非你显式地删除术语使用1

威尔金森符号

威尔金森符号描述术语出现在一个模型。符号相关条款存在于一个模型,而不是乘数(系数)的条款。

威尔金森符号使用这些符号:

  • +意味着包括下一个变量。

  • - - - - - -意味着不包括下一个变量。

  • :定义了一个交互,这是一个产品的术语。

  • *定义了一个交互和所有低阶项。

  • ^提高预测能力,完全一样*重复,所以^包括低阶项。

  • ()组条件。

此表显示了威尔金森符号的典型例子。

威尔金森符号 在标准符号
1 常数(拦截)
x1 ^ k,在那里k是一个正整数 x1,x12、……x1k
x1 + x2 x1,x2
x1 * x2 x1,x2,x1 * x2
x1, x2 x1 * x2只有
x2 不包括x2
x1 * x2 + x3 x1,x2,x3,x1 * x2
x1 + x2 + x3 + x1, x2 x1,x2,x3,x1 * x2
x1 * x2 * x3 - x1, x2, x3 x1,x2,x3,x1 * x2,x1 * x3,x2 * x3
x1 * (x2 + x3) x1,x2,x3,x1 * x2,x1 * x3

更多细节,请参阅威尔金森符号

提示

  • 您不能使用健壮的回归和逐步回归。使用前检查你的数据异常值stepwiselm

  • 等其他方法方差分析或属性的LinearModel对象,看到LinearModel

  • 训练模型后,可以生成C / c++代码为新数据预测的反应。需要生成C / c++代码MATLAB编码器™。有关详细信息,请参见介绍代码生成

算法

  • 逐步回归是一个系统性的方法来添加和删除从一个线性或广义线性模型基于统计学意义的解释变量的响应。使用指定的方法始于一个初始模型,modelspec,然后比较了增量较大和较小的模型的解释力。

    stepwiselm函数使用向前和向后逐步回归来确定最终的模型。每一步,函数搜索条件对模型添加或删除从模型基础上的价值“标准”名称-值对的论点。

    的默认值“标准”对于一个线性回归模型上交所的。在这种情况下,stepwiselm一步LinearModel使用p价值的F统计测试模型,没有潜在的每一步。如果一个术语不是目前模型中,零假设是这个词有一个零系数如果添加到模型中。如果有足够的证据拒绝零假设,该函数将项添加到模型中。相反,如果一个词目前模型中,零假设是,这个词有一个零系数。如果没有足够的证据拒绝零假设,函数从模型中删除这个词。

    逐步回归的时候需要这些步骤“标准”上交所的:

    1. 初始模型。

    2. 检查一组可用的条款不能在模型中。如果任何条款p公差值不到一个入口(也就是说,如果一个词不太可能有一个零系数如果添加到模型),添加术语与最小的p值和重复这个步骤;否则,进入步骤3。

    3. 如果在模型中任何可用的条款p值大于退出公差(即零系数的假设不能被拒绝),删除与最大的术语p值并返回步骤2;否则,结束流程。

    在任何阶段,该函数不会增加一个高阶术语如果模型不包括所有低阶项的高阶项的子集。例如,函数不会试图添加X1, X2 ^ 2除非两X1X2 ^ 2已经在模型中。同样,这个函数不会删除低阶项高阶项保留在模型的子集。例如,函数不会试图删除X1X2 ^ 2如果X1, X2 ^ 2仍然在模型中。

    的默认值“标准”广义线性模型“异常”stepwiseglm一步GeneralizedLinearModel遵循类似的程序添加或删除。

    您可以指定使用的其他标准“标准”名称-值对的论点。例如,您可以指定的值的变化Akaike信息标准,贝叶斯信息准则,平方,或调整的平方为准绳添加或删除。

    根据条款包含在初始模型,和函数的顺序添加和删除条款,该函数可能会建立不同的模型相同的一组潜在的条款。函数终止当没有一步改善模型。然而,不同的初始模型或一个不同的一系列步骤并不能保证一个更好的选择。从这个意义上讲,分段模型的局部最优,但可能不是全局最优。

  • stepwiselm对待分类预测如下:

    • 一个模型的分类预测l包括水平(类别)l- 1指标变量。模型使用第一类作为参考水平,所以它不包括参考的指标变量的水平。如果数据类型的分类预测分类,那你可以检查的顺序分类利用类别通过使用和重新排序的类别reordercats自定义参考水平。关于创建指标变量的更多细节,请参阅自动创建虚拟变量

    • stepwiselm治疗组l- 1作为一个变量指标变量。如果你想把指标变量不同的预测变量,使用手动创建指标变量dummyvar。然后使用指标变量,除了一个对应的参考电平分类变量,当你适应一个模型。的分类预测X如果你指定的所有列dummyvar (X)和一个截距项预测,然后设计矩阵变得不足。

    • 交互条款之间的连续预测和分类预测l由element-wise产品的水平l- 1变量与连续预测指标。

    • 两个分类预测之间的交互方面l水平的(l- 1)* (- 1)指标变量包括所有可能的组合的两个分类预测的水平。

    • 你不能指定高阶术语分类预测,因为一个指标的平方等于本身。

    因此,如果stepwiselm添加或删除分类预测,实际上函数添加或删除的指标变量在一个步骤。类似地,如果stepwiselm添加或删除一个交互项分类预测,实际上这个函数添加或删除组交互条款包括分类预测。

  • stepwiselm认为,(空字符向量),”“(空字符串),<失踪>,<定义>资源描述,X,Y缺失值。stepwiselm不使用与缺失值的观察。的ObservationInfo拟合模型表明是否的属性stepwiselm使用中的每个观察健康。

选择功能

版本历史

介绍了R2013b