主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

stepwiselm

ステップワイズ回帰の実行

说明

MDL.=步骤行行令(资源描述的)は,定数モデルから開始し,ステップワイズ回帰を使用して予測子を追加または削除することにより,表またはデータセット配列资源描述内の変数に対する線形モデルを作成します。stepwiselm资源描述の最後の変数を応答変数として使用します。stepwiselmは,変数増減法のステップワイズ回帰を使用して,最終的なモデルを決定します。各ステップで,引数'标准'の値に基づいて,モデルに対して追加または削除する項が探索されます。

MDL.=步骤行行令(Xy的)は,データ行列X内の予测子数目に対する応答yの线形モデル作物成し。

MDL.=步骤行行令(___modelspec的)は,前の構文におけるいずれかの入力引数の組み合わせを使用して,開始モデルmodelspecを指定します。

MDL.=步骤行行令(___名称,价值的)では,1つ以上のと値のペアのを使しててたとえばたとえば指定ししししししししししししししししししししししししし。stepwiselmが项の追加または削除に使用する基准などを指定できます。

すべて折りたたむ

halデータセットを読み込みます。これは,セメントの硬化熱に対してセメントの組成が与える影響を測定したデータです。

加载hal

このデータセットには,変数配料およびが含まれています。行列配料には,セメントに含まれている4種類の化学物質の組成率が格納されています。ベクトルには,各セメント標本に対する180日後の硬化熱の値が格納されています。

ステップワイズ项あてはめますデータデータあてはめ形モデルをにあてはめますてののしきい値て0.06

MDL =步骤(成分,加热,'penter', 0.06)
1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-063 .添加x2, FStat = 5.0259, pValue = 0.051687移除x4, FStat = 1.8633, pValue = 0.2054
mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue  ________ ________ ______ __________ ( 拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整后的R-Squared: 0.974 F-statistic vs. constant model: 230, p-value = 4.41e-09

既定では,开始モデルははモデルです。stepwiselmは前方选択を実行し,x4x1およびx2の各项を(このこので)加加します。これこれ対応するP.値が开普赛人0.06の値より小さいためです。その後,stepwiselmは后退消去を使使使てx4をモデルから削除します。これは,x2がモデル内にあると,保单0.1の既定値であるよりx4P.値が大厦なるです。

データセット配列に格式されているいるををしステップワイズ回帰をししますますます。ウィルキンソンの表记を使使して开始モデル指定し,オプションののを指定し,オプションののををしし応答応答と子数目します。

标本データを読み込み。

加载医院

医院データデータ配列には,患者の性别,年份,体验,吃烟状态が含まれいい。

线路モデルモデル,定数项の开始と予测子数量としての吸烟者に结合させ。応答函数重量,カテゴリカルカテゴリカル子阶数年龄および吸烟者を指定します。

mdl = stepwiselm(医院,的体重~ 1 +抽烟'......'responsevar''重量''predictorvars',{“性”'年龄'“抽烟”},......“CategoricalVar”,{“性”“抽烟”})
1.添加性别,FStat = 770.0158, pValue = 6.262758e-48移除吸烟者,FStat = 0.21224, pValue = 0.64605
MDL =线性回归模型:重量〜1 +性别估计系数:估计e_______________________(拦截)130.47 1.1995 108.77 5.2762E-104 sex_male 50.06 1.7496 28.612 2.2464E-49观察数:100,误差自由度:98均方方误差:8.73 R线:0.893,调整R线:0.892 F统计与常数型号:819,P值= 2.25E-49

各ステップで,stepwiselmは追加および削除する項を検索します。最初のステップでは, P. 値6.26E-48でモデルにが追加されます。モデル内にが与えられると,変数吸烟者が重複するためです。stepwiselmの最終的な線形モデルには患者が含まれます。

标本データデータセットを,予测子の行をを定义ますし。

加载Carsmall.X =(加速度、重量);

项行列を使をて,开始モデルと上限モデル定义します。

t_starting = [0 0 0]%常量模型
t_starting =.1×30 0 0
T_upper = [0 0 0;1 0 0;1 1 0]%具有相互作用的线性模型
T_upper =4×30 0 0 1 0 0 1 0 0 1 1 0 1 1 1 0

ステップワイズ回帰回帰使使し形形回帰回帰をしし列を使て,开始モデルと上限“详细”として2を指定します。

mdl = stepwiselm(x,mpg,t_starting,“上”T_upper,“详细”, 2)
添加x1的pValue为4.0973e-06添加x2的pValue为1.6434e-28 1。添加x1的pValue是0.18493没有候选项要删除
mdl = Linear regression model: y ~ 1 + x2 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _______ __________ (Intercept) 49.238 1.6411 30.002 2.7015e-49 x2 -0.0086119 0.0005348 -16.103 1.6434e-28观测数:94,误差自由度:92均方根误差:4.13 r平方:0.738,校正r平方:0.735 F-statistic vs. constant model: 259, p-value = 1.64e-28

ステップワイズ回帰を使用して,カテゴリカル予测子がある线形回帰モデルをあてはめます。stepwiselmは,指标指标のを削除てカテゴリカルカテゴリカルこの例削除しますこのまたは削除ます。stepwiselmが各指标指标数を个别の子として扱うようにためため,指标変数码驾驶で作物しstepwiselmに渡す方法も示します。

Carsmall.データセットを読み込み,幂数重量Model_Yearおよび英里/加仑を使用して表を作成します。

加载Carsmall.年=分类(model_year);TBL1 =表(MPG,重量,年);

ステップワイズ回帰を使用して,英里/加仑の形回帰モデルをあてはめます。开放モデルとして,重量の关键をます。モデルモデル上限“poly21”に設定します。これは,(最大で)定数と項重量重量^ 2.一年および重量*年ををモデルに含めることができることを意味しし评価プロセス,各“详细”として2を指定します。

mdl1 = stepwiselm (tbl1,'mpg〜weight''上'“poly21”“详细”, 2)
添加Year的pValue为8.2284e-15。添加Weight^2的pValue为0.15454 1。添加年份,FStat = 47.5136, pValue = 8.22836e-15添加重量^2的pValue为0.0022303 pValue为添加重量:年份为0.0071637 2。添加Weight^2, FStat = 9.9164, pValue = 0.0022303添加Weight的pValue:Year为0.19519 pValue删除Year为2.9042e-16
MDL1 =线性回归型号:MPG〜1 +重量+年+重量^ 2估计系数:估计系数PVALUE __________ ________________________________________________________________________________________________________________031249 -5.2493 1.0283E-06.016404 0.0031249 -5.016404 0.0031249-50.71491 2.9215 0.0044137年_8281.041 2.6364E-16重量^ 2 1.5573C-06 4.9454C-07 4.149 0.0022303观察数:94,误差自由度:89根均匀误差:2.78 R线:0.885,调整r-SQUARED:0.88 F统计与常数型号:172,P值= 5.52E-41

一年には3つの异なる値が含まれているので,stepwiselmは2つの指標変数Year_76およびYear_82を作物成します。

“详细”が2なので,stepwiselmは評価プロセスを表示します。

  • stepwiselm重量[关键词作物

  • stepwiselm一年または重量^ 2.の追加に対するP.値を計算します。一年P.値は重量^ 2.P.値および既定のしきい値0.05の両より小小さい,stepwiselm一年をモデルに加加します。

  • stepwiselm重量:一年または重量^ 2.の追加に対するP.値を計算します。重量^ 2.P.値は重量:一年P.値より小さいので,关节stepwiselm重量^ 2.をモデルに加加します。

  • 2次の项を追加しし后,stepwiselm重量:一年の追加に対するP.値値を再度计算计算しますが,P.値はしきい値より大厦なっています。したがっしたがっ,stepwiselmは項をモデルに追加しません。名前と値のペアの引数'上'によって指定された上限のため,stepwiselm重量^ 3.の追加を検讨しんん。

  • stepwiselmは,削除する项を探します。stepwiselmは既に重量^ 2.を検讨したので,一年の削除に対するP.値のみを计算します。P.値が既定のしきい値0.10より小さいので,stepwiselmは項を削除しません。

  • 許容される最大ステップ数は5ですが,項の追加または削除を行ってもモデルが改善されないので,stepwiselmは2ステップ后にに定理を停止し。

stepwiselmは2つの指標変数を1つの予測子変数として扱い,一年戴维尔を使用して别々のカテゴリカル変数を作成します。

temp_Year = dummyvar(年);Year_76 =逻辑(temp_Year (:, 2));Year_82 =逻辑(temp_Year (:, 3));

英里/加仑重量Year_76およびYear_82が含まれている表を作物成し。

TBL2 =表(MPG,重量,年_76,年份_82);

MDL1にに使しもの开始モデルから,ステップワイズ线形回帰モデルを作物。

mdl2 = stepwiselm (tbl2,'mpg〜weight''上'“poly211”的)
1.添加Year_82, FStat = 83.1956, pValue = 1.76163e-14添加重量:Year_82, FStat = 8.0641, pValue = 0.0055818添加Year_76, FStat = 8.1284, pValue = 0.0054157
MDL2 =线性回归模型:MPG〜1 +年_76 +重量*年份估计系数:估计系数_________________________________________1.52294 25.397 1.5032294 25.397 1.503220-25岁__14.698 1.56220-25 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.0395 0.71537 2.851 2.8510.0054157年度_82_1 19.6.0623 2.21623 2.21623 2.2163E-06重量:年度_82_1 -0.0046268 0.00114979 -3.0888 0.0026806观测数量:94,误差自由度:89根均匀误差:2.79 r断层:0.885,调整r型:0.88统计与常量型号:171,p值= 6.54e-41

モデルMDL2.には,MDL1に含まれていた項重量^ 2.の代わりに交互作用項重量:年份_82_1が含まれています。

入力引数

すべて折りたたむ

予测子データはとしてをを含むとしてします予测予测ます予测予测。逻辑,分类,文章または字符串にすることができ。応答応答ます。なければなりません。

  • 既定では,stepwiselmは最后の変数を応答変数として,それ以外の変数を予测子変数として取ります。

  • 応答応答数として异なる列を设定するには,名称と値のペア幂ResponseVarを使用します。

  • 列のサブセットを予測子として使用するには,名前と値のペア引数预测orvarsを使用します。

  • モデル仕様を定義するには,式または項行列を使用して引数modelspecをまたは项ます。

テーブルの数名は,有效なmatlab®識別子である必要はありません。ただし,名前が有効ではない場合,モデルをあてはめるまたは調整するときに式を使用することはできません。以下に例をます。

  • 式を使用してmodelspecを指定することはできません。

  • 関数addterms.または関数removeTermsをを使使使とき,式式使使しし追または削除する项指定するはできませんませはできませませ

  • 名前と値のペアの引数“低”'上'をを用词相关数一步または関数stepwiselmをを使使ときに,式を使用してモデルのとを指定することできませませんするできませんんできませんんませません。

関数Isvarname.を使用して资源描述の変数名を検証できます。変数名が有効でない場合,関数matlab.lang.makevalidname.を使用してそれらを変換できます。

n行p列の行列として指定される予測子変数。ここで,n は観測値の数、p は予測子変数の数です。Xの各列が1つの変数を表し,各行が1つの観測値を表します。

既定では,明显的に削除しない限制,モデルにはは数项项あるので,1の列をXに含めないでください。

データ型:|

n行1列のベクトルとして指定れるれる次数。yの各エントリはXの対応する行に対する応答です。

データ型:||逻辑

以以いずれかとしてされる,ステップワイズ回帰の开放モデル。

  • モデルを指定する文ベクトルベクトルまたはまたはスカラー。

    モデルタイプ
    “不变” モデルは定数(切片)項だけを含みます。
    '线性' 切片と各予測子の線形項がモデルに含まれます。
    '互动' 切片,各予測子の線形項,および異なる予測子のペアすべての積がモデルに含まれます(二乗項はありません)。
    “purequadratic” 切片項と各予測子の線形項および二乗項がモデルに含まれます。
    “二次” 切片項,各予測子の線形項,二乗項,および異なる予測子のペアすべての積がモデルに含まれます。
    'Poly.ijk' モデルは多重式式,1番目のの子における数一世までのすべての项,2番目のの子における数jまでのすべてすべての项が含まれますますますますについて同様同様.0〜9の数据を使し,各各子の最大声を指定ますます。たとえばが,各交互作用项,指定指定された次の最最たとえばたとえばたとえば,“poly13”には,切片,x1,X2,X22,X23.,X1*X2およびx1*X22の各項が含まれます。x1およびx2はそれぞれ1番目および2番目の予测子です。
  • モデル内の项をを指定t行(p + 1)列の行列,つまり項の行列。は予测子数目のであり,+ 1は応答ににします。

  • 次の形式の文字ベクトルまたは字符串スカラー

    “y ~条款”

    ここで,条款ウィルキンソンの表記法で表されます。式式数は资源描述の数名またはvarnames.また,幂名,はなな识别んんませませんませませませませませなませませませませませませませませませませませませななりなりませませませませませませませませませませませませませませませませませませませ识别识别识别识别识别

    资源描述またはXの项の顺序によって,あてはめたモデルの项の顺序が决定されます。そのため,モデルの项の顺序は,指定した式での项の顺序とは异なる场合があります。

stepwiselmで近似するモデルに含まているいる小または最の项ののをするにはは,名称と値のペア幂较低的およびを使用します。

データ型:字符|字符串||

名前と値のペアの引数

オプションの名称,价值的名字は数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,复数の名前とのペアののを,任意の顺番で指定でき。

例:'标准','aiC','上','互动','verbose',1stepwiselmに対して,赤池情報量基準を使用し,各ステップで実行するアクションを表示し,最大でモデル内の交互作用項を含むように指示します。

カテゴリカル変数のリスト。“CategoricalVars”と,テーブルまたはデータセット配列资源描述内のカテゴリカル数名が含まれているいる字のの配列または字符串配列,またはどの列がであるかを示すインデックスまたは资料。

  • データがテーブルまたはデータセット配列资源描述に格式されてて结合の既定では,stepwiselmはは値,论论,文章配列,字符串配列,および文字の细胞

  • データが行列Xに格納されている場合,“CategoricalVars”の既定値は空の行列[]です,カテゴリカルとして指定ない限制,カテゴリカルになるなるははありん。

たとえば,以下のいずれかを使用して,6つのうちの2番目と3番目の変数をカテゴリカルとして指定できます。

例:“CategoricalVars”,[2,3]

例:'pationoricalvars',逻辑([0 1 1 0 0 0])

データ型:||逻辑|字符串|细胞

項を追加または削除する基準。'标准'と以下のいずれかの値から構成されるコンマ区切りのペアとして指定します。

  • “上世纪”——項の追加または削除によって生じる残差平方和の変化に対するF検定のp値。

  • 'AIC'- 赤池存报载基因(AIC)のののの化

  • 'BIC'——ベイズ情報量基準(BIC)の値の変化

  • “rsquared”- R2の値の増加

  • 'adjrsquared'- 自然调整済みr2の値の増加

例:'标准','bic'

近似から除外する観測値。“排除”と,近似から除外する観測値を示す論理インデックスベクトルまたは数値インデックスベクトルで構成されるコンマ区切りのペアとして指定します。

たとえば,以下のいずれかの例を使用して,6つの観測値のうち観測値2および3を除外できます。

例:“排除”,[2,3]

例:“排除”,逻辑([0 1 1 0 0 0])

データ型:||逻辑

あてはめあてはめ分数项(切片)のインジケーター。'截距'と,モデルに分数项を含める真的またはモデルから定数項を削除する错误的で構成されるコンマ区切りのペアとして指定します。

式または行列ではなく文字ベクトルまたは字符串スカラーを使用してモデルを指定する場合のみ,'截距'を使用します。

例:“拦截”,假的

モデルモデルから削除できできないを表すモデルモデル“低”と,モデルの名前を表すmodelspecに対するいずれかのオプションから构成されるコンマ区切りのペアとして指定します。

例:'下','线性'

実行する最大ステップ数。“NSteps”と正の整数から構成されるコンマ区切りのペアとして指定します。

例:“NSteps”,5

データ型:|

項を追加する基準のしきい値。'penter'と次の表に記載されているスカラー値から構成されるコンマ区切りのペアとして指定します。

規範 既定値 判定
“上世纪” 0.05 f统计量のp値が开普赛人(入力に対するp値)より小さい場合,項をモデルに追加します。
'AIC' 0. モデルのaiCのの化が开普赛人より小さい场合,项をモデルに追加します。
'BIC' 0. モデルのbicのの化が开普赛人より小さい场合,项をモデルに追加します。
'rsquared' 0.1 モデルの决定系値値値加が开普赛人〖大大きい合,项をモデルに加加します。
'adjrsquared' 0. モデルの自由度調整済み決定係数値の増加が开普赛人〖大大きい合,项をモデルに加加します。

詳細は,名前と値のペアの引数标准を参照してください。

例:'penter',0.075

あてはめあてはめ使使する子数量。'predictorvars'と,テーブルまたはデータセット配列资源描述に格式されているいるいる名前を表すベクトルの细胞。

字符串値または文库ベクトルは,资源描述に含まれてて名称,または名前と値のペアの'varnames'を使用して指定した名前でなければなりません。

既定の设定は,X内のすべての変数,またはResponseVarを除く,资源描述内内すべてのの数。

たとえば,以下のいずれかの例を使用して,2-番目と3番目の変数を予测子変数として指定できます。

例:'predictorvars',[2,3]

例:'predictorvars',逻辑([0 1 1 0 0 0])

データ型:||逻辑|字符串|细胞

項を削除する基準のしきい値。“PRemove”と次の表に記載されているスカラー値から構成されるコンマ区切りのペアとして指定します。

規範 既定値 判定
“上世纪” 0.10 f统计量のp値が保单(削除するp値)より大きい場合,項をモデルから削除します。
'AIC' 0.01 モデルのaiCのの化が保单より大きい場合,項をモデルから削除します。
'BIC' 0.01 モデルのbicのの化が保单より大きい場合,項をモデルから削除します。
'rsquared' 0.05 モデルの决定系値値値加が保单より小さい场合,项をモデルから削除します。
'adjrsquared' -0.05. モデルの自由度調整済み決定係数値の増加が保单より小さい场合,项をモデルから削除します。

各各ステップ,关节stepwiselmは項が現在のモデル内の他の項に対して冗長(線形従属)であるかどうかもチェックします。項が現在のモデル内の他の項に線形従属している場合,関数stepwiselmは従属する项を基准値に关系なく削除します。

詳細は,名前と値のペアの引数标准を参照してください。

例:'premove',0.05

あてはめあてはめ使使する応答数。'responsevar'と,テーブルまたはデータセット配列资源描述内の変数名が格納されている文字ベクトルまたは字符串配列,またはどの列が応答変数であるかを示す論理インデックスベクトルまたは数値インデックスベクトルから構成されるコンマ区切りのペアとして指定します。通常,テーブルまたはデータセット配列资源描述を近似させる场合'responsevar'を使用する必要があります。

たとえば,以下のいずれかの方法を使用して,6つの変数のうち4番目の変数,つまり屈服を応答分数として指定できます。

例:“ResponseVar”、“收益”

例:'ResponalVar',[4]

例:'ResponseVar',逻辑([0 0 0 1 0 0])

データ型:||逻辑|字符|字符串

あてはめにおける最大の項集合を記述するモデル仕様。'上'とモデルを指定するmodelspecのいずれかのオプションから构成されるコンマ区切りのペアとして指定します。

例:'上','二次'

変数の名。'varnames'Xの列名录が最初に,応答函数yの名前が​​最后ににてている字ベクトルの

テーブルまたはデータセット配列の変数には既に名前が設定されているため,'varnames'はこれらの配列には适用されません。

変数名は,有効なMATLAB識別子である必要はありません。ただし,名前が有効ではない場合,モデルをあてはめるまたは調整するときに式を使用することはできません。以下に例をます。

  • 関数addterms.または関数removeTermsをを使使使とき,式式使使しし追または削除する项指定するはできませんませはできませませ

  • 名前と値のペアの引数“低”'上'をを用词相关数一步または関数stepwiselmをを使使ときに,式を使用してモデルのとを指定することできませませんするできませんんできませんんませません。

VarNames, VarNamesを指定指定する前,关键Isvarname.を使用してvarNamesの変数名を検証できます。変数名が有効でない場合,関数matlab.lang.makevalidname.を使用してそれらを変換できます。

例:'varnames',{'horsepower','加速','model_year','mpg'}

データ型:字符串|细胞

情報の表示に関する制御。“详细”と以下のいずれかの値から構成されるコンマ区切りのペアとして指定します。

  • 0.——すべての表示を抑制します。

  • 1——各ステップで実行されるアクションを表示します。

  • 2——評価プロセスと,各ステップで実行されるアクションを表示します。

例:'verbose',2

観测値の重み。“重量”と,非负のスカラー値のn行1列のベクトル(nは観测値値数)

データ型:|

出力数

すべて折りたたむ

データに対する応答の最小二乘近似を表す线形モデル。LinearModelオブジェクトとして返されます。

线形モデルMDL.のプロパティとメソッドについては,LinearModelクラスのページを参照してください。

详细

すべて折りたたむ

項の行列

項行列T.は,モデル内の項を指定するt行(p + 1)列の行列です。tは項の数,pは予測子変数の数であり,+ 1は応答変数に相当します。T(i,j)のの値,项一世の変数jの指数です。

たとえば3つの予測子変数x1x2x3と応答数yx1x2x3yという順序で入力に含まれていると仮定します。T.の各行は1つの項を表します。

  • [0 0 0 0]——定数項(切片)

  • [0 1 0 0]-x2X1 ^0 * x2^1 * x3^0と等価)

  • [1 0 1 0]-x1 * x3

  • [2 0 0 0]-X1 ^ 2

  • [0 1 2 0]-x2 * (x3 ^ 2)

各项の最后の0.は,応答変数を表します。一般に,項行列内のゼロの列ベクトルは,応答変数の位置を表します。行列と列ベクトルに予測子と応答変数がある場合、各行の最後の列に応答変数を示す0.を含めなければなりません。

モデル仕様の式は'y条款'という形式の文字ベクトルまたは字符串スカラーです。

  • yは応答名です。

  • 条款は,ウィルキンソンの表記法を使用してモデル内の予測子の項を表します。

予測子と応答変数を表現するには,表入力资源描述の数名,またはVarNamesを使用して指定された変数名を使用します。VarNamesの既定値は{'x1','x2',...,'xn','y'}です。

以下に例をます。

  • 'y〜x1 + x2 + x3'は,切片がある3

  • 'y〜x1 + x2 + x3 - 1'は,切片がない3次数の形モデルモデルますますますますがが含まれることに注意てくださいモデルてててくださいてててててくださいてててててににににににににににににに-1を式に含めなければなりません。

-1をを用しし项明显的ににしないない含み。

ウィルキンソンの表記法

ウィルキンソンの表记法,モデルに现处于するするを记述ます。

ウィルキンソンの表記法では,以下の記号を使用します。

  • +は,次の変数を含むことを意味します。

  • -は,次の変数を含まないことを意味します。

  • は,项の积である交互

  • *は,交互作用と,より低い次数の項すべてを定義します。

  • ^*を繰り返した場合とまったく同じ方法で予測子をべき乗にします。このため,^には,より低い次数の项も含まれます。

  • ()は,项项をグループグループし

次の表に,ウィルキンソンの表記法の代表的な例を示します。

ウィルキンソンの表記法 標準表記の項
1 参数(切片)项
X1 ^ K.K.は正の整数 x1x12,......,x1K.
x1 + x2 x1x2
x1 * x2 x1x2x1 * x2
X1:X2 x1 * x2のみ
x2 x2は含めない
x1 * x2 + x3 x1x2x3x1 * x2
X1 + x2 + x3 + X1:x2 x1x2x3x1 * x2
x1 * x2 * x3 - x1:x2:x3 x1x2x3x1 * x2x1 * x3x2 * x3
x1 *(x2 + x3) x1x2x3x1 * x2x1 * x3

詳細は,ウィルキンソンの表記法を参照してください。

ヒント

  • ロバスト回帰をステップワイズ回帰と并用することはできません。stepwiselmをを用する前にののののてしてください。

  • Anova.などの他のメソッドや,LinearModelオブジェクトのプロパティについては,LinearModelを参照してください。

  • モデルに学習をさせた後で,新しいデータについて応答を予測するC / c++コードを生成できます。C / c++コードの生成にはMATLAB编码器™が必要です。详细详细について,コード生成の紹介を参照してください。

アルゴリズム

  • “ステップステップワイズ”は,応答変数の説明としての各項の統計的な重要性に基づき,線形または一般化線形モデルの項を追加したり削除するための体系的な方法です。この方法は,まずmodelspecを使用して指定される初期モデルから開始して,徐々により大きいまたはより小さいモデルの説明能力を比較していきます。

    関数stepwiselmは,変数増减法のワイズワイズ回帰使てて,最终的なモデルを决定し。'标准'の値に基づいて,モデルに追加する项またはモデルから削除する项が探索されます。

    线形回帰モデルは,'标准'の既定値は“上世纪”です。この場合,LinearModel一步stepwiselmは,各ステップでF統計量のp値を使用して,ある項が存在する場合と存在しない場合のモデルを検定します。ある項が現在はモデルにない場合,帰無仮説は,項がモデルに追加された場合に係数ゼロをもつということです。帰無仮説を棄却する十分な証拠がある場合,その項がモデルに追加されます。逆に,ある項がモデルに現在ある場合,帰無仮説は,その項が係数ゼロをもつことです。帰無仮説を棄却する十分な証拠がない場合,その項がモデルから削除されます。

    '标准'“上世纪”である場合,ステップワイズ回帰では以下のステップが実行されます。

    1. 初初モデルをあてはめます。

    2. 使用可能な一連の項の中でモデルに含まれていないものを調べます。いずれかの項に対するp値が開始許容誤差より小さい場合(つまり,モデルに追加すると係数がゼロになる可能性が低い場合),p値が最小である項を追加し,このステップを繰り返します。それ以外の場合,ステップ3を実行します。

    3. モデルに含まれている使用可能な項のいずれかに対するp値が終了許容誤差より大きい場合(つまり,係数がゼロになるという仮説を棄却できない場合),p値が最大である項を削除してステップ2に戻ります。それ以外の場合,このプロセスを終了します。

    高い次数の項は,その項のサブセットである低い次数の項のすべてもモデルに含まれている場合を除き,どの段階でも追加されません。たとえば,X1X2 ^ 2の両方が既にモデルに含まれている場合を除き,x1:x2 ^ 2,x1:x2 ^ 2がモデルに残ってているいる合书,X1またはX2 ^ 2の削除は行行されません。

    一般化線形モデルでは,'标准'の既定値は'偏见'です。GeneralizedLinearModel.一步stepwiseglmは,同様の手順に従って項を追加または削除します。

    名前と値のペアの引数'标准'をを使し,他の基础を指定できます。たとえば,赤池报心基因,ベイズ存报载基因,决定系数量自由度调整决定系数ののの変,项项追加またはのの准准できます。

    初モデルに含まれていると,项项追加およびを行顺序によって,同じ一定の项から异なるがされる可性がますステップもモデルが改良さますとと改良改良れととと改良ととととします。ただし、異なる初期モデルまたはステップの順序を使用しても、近似が向上するという保証はありません。この意味において、ステップワイズ モデルは、局所的には最適でも大域的には最適ではないことがあります。

  • stepwiselmでは,カテゴリカル予测子が次のように扱われます。

    • l个个の(カテゴリ)があるカテゴリカルカテゴリカル子をもつモデルは,L - 1個の指標変数が含まれています。1番目のカテゴリが基準レベルとして使用されるので、基準レベルに対する指標変数はモデルに含まれません。カテゴリカル予測子のデータ型が分类であるである合,类别を使用してカテゴリの順序をチェックし,雷德斯を使用してカテゴリを並べ替えることにより,基準レベルをカスタマイズできます。指標変数の作成の詳細については,ダミー函数の自动作作作作者を参照してください。

    • stepwiselmL - 1個の指標変数のグループを単一の変数として扱います。指標変数を個別の予測子変数として扱うには,戴维尔を使用して指标変数を手动で作成します。そして,モデルをあてはめるときに,カテゴリカル変数の基准レベルに対応するものを除く指标変数を使用します。カテゴリカル予测子Xについてdummyvar(x)のすべての列と切片項を予測子として指定した場合,計画行列はランク落ちとなります。

    • l个のレベルをもつカテゴリカル子と连続连続子の间の交互作用L - 1个の指标変数と连続予测子の要素単位の积から构成されます。

    • l个个のレベルレベルをもつカテゴリカル子とm个ののをカテゴリカルカテゴリカル子间の交互作用项は,2つのカテゴリカルカテゴリカル子のについてななののわせをため(L - 1)*(M - 1)个个指标指标数からから成されます。

    • 指標の二乗はそれ自体に等しいので,より次数が高い項をカテゴリカル予測子に対して指定することはできません。

    したがって,stepwiselmがカテゴリカルカテゴリカル子を追または削除する合,実际にはは変のグループが度にに同様同様されれれれれれれれれれれれれれれれれれ度れれれ度度にれ作作作度stepwiselmが追加または削除する场合,実际には,カテゴリカル予测子が含まれている交互作用项のグループが追加または削除されます。

  • stepwiselm资源描述Xおよびyに含まれている''(空の文字ベクトル),""(空の字符串),< >失踪,および<未定义>値を欠損値と見なします。stepwiselmは,欠损欠损値がある観测値をあてはめででででませませませませモデルモデルモデルモデルモデルモデルモデルモデルObservationInfoプロパティは,stepwiselmが各観测値をあてはめで使用したかどうかを示します。

代替机械

R2013bで導入