Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

線形回帰モデルとは

線形回帰モデルは、1 つの"従属変数" y と 1 つ以上の"独立変数" X の関係を記述します。従属変数は、"応答変数"とも呼ばれます。独立変数は、"説明変数" または"予測子変数"とも呼ばれます。連続予測子変数は、"共変量"とも呼ばれ、カテゴリカル予測子変数は "因子"とも呼ばれます。予測子変数に関する観測値の行列 X は通常 "計画行列"と呼ばれます。

多重線形回帰モデルは次のようになります。

y i = β 0 + β 1 X i 1 + β 2 X i 2 + + β p X i p + ε i , i = 1 , , n ,

ここで、

  • yiは i 番目の応答です。

  • βkは k 番目の係数で、β0はモデルの定数項です。計画行列には、定数項に関する情報が含まれる場合があります。ただし、fitlmまたはstepwiselmには既定でモデルの定数項が含まれるため、計画行列 X に 1 の列を入力しないでください。

  • Xijは、j 番目の予測子変数 j = 1, ..., p の i 番目の観測値です。

  • εiは i 番目のノイズ項、つまり確率的誤差です。

モデルに含まれている予測子変数が 1 つだけ (p = 1) である場合、そのモデルは単純な線形回帰モデルと呼ばれます。

通常、線形回帰モデルは次の形式のモデルになります。

y i = β 0 + k = 1 K β k f k ( X i 1 , X i 2 , , X i p ) + ε i , i = 1 , , n ,

ここで、f(.) は独立変数 Xijのスカラー値関数です。関数 f(X) の形式に制限はなく、非線形関数や多項式になることもあります。線形回帰モデルにおける線形性は、係数 βkの線形性を意味します。つまり、応答変数 y は、係数 βkの線形関数を表します。

以下に、線形モデルの例をいくつか示します。

y i = β 0 + β 1 X 1 i + β 2 X 2 i + β 3 X 3 i + ε i y i = β 0 + β 1 X 1 i + β 2 X 2 i + β 3 X 1 i 3 + β 4 X 2 i 2 + ε i y i = β 0 + β 1 X 1 i + β 2 X 2 i + β 3 X 1 i X 2 i + β 4 log X 3 i + ε i

しかし、次のモデルは未知係数 βkに対して線形になっていないので、線形モデルではありません。

log y i = β 0 + β 1 X 1 i + β 2 X 2 i + ε i y i = β 0 + β 1 X 1 i + 1 β 2 X 2 i + e β 3 X 1 i X 2 i + ε i

線形回帰モデルの通常の仮定は以下のとおりです。

  • ノイズ項εiは無相関です。

  • ノイズ項εiは、平均 0 と一定分散 σ2をもつ独立した同一の正規分布となります。したがって、

    E ( y i ) = E ( k = 0 K β k f k ( X i 1 , X i 2 , , X i p ) + ε i ) = k = 0 K β k f k ( X i 1 , X i 2 , , X i p ) + E ( ε i ) = k = 0 K β k f k ( X i 1 , X i 2 , , X i p )

    および

    V ( y i ) = V ( k = 0 K β k f k ( X i 1 , X i 2 , , X i p ) + ε i ) = V ( ε i ) = σ 2

    yiの分散は、Xijのすべてのレベルで同じになります。

  • 応答 yiは無相関です。

当てはめた線形関数は次のようになります。

y ^ i = k = 0 K b k f k ( X i 1 , X i 2 , , X i p ) , i = 1 , , n ,

ここで、 y ^ i は推定応答、bkは当てはめた係数です。係数は,予測ベクトル y ^ と真の応答ベクトル y の平均二乗誤差、つまり y ^ y が最小になるように推定されます。この方法は、"最小二乗法"と呼ばれます。ノイズ項に関する仮定のもとでは、これらの係数もまた予測ベクトルの尤度を最大化します。

y = β1X1+ β2X2+ ... + βpXpという形式の線形回帰モデルにおいて、他の予測子変数がすべて一定である場合、係数 βkは予測子変数 Xjにおける 1 単位の変化が応答値の平均 E(y) に与える影響を表します。係数の符号は影響の方向を示します。たとえば、線形モデルが E(y) = 1.8 – 2.35X1+ X2の場合、–2.35 は、X2が一定であることを前提に、X1で 1 単位増加すると平均応答値が 2.35 単位減少することを示します。モデルが E(y) = 1.1 + 1.5X12+ X2の場合、X12の係数は、他がすべて一定であることを前提に、X12で 1 単位増加すると Y の平均値が 1.5 単位増加することを示します。ただし、E(y) = 1.1 + 2.1X1+ 1.5X12の場合は、係数を同様に解釈することが難しくなります。これは、X12が変更された場合 X1を一定にすることができなくなるためです (またはその逆の場合もあります)。

参照

[1] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models. IRWIN, The McGraw-Hill Companies, Inc., 1996.

[2] Seber, G. A. F. Linear Regression Analysis. Wiley Series in Probability and Mathematical Statistics. John Wiley and Sons, Inc., 1977.

参考

||

関連するトピック