线形回帰のの解釈

こので，回帰の统计をおよび解釈方法を表示してて。。。

线形回帰モデルのあてはめ

行列入力データセットである汽车舞データセットを読み込みます。

load汽车舞X = [Weight,Horsepower,Acceleration];

fitlmを使用して、線形回帰モデルをあてはめます。

lm = fitlm(X,MPG)

lm = Linear regression model: y ~ 1 + x1 + x2 + x3 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236 Number of observations: 93, Error degrees of freedom: 89 Root Mean Squared Error: 4.09 R-squared: 0.752, Adjusted R-Squared: 0.744 F-statistic vs. constant model: 90, p-value = 7.38e-27

モデルの表示は，モデル式、推定された係数、およびモデルの要約統計が含まれています。

この表示の式y ~ 1 + x1 + x2 + x3は， $y = β_{0} + β_{1} X_{1} + β_{2} X_{2} + β_{3} X_{3} + ϵ$ に対応し。

モデルの表示は，系数sプロパティに格納されている、推定された係数が示されています。系数sプロパティを表示します。

lm.Coefficients

ans=4×4桌Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236

系数プロパティには、以下の列が含まれています。

Estimate— モデル内の対応する各項の係数推定値。たとえば、定数項 (intercept) の推定値は 47.977 です。
SE— 係数の標準誤差。
tStat— 各係数のt統計量。モデル内の他の予測子が与えられた場合に、対応する係数が 0 ではないという対立仮説に対して係数が 0 であるという帰無仮説を検定するために使用します。tStat = Estimate/SEであること注意てくださいたとえば，切片のt統計量は 47.977/3.8785 = 12.37 です。
pValue- 対応するががであるかかについてのののt統計量に対するp値。たとえば、x2のt統計量のp値は 0.05 より大きいので、この項はモデル内の他の項に対して 5% の有意水準では有意ではありません。

モデルの要約統計は以下のとおりです。

Number of observations—NaN値がれない行の数この例では，XとMPGの行数が 100 であり、異なる観測値についてデータベクトルMPGには 6 つのNaN値、データベクトル马力には 1 つのNaN値があるので、Number of observationsは 93 です。
Error degrees of freedom—n–p。ここで、nは観測値の個数、pはモデル内の係数の個数 (切片を含む) です。たとえば、モデルには 4 つの予測子があるため、Error degrees of freedomは93 - 4 = 89となり。。
Root mean squared error— 平均二乗誤差の平方根。誤差分布の標準偏差の推定に使用します。
R-squaredおよびAdjusted R-squared- それぞれ决定および调整の决定系数たとえば，，R-squared値からは応答変数MPG75％ををこのモデルで说明できることがわかり。。。
F统计与恒定模型- 回帰モデルに対するF検定の検定統計量。この検定では、定数項のみから構成される縮退したモデルより回帰モデルの方が有意に優れているかどうかを検定します。
p值- モデルに対するF検定のp値。たとえば、p値が 7.3816e-27 なので、このモデルは有意です。

分散分析

モデルの分散分析 (ANOVA) を実行します。

方差分析(lm,'概括')

ans=3×5表SUMSQ DF MENEQ F PVALUE ______ ______________________________________________________________________________________________________________________6.6型型号451型45.3型号451型45.3 7.98 7.387.77.389.97. 7.387.77.37. 7.387.389.77.389.97.Sright-1-1-1-1-1-1例一下

この方差分析では,以下が表示されます。

SumSq- 回帰モデル模型、誤差項Residual，および合计値全部的の二乘和。
DF— 各項の自由度。自由度は合計について $n - 1$ ，モデルについて $p - 1$ 、誤差項について $n - p$ です。ここで、 $n$ は観測値の個数、 $p$ はモデル内の係数の個数 (切片を含む) です。この例では、データベクトルMPGに 6 つのNaN値が，の観测はデータベクトルのうち马力に 1 つのNaN値があるので、全体の自由度は 93 – 1 = 92 となります。モデルには 4 つの係数があるので、モデルのDFでは 4 – 1 = 3、誤差項のDFは93 - 4 = 89となり。。
MeanSq— 各項の平均二乗誤差。MeansQ = sumsq/dfであること注意てください。たとえば，误差项の平均二乘1488.8/89 = 16.728です。この値の平方根は線形回帰表示の根平方错误(4.09) です。
F—F統計値。線形回帰表示のF统计与恒定模型89.987ですです。线形线形回帰回帰表示表示ででは，，このF統計値は切り上げられて 90 となります。
pValue- モデルに対するF検定のp値。この例では 7.3816e-27 です。

回帰モデル高いの项がある，，方差分析はモデルSumSqをそのでされる部分と以外部分に分割し。対応するF统计量と次数の项有意性を别のグループグループとして検定検定するためための。

データにある场合，同じ予测子値复数の测定がある场合，方差分析は誤差SumSqを繰り返し部分とそれ以外の部分に分割します。対応するF統計量は、複製について計算されたモデルに依存しない分散の推定値とモデルの残差を比較することにより不適合を検定するためのものです。

ANOVA の表を分解し、モデル項を抽出します。

方差分析(lm)

ans=4×5桌SumSq DF MeanSq F pValue ________ __ ________ _________ __________ x1 563.18 1 563.18 33.667 9.8742e-08 x2 52.187 1 52.187 3.1197 0.08078 x3 0.060046 1 0.060046 0.0035895 0.95236 Error 1488.8 89 16.728

この方差分析を実行，次ように表示れ。。。

1列目 - モデルにれる项。
SumSq— 定数以外の各項の二乗誤差の和。
DF— 自由度。この例では、DFはモデルの各項について 1、誤差項について $n - p$ です。ここで、 $n$ は観測値の個数、 $p$ はモデルの个数（切片含む）ですですたとえばこのモデルはDFは 93 – 4 = 89 です。モデル内のいずれかの変数がカテゴリカル変数である場合、その変数のDFはカテゴリ作成れた変数（1）ですです个数个数个数个数个数个数个数
MeanSq— 各項の平均二乗誤差。MeansQ = sumsq/dfであること注意てください。たとえば，误差项の平均二乘1488.8/89 = 16.728です。
F— 各係数のF値。Fの値は、平均二乗誤差に対する各項の平均二乗の比率、つまりF = MeanSq(xi)/MeanSq(Error)です。各F統計量はF分布に，の自由は対応する项のDFの値分母の自由はは $n - p$ です。 $n$ は観測値の個数、 $p$ はモデル内の係数の個数です。この例では、各F統計量は $F_{(1, 89)}$ 分布に従います。
pValue— 線形モデルにおける対応する項の係数に対する各仮説検定のp値。たとえば、x2のF統計量係数のp値は 0.08078 であり、モデル内の他の項に対して 5% の有意水準では有意でないことになります。

系数の信頼区间

系数の信頼区间を表示します。

coefCI(lm)

ans =4×240.2702 55.6833 -0.0088 -0.0043 -0.0913 0.0054 -0.3957 0.3726

各行の値はそれぞれ、係数の既定の 95% 信頼区間の下限と上限です。たとえば、1 行目は切片 $β_{0}$ の下限と上限 (40.2702 と 55.6833) を表しています。同様に、2 行目は $β_{1}$ の下限をています。各行も同様です。信頼区间区间により线形回帰回帰系数のの推定推定推定の $100 (1 - α) %$ の信頼区間は、対応する回帰係数が $100 (1 - α) %$ の信頼度で含まれる範囲を与えます。

信頼度を変更することもできます。係数に対する 99% 信頼区間を求めます。

coefCI(lm,0.01)

ans =4×237.7677 58.1858 -0.0095 -0.0036 -0.1069 0.0211 -0.5205 0.4973

係数に対する仮説検定

1つのつの系数がががでないでないと仮说，，予测子変数系数系数はすべてすべてすべてすべてすべてすべてであるであるであるであるであるという说说说を

[p,F,d] = coefTest(lm)

p = 7.3816e-27

F = 89.9874

d = 3

ここでcoefTest1つつつ回帰系ががゼロという说说说说说说说说说说说说说仮基本基本的的的的的的なな说说说说说说说说说说说说说说说说に対してに対してに対してに対してに対してに対してに対してに対してに対してに対してに対してに対してF検定を実行します。これにより、 $p$ (p値)、F(F統計量)、d(分子の自由度) が返されます。このモデルでは、F統計量およびp値は线形表示および方差分析におけるもの同じ。モデルにははははつのつの（切片含む）がががががある，，，自由度度度度度度ははははははははははははははははははははははははは

次に、最初と 2 番目の予測子変数の係数に仮説検定を実行します。

H = [0 1 0 0; 0 0 1 0]; [p,F,d] = coefTest(lm,H)

p = 5.1702e-23

F = 96.4873

d = 2

分子の自由度は検定した係数の数 (この例では 2) です。この結果から、 $β_{2}$ と $β_{3}$ の少なくとも一方が 0 ではないことがわかります。

参考

线性模型|fitlm|Stepwiselm|方差分析

线形回帰のの解釈

线形回帰モデルのあてはめ

分散分析

系数の信頼区间

係数に対する仮説検定

参考

関連する例

詳細

统计和机器学习工具箱ドキュメンテーション

サポート

机械学习マスター：matlabステップステップバイ・ガイドガイドガイド