このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
こので,回帰の统计をおよび解釈方法を表示してて。。。
行列入力データセットである汽车舞
データセットを読み込みます。
load汽车舞X = [Weight,Horsepower,Acceleration];
fitlm
を使用して、線形回帰モデルをあてはめます。
lm = fitlm(X,MPG)
lm = Linear regression model: y ~ 1 + x1 + x2 + x3 Estimated Coefficients: Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236 Number of observations: 93, Error degrees of freedom: 89 Root Mean Squared Error: 4.09 R-squared: 0.752, Adjusted R-Squared: 0.744 F-statistic vs. constant model: 90, p-value = 7.38e-27
モデルの表示は,モデル式、推定された係数、およびモデルの要約統計が含まれています。
この表示の式y ~ 1 + x1 + x2 + x3
は,
に対応し。
モデルの表示は,系数s
プロパティに格納されている、推定された係数が示されています。系数s
プロパティを表示します。
lm.Coefficients
ans=4×4桌Estimate SE tStat pValue __________ _________ _________ __________ (Intercept) 47.977 3.8785 12.37 4.8957e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742e-08 x2 -0.042943 0.024313 -1.7663 0.08078 x3 -0.011583 0.19333 -0.059913 0.95236
系数
プロパティには、以下の列が含まれています。
Estimate
— モデル内の対応する各項の係数推定値。たとえば、定数項 (intercept
) の推定値は 47.977 です。
SE
— 係数の標準誤差。
tStat
— 各係数のt統計量。モデル内の他の予測子が与えられた場合に、対応する係数が 0 ではないという対立仮説に対して係数が 0 であるという帰無仮説を検定するために使用します。tStat = Estimate/SE
であること注意てくださいたとえば,切片のt統計量は 47.977/3.8785 = 12.37 です。
pValue
- 対応するががであるかかについてのののt統計量に対するp値。たとえば、x2
のt統計量のp値は 0.05 より大きいので、この項はモデル内の他の項に対して 5% の有意水準では有意ではありません。
モデルの要約統計は以下のとおりです。
Number of observations
—NaN
値がれない行の数この例では,X
とMPG
の行数が 100 であり、異なる観測値についてデータ ベクトルMPG
には 6 つのNaN
値、データ ベクトル马力
には 1 つのNaN
値があるので、Number of observations
は 93 です。
Error degrees of freedom
—n–p。ここで、nは観測値の個数、pはモデル内の係数の個数 (切片を含む) です。たとえば、モデルには 4 つの予測子があるため、Error degrees of freedom
は93 - 4 = 89となり。。
Root mean squared error
— 平均二乗誤差の平方根。誤差分布の標準偏差の推定に使用します。
R-squared
およびAdjusted R-squared
- それぞれ决定および调整の决定系数たとえば,,R-squared
値からは応答変数MPG
75%ををこのモデルで说明できることがわかり。。。
F统计与恒定模型
- 回帰モデルに対するF検定の検定統計量。この検定では、定数項のみから構成される縮退したモデルより回帰モデルの方が有意に優れているかどうかを検定します。
p值
- モデルに対するF検定のp値。たとえば、p値が 7.3816e-27 なので、このモデルは有意です。
モデルの分散分析 (ANOVA) を実行します。
方差分析(lm,'概括')
ans=3×5表SUMSQ DF MENEQ F PVALUE ______ ______________________________________________________________________________________________________________________6.6型型号451型45.3型号451型45.3 7.98 7.387.77.389.97. 7.387.77.37. 7.387.389.77.389.97.Sright-1-1-1-1-1-1例一下
この方差分析
では,以下が表示されます。
SumSq
- 回帰モデル模型
、誤差項Residual
,および合计値全部的
の二乘和。
DF
— 各項の自由度。自由度は合計について
,モデルについて
、誤差項について
です。ここで、
は観測値の個数、
はモデル内の係数の個数 (切片を含む) です。この例では、データ ベクトルMPG
に 6 つのNaN
値が,の観测はデータベクトルのうち马力
に 1 つのNaN
値があるので、全体の自由度は 93 – 1 = 92 となります。モデルには 4 つの係数があるので、モデルのDF
では 4 – 1 = 3、誤差項のDF
は93 - 4 = 89となり。。
MeanSq
— 各項の平均二乗誤差。MeansQ = sumsq/df
であること注意てください。たとえば,误差项の平均二乘1488.8/89 = 16.728です。この値の平方根は線形回帰表示の根平方错误
(4.09) です。
F
—F統計値。線形回帰表示のF统计与恒定模型
89.987ですです。线形线形回帰回帰表示表示ででは,,このF統計値は切り上げられて 90 となります。
pValue
- モデルに対するF検定のp値。この例では 7.3816e-27 です。
回帰モデル高いの项がある,,方差分析
はモデルSumSq
をそのでされる部分と以外部分に分割し。対応するF统计量と次数の项有意性を别のグループグループとして検定検定するためための。
データにある场合,同じ予测子値复数の测定がある场合,方差分析
は誤差SumSq
を繰り返し部分とそれ以外の部分に分割します。対応するF統計量は、複製について計算されたモデルに依存しない分散の推定値とモデルの残差を比較することにより不適合を検定するためのものです。
ANOVA の表を分解し、モデル項を抽出します。
方差分析(lm)
ans=4×5桌SumSq DF MeanSq F pValue ________ __ ________ _________ __________ x1 563.18 1 563.18 33.667 9.8742e-08 x2 52.187 1 52.187 3.1197 0.08078 x3 0.060046 1 0.060046 0.0035895 0.95236 Error 1488.8 89 16.728
この方差分析
を実行,次ように表示れ。。。
1列目 - モデルにれる项。
SumSq
— 定数以外の各項の二乗誤差の和。
DF
— 自由度。この例では、DF
はモデルの各項について 1、誤差項について
です。ここで、
は観測値の個数、
はモデルの个数(切片含む)ですですたとえばこのモデルはDF
は 93 – 4 = 89 です。モデル内のいずれかの変数がカテゴリカル変数である場合、その変数のDF
はカテゴリ作成れた変数(1)ですです个数个数个数个数个数个数个数
MeanSq
— 各項の平均二乗誤差。MeansQ = sumsq/df
であること注意てください。たとえば,误差项の平均二乘1488.8/89 = 16.728です。
F
— 各係数のF値。Fの値は、平均二乗誤差に対する各項の平均二乗の比率、つまりF = MeanSq(xi)/MeanSq(Error)
です。各F統計量はF分布に,の自由は対応する项のDF
の値分母の自由はは
です。
は観測値の個数、
はモデル内の係数の個数です。この例では、各F統計量は
分布に従います。
pValue
— 線形モデルにおける対応する項の係数に対する各仮説検定のp値。たとえば、x2
のF統計量係数のp値は 0.08078 であり、モデル内の他の項に対して 5% の有意水準では有意でないことになります。
系数の信頼区间を表示します。
coefCI(lm)
ans =4×240.2702 55.6833 -0.0088 -0.0043 -0.0913 0.0054 -0.3957 0.3726
各行の値はそれぞれ、係数の既定の 95% 信頼区間の下限と上限です。たとえば、1 行目は切片 の下限と上限 (40.2702 と 55.6833) を表しています。同様に、2 行目は の下限をています。各行も同様です。信頼区间区间により线形回帰回帰系数のの推定推定推定の の信頼区間は、対応する回帰係数が の信頼度で含まれる範囲を与えます。
信頼度を変更することもできます。係数に対する 99% 信頼区間を求めます。
coefCI(lm,0.01)
ans =4×237.7677 58.1858 -0.0095 -0.0036 -0.1069 0.0211 -0.5205 0.4973
1つのつの系数がががでないでないと仮说,,予测子変数系数系数はすべてすべてすべてすべてすべてすべてであるであるであるであるであるという说说说を
[p,F,d] = coefTest(lm)
p = 7.3816e-27
F = 89.9874
d = 3
ここでcoefTest
1つつつ回帰系ががゼロという说说说说说说说说说说说说说仮基本基本的的的的的的なな说说说说说说说说说说说说说说说说に対してに対してに対してに対してに対してに対してに対してに対してに対してに対してに対してに対してF検定を実行します。これにより、
(p値)、F
(F統計量)、d
(分子の自由度) が返されます。このモデルでは、F統計量およびp値は线形表示および方差分析
におけるもの同じ。モデルにははははつのつの(切片含む)がががががある,,,自由度度度度度度ははははははははははははははははははははははははは
次に、最初と 2 番目の予測子変数の係数に仮説検定を実行します。
H = [0 1 0 0; 0 0 1 0]; [p,F,d] = coefTest(lm,H)
p = 5.1702e-23
F = 96.4873
d = 2
分子の自由度は検定した係数の数 (この例では 2) です。この結果から、 と の少なくとも一方が 0 ではないことがわかります。