이번역페이지는최신내용을담고있지않습니다。최신내용을문으로보려면여기를클릭하십시오。
F-통계량과t-통계량
f -통계량
용도
선형회귀에서F -통계량은모델또는모델성분의유의성을검정하는분산분석(方差分析)방식에대한검정통계량입니다。
정의
선형모델의출력값표시에포함된F -통계량은모델의통계적유의성을검정하기위한검정통계량입니다。方差分析
의f -통계량값은모델의항또는성분의유의성을평가하기위한것입니다。
방법
fitlm
또는stepwiselm
을사용하여피팅된모델,예를들어,mdl
을얻은후다음을수행할수있습니다。
출력@ @시에서또는다음을사용하여
f统计量与常数模型
구하기disp (mdl)
모델에대한anova시하기
方差分析(mdl“总结”)
상수항을제외한성분에대해f -통계량값구하기
方差分析(mdl)
LinearModel
클래스의方差分析
메서드를참조하십시오。
F-통계량을사용하여모델의피팅평가하기
이예제에서는F -통계량을사용하여모델의피팅과회귀계수의유의성을평가하는방법을보여줍니다。
본데이터를불러옵니다。
负载医院tbl = table(医院。年龄,医院。体重,医院。吸烟者,医院。血压(:,1),...“VariableNames”, {“年龄”,“重量”,“抽烟”,“血压”});资源描述。年代moker = categorical(tbl.Smoker);
선형회귀모델을피팅합니다。
MDL = fitlm(tbl,‘血压~年龄*体重+吸烟者+体重^2’)
mdl =线性回归模型:血压~ 1 +吸烟者+年龄*体重+体重^2估计系数:估计SE tStat pValue __________ _________ ________ __________(拦截)168.02 27.694 6.067 2.7149e-08年龄0.079569 0.39861 0.19962 0.84221 Weight -0.69041 0.3435 -2.0099 0.047305 Smoker_true 9.8027 1.0256 9.5584 1.5969e-15年龄:体重0.00021796 0.0025258 0.086294 0.93142 Weight^2 0.0021877 0.0011037 1.9822 0.050375观测数:100,误差自由度:94均方根误差:4.73 r平方:0.528,调整r平方:0.503 f统计量vs常数模型:21,p值= 4.81e-14
상수모델대비선형피팅의f -통계량은21이고p-값은4.81e-14입니다。모델은5%유의수준에서유의미합니다。결정계수값0.528은모델이응답변수의변동성의약53%를설명한다는의미입니다。현재모델에포함되지않은다른예측(설명)변수가있을수있습니다。
피팅된모델에대해분산분석` ` `를` ` ` `시합니다。
方差分析(mdl“摘要”)
ans =5×5表SumSq DF MeanSq F pValue ______ __ ______ ______ __________ 总99 4461.2 45.062 4.8099 470.9 - 21.012 2354.5 - 5 e-14模型。线性2263.3 3 754.42 33.663 7.2417e-15。非线性91.248 2 45.624 2.0358 0.1363残差2106.6 94 22.411
이@ @는모델의변동성을일차항과비선형항으로분리합니다。비선형항이2개(体重^ 2
,그리고重量
와年龄
간의상호작용)이므로DF
열의비선형자유도는2입니다。모델에는3개의일차항(吸烟者
@ @ @ @시변수1개,重量
,年龄
)이있습니다。이에대응하는F
열의f -통계량은별도의그룹으로일차항과비선형항의유의성을검정하는데사용됩니다。
복제된관측값이있을경우,잔차항도두부분으로분리됩니다。첫번째부분은적합결여로인해발생한오차이고,두번째부분은모델과독립적으로발생한순오차로복제된관측값에서얻어집니다。이경우f -통계량은적합결여,즉피팅이적절한지여부를검정하는데사용됩니다。그러나이예제에는복제된관측값이없습니다。
모델항에대해분산분석` ` `를` ` ` `시합니다。
方差分析(mdl)
ans =6×5表SumSq DF MeanSq F pValue __________ ________ _________ __________ Age 62.991 1 62.991 2.8107 0.096959 Weight 0.064104 1 0.064104 0.0028604 0.95746 smoke 2047.5 1 2047.5 91.363 1.5969e-15 Age:Weight 0.16689 1 0.16689 0.0074466 0.93142 Weight^2 88.057 1 88.057 3.9292 0.050375 Error 2106.6 94 22.411
이` ` `는분산분석` ` ` `를모델항으로분해합니다。이에대응하는F
열의f -통계량은각항의통계적유의성을평가합니다。예를들어,吸烟者
에대한f -검정은吸烟者
에대한시변수의계수가0과다른지여부를검정합니다。즉,f -검정은흡연자라는사실이血压
에유의미한향을주는지여부를판단합니다。각모델항의자유도는대응하는f -검정에대한분자의자유도입니다。모든항은자유도가1입니다。범주형변수의경우,자유도는@시변수의개수입니다。吸烟者
에는` ` `시변수가1개밖에없으므로자유도가1입니다。
t-통계량
용도
선형회귀에서,t-통계량은회귀계수에대한추론을할때유용합니다。我계수에대한가설검정은'계수0이가아니다’는대립가설에대해”계수가0이다”(즉,대응되는항이유의미하지않다)는귀무가설을검정합니다。
정의
계수i에대한다음과같은가설검정에대해
H0:β我= 0
H1:β我≠0,
T -통계량은다음과같습니다。
여기서SE(b我)는추정된계수我의@ @준오차입니다。
방법
fitlm
또는stepwiselm
을사용하여피팅된모델,예를들어,mdl
을얻은후다음을수행할수있습니다。
출력값指导书시에포함된대응되는계수(
tStat
)에대해계수추정값,추정값의SE
)및가설검정의t-통계량값구하기。출력값을@ @시하는호출수행하기
显示器(mdl)
T -통계량을사용하여회귀계수의유의성평가하기
이예제에서는t-통계량을사용하여회귀계수의유의성을검정하는방법을보여줍니다。
본데이터를불러와서선형회귀모델을피팅합니다。
负载哈尔德MDL = fitlm(配料,热量)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue ________ _______ ________ ________(截距)62.405 70.071 0.8906 0.39913 x1 1.5511 0.74477 2.0827 0.070822 x2 0.51017 0.72379 0.70486 0.5009 x3 0.10191 0.75471 0.13503 0.89592 x4 -0.14406 0.70905 -0.20317 0.84407观测数:13,误差自由度:8均方根误差:2.45 r平方:0.982,调整r平方:0.974 f统计量vs常数模型:111, p-value = 4.76e-07
각계수에대해tStat =估计/SE
임을확할수있습니다。가설검정에대한
-값은pValue
열에있습니다。각
-통계량은모델의다른항을가정할때각항의유의성을검정합니다。이결과에따르면모델의결정계수가로0.97매우높음에도불구하고5%유의수준에서유의미하게보이는계수가없습니다。이는예측변수간에다중공선성이존재함을나타내는경우가많습니다。
단계적회귀를사용하여모델에어느변수를포함시킬지판단합니다。
负载哈尔德MDL =逐级(配料,热量)
1.添加x4, FStat = 22.7985, pValue = 0.000576232添加x1, FStat = 108.2239, pValue = 1.105281e-06
mdl =线性回归模型:y ~ 1 + x1 + x4估计系数:估计SE tStat pValue ________ ________ _______ __________(截距)103.1 2.124 48.54 3.3243e-13 x1 1.44 0.13842 10.403 1.1053e-06 x4 -0.61395 0.048645 -12.621 1.8149e-07观测数:13,误差自由度:10均方根误差:2.73 r平方:0.972,调整r平方:0.967 f统计量vs常数模型:177,p值= 1.58e-08
이예제에서stepwiselm
은상수모델(디폴트)로시작하고순방향선택을사용하여x4
와x1
을점진적으로추가합니다。최종모델의각예측변수는모델의다른항을가정할때유의미합니다。알고리즘은모델에서어떤예측변수를추가해도유의미하게개선되지않을때중지됩니다。단계적회귀에대한자세한내용은stepwiselm
을참조하십시오。
참고 항목
LinearModel
|fitlm
|stepwiselm
|方差分析
|coefCI
|coefTest