主要内容

aicbic

信息标准

描述

为了评估模型的充分性,aicbic计算信息标准通过将竞争模型与数据拟合得到的对数似然值。

例子

另类投资会议= aicbic (logLnumParam返回给出对数似然值的赤池信息标准(AIC)logL推导出不同模型对数据的拟合,并给出相应数量的估计模型参数numParam

例子

另类投资会议bic) = aicbic (logLnumParamnumObs还返回贝叶斯(Schwarz)信息标准(BIC)给定估计中使用的相应样本尺寸numObs

例子

另类投资会议bic) = aicbic (logLnumParamnumObs“正常化”,真的)通过将所有输出参数除以样本大小来规范化结果numObs.默认情况下,aicbic不将结果标准化('正常化',假).

例子

另类投资会议bic集成电路) = aicbic (logLnumParamnumObs也返回结构集成电路包含AIC、BIC和其他信息标准

另类投资会议bic集成电路) = aicbic (logLnumParamnumObs“正常化”,真的)根据样本大小将所有返回的信息标准归一化numObs

例子

全部折叠

使用AIC和BIC比较三个竞争模型的样本内拟合。loglikelihood价值logL和相应的估计参数个数numParam在下表中。假设有效的样本大小为1500。

logL = (-681.4724;-663.4615;-632.3158);numParam = [12;18;27];numObs = 1500;台=表(logL numParam,“RowNames”“模型”+字符串(1:3)
台=3×2表logL numParam _______ ________ Model1 -681.47 12 Model2 -663.46 18 Model3 -632.32 27

计算AIC

计算每个估计模型的AIC。

aic = aicbic (logL numParam)
AIC =.3×1103.× 1.3869 1.3629 1.3186

最低AIC的模型具有最佳的样品拟合。用最低AIC识别模型。

[~, idxmin] = min (aic);bestFitAIC = Tbl.Properties.RowNames {idxmin}
bestFitAIC = ' Model3 '

AIC表明模型3.尽管是三款车型中最复杂的一款,但它的契合度是最好、最简约的。

计算BIC

计算每个估计模型的BIC。指定样本量numObs,计算BIC需要。

[~, bic] = aicbic (logL、numParam numObs)
BIC =3×1103.× 1.4507 1.4586 1.4621

与AIC一样,BIC值最低的模型具有最好的样本内拟合。确定最小BIC的模型。

[~, idxmin] = min (bic);bestFitBIC = Tbl.Properties.RowNames {idxmin}
bestFitBIC = ' Model1 '

BIC建议Model1.这是三种模型中最简单的一种。结果表明,当样本量较大时,BIC比AIC对复杂模型的影响更大。

将几个模型拟合到模拟数据中,然后使用所有可用的信息标准对模型拟合进行比较。

从数据生成过程(DGP)中模拟长度为100的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε. t

在哪里 ε. t 是一个均值为0,方差为1的随机高斯序列。

rng (1)重复性的%T = 100;文章= arima (“不变”,1,基于“增大化现实”技术的,[0.2,-0.4],“方差”1);y =模拟(文章、T);

假设DGP是未知的,AR(1)、AR(2)和AR(3)模型适合描述DGP。

对于每个竞争模型,创建一个华宇电脑估计模型模板。

Mdl (1) = arima (1,0,0);Mdl (2) = arima (2 0 0);Mdl (3) = arima (0, 0);

将每个模型适合模拟数据y,计算对数似然,并抑制估计显示。

numMdl =元素个数(Mdl);logL = 0 (numMdl, 1);% PreallocatenumParam = 0 (numMdl, 1);1:numMdl [EstMdl,~,logL(j)] =估计(Mdl(j),y,'展示''离开');结果=总结(EstMdl);numParam (j) = results.NumEstimatedParameters;结束

对于每个模型,计算所有可用的信息标准。

[〜,〜,ic] = aicbic(logl,numparam,t)
ic =结构体字段:Aic: [310.9968 285.5082 287.0309] bic: [318.8123 295.9289 300.0567] aicc: [311.2468 285.9292 287.6692] caic: [321.8123 299.9289 305.0567] hqc: [314.1599 289.7256 292.3027]

集成电路是一个一维结构数组,每个信息标准都有一个字段。每个场包含一个测量向量;元素j对应于产生对数似然的模型logL (j

对于每个标准,确定产生最小值的模型。

[〜,minidx] = structfun(@ min,ic);[MDL(minidx).Description]'
ans =5 x1字符串ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)ARIMA(2,0,0)模型(高斯分布)

每个标准的最小值对应于具有DGP的结构的AR(2)模型。

将几个模型拟合到模拟数据中,指定一个预样本进行估计,然后使用归一化AIC对拟合的模型进行比较。

从DGP模拟长度为50的随机路径

y t 1 + 0 2 y t - 1 - 0 4 y t - 2 + ε. t

在哪里 ε. t 是一个均值为0,方差为1的随机高斯序列。

rng (1)重复性的%t = 50;文章= arima (“不变”,1,基于“增大化现实”技术的,[0.2,-0.4],“方差”1);y =模拟(文章、T);

创建一个华宇电脑每个竞争模型的模型模板。

Mdl (1) = arima (1,0,0);Mdl (2) = arima (2 0 0);Mdl (3) = arima (0, 0);

将每个模型适合模拟数据y,并指定每次拟合所需的预样本观察数。计算对数似然,并抑制估计显示。

numMdl =元素个数(Mdl);logL = 0 (numMdl, 1);% PreallocatenumParam = 0 (numMdl, 1);numObs = 0 (numMdl, 1);j = 1:numMdl y0 = y(1:Mdl(j).P);% Presample是的= y ((Mdl每分钟(j) + 1):结束);%估计样本[estmdl,〜,logl(j)] =估计(mdl(j),最新,“Y0”, y0,...'展示''离开');结果=总结(EstMdl);numParam (j) = results.NumEstimatedParameters;numObs (j) = results.SampleSize;结束

对于每个模型,计算归一化AIC。

aic = aicbic (logL numParam numObs,“正常化”,真正的)
AIC =.3×13.2972 2.9880 3.0361

确定产生最小AIC的模型。

[~, minIdx] = min (aic);Mdl (minIdx)。描述
ans = "ARIMA(2,0,0)模型(高斯分布)"

输入参数

全部折叠

与不同模型的参数估计相关的对数似然数,指定为数值向量。

数据类型:双倍的

模型中估计参数的数目,指定为适用于的所有元素的正整数logL,或具有相同长度的正整数向量logL

数据类型:双倍的

估计中使用的样本大小指定为应用于所有元素的正整数logL,或具有相同长度的正整数向量logL

aicbic需要numObs除AIC外的所有标准。aicbic还需要numObs如果“正常化”真正的

数据类型:双倍的

输出参数

全部折叠

的元素对应的AIClogL,作为数字向量返回。

的元素对应的BIClogL,作为数字向量返回。

信息标准,作为包含本表中描述的字段的1-D结构数组返回。字段值是数值向量,其元素对应于的元素logL

描述
另类投资会议 另类投资会议
bic BIC
aicc 纠正AIC (AICc)
中安集团经贸 一致的AIC (CAIC)
认证机构 Hannan-Quinn标准(认证机构)

ic.aicic.bic是否返回相同的值另类投资会议bic,分别。

更多关于

全部折叠

信息标准

信息标准使用措施平衡适合参数分析的措施等级模型。对于特定标准,优选具有较低值的模型。

这个表描述了aicbic计算非规范标准。

信息标准 公式
另类投资会议 aic = -2*logL + 2*numParam
BIC bic = -2*logL + log(nummobs)*numParam . log(
AICc aic = aic + [2*numParam*(numParam + 1)]/(nummobs - numParam - 1)
中安集团经贸 caic = -2 * logl +(log(numobs)+ 1)* numparam
认证机构 hqc = -2*logL + 2*log(log(nummobs))*numParam . hqc = -2*logL + 2*log(log(nummobs))

错误说明测试,如拉格朗日乘数(lmtest.),可能性比率(lratiotest.)和沃尔德(Waldtest.)测试,比较两个相互竞争的嵌套模型的对数似然。相比之下,基于个体模型拟合的对数似然信息标准是相对于DGP的信息损失的近似度量。信息标准提供了任意数量的竞争模型(包括非嵌套模型)的相对排名。

提示

  • 在小样本中,AIC倾向于过拟合。为了解决过拟合问题,AICc增加了一个尺寸依赖的校正项,增加了对参数数量的惩罚。AIC与AIC渐近。的分析[3]建议使用AICcnumObs / numParam<40

  • 当经济学家比较具有不同数量的自回归滞后或不同的差异订单时,他们经常通过观察的数量来缩放信息标准[5].要缩放信息标准,请设置numObs到每个估计和设置的有效样本大小“正常化”为true。

参考

[1]Akaike Hirotugu。信息理论和极大似然原理的扩展在Hirotugu Akaike的选定论文,由Emanuel Parzen,Kunio Tanabe和Genshiro Kitagawa,199-213编辑。纽约:斯普林斯,1998年。https://doi.org/10.1007/978-1-4612-1694-0_15

[2]Akaike Hirotugu。“新看看统计模型识别。”自动控制学报19日,没有。6(1974年12月):716-23。https://doi.org/10.1109/TAC.1974.1100705

[3]Kenneth P. Burnham和David R. Anderson。模型选择与多模型推理:一种实用的信息论方法.第二届,纽约:斯普林斯,2002年。

[4]汉南,爱德华·J和巴里·g·奎恩。"确定自回归的顺序"英国皇家统计学会学报:B辑(方法论)41岁的没有。2(1979年1月):190-95。https://doi.org/10.1111/j.2517-6161.1979.tb01072.x

[5]Lütkepohl, Helmut和Markus Krätzig,编辑。应用时间序列计量经济学.第一版,剑桥大学出版社,2004。https://doi.org/10.1017/CBO9780511606885

[6]施瓦兹,吉迪恩。“估计模型的维度。”统计年鉴6,不。2(1978年3月):461-64。https://doi.org/10.1214/aos/1176344136

之前介绍过的R2006a