主要内容

时间序列回归VIII:滞后变量和估计偏差

这个例子展示了滞后预测因子如何影响多元线性回归模型的最小二乘估计。这是关于时间序列回归的一系列例子中的第8个,在前面的例子中有介绍。

介绍

许多计量经济学模型都是如此动态,使用滞后变量来整合随时间变化的反馈。相比之下,静态时间序列模型表示只对当前事件做出响应的系统。

滞后变量有几种类型:

  • 分布式滞后(DL)变量是滞后值 x t - k 观察到的外源性预测变量 x t

  • 自回归(AR)变量是滞后值 y t - k 观察到的内源性反应变量 y t

  • 移动平均线(MA)变量是滞后值 e t - k 不可观测随机过程的稳定性 e t

动态模型通常使用不同类型的滞后变量的线性组合来构建,以创建ARMA、ARDL和其他混合变量。在每种情况下,建模的目标都是准确而简明地反映相关经济因素之间的重要相互作用。

动态模型规范提出以下问题:哪些滞后是重要的?一些模型,如季节性模型,在数据的不同时期使用滞后。其他模型的滞后结构基于经济主体如何以及何时对变化条件作出反应的理论考虑。一般来说,滞后结构确定了对已知领先指标作出反应的时间延迟。

然而,滞后结构必须做的不仅仅是代表现有的理论。因为动态规范会在变量之间产生相互作用,从而影响标准回归技术,所以在设计滞后结构时也必须考虑到准确的模型估计。

规范问题

考虑多元线性回归(MLR)模型:

y t Z t β + e t

在哪里 y t 这是一个观察到的反应, Z t 包括每个潜在相关预测变量(包括滞后变量)的列,以及 e t 是一个随机创新过程。中系数估计的准确性 β 取决于的组成列 Z t ,以及联合分配 e t .选择预测 Z t 在统计和经济上都具有重要意义的方法通常包括估算、残差分析和重新确定的周期。

经典线性模型(CLM)假设,在例子中讨论时间序列回归I:线性模型,允许普通最小二乘法(OLS)生成 β 具有理想的特性:相对于其他估计量,无偏、一致和有效。滞后指标在 Z t 但是,可能会导致违反CLM假设。具体违反情况取决于模型中滞后变量的类型,但动态反馈机制的存在通常会夸大与静态规范相关的问题。

模型规范问题通常是相对于响应变量的数据生成过程(DGP)进行讨论的 y t 然而,实际上,DGP是一种理论构造,仅在仿真中实现。没有任何模型能够完全捕获真实世界的动力学,并且模型系数是真实的 β 总是真实DGP中的子集。因此,创新在 e t 成为过程内在随机性和潜在的大量遗漏变量(OVs)的混合体。自我在 e t 在计量经济模型中,OV随时间呈现持续性。与其将模型与理论DGP进行比较,不如评估数据中的动态是否与残差中的自相关相区别,或者在多大程度上与之相区别。

最初,滞后结构可能包括在多个近似时间对经济因素的观察。然而,观察时间t可能与观测结果相关吗t- 1,t- 2,以此类推,通过经济惯性。因此,滞后结构可能overspecify通过包含对DGP仅有边际贡献的滞后预测序列,对响应进行动态分析。该规范将夸大过去历史的影响,并未能对模型施加相关限制。扩展滞后结构还需要扩展预采样数据,从而减少样本量,减少估计过程中的自由度。因此,过度指定的模型可能表现出明显的共线性和高估计方差问题。由此产生的估计数 β 精度低,而且很难分离单个的效果。

为了减少预测器的依赖,可以限制滞后结构。但是,如果限制过于严格,就会出现其他估计问题。限制滞后结构可以提供不充分或不够精确的信息通过排除实际上是gdp重要组成部分的预测指标,来研究响应的动态。这导致了一个低估过去历史影响的模型,迫使重要的预测者进入创新过程。如果滞后预测 e t 是否与近似滞后预测因子相关 Z t ,违反了CLM关于回归者严格外生性的假设,并且OLS估计 β 变得有偏见和不一致。

具体问题与不同类型的滞后预测因子相关。

滞后外生因素 x t - k ,不违反CLM假设。然而,DL模型通常被描述,至少在最初,由一个长序列潜在的相关的滞后,因此遭受上述过度规范的问题。通常(如果是特别的)方法对滞后权重(即 β )在示例中讨论了这些问题时间序列回归IX:滞后顺序选择.然而,从原则上讲,DL模型的分析与静态模型的分析是相似的。与共线性、有影响的观测、伪回归、自相关或异方差创新等相关的估计问题仍然必须加以检验。

落后于内生因素 y t - k AR模型引入了违反CLM假设的行为,从而导致OLS估计的偏差 β .在没有任何其他CLM违规的情况下,估计仍然是一致的和相对有效的。考虑一个简单的一阶自回归 y t 在…上 y t - 1

y t β y t - 1 + e t

在这个模型中, y t 这是由两者共同决定的 y t - 1 e t .将方程一步一步地向后移动, y t - 1 这是由两者共同决定的 y t - 2 e t - 1 y t - 2 这是由两者共同决定的 y t - 3. e t - 2 等等。,由轨迹的预测 y t - 1 与创新过程的整个历史相关。与规格不足一样,CLM严格外生性假设被违反,OLS估计 β 成为有偏见。因为 β 必须吸收各自的影响吗 e t - k ,模型残差不再代表真正的创新[10]

当AR模型中的创新是自相关的时,问题就更加复杂了。如示例中所讨论的时间序列回归VI:残留诊断,在没有其他CLM违规的情况下,自相关创新产生了无偏的,如果潜在的高方差,模型系数的OLS估计。在这种情况下,主要的复杂情况是,系数的标准误差的通常估计量变得有偏差。(异方差创新的影响类似,但通常不那么明显。)然而,如果自相关的创新与严格外生性的违反相结合,如AR术语所产生的,估计 β 变得有偏见和不一致。

如果创新滞后 e t - k 由于创新无法直接观察到,因此将其用作预测因子,估计过程的性质将发生根本性的变化。估计要求将MA项倒置以形成无限AR表示,然后限制其生成可在实践中进行估计的模型。因为在估计过程中必须施加限制在这方面,除了OLS之外,还需要数值优化技术,例如最大似然估计(MLE)。示例中考虑了带有MA项的模型时间序列回归IX:滞后顺序选择

模拟估计量的偏差

为了说明由滞后的内生预测因子引入的估计量偏差,考虑以下DGP:

y t β 0 y t - 1 + e t

e t γ 0 e t - 1 + δ t

δ t N 0 σ 2

我们对该模型进行了两组重复的蒙特卡罗模拟。第一组使用正常和独立分布(NID)的创新 γ 0 0 .第二组使用AR(1)创新,具有 | γ 0 | > 0

%构建模型组件:beta0 = 0.9;y_t的% AR(1)参数gamma0=0.2;e_t的% AR(1)参数AR1 = arima (基于“增大化现实”技术的beta0,“常数”0,“方差”1);AR2 = arima (基于“增大化现实”技术的gamma0,“常数”0,“方差”1);%模拟样本量:T=[10,501005001000];numizes=长度(T);%运行模拟:numObs = max (T);%模拟路径的长度numPaths = 1 e4;%模拟路径数燃烧= 100;%初始过渡期,待丢弃西格玛=2.5;%创新的标准差E0=西格玛*随机数(燃尽+微秒,微秒,2);%NID创新E1Full=E0(:,:,1);Y1Full=filter(AR1,E1Full);% AR(1)流程与NID创新E2Full=滤波器(AR2,E0(:,:,2));Y2Full=过滤器(AR1,E2Full);%AR(1)流程与AR(1)创新清晰的E0%提取仿真数据,暂态期后:日元= Y1Full(燃烧+ 1:最终,);% Y1 (t)LY1 = Y1Full(燃烧:end-1:);%Y1(t-1)Y2=Y2满(烧成+1:结束,:);% Y2 (t)LY2 = Y2Full(燃烧:end-1:);% Y2 (t - 1)清晰的Y1FullY2Full计算β的OLS估计值:BetaHat1 = 0 (numSizes numPaths);BetaHat2 = 0 (numSizes numPaths);i=1:numizes n=T(i);j = 1: numPaths BetaHat1 (i, j) = LY1 (1: n, j) \ Y1 (1: n, j);BetaHat2 (i, j) = LY2 (1: n, j) \ Y2 (1: n, j);结束结束%设置绘图域:w1 =性病(BetaHat1 (:));x1 = (beta0-w1): (w1/1e2): (beta0 + w1);w2 =性病(BetaHat2 (:));x2 = (beta0-w2): (w2/1e2): (beta0 + w2);%创建图形和打印控制柄:hFig1 =图;持有在…上hPlots1 = 0 (numSizes, 1);hFig2 =图;持有在…上hPlots2 = 0 (numSizes, 1);%图估计分布:颜色=冬天(numSizes);i = 1:numSizes c = colors(i,:);图(hFig1);f1 = ksdensity (BetaHat1(我,:),x1);hPlots1 (i) =情节(x1, f1,“颜色”C“线宽”图(hFig2);f2=Ks密度(BetaHat2(i,:),x2);hPlots2(i)=绘图(x2,f2,“颜色”C“线宽”2);结束%注释绘图:图(hFig1)hBeta1=直线([beta0 beta0],[0(1.1)*最大值(f1)],“颜色”“c”“线宽”2);包含(“估计”)伊拉贝尔(“密度”)头衔(['{\bf OLS estimation of \beta_0 = 'num2str (beta0, 2),“,NID创新}”])传说([hPlots1; hBeta1], [strcat ({“T =”}, num2str (T ',“%-d”));“\ beta_0 = ',num2str(beta0,2)])轴网格在…上持有

图中包含一个轴对象。轴对象的标题空白O L S空白E S ti m a t S空白的空白β指数的0基线空白=空白0。9、blank N I D blank I N o v a t o s包含6个line类型的对象。这些对象表示T = 10, T = 50, T = 100, T = 500, T = 1000, \beta_0 = 0.9。

图(hFig2) hBeta2 = line([beta0 beta0],[0 (1.1)*max(f2)],“颜色”“c”“线宽”2);包含(“估计”)伊拉贝尔(“密度”)头衔(['{\bf OLS estimation of \beta_0 = 'num2str (beta0, 2),“,AR(1)创新}”])传说([hPlots2; hBeta2], [strcat ({“T =”}, num2str (T ',“%-d”));“\ beta_0 = ',num2str(beta0,2)])轴网格在…上持有

图中包含一个Axis对象。标题为blank O L S blank E S t t i m a t E S blank O f blank beta indexOf 0基线blank=blank 0.9,blank a R(1)blank i n n O v a t i O n S的Axis对象包含6个类型为line的对象。这些对象表示t=10、t=50、t=100、t=500、t=1000、\beta_0=0.9。

在上述所有模拟中, β 0 0 9 .这些图是…的分布 β 0 ˆ 在每个过程的多个模拟中,显示了OLS估计量的偏差和方差作为样本量的函数。

分布的偏差使得很难直观地评估它们的中心。偏见被定义为 E β 0 ˆ - β 0 ,所以我们用均值来衡量总体估计值。在NID创新的情况下,一个相对较小的负偏差逐渐消失,因为累计估计单调地增加 β 0

AggBetaHat1=平均值(BetaHat1,2);fprintf(% 6 s % 6年代\ n“大小”“Mean1”
大小Mean1
i = 1:numSizes fprintf(“% 6 u % -6.4 f \ n”,T(i),AggBetaHat1(i))结束
10 0.7974 50 0.8683 100 0.8833 500 0.8964 1000 0.8981

在AR(1)创新的情况下,在小样本中具有负偏差的合计估计值单调地向 β 0 ,但在中等样本量时通过DGP值,在大样本量时逐渐变得更有正偏差:

AggBetaHat2=平均值(BetaHat2,2);fprintf(% 6 s % 6年代\ n“大小”“非常刻薄的”
大小非常刻薄
i = 1:numSizes fprintf(“% 6 u % -6.4 f \ n”,T(i),AggBetaHat2(i))结束
10 0.8545 50 0.9094 100 0.9201 500 0.9299 1000 0.9310

在存在自相关创新时,OLS估计量的不一致性在计量经济学家中广为人知。尽管如此,它对一系列样本大小给出了准确的估计,但其实际后果却不太被广泛认可。我们将在本节进一步描述这种行为动态相关效应

在OLS估计方面,上述两组模拟的主要区别在于创新和预测器之间的交互是否存在延迟。在具有NID创新的AR(1)过程中,预测器 y t - 1 是同时不相关的 e t ,但与之前所有的创新相关,如前所述。在具有AR(1)创新的AR(1)过程中,预测器 y t - 1 成为与 e t 同时,通过 e t e t - 1

为了了解这些关系,我们计算了它们之间的相关系数 y t - 1 和两个 e t e t - 1 ,对于每个流程分别为:

%提取过渡期后的创新数据:E1=E1满(磨合+1:结束,:);% E1 (t)LE1 = E1Full(燃烧:end-1:);%E1(t-1)E2 = E2Full(燃烧+ 1:最终,);% E2 (t)LE2 = E2Full(燃烧:end-1:);% E2 (t - 1)清晰的E1FullE2Full%预分配相关系数:CorrE1 = 0 (numSizes numPaths);CorrLE1 = 0 (numSizes numPaths);CorrE2 = 0 (numSizes numPaths);CorrLE2 = 0 (numSizes numPaths);计算相关系数:i=1:numizes n=T(i);j=1:numPaths% NID创新:(CorrE1 (i, j) = corr LY1 (1: n, j), E1 (1: n, j));(CorrLE1 (i, j) = corr LY1 (1: n, j), LE1 (1: n, j));%有AR(1)创新CorrE2(i,j)=corr(LY2(1:n,j),E2(1:n,j));correle2(i,j)=corr(LY2(1:n,j),LE2(1:n,j));结束结束%设置绘图域:sigmaE1=std(CorrE1(:);muE1=mean(CorrE1(:);xE1=(muE1-sigmaE1):(sigmaE1/1e2):(muE1+sigmaE1);sigmaLE1=std(correle1(:);muLE1=mean(correle1(:);xLE1=(muLE1-sigmaE1/2):(sigmaE1/1e3):muLE1;sigmaE2=std(CorrE2(:);muE2=mean)(CorrE2(:);xE2=(muE2-sigmaE2)/sigmaE2=mean:);sigmaE2=std=(correle2(:);xLE2=(muLE2-sigmaLE2):(sigmaLE2/1e2):(muLE2+sigmaLE2);%创建图形和打印控制柄:hFigE1 =图;持有在…上hPlotsE1 = 0 (numSizes, 1);hFigLE1 =图;持有在…上hPlotsLE1=零(numizes,1);hFigE2=数字;保持在…上hPlotsE2 = 0 (numSizes, 1);hFigLE2 =图;持有在…上hPlotsLE2 = 0 (numSizes, 1);% Plot相关系数分布:颜色=铜(numSizes);i = 1:numSizes c = colors(i,:);图(hFigE1) fE1 = ksdensity(CorrE1(i,:),xE1);hPlotsE1 (i) =情节(fE1 xE1,“颜色”C“线宽”2);图(hFigLE1) fLE1 = ksdensity(CorrLE1(i,:),xLE1);hPlotsLE1 (i) =情节(xLE1 fLE1,“颜色”C“线宽”2);图(hFigE2) fE2 = ksdensity(CorrE2(i,:),xE2);hPlotsE2 (i) =情节(xE2、价“颜色”C“线宽”2);图(hFigLE2) fLE2 = ksdensity(CorrLE2(i,:),xLE2);hPlotsLE2 (i) =情节(xLE2 fLE2,“颜色”C“线宽”2);结束清晰的科雷1CorrLE1科雷2CorrLE2%注释绘图:图(hFigE1)包含(“相关系数”)伊拉贝尔(“密度”)标题('{\bf {it y_{t-1}}与NID {\it e_t}}的样本相关性')传说(hPlotsE1 strcat ({“T =”}, num2str (T ',“%-d”)),“位置”“西北”)轴网格在…上ylim([0(1.1) *马克斯(fE1)])

图中包含一个轴对象。标题为空白的轴对象S a m p l e blank C o r e l a t i o n blank o f blank y indexOf t-1基线空白a n d blank n i d blank e indexOf t基线包含5个类型行对象。这些对象表示t=10、t=50、t=100、t=500、t=1000。

图(hFigLE1)包含(“相关系数”)伊拉贝尔(“密度”)标题({\bf {it y_{t-1}}与NID {\it e_{t-1}}的样本相关性)传说(hPlotsLE1 strcat ({“T =”}, num2str (T ',“%-d”)),“位置”“西北”)轴网格在…上ylim([0(1.1) *马克斯(fLE1)])

图中包含一个轴对象。坐标轴对象与标题空白S m p l e C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d n i d空白e indexOf t - 1基线包含5线类型的对象。这些对象代表T = 10, T = 50, T = 100, T = 500, T = 1000。

图(hFigE2)xlabel(“相关系数”)伊拉贝尔(“密度”)标题({\bf {it y_{t-1}}与AR(1) {\it e_t}}的样本相关性)传说(hPlotsE2 strcat ({“T =”}, num2str (T ',“%-d”)),“位置”“西北”)轴网格在…上ylim([0(1.1) *马克斯(铁)])

图中包含一个轴对象。坐标轴对象标题空白S m p l e空白C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d r(1)空白空白e indexOf t基线包含5线类型的对象。这些对象代表T = 10, T = 50, T = 100, T = 500, T = 1000。

图(hFigLE2)包含(“相关系数”)伊拉贝尔(“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}和AR(1){\它e_ {t - 1}}}”)图例(hPlotsLE2,strcat({“T =”}, num2str (T ',“%-d”)),“位置”“西北”)轴网格在…上ylim([0(1.1)*最大值(fLE2)]保持

图中包含一个轴对象。坐标轴对象标题空白S m p l e空白C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d r(1)空白空白e indexOf t - 1基线包含5线类型的对象。这些对象代表T = 10, T = 50, T = 100, T = 500, T = 1000。

这些图显示了两者之间的相关性 y t - 1 e t - 1 在这两种情况下。之间的相关性 y t - 1 e t ,然而,只有在AR(1)创新的情况下才会持续渐进。

相关系数是自相关标准度量的基础。上面的图突出了有限样本中相关系数的偏差和方差,这使模型残差中自相关的实际评估变得复杂。Fisher对相关度量进行了广泛的检查([3][4][5]),他提出了许多可供选择的方案。

使用有偏估计 β 0 估计 γ 0 在残差中也是有偏差的[11].如前所述,AR(1)创新情况下的OLS残差不能准确表示工艺创新,因为 β 0 ˆ 吸收自相关扰动所产生的系统影响。

更复杂的是,杜宾-沃森统计数据,通常被报道为一阶自相关程度的衡量,是有偏见的检测之间的任何关系 e t ˆ e ˆ t - 1 正是在存在这种关系的AR模型中,偏差是模型中偏差的两倍 β 0 ˆ [8]

因此,OLS可能持续高估 β 0 而残差自相关的标准度量低估了导致不一致的条件。这就产生了一种扭曲的契合度,以及对动态术语重要性的误读。德宾的 h 在这种情况下,测试同样无效[7].德宾的 通常更倾向于采用类似的Breusch-Godfrey测试[1]

近似估计偏差

在实践中,必须从可用数据中发现产生时间序列的过程,并且这种分析最终会受到估计偏差和方差带来的信心损失的限制。经济数据的样本量通常位于上述模拟中考虑的样本量的较低端,因此不准确度可能很大对自回归模型预测性能的影响可能是严重的。

对于具有简单创新结构的简单AR模型,从理论上给出了OLS估计偏差的近似。这些公式在评估从单一数据样本得到的AR模型系数的可靠性时很有用。

在NID创新的情况下,我们可以将模拟偏差与广泛使用的近似值进行比较[11][13]

E β 0 ˆ - β 0 - 2 β 0 / T

m = min (T);M = max (T);eBias1 = AggBetaHat1-beta0;%估计偏差tBias1 = 2 * beta0. / T;%的理论偏差eB1interp=interp1(T,eBias1,m:m,“pchip”);tB1interp = interp1 (T tBias1 m: m,“pchip”);图绘制(T eBias1“罗”“线宽”, 2)在…上he1=绘图(m:m,eB1interp,“r”“线宽”图(T,tBias1,“波”) ht1 = plot(m: m,tB1interp,“b”);持有图例([he1 ht1],“模拟偏差”“近似理论偏见”“位置”“E”)xlabel(“样本”)伊拉贝尔(“偏见”)标题(“{\bf估计偏差,NID创新}”网格)在…上

图中包含一个Axis对象。标题为blank E s t i m a t o或blank B i a s、blank N i D blank i N o v a t o N s的Axis对象包含4个类型为line的对象。这些对象表示模拟偏差、近似理论偏差。

即使在中等大小的样本中,近似值也相当可靠,并且通常随着时间的推移而提高 β 0 绝对值减少。

在AR(1)创新的情况下,偏差取决于两者 β 0 γ 0 。渐近地,它近似为[6]

E β 0 ˆ - β 0 γ 0 1 - β 0 2 / 1 + γ 0 β 0

eBias2 = AggBetaHat2-beta0;%估计偏差tBias2 = gamma0 * (1-beta0 ^ 2) / (1 + gamma0 * beta0);%渐近偏差eB2interp=interp1(T,eBias2,m:m,“pchip”);图绘制(T eBias2“罗”“线宽”, 2)在…上何=情节(m: m、eB2interp“r”“线宽”2);ht2 =情节(0:M, repmat (tBias2 1 M + 1),“b”“线宽”2);持有传奇([何ht2],“模拟偏差”“近似渐近偏差”“位置”“E”)xlabel(“样本”)伊拉贝尔(“偏见”)标题(“{\bf估计偏差,AR(1)创新}”网格)在…上

图中包含一个轴对象。该轴对象的标题为空白E t t t t t t o s,空白a r(1)空白in o t o s包含3个类型的对象。这些对象代表模拟偏差,近似渐近偏差。

这里我们看到偏差随着样本量的增加从负值移动到正值,然后最终接近渐近界。有一个样本大小的范围,从25到100,偏差的绝对值低于0.02。在这样一个“甜蜜点”中,OLS估计器的表现可能优于专门设计用于说明自相关存在的其他估计器。我们将在本节进一步描述这种行为动态相关效应

图中近似渐近偏差是有用的 β 0 ˆ 两者的函数 β 0 γ 0 ,以观察自相关程度的变化对两者的影响 y t e t

图beta=-1:0.05:1;gamma=-1:0.05:1;[beta,gamma]=网格(beta,gamma);保持在…上冲浪(βγγ。*(1测试版^ 2)。/(1 +γ。*β))无花果= gcf;厘米= fig.Colormap;numC =尺寸(厘米,1);zL = zlim;zScale = zL (2) zL (1);iSim = (tBias2-zL (1)) * numC / zScale;cSim = interp1 (1: numC,厘米,iSim);恒生投资管理公司= plot3 (beta0 gamma0 tBias2,“高”“MarkerSize”8“MarkerFaceColor”, cSim);视图(-20,20)ax = gca;u = ax.XTick;v = ax.YTick;网格(u, v, 0(长度(v),长度(u)),“FaceAlpha”,0.7,“EdgeColor”“k”“线型”':')持有联想(hSim,“模拟模式”“位置”“最佳”)xlabel(“\beta_0”)伊拉贝尔(“\ gamma_0”) zlabel (“偏见”)标题(“{\bf近似渐近偏差}”)灯光色条网格在…上

图中包含一个轴对象。标题为空白A p p r x i m t e空白A s y m t t t c空白B的轴对象包含类型为面、线的3个对象。这个对象表示模拟模型。

β 0 γ 0 向相反的方向移动,远离零自相关。当然,在有限的样本中,偏差可能要小得多。

动态相关效应

如前所述,使用OLS进行动态模型估计的挑战来自CLM假设的违背。有两种违反是关键的,我们在这里详细讨论它们的影响。

首先是动态效应,这是由预测因子之间的相关性引起的 y t - 1 以及之前所有的创新 e t - k .这发生在任何AR模型中,并导致有限样本的有偏OLS估计。在没有其他违规行为的情况下,苏丹生命线行动仍然保持一致,而且在大样本中偏见消失了。

第二个是相关效应,这是由预测因子之间的同期相关性引起的 y t - 1 和创新 e t 。这发生在创新过程是自相关的情况下,并导致预测值的OLS系数因响应中的同期变化而获得过多或过少的积分,具体取决于相关符号。也就是说,它产生了持续偏差。

上面的第一组模拟说明了这样一种情况 β 0 是积极的, γ 0 是零。第二组模拟演示了两种情况 β 0 γ 0 是积极的。积极 β 0 ,对 β 0 ˆ 是负的。积极 γ 0 ,相关性对 β 0 ˆ 是正的。因此,在第一组模拟中,在样本大小上存在负偏差。而在第二组模拟中,两种效应之间存在竞争关系,小样本中动态效应占主导地位,大样本中相关效应占主导地位。

正AR系数在计量模型中很常见,因此这两种效应相互抵消是典型的,从而产生了一系列的样本量,其中OLS偏差显著降低。这个范围的宽度取决于 β 0 γ 0 ,并决定OLS-superior范围其中,OLS优于在创新中为直接解释自相关性而设计的备选估计器。

中总结了影响动态和相关效应大小的一些因素[9].其中包括:

动态效果

  • 随着样本量的减少而增加。

  • 减少与增加 β 0 如果创新的方差是固定的。

  • 减少与增加 β 0 如果调整创新的方差以保持恒定 R 2

  • 随着创新的变化而增加。

相关的影响

  • 增加而增加 γ 0 ,以递减的速度。

  • 减少与增加 β 0 ,以日益增长的速度。

这些因素的影响可以通过改变上述模拟中的系数来测试。总的来说,动态效应越大,相关效应越小,ols优势范围越宽。

刀切偏压减小

重叠程序是一种交叉验证技术,通常用于减少样本统计的偏差。模型系数的Jacknife估计量相对容易计算,不需要大的模拟或重采样。

基本思想是从全样本计算估计值从一个子样本序列中,然后以消除部分偏差的方式合并估计。一般来说,对于样本大小 T , OLS估计量的偏差 β 0 ˆ 可以表示为对 T - 1

E β 0 ˆ - β 0 w 1 T + w 2 T 2 + O T - 3.

的权重 w 1 w 2 取决于具体系数和模型。如果估计 β ˆ 是按顺序制作的吗 1 子样本的长度 l O T ,则折刀估计 β 0 是:

β J ˆ T T - l β 0 ˆ - l T - l 1 1 β ˆ

可以证明,折刀估计量满足:

E β 0 ˆ - β 0 O T - 2

从而消除 O T - 1 项从偏置展开。偏差是否真的减少取决于扩展中剩余项的大小,但是折叠式估计器在实践中表现得很好。特别的是,该技术对于非常规创新、ARCH效应和各种模型的错误规范是稳健的[2]

统计和机器学习工具箱™功能重叠使用系统的“漏掉一个”子样本序列执行刀切程序。对于时间序列,删除观测值会改变自相关结构。为了保持时间序列中的相关性结构,刀切程序必须使用非重叠子样本,如分区或移动块。

下面实现了一个简单的折刀估计 β 0 ˆ 使用每个模拟中的数据分区来产生子样本估计 β ˆ .我们用NID或AR(1)创新技术对模拟数据进行折刀前后的性能比较:

m = 5;%子样本数量% Preallocate记忆:betaHat1 = 0 (m, 1);次样本估计,NID创新betaHat2 = 0 (m, 1);%子样本估计,AR(1)创新BetaHat1J = 0 (numSizes numPaths);Jackknife估计,NID创新BetaHat2J = 0 (numSizes numPaths);Jackknife估计,AR(1)创新%计算折刀估计值:i=1:numizes n=T(i);%样本大小l = n / m;%分区子间隔长度j=1:numPathss=1:m betaHat1(s)=LY1((s-1)*l+1:s*l,j)\Y1((s-1)*l+1:s*l,j);betaHat2(s)=LY2((s-1)*l+1:s*l,j)\Y2((s-1)*l+1:s*l,j);BetaHat1J-(n/(n-l))*;结束结束结束清晰的BetaHat1BetaHat2%显示jackknifing前后的平均估计值:AggBetaHat1J=平均值(BetaHat1J,2);清除BetaHat1J流(% 6 s % 8 s % 8年代\ n”“大小”“Mean1”“Mean1J”
大小Mean1 Mean1J
i = 1:numSizes fprintf(' % 6 u % -8.4 f % -8.4 f \ n”AggBetaHat1 T(我),(我),AggBetaHat1J(我))结束
10 0.7974 0.8055 50 0.8683 0.8860 100 0.8833 0.8955 500 0.8964 0.8997 1000 0.8981 0.8998
AggBetaHat2J =意味着(BetaHat2J, 2);清晰的BetaHat2J流(% 6 s % 8 s % 8年代\ n”“大小”“非常刻薄的”“Mean2J”
尺寸平均值2平均值2J
i = 1:numSizes fprintf(' % 6 u % -8.4 f % -8.4 f \ n”AggBetaHat2 T(我),(我),AggBetaHat2J(我))结束
10 0.8545 0.8594 50 0.9094 0.9233 100 0.9201 0.9294 500 0.9299 0.9323 1000 0.9310 0.9323

子样本的数量, 5 ,以最小的样本量选择, n 1 0 ,记住。更大的 在更大的样本中可能会提高性能,但对于选择子样本大小没有公认的启发式方法,因此有必要进行一些实验。代码可以很容易地修改为使用替代的子采样方法,例如移动块。

结果表明,在NID创新的情况下,偏差一致减少。在AR(1)创新的情况下,该程序似乎推动估计更快地通过ols优越范围。

总结

这个例子展示了一个简单的AR模型,以及一些简单的创新结构,以此来说明与动态模型估计相关的一些一般问题。这里的代码很容易修改,以观察改变参数值、调整创新方差、使用不同的滞后结构等的影响。解释性DL术语也可以添加到模型中。DL项具有降低估计偏差的能力,尽管OLS倾向于以DL系数为代价过高估计AR系数[11].这里的一般设置允许大量的实验,这是在实践中评估模型时经常需要的。

当考虑任何估计量的偏差和方差所带来的权衡时,重要的是要记住,与高方差无偏估计量相比,方差减小的有偏估计量可能具有更好的均方误差特征。除了计算简单之外,OLS估计器的一个优点是,随着样本量的增加,它能相对有效地减少方差。这通常足以采用OLS作为选择的估计值,甚至对于动态模型也是如此。另一个优点,正如这个例子所显示的,是OLS优越范围的存在,在这个范围内,即使在通常被认为是不利的条件下,OLS也可能优于其他估计量。OLS估计的最薄弱之处是它在小样本中的表现,在小样本中,偏差和方差可能是不可接受的。

在这个例子中提出的估计问题表明,需要新的自相关指标,并在其存在的情况下使用更稳健的估计方法。示例中描述了其中一些方法时间序列回归X:广义最小二乘和HAC估计.然而,正如我们所看到的,自相关AR模型的OLS估计量的不一致性并不足以排除它,一般来说,它是更复杂的、一致的估计量(如最大似然、可行广义最小二乘和工具变量)的可行竞争者,试图消除关联效应,但不改变动态效应。最佳选择将取决于样本量、滞后结构、外生变量的存在,等等,通常需要本例中给出的模拟类型。

参考文献

[1]Breusch,T.S.和L.G.Godfrey,“动态同步模型中自相关测试的最新工作回顾”,载于Currie,D.,R.Nobay和D.Peel(编辑),宏观经济分析:宏观经济学和计量经济学论文集。伦敦:克罗姆·赫尔姆,1981年。

[2]钱伯斯,m . J。平稳自回归模型的折刀估计。埃塞克斯大学讨论论文第684号,2011。

[3]费舍尔,r . .来自无定大总体的样本的相关系数值的频率分布生物计量学.第十卷,1915年,第507-521页。

[4]费舍尔,r。从小样本推导出的相关系数的“可能误差”密特隆.1921年第1卷,3-32页。

[5]费舍尔,r。偏相关系数的分布密特隆.第3卷,1924年,329-332页。

[6]海布斯,D。动态时间序列模型中的统计估计和因果推理问题科斯特纳(H. Costner)社会学方法论.旧金山:乔西-巴斯出版社,1974年出版。

[7]英德尔,b。含滞后因变量模型自相关检验的有限样本功率经济学的信件.《中国科学院大学学报(自然科学版)》1984年第14卷,第179 - 185页。

[8]约翰斯顿,J。计量经济学方法纽约:麦格劳·希尔,1972年。

[9]雪道。具有滞后因变量和自相关干扰的教学回归分析。经济教育学报.1996年第27卷,72-84页。

[10]雪道。说明OLS的偏倚YtλYt1+Ut."经济教育学报.第31卷,2000年,76-80页。

[11]Malinvaud E。计量经济学的统计方法.阿姆斯特丹:北荷兰,1970年。

[12]万豪,F.和J.波普。自相关估计中的偏差生物计量学.1954年第41卷,第390—402页。

[13]白色,j·S。“序列相关系数的均值和方差的渐近展开”。生物计量学.第48卷,1961年,85-94页。