主要内容

时间序列回归八世:滞后变量和估计偏差

这个例子展示了滞后因素如何影响多元线性回归模型的最小二乘估计。第八在一系列的例子在时间序列回归,后表示在之前的例子。

介绍

许多经济计量模型动态随着时间的推移,使用滞后变量将反馈。相比之下,静态时间序列模型表示系统,专门应对时事。

滞后变量有几种类型:

  • 分布式滞后(DL)变量的滞后值 x t - - - - - - k 观察到的外生变量预测指标 x t

  • 自回归(AR)变量的滞后值 y t - - - - - - k 观察到的内生变量的反应 y t

  • 移动平均线(MA)变量的滞后值 e t - - - - - - k 未被注意的随机的创新过程 e t

动态模型通常使用的线性组合构造不同类型的滞后变量,建立ARMA, ARDL等混合动力车。在每种情况下,建模的目标是反映重要的相互作用相关的经济因素,准确、简明。

动态模型规范问的问题:滞后是重要的?一些模型,如季节性模型,在不同时期的数据使用滞后。其他模型理论的基础上建立滞后结构考虑的,当经济主体应对不断变化的环境。一般来说,滞后结构识别的时间延迟响应已知的领先指标。

然而,滞后结构必须做的不仅仅是代表可用的理论。因为动态规格生产变量之间的相互作用可以影响标准的回归技术,滞后结构也必须设计精确的模型估计。

规范问题

看不到考虑多元线性回归(MLR)模型:

y t = Z t β + e t ,

在哪里 y t 是一个观察到的反应, Z t 对于每一个可能相关的预测变量,包括列包括滞后变量,和 e t 是一个随机的创新过程。系数的估计的准确性 β 取决于组成的列 Z t 的联合分布 e t 。选择预测 Z t 都统计上和经济上重要的通常涉及周期估计,残留分析,respecification。

经典线性模型(CLM)假设,讨论的例子时间序列回归我:线性模型,允许普通最小二乘法(OLS)产生的估计 β 与理想的属性:无偏、一致和高效的相对于其他估计。滞后指标在 Z t 然而,可以引入违反CLM的假设。具体违法行为取决于类型的滞后变量模型中,但动态反馈机制的存在,一般来说,往往夸大与静态规范相关的问题。

通常讨论模型规范问题相对于响应变量的数据生成过程(文章) y t 。然而,实际上,文章的理论构造,意识到只有在模拟。完全没有模型捕捉真实的动力学,模型系数 β 总是一个子集的真正的文章。因此,创新 e t 成为一个固有的特性转化过程和一个潜在的大量的省略变量(ov)。自我在 e t 是常见的在经济计量模型机汇展览持久性。而不是比较模型和理论文章,更实用的评估,是否或什么程度,动态数据区别于自我的剩余工资。

最初,滞后结构的经济因素可能包括观察多个近似。然而,观察时间t有时可能会与观察吗t- 1,t- 2,等等,通过经济惯性。因此,可能会滞后结构overspecify的动态滞后的反应包括序列预测文章只有边际贡献。规范将夸大历史的影响,以及无法对模型施加相关限制。扩展滞后结构还需要延长presample数据,减少了样本容量和减少自由度的数量估计程序。因此,overspecified模型可能出现明显的共线性和高估计量方差的问题。由此产生的估计 β 精度较低,很难单独个体的影响。

减少预测依赖、滞后结构可以限制。如果限制太严重,然而,其他的估计出现问题。一个滞后结构可能受到限制underspecify的动态反应不包括预测,实际上是文章的重要组成部分。这导致模型低估了历史的影响,迫使重要预测因子到创新的过程。如果落后预测 e t 与直接滞后的预测吗 Z t CLM假设的严格的解释变量是违反,exogeneity和OLS估计 β 成为偏见和不一致的。

具体问题与不同类型的滞后指标。

滞后外生因素 x t - - - - - - k 本身不违反CLM的假设。然而,DL模型常常被描述,至少在最初,长序列潜在的相关的滞后,所以遭受overspecification上面提到的问题。常见,如果有些特别,方法强加限制滞后权重(即系数 β 在这个例子中讨论)时间序列回归第九:延迟订单的选择。原则上,然而,DL的分析模型相似的静态模型。估计共线性问题,影响观察,伪回归,仍然必须检查autocorrelated或异方差的创新等。

落后于内生因素 y t - - - - - - k 有更多的问题。AR模型引入违反CLM假设导致偏见的OLS估计 β 。没有任何其他违反CLM,估计,然而,一致的和相对有效的。考虑一个简单的一阶自回归 y t y t - - - - - - 1 :

y t = β y t - - - - - - 1 + e t

在这个模型中, y t 是由两个 y t - - - - - - 1 e t 。将方程向后一步一个脚印, y t - - - - - - 1 是由两个 y t - - - - - - 2 e t - - - - - - 1 , y t - - - - - - 2 是由两个 y t - - - - - - 3 e t - - - - - - 2 ,等等。,由轨迹的预测 y t - - - - - - 1 与整个以前历史的创新过程。就像不指定,违反了严格exogeneity CLM的假设,和OLS估计 β 成为有偏见。因为 β 必须吸收的影响 e t - - - - - - k ,该模型残差不再代表真正的创新[10]

问题是加剧当autocorrelated AR模型的创新。作为讨论的例子时间序列回归VI:残留的诊断,autocorrelated创新没有侵犯其他CLM产生无偏,如果潜在的高方差,OLS估计模型系数。主要的并发症,在这种情况下,通常的估计的标准误差系数变得有偏见。(异方差的创新的影响是相似的,尽管通常不明显。)然而,如果autocorrelated创新结合exogeneity违反严格,像那些由AR,估计的 β 偏见和不一致的。

如果落后于创新 e t - - - - - - k 被用作预测,估计过程的性质从根本上改变,自创新不能直接观察到。估计要求倒马条款形成无限AR表达,然后限制来生成一个模型可以估计在实践中。因为必须评估期间实施的限制,数值优化技术除了OLS,如最大似然估计(标定),是必需的。模型与马条款被认为是在这个例子时间序列回归第九:延迟订单的选择

模拟估计量的偏差

说明估计偏差引入滞后内生因素,考虑以下文章:

y t = β 0 y t - - - - - - 1 + e t ,

e t = γ 0 e t - - - - - - 1 + δ t ,

δ t N ( 0 , σ 2 )

我们运行两套重复的蒙特卡罗模拟模型。第一组使用通常和分布式)(国家免疫日独立创新 γ 0 = 0 。第二组使用AR(1)创新 | γ 0 | > 0

%建立模型组件:beta0 = 0.9;%为y_t AR(1)参数gamma0 = 0.2;%为e_t AR(1)参数AR1 = arima (基于“增大化现实”技术的beta0,“不变”0,“方差”1);AR2 = arima (基于“增大化现实”技术的gamma0,“不变”0,“方差”1);%仿真样本大小:T = (50100500, 1000);numSizes =长度(T);%运行模拟:numObs = max (T);%模拟路径的长度numPaths = 1 e4;%的模拟路径燃烧= 100;%初始过渡时期,被丢弃σ= 2.5;%的标准偏差的创新E0 =σ* randn(燃烧+ numObs numPaths 2);创新%国家免疫日E1Full = E0 (:: 1);Y1Full =过滤器(AR1 E1Full);% AR(1)创新过程与国家免疫日E2Full =过滤器(AR2 E0 (:,: 2));Y2Full =过滤器(AR1 E2Full);% AR(1)过程AR(1)创新清晰的E0%提取仿真数据,经过短暂的时间:日元= Y1Full(燃烧+ 1:最终,);% Y1 (t)LY1 = Y1Full(燃烧:end-1:);% Y1 (t - 1)Y2 = Y2Full(燃烧+ 1:最终,);% Y2 (t)LY2 = Y2Full(燃烧:end-1:);% Y2 (t - 1)清晰的Y1FullY2Full%计算beta0 OLS估计:BetaHat1 = 0 (numSizes numPaths);BetaHat2 = 0 (numSizes numPaths);i = 1: numSizes n = T(我);j = 1: numPaths BetaHat1 (i, j) = LY1 (1: n, j) \ Y1 (1: n, j);BetaHat2 (i, j) = LY2 (1: n, j) \ Y2 (1: n, j);结束结束%设置情节域:w1 =性病(BetaHat1 (:));x1 = (beta0-w1): (w1/1e2): (beta0 + w1);w2 =性病(BetaHat2 (:));x2 = (beta0-w2): (w2/1e2): (beta0 + w2);%创建人物和情节处理:hFig1 =图;持有hPlots1 = 0 (numSizes, 1);hFig2 =图;持有hPlots2 = 0 (numSizes, 1);%情节估计量分布:颜色=冬天(numSizes);i = 1: numSizes c =颜色(我:);图(hFig1);f1 = ksdensity (BetaHat1(我,:),x1);hPlots1 (i) =情节(x1, f1,“颜色”c“线宽”2);图(hFig2);f2 = ksdensity (BetaHat2(我,:),x2);hPlots2 (i) =情节(x2, f2,“颜色”c“线宽”2);结束%注释块:图(hFig1) hBeta1 =线([beta0 beta0],[0(1.1) *马克斯(f1)],“颜色”,“c”,“线宽”2);包含(“估计”)ylabel (“密度”)标题(”{\ bf OLS估计\ beta_0 = 'num2str (beta0, 2),创新}’”,国家免疫日])传说([hPlots1; hBeta1], [strcat ({“T =”},num2str (T ',“% - d”));“\ beta_0 = 'num2str (beta0 2)]])轴网格持有

图包含一个坐标轴对象。坐标轴对象与标题空白O L S空白E S t i m t E S空白O f空白βindexOf空白基线空白= 0。9日,空白N D空白我N N o v t I o N s,包含估计,ylabel密度包含6行类型的对象。这些对象代表T = 10 T = 50 T = 100 T = 500 T = 1000 \ beta_0 = 0.9。

图(hFig2) hBeta2 =线([beta0 beta0],[0(1.1) *马克斯(f2)],“颜色”,“c”,“线宽”2);包含(“估计”)ylabel (“密度”)标题(”{\ bf OLS估计\ beta_0 = 'num2str (beta0, 2),“,AR(1)创新}”])传说([hPlots2; hBeta2], [strcat ({“T =”},num2str (T ',“% - d”));“\ beta_0 = 'num2str (beta0 2)]])轴网格持有

图包含一个坐标轴对象。坐标轴对象与标题空白O L S空白E S t i m t E S空白O f空白βindexOf空白基线空白= 0。9日,空白R(1)空白I n n o v t I o n s,包含估计,ylabel密度包含6行类型的对象。这些对象代表T = 10 T = 50 T = 100 T = 500 T = 1000 \ beta_0 = 0.9。

在上面所有的模拟中, β 0 = 0 9 。故事情节的分布 β 0 ˆ 跨多个模拟每一个过程,显示OLS估计量的偏差和方差作为样本大小的函数。

的倾斜分布很难直观地评估他们的中心。偏见被定义为 E ( β 0 ˆ ] - - - - - - β 0 ,因此我们使用意味着测量总估计。创新,在国家免疫日一个相对较小的负面的偏见消失了渐近估计总单调增加的方向 β 0 :

AggBetaHat1 =意味着(BetaHat1, 2);流(% 6 s % 6年代\ n,“大小”,“Mean1”)
大小Mean1
i = 1: numSizes流(“% 6 u % -6.4 f \ n”AggBetaHat1 T(我),(我))结束
1000 0.7974 500 0.8683 100 0.8833 0.8964 0.8981

在AR(1)的情况下创新,总估计在小样本中负偏压增加单调的方向 β 0 ,如上所述,然后通过突变值样本大小适中,在大样本,变得越来越积极的偏见:

AggBetaHat2 =意味着(BetaHat2, 2);流(% 6 s % 6年代\ n,“大小”,“非常刻薄的”)
大小非常刻薄
i = 1: numSizes流(“% 6 u % -6.4 f \ n”AggBetaHat2 T(我),(我))结束
1000 0.8545 500 0.9094 100 0.9201 0.9299 0.9310

OLS估计量的一致性存在autocorrelated创新广为人知在计量经济学家。它不过给准确的一系列样本大小的估计实际后果,更广泛的赞赏。我们在部分进一步描述这种行为动态和相关影响

上述两套模拟的主要区别,OLS估计而言,是否有一个延迟之间的交互创新和预测。AR(1)过程中创新,与国家免疫日预测 y t - - - - - - 1 同时是不相关的, e t ,但与之前所有的创新,如前所述。在AR(1)与AR(1)创新过程,预测 y t - - - - - - 1 成为与 e t 同时,通过之间的自相关 e t e t - - - - - - 1

看到这些关系,我们之间的相关系数计算 y t - - - - - - 1 和两个 e t e t - - - - - - 1 分别为每一个过程:

%提取创新数据,经过短暂的时间:E1 = E1Full(燃烧+ 1:最终,);% E1 (t)LE1 = E1Full(燃烧:end-1:);% E1 (t - 1)E2 = E2Full(燃烧+ 1:最终,);% E2 (t)LE2 = E2Full(燃烧:end-1:);% E2 (t - 1)清晰的E1FullE2Full% Preallocate相关系数:CorrE1 = 0 (numSizes numPaths);CorrLE1 = 0 (numSizes numPaths);CorrE2 = 0 (numSizes numPaths);CorrLE2 = 0 (numSizes numPaths);%计算相关系数:i = 1: numSizes n = T(我);j = 1: numPaths%的创新与国家免疫日:(CorrE1 (i, j) = corr LY1 (1: n, j), E1 (1: n, j));(CorrLE1 (i, j) = corr LY1 (1: n, j), LE1 (1: n, j));%与AR(1)创新(CorrE2 (i, j) = corr LY2 (1: n, j) E2 (1: n, j));(CorrLE2 (i, j) = corr LY2 (1: n, j), LE2 (1: n, j));结束结束%设置情节域:sigmaE1 =性病(CorrE1 (:));muE1 =意味着(CorrE1 (:));xE1 = (muE1-sigmaE1): (sigmaE1/1e2): (muE1 + sigmaE1);sigmaLE1 =性病(CorrLE1 (:));muLE1 =意味着(CorrLE1 (:));xLE1 = (muLE1-sigmaLE1/2): (sigmaLE1/1e3): muLE1;sigmaE2 =性病(CorrE2 (:));muE2 =意味着(CorrE2 (:));xE2 = (muE2-sigmaE2): (sigmaE2/1e2): (muE2 + sigmaE2);sigmaLE2 =性病(CorrLE2 (:)); muLE2 = mean(CorrLE2(:)); xLE2 = (muLE2-sigmaLE2):(sigmaLE2/1e2):(muLE2+sigmaLE2);%创建人物和情节处理:hFigE1 =图;持有hPlotsE1 = 0 (numSizes, 1);hFigLE1 =图;持有hPlotsLE1 = 0 (numSizes, 1);hFigE2 =图;持有hPlotsE2 = 0 (numSizes, 1);hFigLE2 =图;持有hPlotsLE2 = 0 (numSizes, 1);%绘制相关系数分布:颜色=铜(numSizes);i = 1: numSizes c =颜色(我:);图(hFigE1) fE1 = ksdensity (CorrE1(我,:),xE1);hPlotsE1 (i) =情节(fE1 xE1,“颜色”c“线宽”2);图(hFigLE1) fLE1 = ksdensity (CorrLE1(我,:),xLE1);hPlotsLE1 (i) =情节(xLE1 fLE1,“颜色”c“线宽”2);图(hFigE2)价= ksdensity (CorrE2(我,:),xE2);hPlotsE2 (i) =情节(xE2、价“颜色”c“线宽”2);图(hFigLE2) fLE2 = ksdensity (CorrLE2(我,:),xLE2);hPlotsLE2 (i) =情节(xLE2 fLE2,“颜色”c“线宽”2);结束清晰的CorrE1CorrLE1CorrE2CorrLE2%注释块:图(hFigE1)包含(“相关系数”)ylabel (“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}{\它e_t}}和国家免疫日”)传说(hPlotsE1 strcat ({“T =”},num2str (T ',“% - d”)),“位置”,“西北”)轴网格ylim([0(1.1) *马克斯(fE1)])

图包含一个坐标轴对象。坐标轴对象与标题空白S m p l e C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d n i d空白e indexOf t基线,包含相关系数,ylabel密度包含5线类型的对象。这些对象代表T = 10 T = 50 T = 100, T = 500 T = 1000。

图(hFigLE1)包含(“相关系数”)ylabel (“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}, NID{\它e_ {t - 1}}}”)传说(hPlotsLE1 strcat ({“T =”},num2str (T ',“% - d”)),“位置”,“西北”)轴网格ylim([0(1.1) *马克斯(fLE1)])

图包含一个坐标轴对象。坐标轴对象与标题空白S m p l e C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d n i d空白e indexOf t - 1基线,包含相关系数,ylabel密度包含5线类型的对象。这些对象代表T = 10 T = 50 T = 100, T = 500 T = 1000。

图(hFigE2)包含(“相关系数”)ylabel (“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}和AR(1){\它e_t}}”)传说(hPlotsE2 strcat ({“T =”},num2str (T ',“% - d”)),“位置”,“西北”)轴网格ylim([0(1.1) *马克斯(铁)])

图包含一个坐标轴对象。坐标轴对象与标题空白S m p l e C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d空白r(1)空白e indexOf t基线,包含相关系数,ylabel密度包含5线类型的对象。这些对象代表T = 10 T = 50 T = 100, T = 500 T = 1000。

图(hFigLE2)包含(“相关系数”)ylabel (“密度”)标题(的{{\ bf样本相关性\它y_ {t - 1}}和AR(1){\它e_ {t - 1}}}”)传说(hPlotsLE2 strcat ({“T =”},num2str (T ',“% - d”)),“位置”,“西北”)轴网格ylim([0(1.1) *马克斯(fLE2)])

图包含一个坐标轴对象。坐标轴对象标题空白S m p l e空白C o r r e l t i o n空白o f空白y indexOf t - 1基线空白n d r(1)空白空白e indexOf t - 1基线,包含相关系数,ylabel密度包含5线类型的对象。这些对象代表T = 10 T = 50 T = 100, T = 500 T = 1000。

故事情节之间的相关性 y t - - - - - - 1 e t - - - - - - 1 在这两种情况下。之间的相关性 y t - - - - - - 1 e t 然而,坚持只渐近的AR(1)创新。

相关系数是自相关的标准措施的基础。上面的情节突出的相关系数的偏差和方差有限样本,这使实际的自我评价模型残差。相关措施进行广泛的费舍尔([3],[4],[5]),他提出了一个替代方案。

使用有偏见的估计 β 0 估计 γ 0 在残差也有偏见[11]。如前所述,OLS残差的AR(1)创新不准确地代表过程创新,因为趋势 β 0 ˆ 吸收autocorrelated干扰产生的系统性影响。

更糟糕的是,Durbin-Watson统计,普遍报道的一阶自相关程度的衡量,是任何关系对检测有偏见 e t ˆ e ˆ t - - - - - - 1 在完全AR模型的这种关系。偏见是两倍的偏见 β 0 ˆ [8]

因此,OLS可以持续高估 β 0 标准残差自相关指标低估了条件,导致不一致。这会产生一种扭曲的拟合优度,歪曲的动态方面的重要性。德宾的 h 在这种情况下测试同样是无效的[7]。德宾的 测试,或相当于Breusch-Godfrey测试,通常是首选[1]

近似估计偏差

在实践中,产生一个时间序列的过程必须从可用的数据,发现和分析最终是有限的丧失信心,估计量的偏差和方差。样本大小对低端的经济数据往往那些被认为在上面的模拟中,所以不可以是巨大的。对自回归模型的预测性能的影响是很严重的。

对于简单的AR模型与简单的创新结构,理论上得到了近似OLS估计量的偏差。这些公式是有用的在评估的可靠性AR模型系数来源于一个数据样本。

创新的国家免疫日,我们可以比较广泛使用的模拟偏差近似的价值[11],[13]:

E ( β 0 ˆ ] - - - - - - β 0 - - - - - - 2 β 0 / T

m = min (T);M = max (T);eBias1 = AggBetaHat1-beta0;%估计偏差tBias1 = 2 * beta0. / T;%的理论偏差eB1interp = interp1 (T eBias1 m: m,“pchip”);tB1interp = interp1 (T tBias1 m: m,“pchip”);图绘制(T eBias1“罗”,“线宽”,2)eB1interp he1 =情节(m: m,“r”,“线宽”2);情节(T, tBias1“波”)ht1 =情节(m: m、tB1interp“b”);持有传奇([he1 ht1),“模拟偏差”,“近似理论偏见”,“位置”,“E”)包含(“样本”)ylabel (“偏见”)标题(“创新}{\男朋友估计偏差,国家免疫日”网格)

图包含一个坐标轴对象。坐标轴对象与标题空白E s t i m t o r空白我一个年代,空白N D空白我N N o v t i o N s,包含样本大小,ylabel偏见包含4线类型的对象。一个或多个行显示的值只使用这些对象标记代表模拟偏差,近似理论偏见。

即使是中等大小的样本近似是合理可靠的,和普遍提高 β 0 减少的绝对值。

在AR(1)创新的情况下,偏差取决于两种 β 0 γ 0 。渐近,近似[6]:

E ( β 0 ˆ ] - - - - - - β 0 γ 0 ( 1 - - - - - - β 0 2 ) / ( 1 + γ 0 β 0 )

eBias2 = AggBetaHat2-beta0;%估计偏差tBias2 = gamma0 * (1-beta0 ^ 2) / (1 + gamma0 * beta0);%渐近的偏见eB2interp = interp1 (T eBias2 m: m,“pchip”);图绘制(T eBias2“罗”,“线宽”,2)何=情节(m: m、eB2interp“r”,“线宽”2);ht2 =情节(0:M, repmat (tBias2 1 M + 1),“b”,“线宽”2);持有传奇([何ht2],“模拟偏差”,“近似渐近偏见”,“位置”,“E”)包含(“样本”)ylabel (“偏见”)标题('{\男朋友估计偏差,AR(1)创新}”网格)

图包含一个坐标轴对象。坐标轴对象与标题空白E s t i m t o r空白我一个年代,空白r(1)空白i n n o v t i o n s,包含样本大小,ylabel偏见包含3线类型的对象。一个或多个行显示的值只使用这些对象标记代表模拟偏差,近似渐近的偏见。

这里我们看到偏差从消极到积极的价值观随着样本量的增加,最终方法渐近。有一个范围的样本大小,从25到100年,偏差的绝对值低于0.02。在这样一个“甜蜜点”,OLS估计量可能比选择估计设计专门账户的存在自相关。我们在部分进一步描述这种行为动态和相关影响

情节很有用的近似渐近的偏见 β 0 ˆ 的函数 β 0 γ 0 ,看到不同程度的自相关的影响 y t e t :

图β= 1:0.05:1;γ= 1:0.05:1;[βγ]= meshgrid(βγ);持有冲浪(βγγ。*(1测试版^ 2)。/(1 +γ。*β))无花果= gcf;厘米= fig.Colormap;numC =尺寸(厘米,1);zL = zlim;zScale = zL (2) zL (1);iSim = (tBias2-zL (1)) * numC / zScale;cSim = interp1 (1: numC,厘米,iSim);恒生投资管理公司= plot3 (beta0 gamma0 tBias2,“柯”,“MarkerSize”8“MarkerFaceColor”,cSim);甘氨胆酸视图(20)-20年ax =;u = ax.XTick;v = ax.YTick;网格(u, v, 0(长度(v),长度(u)),“FaceAlpha”,0.7,“EdgeColor”,“k”,“线型”,“:”)举行传奇(恒生投资管理公司,“模拟模式”,“位置”,“最佳”)包含(“\ beta_0”)ylabel (“\ gamma_0”)zlabel (“偏见”)标题(“{}\ bf近似渐近偏见”)camlight colorbar网格

图包含一个坐标轴对象。坐标轴对象标题空白p p r o x i m t e空白s y m p t o t c空白B我一个年代,包含βindexOf 0基线,ylabel伽马indexOf 0基线包含3类型的对象表面,线。一个或多个行显示的值只使用标记该对象表示模拟模型。

渐近的偏见就变得重要 β 0 γ 0 朝着相反的方向远离零自相关。当然,偏见可能会大大减少在有限样本。

动态和相关影响

如前所述,使用OLS估计动态模型的挑战来自违反CLM的假设。两个违规行为是至关重要的,我们更详细地讨论他们的影响。

第一个是动态效果,造成的预测因子之间的相关性 y t - - - - - - 1 和所有之前的创新 e t - - - - - - k 。这发生在任何AR模型,导致偏见OLS估计从有限的样本。在缺乏其他违规行为,不过OLS保持一致,偏差消失在大样本。

第二个是相关的影响,同期相关性所造成的预测 y t - - - - - - 1 和创新 e t 。这发生在创新过程是autocorrelated,和结果的OLS系数预测接受太多,或过少,信用的变化的反应,根据相关的迹象。也就是说,它产生一个持续的偏见。

第一组模拟以上说明的情况 β 0 是积极的, γ 0 是零。第二组模拟说明一个情况 β 0 γ 0 是积极的。积极 β 0 ,动态效果 β 0 ˆ 是负的。积极 γ 0 的相关影响 β 0 ˆ 是正的。因此,在第一组模拟负偏压在样本大小。在第二组模拟,然而,有一个两人之间的竞争影响,动力效应控制在小样本,关联效应控制在大样本。

积极的AR系数是常见的计量经济学模型,所以它是典型的两种效果相互抵消,创建一个范围的样本大小的OLS偏见是显著降低。这个范围的宽度取决于 β 0 γ 0 ,决定了OLS-superior范围的OLS优于直接替代设计估计占的自我创新。

的一些影响因素的大小动态和相关效果进行了总结[9]。其中包括:

动态效果

  • 增加与减少样本量。

  • 减少与增加 β 0 如果创新保持固定的方差。

  • 减少与增加 β 0 如果创新的方差调整保持一个常数 R 2

  • 增加与创新的方差。

相关的影响

  • 增加而增加 γ 0 ,以减少的速度。

  • 减少与增加 β 0 ,以越来越快的速度。

这些因素的影响可以通过改变系数在上面的模拟测试。一般来说,更大的动态效应和关联效应越小,越宽OLS-superior范围。

重叠的偏见减少

重叠过程是一种交叉验证技术通常用于减少样本统计量的偏差。Jacknife估计模型系数是计算相对简单,不需要大型模拟或重采样。

的基本思想是计算估计从完整的样品从一个次级样本序列,然后将估计的方式消除了偏见的一部分。在一般情况下,样本的大小 T OLS估计量的偏差 β 0 ˆ 可以表示为一个扩张的力量吗 T - - - - - - 1 :

E ( β 0 ˆ ) - - - - - - β 0 = w 1 T + w 2 T 2 + O ( T - - - - - - 3 ) ,

的权重 w 1 w 2 依赖于特定的系数和模型。如果估计 β ˆ 是由序列 = 1 , , 次级样本的长度 l = O ( T ) ,然后的重叠估计量 β 0 是:

β J ˆ = ( T T - - - - - - l ) β 0 ˆ - - - - - - ( l T - - - - - - l ) 1 = 1 β ˆ

它可以显示重叠估计量满足:

E ( β 0 ˆ ) - - - - - - β 0 = O ( T - - - - - - 2 ) ,

从而消除 O ( T - - - - - - 1 ) 术语的偏见扩张。偏差是否实际上是减少的大小取决于剩余条款的扩张,但重叠估计已经在实践中表现良好。特别是,技术是健壮的非正规的创新,misspecifications拱效应,以及各种模型[2]

统计和机器学习的工具箱™函数重叠实现了重叠过程使用一个系统的“分析”次级样本序列。为时间序列,删除观察改变了自相关结构。保持依赖结构时间序列,一个重叠的过程必须使用不重叠的次级样本,如分区或移动块。

下面的实现了一个简单的重叠估计 β 0 ˆ 使用分区的模拟产生的数据在每个子样品的估计 β ˆ 。我们比较之前和之后的性能折裂,或模拟数据与国家免疫日AR(1)创新:

m = 5;%的次级样本数量% Preallocate记忆:betaHat1 = 0 (m, 1);创新%子样品估计,国家免疫日betaHat2 = 0 (m, 1);%子样品估计,AR(1)创新BetaHat1J = 0 (numSizes numPaths);创新%重叠估计,国家免疫日BetaHat2J = 0 (numSizes numPaths);%重叠估计,AR(1)创新%计算重叠估计:i = 1: numSizes n = T(我);%样本大小l = n / m;%分区子区间的长度j = 1: numPathss = 1: m betaHat1 (s) = LY1 ((s - 1) * l + 1: * l, j) \ Y1 ((s - 1) * l + 1: * l, j);betaHat2 (s) = LY2 ((s - 1) * l + 1: * l, j) \ Y2 ((s - 1) * l + 1: * l, j);BetaHat1J (i, j) = (n / (n-l)) * BetaHat1 (i, j) - (l / ((n-l) *米))*总和(BetaHat1);BetaHat2J (i, j) = (n / (n-l)) * BetaHat2 (i, j) - (l / ((n-l) *米))*总和(BetaHat2);结束结束结束清晰的BetaHat1BetaHat2%显示平均估计,之前和之后的折裂:AggBetaHat1J =意味着(BetaHat1J, 2);清晰的BetaHat1J流(% 6 s % 8 s % 8年代\ n”,“大小”,“Mean1”,“Mean1J”)
大小Mean1 Mean1J
i = 1: numSizes流(' % 6 u % -8.4 f % -8.4 f \ n”AggBetaHat1 T(我),(我),AggBetaHat1J(我))结束
500 0.7974 0.8055 0.8683 - 0.8860 100 0.8833 0.8955 0.8964 - 0.8997 0.8981 - 0.8998 1000人
AggBetaHat2J =意味着(BetaHat2J, 2);清晰的BetaHat2J流(% 6 s % 8 s % 8年代\ n”,“大小”,“非常刻薄的”,“Mean2J”)
大小非常刻薄的Mean2J
i = 1: numSizes流(' % 6 u % -8.4 f % -8.4 f \ n”AggBetaHat2 T(我),(我),AggBetaHat2J(我))结束
500 0.8545 0.8594 0.9094 - 0.9233 100 0.9201 0.9294 0.9299 - 0.9323 0.9310 - 0.9323 1000人

次级样本的数量, = 5 ,选择最小的样本大小, n = 1 0 ,记住。更大的 在更大的样本可能会提高性能,但没有接受启发式选择子样品的大小,所以一些实验是必要的。代码很容易适应使用替代二次抽样方法,例如移动块。

结果显示统一的创新减少偏见的情况下国家免疫日。在AR(1)的情况下创新,这个过程似乎推估计更快通过OLS-superior范围。

总结

这个例子显示了一个简单的基于“增大化现实”技术的模型和一些简单的创新结构,来说明一些一般性问题动态模型的估计。这里很容易修改的代码观察改变参数值的影响,调整创新方差,使用不同的滞后结构,等等。解释性DL条款也可以添加到模型中。DL方面有能力减少估计偏差,尽管OLS倾向于高估AR系数的DL系数[11]。一般设置在这里允许大量的实验,是在实践中经常需要在评估模型。

当你考虑权衡了偏差和方差的估计量,重要的是要记住,偏见与减少方差估计可能会有优越的均方误差的特点相比,方差的无偏估计量。OLS估计量的强项,除了它的简单计算,其相对效率在降低其方差增加样本量。这是经常采用OLS估计量的选择,甚至对动态模型。另一个强项,正如这个例子所展示的,就是一个OLS-superior范围、OLS可能比其他估计,即使在什么是通常被认为是不利条件。最弱的OLS估计量是小样本,其性能的偏差和方差可能是不可接受的。

本例中的估计问题建议需要自相关的新指标,更稳健估计方法用于它的存在。这些方法中描述的例子时间序列回归X:广义最小二乘估计和工厂。然而,正如我们所见,矛盾OLS估计量的AR模型与自相关规则是不够的,一般来说,作为一个可行的竞争对手更加复杂,一致估计最大似然等可行的广义最小二乘,和辅助变量,试图消除效果的相关性,但不改变的动态效果。最好的选择将取决于样本大小,滞后结构,外生变量的存在,所以,常常需要的各种模拟提出了这个例子。

引用

[1]Breusch, t。s。,和L. G. Godfrey. "A Review of Recent Work on Testing for Autocorrelation in Dynamic Simultaneous Models." In Currie, D., R. Nobay, and D. Peel (Eds.),宏观经济分析:论文在宏观经济学和计量经济学。伦敦:Croom舵,1981。

[2]钱伯斯,m . J。“重叠平稳自回归模型的估计。”Un我versity of Essex Discussion Paper No. 684, 2011.

[3]费舍尔,r . .“频率分布样本的相关系数的值从一个无限期的庞大的人口。”生物统计学。10卷,1915年,页507 - 521。

[4]费舍尔,r。”“可能错误”的相关系数推导出从一个小样本。”密特隆。1卷,1921年,页3-32。

[5]费舍尔,r。偏相关系数的分布。密特隆。3卷,1924年,页329 - 332。

[6]海布斯,D。”问题的统计估计和动态时间序列模型的因果推论。”In Costner, H. (Ed.)社会学研究方法。旧金山:台中县,1974。

[7]英德尔,b。“有限样本自相关的测试模型包含滞后因变量。”经济学的信件。1984年卷。14日,pp.179 - 185。

[8]约翰斯顿(J。计量经济学方法。纽约:麦格劳-希尔,1972年。

[9]雪道。“教学回归滞后因变量和Autocorrelated干扰。”经济教育杂志。27卷,1996年,页72 - 84。

[10]雪道。“一个插图OLS的偏见Yt=λYt1+Ut。"经济教育杂志。31卷,2000年,页76 - 80。

[11]Malinvaud E。计量经济学的统计方法。阿姆斯特丹:北荷兰,1970年。

[12]万豪,f . j .教皇。“估计的偏差的自我”。生物统计学。41卷,1954年,页390 - 402。

[13]白色,j·S。“渐近展开的均值和方差序列相关系数”。生物统计学。48卷,1961年,页85 - 94。