什么是面板数据?

分析多个时间点的横截面数据

面板数据是长期收集的对多个主题的观察结果。面板数据的例子包括同一时期内收集的个人、家庭、公司、市政当局、州或国家的数据。

面板数据有两种类型:

  • 平衡(完整)面板数据包括在同一时间点测量的每个个体的所有观测值。例如:十年来每年从国家或州收集的经济数据。
  • 不平衡(不完整)面板数据包含某些人在某些时间点的缺失观测值。例如:来自公司或个人的财务数据,其中一些公司或个人的年龄比其他公司或个人的年龄大。

大多数统计分析是在所谓的横断面数据上进行的,横断面数据是在某一时间点收集的。相比之下,面板数据分析通过拟合面板回归模型扩展了对多个时间点的断面数据的统计分析,该模型同时考虑了断面效应和时间效应。这些方法给出了更可靠的参数估计线性回归模型。

面板数据分析的常用方法包括多元回归和线性混合效应模型。面板回归模型的不同在于它们如何解释横截面和时间效应。

  • 面板数据固定效应模型或带虚拟变量的最小二乘(LSDV)模型:横断面效应采用虚拟变量建模
  • 单向随机效应模型:将截面效应而不是时间效应建模为随机效应
  • 双向随机效应模型:横截面效应和时间效应均采用随机效应模型
  • 嵌套(层次)模型:横截面数据的嵌套分组(例如,国家嵌套)被建模为随机效应

MATLAB®万博1manbetx支持面板数据回归模型的常用估计方法,包括:

要点

  • 纵向数据在计量经济学、生物统计学(如药物开发)和社会学中很常见
  • 面板数据分析的常用方法包括多元回归和线性混合效应模型

有关如何适应各种面板数据回归模型的更多信息,请参见统计和机器学习工具箱™金融工具箱™,计量经济学工具箱™使用MATLAB

参见:统计和机器学习工具箱计量经济学的工具箱金融工具箱线性模型线性回归预测建模