从实验数据构建概率模型

概率分布是数学模型将概率分配给a随机变量。它们可用于模拟实验或历史数据,以产生预测估计或分析大量结果,例如蒙特卡洛模拟。

有两种主要类型的概率分布:参数和非参数。

参数分布是可以使用具有有限参数集的等式来描述的概率分布。对于指定的参数分布,通过拟合数据来估计参数。一些常见的参数分布包括:

  • 正常(或高斯)分布
  • 威布尔分布
  • 广义极值(GEV)分布
  • 物流分布
  • 内核分布
  • Copulas(多变量分布)

非参数分布是概率分布,其提供纯粹基于样本数据的概率密度函数的估计。当参数分布不能准确地描述数据时,这是优选的。一些常见的非参数概率分布包括:

  • 内核分布
  • 经验累积分布
  • 分段线性分布
  • 分段分布与帕累托尾巴
  • 三角分布

参数分布可以使用最大似然估计来容易地符合数据。然后使用拟合的分布来通过计算概要统计来执行进一步分析,评估概率密度函数(PDF)和累积分布函数(CDF),并评估分发到您的数据的适合。

有关发行类型,分发拟合,可视化分布和生成随机数的更多信息,请参阅统计和机器学习工具箱™使用马铃薯®

也可以看看:统计和机器学习工具箱机器学习随机数数据配件数据分析数学建模