概率分布

从实验数据建立概率模型

概率分布是数学模型把概率赋给a随机变量.它们可以用来模拟实验数据或历史数据,以生成预测估计或分析大量的结果,如蒙特卡罗模拟。

有两种主要类型的概率分布:参数和非参数。

参数分布是概率分布,可以用一个具有有限参数集的方程来描述。对于指定的参数分布,通过对数据的拟合来估计参数。一些常见的参数分布包括:

  • 正态(或高斯)分布
  • 威布尔分布
  • 广义极值分布
  • 物流配送
  • 内核分配
  • 连系动词(多元分布)

非参数分布是提供纯粹基于样本数据的概率密度函数估计的概率分布。当数据不能被参数分布准确描述时,这是首选。一些常见的非参数概率分布包括:

  • 内核分配
  • 经验累积分布
  • 分段线性分布
  • 带帕累托尾部的分段分布
  • 三角形分布

利用极大似然估计,参数分布可以很容易地拟合数据。然后使用拟合的分布执行进一步的分析,计算汇总统计,评估概率密度函数(PDF)和累积分布函数(CDF),并评估分布与数据的拟合程度。

有关分布类型、分布拟合、可视化分布和生成随机数的更多信息,请参见统计和机器学习工具箱™使用MATLAB®

参见:统计和机器学习工具箱机器学习随机数数据拟合数据分析数学建模