概率分布

从实验数据建立概率模型

概率分布为数学模型把概率分配给随机变量. 它们可以用于模拟实验数据或历史数据,以生成预测估计或分析大量结果,例如蒙特卡洛模拟。

概率分布主要有两种:参数分布和非参数分布。

参数分布是概率分布,可以用一组有限参数的方程来描述。对于指定的参数分布,参数将通过拟合数据来估计。一些常见的参数分布包括:

  • 正态(或高斯)分布
  • 威布尔分布
  • 广义极值分布
  • 物流配送
  • 核分布
  • Copulas(多元分布)

非参数分布是提供纯粹基于样本数据的概率密度函数估计的概率分布。当数据不能通过参数分布精确描述时,首选此选项。一些常见的非参数概率分布包括:

  • 核分布
  • 经验累积分布
  • 分段线性分布
  • 带Pareto尾的分段分布
  • 三角分布

参数分布可以很容易地适应数据的最大似然估计。然后,通过计算汇总统计、评估概率密度函数(PDF)和累积分布函数(CDF)以及评估分布与数据的匹配性,将拟合的分布用于进行进一步分析。

有关分布类型、分布拟合、可视化分布和生成随机数的详细信息,请参见统计与机器学习工具箱™用于MATLAB软件®.

另请参见:统计与机器学习工具箱,机器学习,随机数,数据拟合,数据分析,数学建模