贝叶斯线性回归
线性回归是一个统计的工具用来:
研究线性依赖关系或影响
预测 或说明 变量在响应 变量。预测或预测未来反应未来的预测数据。
的
为次
yt是观察到的反应。
xt是一个1 - (
p + 1)的观测值的行向量p 预测因子。为了适应拦截模型,x 1t = 1为所有t 。β是(
p + 1)1的列向量回归系数对应的变量组成的列xt 。εt是均值为零的随机干扰和浸(
ε )=Ω 。一般来说,Ω 是一个T ——- - - - - -T 对称正定矩阵。为简单起见,假设扰动是不相关的和有共同的方差,即Ω =σ 2我T×T 。
的值
古典和贝叶斯分析
研究线性响应的预测因素的影响,或建立一个预测高钙,你必须首先估计参数
一个
主要的贝叶斯分析组件
贝叶斯分析的主要目标之一是计算,或样本
一个
似然函数 ——关于参数样本提供的信息。如果你采取随机抽样,那么高的可能性的条件概率密度函数是
yt考虑到参数和诱导的条件分布 εt。通常情况下, xt是一个固定的数量。如果干扰独立同方差的,高斯, ϕ(
yt ;xtβ ,σ 2)是高斯概率密度的意思xtβ 和方差σ 2,评估yt。 先验分布(或
先知先觉 )的参数,参数的分布假设之前观察数据。对参数的先验分布的假设有一个优势频率论的分析:先验模型允许您将了解之前查看数据。你可以控制你的知识的信心的参数通过调整先验方差。指定一个高方差意味着你知之甚少的参数,你想重数据中的信息更多的参数。指定一个低方差意味着高的信心你的知识的参数,和你想占知识的分析。在实践中,您使用先验为了方便而不是遵循研究员的观点的实际分布参数。例如,您可以选择先知先觉,以便相应的后验分布在同一家族的分布形式。这些prior-posterior对被称为
共轭 分布。然而,先知先觉的选择可以影响估计和推断,所以你应该执行敏感性分析与评估。先知先觉可以包含参数,调用
hyperparameters 能进行概率分布。这样的模型被称为分层贝叶斯模型 。高钙,先验分布通常表示
π (β ),π (σ 2)。一个受欢迎的选择normal-inverse-gamma共轭模型 ,在这π (β |σ 2)是多元高斯或<一个href="//www.tianjin-qmedu.com/in/help/stats/multivariate-normal-distribution.html" class="a">多元正态一个>分布和π (σ 2)是逆伽马分布。
你可以包含的联合后验分布
如果
后就像任何其他的联合概率分布的随机变量,它包含所有的信息了解合并后的参数数据。参数估计和推断是主要基于积分函数的参数的后验分布。
后估计和推断
后估计和推断包括集成的功能参数后。流行的估计和推断为高参数包括以下:
的期望值
β 考虑到数据这个量提供了一种自然的解释,最小均方误差(MSE)估计,也就是说,它最小化 中位数,模式,或分位数可以贝叶斯估计,对其他损失。
的
最大的先验估计 (地图)的价值最大化后验分布的参数。考虑到数据,预测反应 的预测 是一个随机变量的
后预测分布 你可以把这个量的条件概率分布的期望值
y 关于参数的后验分布。95%置信区间
β (或可信区间 )- - -设置年代 这样P (β ∊年代 |y ,x )=0。95。这个方程收益无穷区间,包括:Equitailed间隔,这是时间间隔(
l ,U ),这样P (β <l |y ,x )=0。025和P (β >U |y ,x )=0。025。后验密度最高(HPD)地区,最窄的区间收益率(或间隔)指定的概率。它必然包含最大后验值。
的解释不同频率论的置信区间,贝叶斯置信区间的解释是,考虑到数据,一个随机的概率
β 在时间间隔(年代)年代 是0.95。这个解释很直观,这是一个利用贝叶斯置信区间在频率论的置信区间。边缘后验概率变量包含,也叫做政权概率,结果从实现随机搜索变量选择(科学)和显示预测变量是否微不足道或冗余的贝叶斯线性回归模型。在科学中,
β 多元,双组分混合高斯分布。这两个组件有一个均值为零,但一个组件都有一个大的方差和其他组件都有一个小的差异。无关紧要的预测可能会接近于零;因此,他们从组件与小的方差。然而样本2的空间p+ 1排列的模型,每个排列包括或不包括一个系数,模型后密度最高的采样。政权概率是来自采样模型。
产品的集成方法依赖于函数形式
例如,和被积函数
如果产品内核的一个已知的概率分布形式,然后积分的
h (β ,σ 2)对后可以易于分析。已知的内核经常出现当你选择先验和后验形成共轭双。在这些情况下,最初的几个时刻的分布通常是已知的,并以此为基础估计。易于分析细节的后验分布的贝叶斯计量经济学工具箱中的线性回归模型框架,明白了<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">易于分析后验一个>。否则,你必须使用数值积分技术计算的积分
h (β ,σ 2)对后验分布。在某些情况下,您可以实现使用数值积分蒙特卡罗 或马尔可夫链蒙特卡罗 (密度)抽样。执行蒙特卡罗估计,你画很多样本概率分布,一个合适的函数应用到每个画(
h (β ,σ 2)是一个因素的函数)和平均结果近似积分。一个受欢迎的蒙特卡罗采样重要性重采样技术<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[6]一个>。你获得实现不知道概率分布到一个常数,或你知道的条件分布参数至少一个常数。包括吉布斯抽样获得流行的技术<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[2]一个>,p米米h算法<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[5]一个>,片抽样<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[9]一个>。
详情在贝叶斯后验估计线性回归模型在计量经济学工具箱后是棘手的,看到的<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">分析棘手的后验一个>。
易于分析后验
贝叶斯计量经济学之前工具箱提供了几种模型中线性回归框架规范,易于分析产量,边际或共轭条件后验。这个表之前识别模型及其相应的后验。当你通过先验模型和数据<一个href="//www.tianjin-qmedu.com/in/help/econ/conjugateblm.estimate.html">估计
,MATLAB®使用这些公式。当软件构造后验,它假设响应数据
之前的模型对象 | 先知先觉 | 边缘后验 | 条件后验 |
---|---|---|---|
conjugateblm |
β和 |
|
|
semiconjugateblm |
β和 | 分析棘手的 |
|
diffuseblm |
前联合pdf
|
|
|
mixconjugateblm |
|
虽然边缘后验易于分析,MATLAB将他们视为棘手的可伸缩性(见<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[1]一个>)。 | 易于分析,如果
|
mixsemiconjugateblm |
|
分析棘手的 | 易于分析,如果
|
lassoblm |
系数是独立的,先天的。 | 分析棘手的 |
|
表中:
Np+ 1(
米 ,Σ )表示(p + 1)维多元正态分布,米 意思是((p + 1)向量)和1Σ 方差((p + 1)————(p + 1)对称正定矩阵)。搞笑(
一个 ,B )表示逆伽马分布的形状一个 >0和规模B >0。的pdf搞笑 (一个 ,B )是X是一个
T ————(p + 1)矩阵的预测数据,也就是说,xjk 是观察j 的预测k 。第一列是由完全的拦截。y是一个
T 1向量的反应。tp+ 1(
米 ,Σ ,ν )表示(p + 1)维多元t 分布,米 的位置,Σ 是规模,ν 的自由度。,即最小二乘估计的
β 。V*j - 1之前是方差因子(
mixconjugate
)或方差(mixsemiconjugate
)βj 当γj= 1, 是它之前或方差方差因素V *j2γj= 0。 V*是(
p + 1)————(p + 1)对角矩阵和元素j ,j 是γj V*j - 1+ (1 -γj )V *j2。mixconjugateblm
和<一个href="//www.tianjin-qmedu.com/in/help/econ/mixsemiconjugateblm.html">mixsemiconjugateblm
模型支持之前的万博1manbetx意思是规范β 除了这两个组件的默认零向量的高斯混合模型。如果你改变之前默认的意思β 之前,那么相应的条件后验分布包括意味着同样的条件后验分布<一个href="//www.tianjin-qmedu.com/in/help/econ/conjugateblm.html">conjugateblm
和<一个href="//www.tianjin-qmedu.com/in/help/econ/semiconjugateblm.html">semiconjugateblm
模型包括之前的意思。λ是固定的套索收缩参数。
InvGaussian (
米 ,v )表示逆高斯(瓦尔德)的意思米 和形状v 。
分析棘手的后验
贝叶斯计量经济学之前工具箱提供了几种模型中线性回归框架规范,收益率分析棘手,但灵活,边际和条件后验。这个表之前识别模型和蒙特卡罗抽样技术,MATLAB使用执行后估计,仿真和推理之前当你通过模型和数据<一个href="//www.tianjin-qmedu.com/in/help/econ/conjugateblm.estimate.html">估计
,<一个href="//www.tianjin-qmedu.com/in/help/econ/conjugateblm.simulate.html">模拟
,或<一个href="//www.tianjin-qmedu.com/in/help/econ/conjugateblm.forecast.html">预测
。
之前的模型对象 | 先知先觉 | 边缘后的仿真技术 | 仿真技术条件后 |
---|---|---|---|
semiconjugateblm |
β和 | 吉布斯采样器<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[2]一个> | 条件后易于分析 |
empiricalblm |
从各自的先验分布的特征 | 采样重要性重采样<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[4]一个> | 不支持万博1manbetx |
customblm |
以联合pdf。在声明函数 |
|
|
mixconjugateblm |
|
吉布斯采样器<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[1]一个> | 条件后易于分析 |
mixsemiconjugateblm |
|
吉布斯采样器<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[1]一个> | 条件后易于分析 |
lassoblm |
系数是独立的,先天的。 | 吉布斯采样器<一个href="//www.tianjin-qmedu.com/in/help/econ/what-is-bayesian-linear-regression.html" class="intrnllnk">[10]一个> | 条件后易于分析 |
引用
[1]乔治,我大肠。,和R. E. McCulloch. "Variable Selection Via Gibbs Sampling."
[2]Gelfand a E。,和一个。F. M. Smith. “Sampling-Based Approaches to Calculating Marginal Densities.”
[3]>。,J. B. Carlin, H. S. Stern, and D. B. Rubin.
[4]戈登:J。,D。J. Salmond, and A. F. M. Smith. "Novel Approach to Nonlinear/Non-Gaussian Bayesian State Estimation."
[5]黑斯廷斯,w . k .“使用马尔可夫链蒙特卡罗抽样方法及其应用”。
[6]马林,j . M。,和C. P. Robert.
[7]的大都市,N。,一个。W. Rosenbluth, M. N. Rosenbluth, A. H. Teller, and E. Teller. "Equations of State Calculations by Fast Computing Machine."
[8]Neal, r . M。“用哈密顿动力学获得。”我n S. Brooks, A. Gelman, G. Jones, and X.-L. Meng (eds.)
[9]Neal, r . m .“切片采样”。
[10]公园,T。,和G。Casella. "The Bayesian Lasso."
另请参阅
bayeslm
|conjugateblm
|semiconjugateblm
|diffuseblm
|customblm
|empiricalblm
|估计
|预测