离散时间马尔可夫链

什么是离散马尔科夫链?

考虑一个取a值的随机过程状态空间。一个马尔可夫过程演进的方式独立于导致当前状态的路径。也就是说,当前状态包含预测未来路径的条件概率所需的所有信息。这个特征被称为马尔可夫性质。虽然马尔可夫过程是随机过程的特定类型,它被广泛用于模拟状态的变化。马尔科夫的特异性过程导致一种理论认为是比较完整的。

马尔科夫过程可以通过各种方式加以限制,从而逐步形成更简洁的数学公式。以下是一些限制条件的例子。

  • 状态空间可以被限制在一个离散的集合中马尔可夫链。马尔可夫特性的转移概率将链中的每个状态“链接”到下一个状态。

  • 如果状态空间是有限的,链就是有限的有限状态

  • 如果流程以离散时间步进行演化,则链是离散时间

  • 如果马尔科夫属性是时间无关,链条均匀

计量经济学工具箱™包括DTMC表示有限状态、离散时间、齐次马尔可夫链的模型对象。即使有限制,DTMC对象具有很大的适用性。它具有足够的鲁棒性,适用于计量经济学中的许多建模场景,并且其数学理论非常适合于MATLAB中的矩阵代数®

有限状态马尔可夫链有一个对偶理论:一个在矩阵分析中,另一个在离散图中。的目标函数DTMC对象突出了这种二元性。这些函数允许您在数字和图形表示之间来回移动。您可以使用最适合调查的特定方面的工具。特别是,传统的确定转移矩阵结构的特征值方法与通过相关有向图跟踪链的演化的可视化方法是成对的。

任何马尔可夫链的一个重要特点是它的极限行为。此功能在计量应用中,模型的预测性能取决于它的随机组件是否具有良好定义的分布,渐近尤其重要。的目标函数DTMC对象允许您研究链的瞬态和稳态行为以及产生唯一极限的属性。其他函数计算极限分布和估计收敛速度,或混合时间

适当的马尔可夫链的基本随机过程的模拟是应用的基础。仿真可以采用从初始状态或从整个状态分布的时间演化中生成状态转换的随机序列的形式。仿真允许您确定链的统计特性,这些特性可能在其规范或理论中并不明显。在计量经济学中,马尔科夫链成为更大的区域转换模型的组成部分,它们代表了经济环境的变化。的DTMC对象包括模拟和可视化马尔科夫链时间演化的函数。

离散时间马尔可夫链理论

任何有限状态、离散时间、齐次马尔可夫链都可以用它的任意一个数学形式来表示n——- - - - - -n转移矩阵P,在那里n是状态数,还是有向图D。尽管这两种表述是等价的——在一个领域进行的分析会导致在另一个领域产生等价的结果——但在分析问题的概念和由此产生的算法解决方案方面都存在相当大的差异。万博 尤文图斯这种两分法最好的说明是通过比较发展的理论[7]中,例如,用在发展[6][9]。或者,使用MATLAB,可以通过比较基于的算法来说明二分法对象及其与矩阵分析的核心功能的功能。

有限状态过程的完全图具有每个节点之间的边和转移概率以及其他节点j。节点表示马尔可夫链中的状态。在D,如果矩阵的元素Pij是0,那么连接状态的边呢j是删除。因此,D只显示可行的国家间的转换。也,D可以包括self-loops表明非零概率P2状态转变回到本身。自转移概率称为状态惯性要么持久性

D, 一个步行国家间的j一系列的连通状态是从什么开始的结束j,且长度至少为2。一个路径是一种没有重复状态的行走。一个电路是走在其中=j,但没有其他重复出现的状态。

状态j到达,或可访问的从状态,表示 j ,如果有一个步行从j。美国沟通,表示 j ,如果每一个都能从另一个到达。通信是状态空间上的等价关系,将其划分为通信类。在图论中,通信的状态称为强连通分量。对于马尔可夫过程,从个人状态的重要性质是由所有其他状态以连通的类共享,所以成为类本身的性质。这些特性包括:

  • 递归式- 被从可到达所有状态到达酒店。此属性等效于返回的渐近概率等于1的每个链具有至少一个经常性类。

  • 顷刻- -非经常性的特性,即有可能进入无法返回的国家。这个性质等价于回报为0的渐近概率。具有传递性的类对渐近行为没有影响。

  • 周期性- 一类内的多个子类中循环和保持初始状态的一些存储器的特性。一个状态的期间是包含状态的所有电路的长度的最大公约数。国家或类周期为1是非周期性的。自循环的状态确保非周期性和形成的基础懒链

链作为一个整体的一个重要性质是不可约性。A链是不可约,如果链由一个单一的通信类的。状态或类属性成为整个链,这简化了说明和分析性质。一概而论是一个unichain,它是一个链,由一个递归类和任意数量的瞬态类组成。与渐近相关的重要分析可以集中在递归类上。

一个冷凝曲线图,这是通过合并每个类的状态到单个超级节点形成,简化了整个结构的视觉认识。在该图中,超节点C1和C2之间的单向边对应的类之间的过渡独特方向。

冷凝的曲线图表明,C1是瞬时的和C2是经常性的。C1的出度是正的,这意味着短暂。由于C1包含一个自我循环,这是非周期性的。C2是周期性的,周期为3.在C2的三循环的单个状态是,在更一般的周期性类,通信子类。链是可还原unichain。想象从C2至C1的有向边。在这种情况下,C1和C2被连通类,以及它们折叠成一个单一的节点。

遍历性,一个理想的性质,结合了不可约性和非周期性,并保证统一的限制行为。因为不可约性本质上是一个链属性,而不是一个类属性,所以遍历性也是一个链属性。当与unichains一起使用时,遍历性意味着惟一的循环类是遍历的。

有了这些定义,就有可能总结出与1-by-有关的基本存在唯一性定理n平稳分布 π ,在那里 π = π P

  • 如果P是随机的吗 π = π P 总是有一个概率向量解。因为每一行P总结,P有一个正确的特征向量特征值是1。具体地说,e= 1n,一个n1乘1的向量。所以,P也有一个左特征 π 特征值为1。根据Perron-Frobenius定理, π 非负,并且可以被归一化以产生一个概率向量。

  • π 当且仅当P代表unichain。在一般情况下,如果链中包含k复发性类,π*=π*Pk线性独立的解决方案。万博 尤文图斯在这种情况下,P收敛, ,但是行是不相同的。

  • 每一个初始分布π0收敛于 π 当且仅当P表示遍历unichain。在这种情况下, π 是一个极限分布

Perron-Frobenius定理是与非负的、不可约矩阵的特征值相关的结果的集合。应用于马尔可夫链,结果可以总结如下。对于有限状态的unichain,P只有一个特征值λ1= 1(Perron-Frobenius特征值)与一个相伴的非负左特征向量 π (可以归一化为一个概率向量)和一个右特征向量e= 1n。其他特征值λ满足 | λ | 1 ,= 2,…,n。如果unichain或唯一的复发类unichain的非周期,那么不平等是严格的。当有周期的周期性k,有k上在单位圆特征值k团结的根源。如果unichain是遍历,然后P收敛到渐近 e π 作为 。误差趋于0的速度至少和 | λ 年代 | ,在那里λ年代第二大的特征值是的多样性λ年代

收敛速率 π 取决于第二大特征值模(SLEM) | λ SLEM | 。速率可以用。来表示光谱的差距,这是 1 | λ SLEM | 。较大的差距产生更快的收敛。的混合时间是偏离平衡的特征时间,在总变化距离中。因为收敛是指数的,衰减的混合时间是e1

T 混合 = 1 日志 | λ SLEM |

考虑到收敛定理,混合时间应该在遍历单角函数的背景下考虑。

相关定理非负不可约矩阵理论给出了一致收敛的两个关键特性的方便刻画:还原性和遍历性。假设Z是个指示器要么零模式P,也就是说,用1来代替非零项的矩阵P。然后,P当且仅当的所有项是不可约的吗 ( + Z ) n 1 是积极的。的CW定理[11]P是否遍历当且仅当的所有项P是积极的 > ( n 1 ) 2 + 1

Perron-Frobenius定理及相关结果对于平稳分布是非建设性的 π 。有几种方法可以计算遍历链的唯一极限分布。

  • 定义返回时间T2国家返回状态的最小步数是多少起动后状态。此外,定义平均收益时间τ2是的预期值T2。然后, π = ( 1 / τ 11 1 / τ n n ] 。这个结果有很多直观的内容。通过蒙特卡罗模拟可以估计个体平均混合时间。然而,由于蒙特卡罗方法的仿真开销大、收敛性难以评估等问题,使得蒙特卡罗方法作为一种通用方法不具有实际意义。

  • 因为P包含所有行等于接近矩阵 π 作为 ,任何一排的“高幂”的P接近π*。虽然这个方法很简单,但是它涉及到选择一个收敛公差和一个适当大的一般来说,混合时间分析的复杂性也使得这种计算不切实际。

  • 线性系统 π P = π 可以用约束增广吗 Σ π = 1 ,形式 π 1 n ——- - - - - - n = 1 n ,其中1n——- - - - - -n是一个n——- - - - - -n矩阵的。利用约束条件,系统变为

    π ( P + 1 n ——- - - - - - n ) = 1 n

    该系统可以有效地与MATLAB反斜杠运营商来解决,是因为遍历数值稳定P不能在主对角线上有1(否则P将可约)。推荐使用这种方法[5]

  • 因为 π 唯一的左特征向量与Perron-Frobenius特征值相关吗P,对特征值进行排序,识别相应的特征向量 π 。由于约束 Σ π = 1 不属于特征值问题, π 需要正常化。此方法使用MATLAB的稳健NUMERICSeigs的方法实现的渐近对象函数DTMC宾语。

对于任何马尔可夫链,a说法分析可以给出它的渐近性质和混合速率。有限步分析包括这些量的计算:

  • 击中概率 h 一个 在状态的子集中击中任何状态的概率是多少一个(目标),从状态开始在链。命中概率表示从其他状态可以到达的状态; h 一个 >表示目标一个从状态可达。如果 h 一个 = 0,目标一个状态不可达,这意味着国家远程为目标。如果一个形成一个循环类, h 一个 是个吸收概率

  • 预计首次命中时间 k 一个 需要达到的长期平均时间步长是多少一个第一次,从国家开始 k 一个 =∞的意思是:

    • 起始状态目标位置较远一个

    • 起始状态remote-reachable对于目标一个;那是, h 一个 > 0, h B > 0,B是一个不包含任何状态的递归类吗一个

    如果一个形成一个循环类, k 一个 是预期吸收时间

击球概率或预期的第一击球次为一目标的从在马尔可夫链的每个状态开始的向量,表明该链的混合速率。

参考文献

[1]Diebold, F.X和G.D. Rudebusch。商业周期:持续时间、动态和预测。普林斯顿:普林斯顿大学出版社,1999年。

[2]界洛格,R.G.随机过程:应用理论。英国剑桥:剑桥大学出版社,2013年。

[3]Gilks​​,W. R.,S.理查森和D.J.Spiegelhalter于。马尔可夫链蒙特卡罗实践。博卡拉顿:查普曼&霍尔/CRC, 1996。

[4]Haggstrom,O.有限马尔可夫链和算法应用。英国剑桥:剑桥大学出版社,2002年。

[5]汉密尔顿,J. D.时间序列分析。普林斯顿:普林斯顿大学出版社,1994。

[6]霍恩,R.,和C·R·约翰逊。矩阵分析。英国剑桥:剑桥大学出版社,1985年。

[7]贾维斯,j。P。和d。r。舍尔。有限马尔可夫链的图论分析。在应用数学建模:多学科方法。博卡拉顿:CRC出版社,2000年。

[8]Maddala, G. S.和I. M. Kim。单位根,协整,和结构变化。英国剑桥:剑桥大学出版社,1998年。

[9]蒙哥马利,J。社会系统的数学模型。未出版的手稿。2016年威斯康星大学麦迪逊分校社会学系。

[10]诺里斯,j . R。马尔可夫链。英国剑桥:剑桥大学出版社,1997年。

[11]Wielandt, H。矩阵分析理论中的主题。由R.梅尔准备讲稿。数学系,威斯康星大学麦迪逊分校,1967年的大学。

另请参阅

对象

功能

相关话题