探索风险传染利用图论和Markov链

由肯·迪利,MathWorks公司

最近的金融危机和市场波动的时期已经提高金融分析师之间风险传递和系统性风险的意识。其结果是,金融专业人士常常任务是构建和分析模型,将产生洞察风险投资,投资组合和业务运营的潜在影响。

一些作者描述了利用先进的数学和统计技术,量化投资,外汇汇率,工业部门或地理区域[1]之间的依赖关系 - [7]。桥接形式化方法和工作代码执行之间的差距是分析师的主要挑战。

本文将介绍如何MATLAB®可以用来分析利用各种数学工具风险传染的方面。涵盖的主题包括:

  • 数据聚合,预处理和风险基准
  • 金融变量间依赖关系的量化
  • 可视化所得到的依赖关系网络与接近度信息一起(图1)
  • 使用隐马尔可夫模型风险传染的分析周期

下载此文章的MATLAB脚本直播用于交互式访问所有图像、方程式和代码。实时脚本包含本文中的所有代码、输出、公式和图像。您可以下载该脚本,在MATLAB中打开它,并探索本文中描述的分析步骤。

R2016a或以上需要使用MATLAB现场编辑器。如果你没有R2016a,你可以下载免费试用.

了解更多关于MATLAB现场编辑器。

图1.相关距离依赖性网络用于工业部门的回报。

数据聚合和预处理

我们首先收集了2008年1月至2013年12月期间各国的中期证券价格。每种证券都有相关的元数据,如市值、工业部门和国家。在这篇文章中,我们将分析不同部门之间的传染,但很容易研究其他类别——例如,原产国。我们使用标准化的市场资本化来定义单个证券权重,然后使用加权和聚合每个部门的所有证券。结果是图2所示的基准价格系列。

图2.基准价格系列八大工业部门。

相关分析

研究变量间依赖关系的最简单方法之一是计算数据的相关矩阵。使用MATLAB绘图矩阵函数与统计与机器学习工具箱™科尔函数,我们可以创建指示扇区返回序列数据中存在的成对关系的信息可视化。这些图表的示例如图3和图4所示。

图3中的非对角线元素显示了成对的关节分布,对角线显示了直方图上每个变量的边缘分布。图4通过说明工业部门回报率之间的成对相关系数,量化了图3所示成对线性关系的相对强度。为了研究变量之间更一般的单调关系,我们可以计算Kendall's牛头或斯皮尔曼RHO系数使用科尔功能。

行业回报率之间如图3实证两两关系。
图4.示出了热图成对扇区线性相关系数。上述0.80的相关性以红色突出显示。

可视化依赖使用图论

它可以是很难直接从相关矩阵洞悉风险传染。运用图论是量化和可视化的变量附近的有效方法。为了测量接近度,我们把相关系数成使用映射如\距离(F(C)= 1 - Visual C \)或\(F(C)= \ SQRT {2(1 - C)} \)

分配工业部门到网络的节点,我们随后经由与由所述相关距离给出的长度边缘联合起来的节点。在[1]和[2]中,作者计算最小生成树(MST)这个图的。MST是连接所有节点的子图,其中的总边长度最小。在这种情况下,我们可以认为MST是封装扇区之间依赖关系的“骨干”网络。在MATLAB中,我们可以使用图形minspantree函数直接计算的MST:

G =图表(sectorDist,扇区);T = minspantree(G);

在这里,宗派主义者是相关距离矩阵和行业是包含该扇区的名字的单元阵列。

有用于可视化所产生的MST几个选项。最简单的方法是使用图形情节直接在树上运行。提供2D表示的另一种方法是通过Sammon映射在距离矩阵上使用非线性多维缩放:

COORDS = mdscale(sectorDist,3, '标准', '的Sammon');

要创建2D可视化,我们通过将得到的欧几里得坐标的数组COORDS图形情节方法:

情节(T, '扩展数据',COORDS(:,1), 'YDATA',COORDS(:,2))

当与一些简单的打印设置相结合,这种方法允许我们创建如图1所示,我们评估的图表通过创建谢泼德图(图5)嵌入的质量的可视化。如果散点从基准线不显着偏离,那么我们有一个良好的质量嵌入。

的萨蒙嵌入距离与实际距离图5.谢泼德情节。

评估使用图形掌措施部门的重要性

代表图形形式的数据可以帮助我们以量化变量之间的关系。由于数学本质的图表提供的节点意义的措施,我们可以通过计算这些量评估部门的重要性。我们使用中心地位方法相关联图形对象:

关联度=中心性(T,“度”);接近度=中心性(T,“接近度”,“成本”,边缘);中间性=中心性(T,“中间性”,“成本”,边缘);

这个发生率节点的计算边相邻节点的数量,而亲近是从节点到所有其它节点的距离的总和的倒数。因此,高接近值意味着该节点是中央,或重要的。同样的,的一个节点测量多久该节点出现在该图的其它两个节点之间的最短路径上。高介值意味着该节点是非常重要的。

计算这些措施的MST上面产生所示的结果如图6,我们看到,服务部门对所有措施的最高值。中央服务节点以红色突出显示在图1中。

从MST计算图6扇区中心性的措施。

通过滚动窗口可视化风险传染

在上一节中所描述的分析使用来自2008 - 2013年的完整数据集。它是在风险模型共同在滚动窗口进行分析,以评估感兴趣变量的动态变化。为了实现连续六个月滚动窗口前面的分析,我们使用了对于-loop来增加每个窗口的开始日期。

此过程中的图形可以使用VideoWriter类,显示高度相关(> 0.80)扇区对的发生率随时间(图7)。

图7。滚动风险传染的例子。

图8示出在中央扇区随时间的变化。我们注意到,服务,工业产品和消费品行业在整个这个时期非常重要的。

图8.在滚动窗口计算中央节点跟踪。

量化依赖与替代距离度量

尽管相关性是简单的解释和计算,它可能无法完全描述金融变量之间的依赖关系的复杂性。[5]中,笔者采用基于熵和互信息理论的统计概念的度量。如果\(F_X \)是随机变量\(X \),那么熵\(X \)的概率密度函数是

\[H_X=-\int f_X(X)\日志f_X(X)\数学{d}X\]

我们可以把熵看作是对变量无序性或随机性的度量。高熵表示高度无序。类似地,如果我们有两个具有联合密度(f{X,Y})的随机变量(X)和(Y),那么(X)和(Y)的相互熵是

\[H{X,Y}=-\iint f{X,Y}(X,Y)\日志f{X,Y}(X,Y)\数学{d}X\数学{d}Y\]

这个互信息内容(X)和(Y)的定义为

\ [I_ {X,Y} = H_X + H_Y - H_ {X,Y} \]

互信息可以使用下式被转换成一个距离

\ [D_ {X,Y} = 1 - \ SQRT {1 - E 1 {{2I_ X,Y}}} \]

请注意,最大距离是一个。这个结果仅实现如果的互信息内容\(X \)和\(Y \)是零,这,反过来,只发生如果\(X \)和\(Y \)是独立的[5]。如果\(X \)和\(Y \)是密切相关的,那么它们的相互信息含量大,因此,距离接近于零。

利用统计和机器学习工具箱函数,在MATLAB中估计两个随机变量的联合密度ksdensity.这种技术避免了对数据的任何分布假设的优势。

假设\(X \)和\(Y \)是用于两个扇区的返回系列,样本代码,用于计算\({H_ X,Y} \)如下:

X = linspace(分钟(X),最大(X),250);Y = linspace(分(Y),最大值(Y),250);[的Xgrid,YGRID] = meshgrid(X,Y);PTS = [的Xgrid(:),YGRID(:)];FXY = ksdensity([X,Y],PTS);FXY =重塑(FXY,大小(的Xgrid));integrandXY = FXY *日志(FXY)。integrandXY(isnan(integrandXY))= 0;HXY =  -  trapz(Y,trapz(X,integrandXY,2));

此代码估计的\(X \)和\(Y \)超过250×晶格的联合密度,然后计算二重积分使用限定\({H_ X,Y} \)trapz函数执行数值梯形积分。一些为NaN如果\的估计值(F_ {X,Y} \)是零值发生在被积。我们将整合之前设置这些零。

图9示出了用于第一两个扇区,基础材料和消费品所估计的联合密度。

图9.估计前两个工业部门联合密度函数。

我们使用类似的方法来估计(H X)和(H Y),然后计算信息距离(d{X,Y})。估计精细晶格上的联合密度函数可能是一个耗时的过程,因此我们使用帕弗构建体在并行计算工具箱™来估计在平行成对距离矩阵,这需要nSector(nSectors-1)/ 2要计算不同的距离。图10显示了所得到的MST使用所述信息的距离度量来计算。始终与前面的分析,中央部门是服务,在图10中以红色突出显示。

图10. MST使用所述信息的距离度量来计算。

模型风险传染的隐马尔可夫模型

当从描述性分析移动到建模,一些作者使用统计技术,例如隐马尔可夫模型(参见,例如,[6])。回到滚动窗口分析,我们认为高度相关部门对数量为目前的风险蔓延的市场水平的基本代理。

为简单起见,我们假设有三个潜在的,未观察到的风险传染的水平,这是我们命名为“低”,“中等”和“高”补隐马尔可夫链的状态。我们从马尔可夫链中的观察到的排放量序列是高度相关的扇区对,其范围可以从0到28的数。

图11显示了2008-2013年期间的观测数据。我们看到,有几个时期的高传染性,高传染性似乎以不同的速度消散。下面的图表显示了发射跃迁的顺序,也就是说,从一个窗口到下一个窗口的高度相关对的数量差异。

图11.高度相关部门对和发射跃迁的观察序列。

统计和机器学习工具箱提供了一种构建隐马尔可夫模型的框架。为了估计状态和发射转换矩阵,我们使用hmmtrain功能,提供初始猜测TREM未知矩阵:

[estTR,estEM] =hmmtrain(排放,TR,EM);

要检查估计矩阵的稳健性,我们可以交叉验证的排放量矢量的子集,以确保算法收敛到相同的矩阵。图12示出有剩余的处于相同状态的高概率,以及由下到上一级或过渡的小,但不平凡的概率从图11中。表1示出了可视化的数据而获得的马尔可夫链。有过渡两级向上或向下一个步骤的微不足道的机会。

介质
0.964 0.036 0.000
介质 0.107 0.833 0.060
0.000 0.035 0.965

表1。马尔可夫链转移概率hmmtrain.

图12.状态图的隐马尔可夫链。

这个hmmviterbi回顾性功能状态估计的最可能的序列:

states=hmmviterbi(排放量,estTR,estEM,…'Statenames',{'Low','Medium','High'});

我们还利用计算后验状态概率hmmdecode:

pstates = hmmdecode(排放,estTR,estEM)'。

的统计结果提供洞察市场条件在历史时期(图13)。第二列包含从输出状态hmmviterbi和列3-5包含从后状态概率hmmdecode.同样,我们在可能的状态与观察到的市场数据(图14)比较深入了解这种模式的有效性。

图13.整理表从​​隐马尔可夫模型的分析结果。
图14.马尔可夫链状态和观察到的市场数据。

总结和后续步骤

了解系统性风险需要仔细建模和分析。在这篇文章中,我们实现的技术量化金融变量,包括关联和信息之间的距离接近。我们已经看到了如何使用图论形象化邻近信息。量化和可视化变量之间的关系是在数据分析的探索阶段重要。移动到建模阶段,我们通过拟合隐马尔可夫模型的观测数据创造了风险传染的简单模型。

为了扩展在这篇文章中描述的技术,包括在我们的分析,系统性风险等方面,我们可以利用其他MATLAB工具箱,包括提供先进的机型:

  • 时间序列和状态空间模型(计量经济学工具箱™)
  • 市场和信用风险模型(金融工具箱™)
  • 仪器定价功能(金融工具工具箱™)

发布时间2016 - 92983v00


参考

  1. Resovsky,马塞尔,丹尼斯·霍瓦特,弗拉基米尔Gazda和玛丽安娜Sinicakova,“在货币市场最小生成树的应用”,货币市场2013年7月http://www.nbs.sk/_img/Documents/_PUBLIK_NBS_FSR/Biatec/Rok2013/07-2013/05_biatec13-7_resovsky_EN.pdf

  2. 麦克道兰,马克,欧麦苏莱曼,斯泰西威廉姆斯,山姆豪森,和尼尔F约翰逊,“检测货币的支配地位或依赖性使用外汇网络树”,https://arxiv.org/abs/cond-mat/0412411

  3. 欧阳红兵和小东柳,系统重要性的分析和系统性风险传染中国的金融机构基于网络的分析,红兵欧阳,小东柳,CMS,2015年,V23(10)的机制:30-37

  4. 洛瑞,朱,朱日骂死,奥维迪乌五Precup,詹保罗Gabbi和圭多·卡代尔利,“意大利隔夜货币市场的网络分析”,经济学系,讨论文件汇编,第05/05https://www.city.ac.uk/__data/assets/pdf_file/0017/90260/0505_iori-et-al.pdf

  5. 卡亚,哈坎,“偏心资产管理”,金融网络理论杂志,第1卷,第1期(http://www.risk.jbs.cam.ac.uk/news/downloads/2015/journalofnetworktheoryinfinance-v1-no1.pdf)

  6. Staum,杰里米左右,刘明Staum,”系统性风险组件在蔓延的网络模型”,2012年可用1月在SSRN:http://ssrn.com/abstract=1726107

  7. Bisias、Dimitrios、Mark Flood、Andrew W.Lo和Stavros Valavanis,“系统风险分析调查”,金融研究办公室,工作文件00012012年1月5日https://financialresearch.gov/working-papers/files/OFRwp0001_BisiasFloodLoValavanis_ASurveyOfSystemicRiskAnalytics.pdf

查看文章的相关能力

查看文章为相关行业