主要内容

modelAccuracy

计算预测和观测lgd的r平方、均方根误差、相关性和样本平均误差

描述

例子

AccMeasure= ModelAccuracy(lgdModel数据计算R-Square,均方根误差(RMSE),相关性和观察到的样本误差。默认(LGD)数据给出了预测损失。modelAccuracy万博1manbetx支持对引用模型的比较,也支持不同的关联类型。默认情况下,modelAccuracy计算LGD刻度中的指标。你可以使用ModelLevel名称-值对参数来使用底层模型的转换规模计算度量。

例子

AccMeasureACCDATA.) = modelAccuracy (___名称,值除了以前语法中的输入参数之外,使用一个或多个名称值对参数指定选项。

例子

全部折叠

此示例显示了如何使用fitlgdmodel.将数据与回归模型然后使用modelAccuracy计算预测和观察LGD的R-Square,RMSE,相关性和样本误差。

加载数据

加载丢失的默认数据。

负载LGDData.mat头(数据)
ans =.8×4表LTV年龄类型LGD _______ _______ ___________ _________ 0.89101 0.39716 residential 0.032659 0.70176 2.0939 residential 0.43564 0.72078 2.7948 residential 0.0064766 0.37013 1.237 residential 0.007947 0.36492 2.5818 residential 0 0.796 1.5957 residential 0.14570.60203 1.1599 residential 0.025688 0.92005 0.50253 investment 0.063182

对数据进行分区

将数据分成训练分区和测试分区。

RNG('默认');%的再现性NumObs =身高(数据);c = cvpartition (NumObs“坚持”,0.4);培训=培训(c);testind =测试(c);

创建回归乐金显示器模型

使用fitlgdmodel.创建一个回归使用训练数据建立模型。

lgdModel = fitLGDModel(数据(TrainingInd,:),'回归');disp (lgdModel)
回归与属性:ResponseTransform: "logit" BoundaryTolerance: 1.0000e-05 ModelID: "Regression" Description: "" underingmodel: [1x1 classreg.regr. regr.]CompactLinearModel] PredictorVars: ["LTV" "Age" "Type"] ResponseVar: "LGD"

显示底层模型。

disp (lgdModel.UnderlyingModel)
紧凑线性回归模型:LGD_logit ~ 1 + LTV +年龄+类型估计系数:估计SE tStat pValue ________ ________ _______ __________ (Intercept) -4.7549 0.36041 -13.193 3.0997e-38 LTV 2.8565 0.41777 6.8377 1.0531e-11 Age -1.5397 0.085716 -17.963 3.3172e-67 Type_investment 1.4358 0.2475 5.8012 7.587e-092093,误差自由度:2089均方根误差:4.24 r -平方:0.206,调整r -平方:0.205 f -统计量与常数模型:181,p值= 2.42e-104

计算预测和观测lgd的r -平方、均方根误差、相关性和样本平均误差

使用modelAccuracy计算RSquaredRMSE相关,SampleMeanError的预测和观测lgd的测试数据集。

[AccMeasure, AccData] = modelAccuracy (lgdModel、数据(TestInd,:))
AccMeasure =1×4表RSquared RMSE相关性SampleMeanError  ________ _______ ___________ _______________ 回归0.070867 0.25988 0.26621 0.10759
AccData =1394×3表观察预测回归残差回归_________ ____________________ ____________________ 0.0064766 0.00091169 0.0055649 0.007947 0.0036758 0.0042713 0.063182 0.18774 - 0.124556 0 0.0010877 -0.0010877 0.10904 0.011213 0.097823 0 0.041992 -0.041992 0.89463 0.052947 0.84168 0 3.7188e-06 -3.7188e-06 0.072437 0.0090124 0.063425 0.0360060.023928 0.012078 0 0.0034833 -0.0034833 0.39549 0.0065253 0.38896 0.057675 0.071956 -0.014281 0.014439 0.0061499 0.008289 0 0.0012183 -0.0012183 0 0.0019828 -0.0019828⋮

生成一个散点图的预测和观察lgd使用modelAccuracyPlot

ModelAccurascalyplot(LGDModel,数据(测试,:),“ModelLevel”“潜在的”

图中包含一个轴。标题为散点回归的轴,R-Squared: 0.17826包含2个散点类型的对象,直线。这些对象代表Data, Fit。

此示例显示了如何使用fitlgdmodel.将数据与托比特书模型然后使用modelAccuracy计算预测和观测lgd的R-Square、均方根误差(RMSE)、相关性和样本平均误差。

加载数据

加载丢失的默认数据。

负载LGDData.mat头(数据)
ans =.8×4表LTV年龄类型LGD _______ _______ ___________ _________ 0.89101 0.39716 residential 0.032659 0.70176 2.0939 residential 0.43564 0.72078 2.7948 residential 0.0064766 0.37013 1.237 residential 0.007947 0.36492 2.5818 residential 0 0.796 1.5957 residential 0.14570.60203 1.1599 residential 0.025688 0.92005 0.50253 investment 0.063182

对数据进行分区

将数据分成训练分区和测试分区。

RNG('默认');%的再现性NumObs =身高(数据);c = cvpartition (NumObs“坚持”,0.4);培训=培训(c);testind =测试(c);

创建托比特书乐金显示器模型

使用fitlgdmodel.创建一个托比特书使用训练数据建立模型。

lgdModel = fitLGDModel(数据(TrainingInd,:),'tobit');disp (lgdModel)
Tobit with properties: CensoringSide: "both" LeftLimit: 0 RightLimit: 1 ModelID: "Tobit" Description: "" underingmodel: [1x1 risk.internal.credit.TobitModel] PredictorVars: ["LTV" "Age" "Type"] ResponseVar: "LGD"

显示底层模型。

disp (lgdModel.UnderlyingModel)
Tobit回归模型LGD = max(0,min(Y*,1)) Y* ~ 1 + LTV + Age + Type估计系数:估计SE tStat pValue _________ _________ _______ __________ (Intercept) 0.058257 0.027276 2.1358 0.032809 LTV 0.20126 0.031373 6.415 1.7363e-10 Age -0.095407 0.0072543 -13.152 0 Type_investment 0.10208 0.018054 5.6542 1.7802e-08 (Sigma) 0.29288 0.005704 51.346 0右截尾数:25对数似然数:-698.383

计算预测和观测lgd的r -平方、均方根误差、相关性和样本平均误差

使用modelAccuracy来计算RSquaredRMSE相关,SampleMeanError的预测和观测lgd的测试数据集。

[AccMeasure, AccData] = modelAccuracy (lgdModel、数据(TestInd:)“CorrelationType”“假象”
AccMeasure =1×4表RSquared RMSE相关SampleMeanError ________ _______ ___________ _______________托比特0.08527 0.23712 0.29964 -0.034412
AccData =1394×3表观察预测tobit剩余tobit _________ _______________ _______________ 0.0064766 0.087889 -0.081412 0.007947 0.12432 -0.11638 0.063182 0.32043 -0.25724 0 0.093354 -0.093354 0.10904 0.16718 -0.058144 0 0.22382 -0.22382 0.89463 0.23695 0.65768 0 0.010234 -0.010234 0.072437 0.1592 -0.086761 0.036006 0.19893 -0.16292 0 0.12764 -0.127640.39549 0.14568 0.2498 0.057675 0.26181 0.20413 0.014439 0.14483 -0.13039 0 0.094123 -0.094123 0 0.10944 -0.10944⋮

使用预测和观察的LGDS产生散点图modelAccuracyPlot

ModelAccurascalyplot(LGDModel,数据(测试,:))

图中包含一个轴。标题为Scatter Tobit, R-Squared: 0.08527的轴包含了2个类型为Scatter, line的物体。这些对象代表Data, Fit。

输入参数

全部折叠

丢失给定的默认模型,指定为以前创建的回归托比特书对象使用fitlgdmodel.

数据类型:对象

数据,指定为aNumRows-经过-NumCols表与预测器和响应值。变量名称和数据类型必须与底层模型一致。

数据类型:表格

名称-值对的观点

指定可选的逗号分隔对名称,值论点。的名字参数名和价值是对应的值。的名字必须出现在引号内。您可以按如下顺序指定几个名称和值对参数name1,value1,...,namen,valuen

例子:[AccMeasure, AccData] = modelAccuracy (lgdModel、数据(TestInd:),‘DataID’,‘测试’,‘CorrelationType’,斯皮尔曼)

关联类型,指定为逗号分隔的对,由“CorrelationType”和一个字符向量或字符串。

数据类型:char|字符串

数据集标识符,指定为逗号分隔的对,由“DataID”和一个字符向量或字符串。的dataid.包含在输出中以报告目的。

数据类型:char|字符串

模型级别,指定为逗号分隔的对,由“ModelLevel”和一个字符向量或字符串。

  • “高级”-精度指标是在顶级模型级别的LGD规模计算。

  • “底层”- 为一个回归仅模型,度量在基础模型的转换规模中计算。度量值在转换后的LGD数据上计算。

请注意

ModelLevel对a没有效果托比特书模型,因为没有响应转换。

数据类型:char|字符串

预测的LGD值数据由引用模型指定为逗号分隔的对,由“ReferenceID”和一个NumRows-经过-1数值向量。的modelAccuracy报告了输出信息lgdModel对象和引用模型。

数据类型:双倍的

引用模型的标识符,指定为逗号分隔的对,由“ReferenceID”和一个字符向量或字符串。“ReferenceID”用于modelAccuracy用于报告目的的输出。

数据类型:char|字符串

输出参数

全部折叠

准确度测量,用列作为表返回“RSquared”'RMSE'“相关”,“SampleMeanError”AccMeasure如果只有一行lgdModel测量精度,如果给出参考模型信息,它有两行。的行名AccMeasure报告型号ID和数据ID(如果提供)。

准确性数据,作为具有观察到的LGD值的表返回,预测的LGD值和残差(观察到的减去预测)。如果提供的话,则包括用于参考模型的预测和剩余值的附加列。的ModelID参考文献标签被附加在列名中。

更多关于

全部折叠

模型的准确性

模型的准确性使用不同的度量度量LGD值的预测概率的准确性。

  • r²-要计算r²度规,modelAccuracy将观测到的LGD值与预测的LGD值进行线性回归

    l G D o b 年代 一个 + b l G D p r e d + ε.

    报道了这种回归的R-平方。有关更多信息,请参阅决定系数(r²)

  • RMSE -计算均方根误差(RMSE),modelAccuracy使用下面的公式N是观察人数:

    R 年代 E 1 N 1 N l G D o b 年代 l G D p r e d 2

  • 相关性-这是观测到的LGD与预测的LGD之间的相关性:

    c o r r l G D o b 年代 l G D p r e d

    有关不同关联类型的更多信息和详细信息,请参见corr

  • 样本平均误差-这是平均观测LGD和平均预测LGD之间的差值,或等价地,残差的平均值:

    年代 一个 p l e e 一个 n E r r o r 1 N 1 N l G D o b 年代 l G D p r e d

参考

Baesens, Bart, Daniel Roesch和Harald Scheule。信用风险分析:SAS中的测量技术,应用和示例。威利,2016年。

[2]贝里尼,Tiziano。IFRS 9和CECL信用风险建模和验证:一个实用指南与实例在R和SAS工作。圣地亚哥,加利福尼亚州:2019年elestvier。

介绍了R2021a