计算分数的creditscorecard与约束对象平等,不平等或逻辑回归模型的系数范围,使用fitConstrainedModel。不像fitmodel,fitConstrainedModel解决无约束和限制的问题。当前解决用于最小化的目标函数fitConstrainedModel是fmincon,从优化工具箱™。
这个例子中有三个主要部分。首先,fitConstrainedModel用于求解无约束模型的系数。然后,fitConstrainedModel演示了如何使用几种类型的约束。最后,fitConstrainedModel使用引导意义的分析,以确定哪些拒绝从模型的预测。
创建creditscorecard对象和本数据
无约束模型使用fitConstrainedModel
求解无约束系数fitConstrainedModel与输入参数的默认值。fitConstrainedModel使用内部优化解算器fmincon从优化工具箱™。如果你不设置任何限制,fmincon将模型作为一个无约束最优化问题。默认的参数下界和UpperBound是负和+正,分别。等式和不等式约束的,默认值是一个空的数字数组。
估计_____(拦截)0.70246 0.70179 0.89648 1.3794 1.0381 0.6057 CustAge TmAtAddress ResStatus EmpStatus CustIncome TmWBank 1.1132 OtherCC 1.0598 AMBalance 1.0572 UtilRate -0.047597
不像fitmodel这给了<年代p一个class="emphasis">p值,当使用fitConstrainedModel,您必须使用引导去找到那些拒绝从模型预测,当受到约束。这是“意义引导”的部分所述。
使用fitmodel比较结果和校准模型
fitmodel
符合逻辑回归模型的证据的效力(悲哀)数据和没有约束。你可以比较的结果“无约束模型使用fitConstrainedModel”部分的fitmodel验证模型校准。
现在,通过使用解决无约束问题fitmodel。请注意,fitmodel和fitConstrainedModel使用不同的解决者。而fitConstrainedModel使用fmincon,fitmodel使用stepwiseglm默认情况下。包括所有预测从一开始,设置“VariableSelection”名称-值对的观点fitmodel来“fullmodel”。
估计SE tStat pValue _____ ________ _____ __________(拦截)0.70246 0.064039 10.969 5.3719即使CustAge ResStatus TmAtAddress 0.015131 0.6057 0.24934 2.4292 1.0381 0.94042 1.1039 0.26963 1.3794 0.6526 2.1137 0.034538 EmpStatus TmWBank CustIncome 0.0022458 0.89648 0.29339 3.0556 0.70179 0.21866 3.2095 0.0013295 1.1132 0.23346 4.7683 1.8579 e-06 OtherCC UtilRate AMBalance 0.045568 1.0598 0.53005 1.9994 1.0572 0.36601 2.8884 0.0038718 -0.047597 0.61133 -0.077858 0.93794
表和图显示,模型系数匹配。你可以相信这个实现的fitConstrainedModel校准。
约束模型<年代p一个我d="function_fitconstrainedmodel_sep_CreditscorecardConstrainedLogisticRegressCoeffsExample-4" class="anchor_target">
约束模型方法,求出的值系数<年代p一个class="inlineequation">
的物流模式,受到约束。支持的约万博1manbetx束绑定、平等或不平等。系数最大化违约可能性函数定义,观察<年代p一个class="inlineequation">
,如:
地点:
是一个未知的模型系数
在观察预测值吗<年代p一个class="inlineequation">
响应值;值1表示默认,0代表非默认的值
这个公式是为非加权数据。当观察<年代p一个class="emphasis">我有重量<年代p一个class="inlineequation">
,这意味着<年代p一个class="inlineequation">
尽可能多的观察<年代p一个class="emphasis">我。因此,违约的概率发生在观察<年代p一个class="emphasis">我违约概率的乘积:
同样,非默认的概率加权观测<年代p一个class="emphasis">我是:
对于加权数据,如果有违约在给定的观察<年代p一个class="emphasis">我的重量是<年代p一个class="inlineequation">
,好像有一个<年代p一个class="inlineequation">
数的一个观察,他们要么全部违约,或所有非默认。<年代p一个class="inlineequation">
可能是也可能不是一个整数。
因此,对于加权数据,违约可能性功能观察<年代p一个class="emphasis">我在第一个方程
通过假设,所有默认值是独立的事件,因此目标函数
或者,更方便对数术语:
应用约束系数
校准后无约束模型中描述的“无约束模型使用fitConstrainedModel”部分中,您可以解出模型系数受约束。你可以选择上下界限等<年代p一个class="inlineequation">
,除了拦截。而且,由于客户的年龄和客户收入有点相关,您还可以使用额外的约束系数,例如,<年代p一个class="inlineequation">
。相对应的系数预测“CustAge”和“CustIncome”在这个例子中是<年代p一个class="inlineequation">
和<年代p一个class="inlineequation">
,分别。
引导意义<年代p一个我d="function_fitconstrainedmodel_sep_CreditscorecardConstrainedLogisticRegressCoeffsExample-6" class="anchor_target">
对无约束问题,标准的公式可用于计算<年代p一个class="emphasis">p值,您可以用它来评估哪个系数是显著的,哪些是被拒绝。然而,对于约束问题,标准的公式并不可用,推导公式的意义分析是复杂的。一个实用的替代方法是执行意义分析<年代p一个class="emphasis">引导。
在引导的方法,当使用fitConstrainedModel,你设置名称参数“引导”来真正的名称-值参数,选择了一个值“BootstrapIter”。引导意味着<年代p一个class="inlineequation">
样品(替代)从原始观测被选中。在每个迭代中,fitConstrainedModel解决了同样的约束问题为“约束模式”部分。fitConstrainedModel为每个系数获得多个值(解决方案)万博 尤文图斯<年代p一个class="inlineequation">
和你可以画出这些箱线图或柱状图。使用箱线图、柱状图,您可以检查中间值来评价系数是否远离零和多少系数偏离他们的意思。
箱线图的固体红线表明中值值和底部和顶部的边缘的<年代p一个class="inlineequation">
和<年代p一个class="inlineequation">
百分位数。“胡须”是最小和最大值,不包括异常值。虚线代表和上界约束系数越低。在这个例子中,不能负系数,通过建设。
帮助决定哪些预测模型中,评估的比例乘以每个系数为零。
根据情节,你可以拒绝“UtilRate”因为它有最多数量的零值。你也可以决定拒绝“TmAtAddress”因为它显示了一个高峰,虽然小。
设置相应的系数为零
设置相应的系数为零,其上限设置为0和解决模型再次使用原始数据集。
设置约束系数回creditscorecard
现在您已经解决了约束系数,使用setmodel设置模型的系数和预测。然后你可以计算(们)点。
_____________________ ___________预测本点* * * {‘CustAge}{[无穷,33)的-0.16725}{‘CustAge}{[33岁,37)的-0.14811}{‘CustAge}{[37、40)的-0.065607}{‘CustAge}{[40岁,46)的0.044404}{‘CustAge}{[46岁,48)的0.21761}{‘CustAge}{[48, 58)的0.23404}{‘CustAge}{的[58岁的Inf]} 0.49029 {‘CustAge}{' <失踪>}南{‘ResStatus}{“租户”}0.0044307 {‘ResStatus}{‘业主’}0.11932 {‘ResStatus}{‘其他’}0.30048 {‘ResStatus}{' <失踪>}南{‘EmpStatus}{‘未知’}-0.077028 {‘EmpStatus}{“雇佣”}0.31459 {‘EmpStatus}{' <失踪>}南{‘CustIncome}{[无穷,29000)的-0.43795}{‘CustIncome}{[29000、33000)的-0.097814}{‘CustIncome}{[33000、35000)的0.053667}{‘CustIncome}{[35000、40000)的0.081921}{‘CustIncome}{[40000、42000)的0.092364}{‘CustIncome}{[42000、47000)的0.23932}{‘CustIncome}{”(47000年,正)}0.42477 {‘CustIncome}{' <失踪>}南{‘TmWBank}{[无穷,12)的-0.15547}{‘TmWBank}{[12、23)的-0.031077}{‘TmWBank}{[23日45)的-0.021091}{‘TmWBank}{[71)的0.36703}{‘TmWBank}{”(71年,正)}0.86888 {‘TmWBank}{' <失踪>}南{‘OtherCC}{‘不’}-0.16832 {‘OtherCC}{'是的'}0.15336 {‘OtherCC}{' <失踪>}南{‘AMBalance}{[无穷,558.88)的0.34418}{‘AMBalance}{[558.88, 1254.28)的-0.012745}{‘AMBalance}{[1254.28, 1597.44)的-0.057879}{‘AMBalance}{'[1597.44,正]}-0.19896 {‘AMBalance}{' <失踪>}NaN
使用任何范围分,您可以遵循的其余部分信用计分卡建模工作流程计算分数和违约概率和验证模型。