主要内容

信用计分卡建模使用观察权重

当创建一个creditscorecard对象,用于输入的表数据参数定义了或没有定义观察权重。如果数据不使用的重量,那么“计数”,,几率使用信用评分卡的功能。然而,如果可选的WeightsVar参数是指定在创建creditscorecard对象,然后“计数”,,几率权重的总和。

举例来说,这是一个输入的一个片段表没有定义观察权重:

输入表代码片段创建creditscorecard对象

如果你本客户的年龄预测数据,与客户45岁在一本,46和另一本,你会得到这些数据:

统计数据对“好”和“坏”一本45岁,46岁,第二本

意味着的总行数0的价值状态响应变量。的数量1的年代状态列。几率的比例是。的,,几率每本报告。这意味着有381人在样例45和支付他们的贷款,241名在同一年龄段违约,因此,的可能性是适合年龄范围1.581

假设modeler认为人们45和年轻的在此示例中未被充分代表的。modeler想给所有行与年龄45更高的重量。假设modeler认为45岁应该有50%的重量比行46岁或以上。表数据扩大到包括观察权重。一个重量列添加到表,所有行和45岁以下的重量1.5的重量,和所有其他行1。还有其他原因使用重量,例如,最近的数据点可能被赋予更高的权重比旧的数据点。

表展示权重取决于CustAge的预测

如果本加权数据基于年龄(45岁及以下,而46岁或以上)每一行的期望是45岁及以下必须算作1.5观察,因此“计数”增加了50%:

表片段展示的影响权重对“好”和“坏”

“计数”现在“加权频率”,不再是整数值。的几率第一本不改变。在这个例子中给出的特定的权重比例的总效应数量在第一本同样的比例因子,因此他们的比率并没有改变。然而,几率价值总样本的变化;第一本现在有更高的权重,因为,本的几率更低,总数是多少几率现在更低。等信用计分卡统计这里没有显示有祸了信息的价值以类似的方式的影响。

一般而言,权重的影响不仅仅是规模在一个特定的频率,因为成员,本将有不同的权重。这个例子的目的是演示的概念从数量转向权重的总和。

另请参阅

||||

相关的话题