当创建一个creditscorecard
对象,用于输入的表数据
参数定义了或没有定义观察权重。如果数据
不使用的重量,那么“计数”好
,坏
,几率
使用信用评分卡的功能。然而,如果可选的WeightsVar
参数是指定在创建creditscorecard
对象,然后“计数”好
,坏
,几率
权重的总和。
举例来说,这是一个输入的一个片段表没有定义观察权重:
如果你本客户的年龄预测数据,与客户45岁在一本,46和另一本,你会得到这些数据:
好
意味着的总行数0
的价值状态
响应变量。坏
的数量1
的年代状态
列。几率
的比例是好
来坏
。的好
,坏
,几率
每本报告。这意味着有381人在样例45和支付他们的贷款,241名在同一年龄段违约,因此,的可能性是适合年龄范围1.581
。
假设modeler认为人们45和年轻的在此示例中未被充分代表的。modeler想给所有行与年龄45更高的重量。假设modeler认为45岁应该有50%的重量比行46岁或以上。表数据扩大到包括观察权重。一个重量
列添加到表,所有行和45岁以下的重量1.5
的重量,和所有其他行1
。还有其他原因使用重量,例如,最近的数据点可能被赋予更高的权重比旧的数据点。
如果本加权数据基于年龄(45岁及以下,而46岁或以上)每一行的期望是45岁及以下必须算作1.5观察,因此好
和坏
“计数”增加了50%:
“计数”现在“加权频率”,不再是整数值。的几率
第一本不改变。在这个例子中给出的特定的权重比例的总效应好
和坏
数量在第一本同样的比例因子,因此他们的比率并没有改变。然而,几率
价值总样本的变化;第一本现在有更高的权重,因为,本的几率更低,总数是多少几率
现在更低。等信用计分卡统计这里没有显示有祸了
和信息的价值
以类似的方式的影响。
一般而言,权重的影响不仅仅是规模在一个特定的频率,因为成员,本将有不同的权重。这个例子的目的是演示的概念从数量转向权重的总和。
creditscorecard
|autobinning
|bininfo
|fitmodel
|validatemodel