某商业银行计划发行一种信用卡,该信用卡有较好的商业功能,例如可以进行透支消费等。银行为了有效地减少金融风险,要求每位申请者填写申请表,提供自身的背景资料,并根据这些资料,对其信誉度进行打分。如果打分为“+”,则表明该申请者信誉度不高,信用卡不予办理;如果打分为“-”,则表明可以向该申请者发放信用卡。为确保商业机密和申请者的个人隐私,申请资料中的属性(变量)已换成没有任何意义的代码。如 b,30.83,0,u,g,w,v,1.25,t,t,01,f,g,00202,0, a,38.58,5,u,g,cc,v,13.5,t,f,0,t,g,00980,0,- 资料中共有15个属性(用逗号隔开,分别记为A1——A15)和一个打分情况,其取值类型如表2所示。 表1:个人资料中属性(变量)的类型 属性变量类型 A1离散型变量,取值为“a, b” A2连续型变量 A3连续型变量 A4离散型变量,取值为“u, y, l, t” A5离散型变量,取值为“g, p, gg” A6离散型变量,取值为“c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff” A7离散型变量,取值为“v, h, bb, j, n, z, dd, ff, o” A8连续型变量 A9离散型变量,取值为“t, f” A10离散型变量,取值为“t, f” A11连续型变量 A12离散型变量,取值为“t, f” A13离散型变量,取值为“g, p, s” A14连续型变量 A15连续型变量 打分离散型变量,取值为“+, -” 现提供600名申请者的背景资料及打分情况(见附录): 1.请你根据600名申请者的背景资料及打分情况,给出一种判别准则,并对这600名申请者重新打分,使你的打分与原打分尽可能相吻合。 2.现有90名待申请者,个人背景资料与前600名申请者有相同的形式,如 a,17.33,9.5,u,g,aa,v,1.75,f,t,10,t,g,00000,10 b,80.25,5.5,u,g,?,?,0.54,t,f,0,f,g,00000,340 其详细资料见表4。现应用你的判别准则对这90名申请者中的前53名进行打分,以确定是否为他(她)们提供信誉卡。 3.由于申请者个人的原因(如漏填或有意不填),有些项的指标没有填写(没有填写的项在表中为?),对于这种情况,你将如何修正你的判别准则,然后对这些申请者(表4中的后37名)进行打分,以判断他(她)们是否可以得到信誉卡。 二 模型假设 1.所有属性变量都为无序列属性变量 2.不考虑属性变量和数值变量在模型中的交叉作用 3. 不考虑模型对变量的多次回归相关性 4. 数据经转换后保留了原始数据的某些统计特征,即问题的可预测性 5. 给出的变量符号没有任何的意义 三 问题分析 本题研究的指标是一属性变量,即离散变量“ ”和“-”,并希望用其它15个连续或离散变量来预测这个属性变量的取值,我们用统计学上的属性数据分析对这600个人的数据进行统计,各个变量对信誉度的相关性不相同,且某些变量之间有可能存在着很强的依赖关系,我们做如下处理...... |
查看评论
已有0位网友发表了看法