对数据量少的“弱活跃用户”进行信用评价,怎么实现?对于一个数据量偏少的用户,通过建模技术来评判这个人的信用状况,这有实现的可能吗,怎么实现的? 从常规的角度看,通常经济计量模型对于数据的要求非常高,数据的数量和质量越高,模型的有效性就越好,对经济现象的解释和预测能力就越强。但在发展普惠金融的过程中,面临的很大的难题就是普惠金融要为那些没有在传统金融体系中获得服务的人群提供服务,而这类群体数据量偏少,难以通过传统的数据模型来判断信用状况。 大数据时代的来临和深度学习技术的进步为改变这种状况带来了契机。互联网、智能手机、社交网络等大行其道,使人们的很多线下行为线上化、数字化,有效增加了评判信用状况的维度。深度学习技术则提升了模型的有效性,可以在综合更多维度的基础上有效建模。 收入、消费、信贷记录等数据对于评判用户信用状况的作用可能是立竿见影的。对于缺少这方面数据的用户,如果能通过全方位搜集各种数据,如用什么手机,下载了多少APP,喜欢什么游戏,发朋友圈的频次与内容,有怎样的地理位置运行轨迹等,都可以组成很多不同的特征向量,从不同维度对用户的信用状况进行或深或浅的揭示。 这些特征向量与用户信用程度的相关性或强或若,可以通过模型进行测算,为不同的特征赋予不同的权重,综合判断用户的信用状况。在这一过程中,大数据带来了各种维度的数据信息,深度学习等技术则提升了预测模型的精度和有效性。模型一定有效吗?当然,大数据与深度学习等技术的进步,只是带来了解决数据量少的“弱活跃用户”信用评价问题的可行性,并不意味着一定能解决,或者完美解决。 首先,技术能解决的是有效数据少的用户的信用评价难题,注意这里是有效数据少,而不是数据少。也就是说,虽然有效数据少,但有不同维度的弱相关数据,也可以在一定程度上判断用户的信用状况。如果数据量本身就很少,连维度都很少,那么再高深的模型也爱莫能助。例如对于一个手机、网络都不使用的用户,其行为都没有数据化、线上化,那么模型也就没有用武之地了。 其次,模型的有效性需要经过时间和市场检验,至少要经过几个放贷周期的测试,才能说明模型是否有用,是否够精准。模型的不断迭代也是必经的过程,放贷过程会不断有数据产生出来,运用这些数据对模型进行进一步升级,使模型更加有效,是提升模型有效性的关键。 |