...开始的风控模型(一)数据分析与准备,滚动率、迁移率和Vintage分析
发布网友
发布时间:2024-10-11 01:55
我来回答
共1个回答
热心网友
时间:2024-11-08 12:24
在风控建模的实际工作中,模型构建的关键步骤之一是对数据的深入理解和定义。模型的目标和“坏样本”识别并非预设,而是需要模型师结合业务需求、数据分析和行业经验来决定。本文介绍一种通用的方法,其中包括 Vintage、迁移率和滚动率分析来定义坏样本。
坏样本的识别可通过模拟情景来理解,比如小A和小B在设计12期贷款产品的评分卡时,对逾期时间作为坏样本的界限产生了分歧。巴塞尔协议中,90天逾期被视为违约,但实际中可能需要更精细的数据分析。他们通过Vintage分析,观察了不同逾期阶段的客户流动情况,发现M4+阶段的迁移率极高,这促使他们初步定义逾期90天以上的客户为坏样本。
滚动率分析进一步验证了这一结论,显示大部分M4+的客户没有改善,而是继续保持逾期状态。Vintage分析则揭示了产品的成熟期,表明在8期后,大部分坏客户的表现趋于稳定。因此,最终定义为:在产品表现期(8个月)内,逾期90天或以上的用户为坏样本。
模型的变量选择也是重要环节。除了传统的信用模型数据,小A和小B还考虑了埋点数据,尽管它在信用风险领域的应用相对有限。总的来说,风控模型的构建首先需要明确观察期和表现期,以及选择合适的自变量。后续文章将探讨逻辑回归评分卡模型的具体构建方法。
以上就是关于数据分析和准备的初步介绍,准备工作的细致程度直接影响模型的精准度。期待在下篇文章中看到模型的构建过程。