你好。
我们是Advanced Analytics GlowByte团队的一员,并正在发布一系列有关信用风险管理建模的文章。该周期的目的是简要地讨论该领域,扩大专业术语的词汇量,并提供指向有用文章和书籍的链接。在介绍性文章中,我们将展示ML和DS在信用风险领域中的应用功能,而无需深入研究主题领域。
接下来,我们将揭示建模方法的问题,信用风险的组成部分以及校准和验证的方法,其中要考虑到银行中模型操作的细节。
出版物的基础是我们在银行业开发和实施分析模型的项目经验。
现在在猫下。
有什么风险?
简单来说,信用风险是客户违反贷款协议下的付款条件的风险。
我们将专注于信用风险管理框架内出现的三个挑战。
- 评级模型;
- 授信;
- 计算预期损失水平。
为什么要精确地放在他们身上?
- 这些任务始终与金融机构相关。
- 它们可以转移到其他行业(电信,工业,保险);
- 它们具有用于ML和DS方法的足够空间。
有关金融机构风险的一般分类及其背景,请参阅评论[1]。
每个人的管道(管道)或信贷流程方案
从原理上讲,信贷过程如下所示:
从申请到发行的整个过程的一部分称为信用传送器。此方案有一些简化。例如,我们在一个贷款产品(即 营销问题(营销优化,产品同类化,客户流失等)仍然不在讨论范围之内。承销商的评分,专家评级调整和止损因素应用程序的流程不包括在内。止损因素意味着限制,其性质首先是银行向客户提供的产品结构。例如,客户进入破产者名单或其他银行中存在拖欠贷款。
评分模型
评分模型(RM)的任务是为后续排名建立客户评分模型。该评级是针对各种负面事件进行的,这些不良事件包括信誉度下降,破产等。
根据上下文,可以以不同方式对这项任务进行分类:
按客户生命周期的阶段:
- 应用程序(应用程序)评分用于新客户或金融公司中历史悠久(或长期且无关)的客户。在建立这样的评级模型时,客户的概况和概况,有关他在其他金融机构中的付款行为的数据(可在信用历史局中获得)以及有关输入不同清单(例如中央银行对法人实体的负面清单)的数据非常重要。申请评分用于决定是否向申请人授予贷款。
- . — -. , .
:
- «» : ( ) , .
- «» : . , , , .
:
- «» . . .
- «» . ( ) . — Z-score [2].
:
- . .
- .
:
- Stand-alone — , . — . , .
- «Supply chain finance» — . , , , ( ) . , — , [3].
:
- : , , . — , ( , ).
- , .. . , .. .
可以在[1],[4],[5],[6]中找到在第一近似中解决该问题的特殊性。我们计划在本周期的下一篇文章中讨论有关开发方法的设计功能。
在相关任务中,值得一提的是提供信用的任务(请参阅下文)和基于评分得分选择临界值的任务-确定批准阈值。后一个问题不在本文中讨论,而是为前沿的ML方法留有空间。例如,尝试使用RL [7]。
我们还应该简短地提及提高已开发的评级模型的质量的当前趋势:
评级建模作为一项独立的任务越来越少地遇到,并且越来越多地与其他任务结合在一起,成为解决更多一般问题的应用程序的一部分。其中之一是信贷发行。我们去吧。
授信或无法拒绝的提议
评级模型的结果(违约概率估计的绝对值-PD)可用于解决授信问题。首先,信用提供是指为客户设定初始限额的任务。
当然,仅PD值(对违约概率的预测)还不足以确定最佳极限。您需要了解合理提供给客户的极限值的可接受范围。这对于使金额至少间接反映客户的需求及其偿债能力是必要的。
在这种情况下,基准可以是例如非信贷产品客户自有资金的营业额。
还有什么事情你需要知道?为了更好地理解问题,您需要对贷款成本的结构有所了解。下图(在[11]中窥视了)示意性地展示了它:
“资源”-货币价值,以其进行借贷为代价(例如,存款利率,可吸引存款人的钱并提供所需的货币供应)。 “保证金”是贷款的预期利润。 “风险”-在贷款违约的情况下扣除。 “费用”-吸引和维护费用。
在此框架中,评级模型可用于确定风险块的大小和结构。 “资源”在很大程度上取决于中央银行的关键利率。 “成本”和“保证金”是产品成分,通常在产品护照中注明。
换句话说,“风险”只是影响交易最终获利能力的组成部分之一。
那别人呢似乎出现了优化问题。让我们尝试使其正式化。应该强调的是,可以有很多选择,并且首先值得依赖业务任务和开发过程的上下文。
让我们从一个简单的选项开始,然后显示该解决方案的潜在开发点。最简单的方法是优化交易的获利能力。
让我们签发金额为L(限额)的贷款协议。该合同具有预计违约概率。作为第一个近似值,我们假设客户在违约时的债务等于L。
那么优化问题将如下所示:
我们看到PD是固定的,对L的依赖性是线性的。似乎没有什么要优化的。
但是,在现实生活中,PD取决于L,其原因如下:限额越大,还本付息的难度就越大,因此违约的可能性也就越大。在这种情况下,我们的任务实际上变成了一项优化。但是,这里也有细微差别。样本中有不同收入的客户,因此绝对值是不够的。最好不是在限制上而是在债务负担的水平上建立依存关系,即 参数:
瘾 可以恢复为历史数据或试验数据。
此外,产品停产也会影响优化任务。例如,在产品护照中,可能会标明可接受的风险级别限制(违约概率)。然后,仅在不超过指定限制的情况下执行优化。
有兴趣的人,再进一步增加麻烦:
, (, ) (-, EAD — Exposure at default — ) . , , ( EAD, , LGD – Loss Given Default).
EAD . LGD , (, ..) ( LGD ). 0.9-1.
, PD . :
, (, ), , :
«» — , «» — . Marketing Optimization.
— . , , , ..
. -.
EAD . LGD , (, ..) ( LGD ). 0.9-1.
, PD . :
, (, ), , :
«» — , «» — . Marketing Optimization.
— . , , , ..
. -.
谷歌还有什么?关键词基于风险的限额,基于信用限额的管理,基于利润的方法。
因此,钱被提供给了客户。但是其中一些已经开始过期。如何处理情况?
储备金和DS在计算中的作用
确定风险量是银行活动的关键:根据风险偏好,银行确定准备与哪些客户合作。但是在任何情况下,为了最大程度地减少可能的损失,现金储备以现金或流动证券的形式形成。在最坏的情况下,银行会损失全部投资组合,但这不太可能,因此拥有全部准备金并不是很有效。需要一些平衡。
为此,您需要准确确定应保留的金额。这就是确保预期损失的资本充足率(所需资本)的任务。(预期损失-EL)。资本充足率要求由监管机构(中央银行)确定和监控。
历史参考:
, . . .
, DS ML .
1974 , .
Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).
, the Basel I Capital Accord RWA, .
, 100 (-, ):
.. 4.
. : XGBoost , , .
Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.
Basel III . . . [6].
? , , RWA:
1. – . — 590-.
( [12]):
, 5 , . , (, ), ( ) .
2. (, 483-) PD, LGD EAD.
:
, , , . , , , , data scientist’.
(Expected Loss – EL) (Unexpected Loss – UL).
, DS ML .
1974 , .
Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).
, the Basel I Capital Accord RWA, .
, % | |
0 | |
50 | |
100 |
.. 4.
. :
Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.
Basel III . . . [6].
? , , RWA:
1. – . — 590-.
( [12]):
« , 590-, . , , ( ) . .».
, 5 , . , (, ), ( ) .
2. (, 483-) PD, LGD EAD.
:
, , , . , , , , data scientist’.
(Expected Loss – EL) (Unexpected Loss – UL).
卢布的损失是三个组成部分的乘积:
- 违约概率(PD-违约概率)
- 违约时付款人的债务金额(EAD-违约暴露),
- 此金额的一部分,将保持未付款状态(“ LGD-违约损失”)。
通常,此公式:
在一系列文章中,我们将不止一次遇到过-这避免了信用风险准备金问题。
经过EL(ECL)的这种分解,可以模拟(DS和ML,您好!))上述每个PD(二进制分类模型),LGD(回归模型),EAD(回归模型)的值,其中,在控制器指定的范围内在建模的不同阶段(开发,校准和验证)中的需求,可以使用统计方法和机器学习算法。
对于喜欢更复杂事物的人:
EL UL (Value at Risk – VaR) – , ( 99%) .
PD, LGD, EAD , .
3. 9. .
9 :
9 :
9 DS ML-.
PD, LGD, EAD , .
3. 9. .
9 :
- ( );
- ( «Lifetime-» «Lt») PD, LGD, EAD, ; ECL — Expected Credit Losses;
- ( ).
9 :
9 DS ML-.
?
- 29.12.2012 N 192- « »
- 6 2015 . № 483- « »
- 15 2015 . N 3624- « »
- 6 2015 . № 3752- « , »
- [13].
有关法规和说明,阅读过书籍,但是DS在哪里?如所承诺的-DS在组件的
评分
模型 |
授信 | 计算
预期损失水平 |
|
---|---|---|---|
问题
解决 与 DS / ML |
-确定
评级
算法 ; -确定 批准的门槛; - 校准。 |
-开发
优化程序; -开发 用于 选择贷款 建议的模型。 |
-PD,LGD,EAD组件的 - 校准。 |
结论
为我们撰写介绍性文章后的主要结论(abv_gbc, Alisaalisa, Artysav, eienkotowaru)如下:简述信用风险计算中出现的三个问题是极其困难的。为什么?
已经为这些任务开发了详细的方法,这为ML和DS思维提供了有益的食物。这些思考提出了应对日益复杂的市场挑战的方法。基于这些方法的工具,从互补的方法开始,逐渐成为决策中的主要工具。所有这些共同使风险建模的最佳实践和直觉可以转移到其他行业(电信,保险,工业)。哪个?我们将在本周期的下一篇文章中告诉您。
使用的术语列表
- 违约-未履行贷款协议下的义务。通常,默认情况下,违约被视为根据合同在90天内未付款。
- PD-违约概率-违约概率。
- EAD – exposure at default – . , , = + .
- LGD – loss given default – EAD, .
- EL – expected loss – .
- EL – expected credit loss – .
- – , .
- - – .
- SCF – supply chain finance – — - .
- RWA – risk-weighted assets – , ; .
- (IRB) – , , , .
- 9 (IFRS9) – , , , .
- VaR – , .
[1]利奥·马丁(Leo Martin),苏尼尔·夏尔马(Suneel Sharma)和科伊拉昆特拉(Koilakuntla Maddulety)。 “银行风险管理中的机器学习:文献综述。”风险7.1(2019):29。
[2] en.wikipedia.org/wiki/Altman_Z评分
[3] www.youtube.com/watch?v=rfCamyEURyw&list=PLLQmSdmAWzkKeiOC1b-nxpoACqgfTc0G5&index=7。[4
] Breeden Joseph “信用风险中的机器学习调查”。 (2020)。
[5]亚历山大·索罗金(Sorokin Alexander)。 “使用逻辑回归模型构建计分卡。”在线科学学报2(21)(2014)。
[6] Baesens Bart,Daniel Roesch,Harald Scheule。信用风险分析:SAS中的度量技术,应用程序和示例。约翰·威利父子(John Wiley&Sons),2016年。
[7] github.com/MykolaHerasymovych/Optimization-Acceptance-Threshold-in-Credit-Scoring-using-Reinforcement-Learning
[8] riskconference.ru/wp-content/uploads/2019/10/%D0%A1%D1%83%D1 %80%D0%B6%D0%BA%D0%BE_%D0%92%D0%A2%D0%91.pdf
[9] Masyutin Alexey。“基于社交网络数据的信用评分。” 商业信息学3(33)(2015)。
[10] habr.com/ru/company/vtb/blog/508012
[11] vc.ru/finance/83771-kak-formiruetsya-procentnaya-stavka-po-kreditam
[12] Farrakhov Igor。“ IFRS 9:估计预期信用损失的规定。” 银行评论。申请“最佳实践2(2018)。
[13]贝里尼·提兹阿诺。IFRS 9和CECL信用风险建模和验证:R和SAS中包含示例的实用指南。学术出版社,2019年。