你好。

我们是Advanced Analytics GlowByte团队的一员，并正在发布一系列有关信用风险管理建模的文章。该周期的目的是简要地讨论该领域，扩大专业术语的词汇量，并提供指向有用文章和书籍的链接。在介绍性文章中，我们将展示ML和DS在信用风险领域中的应用功能，而无需深入研究主题领域。

接下来，我们将揭示建模方法的问题，信用风险的组成部分以及校准和验证的方法，其中要考虑到银行中模型操作的细节。

出版物的基础是我们在银行业开发和实施分析模型的项目经验。

现在在猫下。

有什么风险？

简单来说，信用风险是客户违反贷款协议下的付款条件的风险。

我们将专注于信用风险管理框架内出现的三个挑战。

评级模型；
授信；
计算预期损失水平。

为什么要精确地放在他们身上？

这些任务始终与金融机构相关。
它们可以转移到其他行业（电信，工业，保险）；
它们具有用于ML和DS方法的足够空间。

有关金融机构风险的一般分类及其背景，请参阅评论[1]。

每个人的管道（管道）或信贷流程方案

从原理上讲，信贷过程如下所示：

从申请到发行的整个过程的一部分称为信用传送器。此方案有一些简化。例如，我们在一个贷款产品（即营销问题（营销优化，产品同类化，客户流失等）仍然不在讨论范围之内。承销商的评分，专家评级调整和止损因素应用程序的流程不包括在内。止损因素意味着限制，其性质首先是银行向客户提供的产品结构。例如，客户进入破产者名单或其他银行中存在拖欠贷款。

评分模型

评分模型（RM）的任务是为后续排名建立客户评分模型。该评级是针对各种负面事件进行的，这些不良事件包括信誉度下降，破产等。

根据上下文，可以以不同方式对这项任务进行分类：

按客户生命周期的阶段：

应用程序（应用程序）评分用于新客户或金融公司中历史悠久（或长期且无关）的客户。在建立这样的评级模型时，客户的概况和概况，有关他在其他金融机构中的付款行为的数据（可在信用历史局中获得）以及有关输入不同清单（例如中央银行对法人实体的负面清单）的数据非常重要。申请评分用于决定是否向申请人授予贷款。
. — -. , .

«» : ( ) , .
«» : . , , , .

«» . . .
«» . ( ) . — Z-score [2].

Stand-alone — , . — . , .
«Supply chain finance» — . , , , ( ) . , — , [3].

: , , . — , ( , ).
, .. . , .. .

可以在[1]，[4]，[5]，[6]中找到在第一近似中解决该问题的特殊性。我们计划在本周期的下一篇文章中讨论有关开发方法的设计功能。

在相关任务中，值得一提的是提供信用的任务（请参阅下文）和基于评分得分选择临界值的任务-确定批准阈值。后一个问题不在本文中讨论，而是为前沿的ML方法留有空间。例如，尝试使用RL [7]。

我们还应该简短地提及提高已开发的评级模型的质量的当前趋势：

/ (, - [8], . [9], )
( XGBoost );
( ) (text-mining);
( pipeline ---) , .. ModelOps [10].

评级建模作为一项独立的任务越来越少地遇到，并且越来越多地与其他任务结合在一起，成为解决更多一般问题的应用程序的一部分。其中之一是信贷发行。我们去吧。

授信或无法拒绝的提议

评级模型的结果（违约概率估计的绝对值-PD）可用于解决授信问题。首先，信用提供是指为客户设定初始限额的任务。

当然，仅PD值（对违约概率的预测）还不足以确定最佳极限。您需要了解合理提供给客户的极限值的可接受范围。这对于使金额至少间接反映客户的需求及其偿债能力是必要的。

在这种情况下，基准可以是例如非信贷产品客户自有资金的营业额。

还有什么事情你需要知道？为了更好地理解问题，您需要对贷款成本的结构有所了解。下图（在[11]中窥视了）示意性地展示了它：

“资源”-货币价值，以其进行借贷为代价（例如，存款利率，可吸引存款人的钱并提供所需的货币供应）。 “保证金”是贷款的预期利润。 “风险”-在贷款违约的情况下扣除。 “费用”-吸引和维护费用。

在此框架中，评级模型可用于确定风险块的大小和结构。 “资源”在很大程度上取决于中央银行的关键利率。 “成本”和“保证金”是产品成分，通常在产品护照中注明。

换句话说，“风险”只是影响交易最终获利能力的组成部分之一。

那别人呢似乎出现了优化问题。让我们尝试使其正式化。应该强调的是，可以有很多选择，并且首先值得依赖业务任务和开发过程的上下文。

让我们从一个简单的选项开始，然后显示该解决方案的潜在开发点。最简单的方法是优化交易的获利能力。

让我们签发金额为L（限额）的贷款协议。该合同具有预计违约概率。作为第一个近似值，我们假设客户在违约时的债务等于L。

那么优化问题将如下所示：

我们看到PD是固定的，对L的依赖性是线性的。似乎没有什么要优化的。

但是，在现实生活中，PD取决于L，其原因如下：限额越大，还本付息的难度就越大，因此违约的可能性也就越大。在这种情况下，我们的任务实际上变成了一项优化。但是，这里也有细微差别。样本中有不同收入的客户，因此绝对值是不够的。最好不是在限制上而是在债务负担的水平上建立依存关系，即参数

\frac{L}{Д о х о д к л и е н т а (Д_{к})}

$\frac{L}{\: (_)}$ ：

瘾

P D (\frac{L}{Д_{к}})

$PD(\frac{L}{_})$ 可以恢复为历史数据或试验数据。

此外，产品停产也会影响优化任务。例如，在产品护照中，可能会标明可接受的风险级别限制（违约概率）。然后，仅在不超过指定限制的情况下执行优化。

有兴趣的人，再进一步增加麻烦：

, (, ) (-, EAD — Exposure at default — ) . , , ( EAD, , LGD – Loss Given Default).

EAD . LGD , (, ..) ( LGD ). 0.9-1.

, PD

\frac{L}{Д_{к}}

$\frac{L}{_}$ . :

, (, ), , :

«» — , «» — . Marketing Optimization.

— . , , , ..

. -.

谷歌还有什么？关键词基于风险的限额，基于信用限额的管理，基于利润的方法。

因此，钱被提供给了客户。但是其中一些已经开始过期。如何处理情况？~~我们拿烙铁。~~我们以储备金的形式收集安全气囊。我们将告诉您如何立即执行此操作。

储备金和DS在计算中的作用

确定风险量是银行活动的关键：根据风险偏好，银行确定准备与哪些客户合作。但是在任何情况下，为了最大程度地减少可能的损失，现金储备以现金或流动证券的形式形成。在最坏的情况下，银行会损失全部投资组合，但这不太可能，因此拥有全部准备金并不是很有效。需要一些平衡。

为此，您需要准确确定应保留的金额。这就是确保预期损失的资本充足率（所需资本）的任务。（预期损失-EL）。资本充足率要求由监管机构（中央银行）确定和监控。

历史参考：

, . . .

, DS ML .

1974 , .

Basel I 1988 . Basel I , 8% , (, – Risk-weighted Assets (RWA)).

, the Basel I Capital Accord RWA, .

	, %
	0
	50
	100

, 100 (-, ):

.. 4.

. : ~~XGBoost~~ , , .

Basel I Basel II. -, Basel II ( ) , , , . Xgboost ML DS.

Basel III . . . [6].

? , , RWA:

1. – . — 590-.

( [12]):

« , 590-, . , , ( ) . .»

.

, 5 , . , (, ), ( ) .

2. (, 483-) PD, LGD EAD.

:

, , , . , , , , data scientist’.

(Expected Loss – EL) (Unexpected Loss – UL).

卢布的损失是三个组成部分的乘积：

违约概率（PD-违约概率）
违约时付款人的债务金额（EAD-违约暴露），
此金额的一部分，将保持未付款状态（“ LGD-违约损失”）。

通常，此公式：

在一系列文章中，我们将不止一次遇到过-这避免了信用风险准备金问题。

经过EL（ECL）的这种分解，可以模拟（DS和ML，您好！））上述每个PD（二进制分类模型），LGD（回归模型），EAD（回归模型）的值，其中，在控制器指定的范围内在建模的不同阶段（开发，校准和验证）中的需求，可以使用统计方法和机器学习算法。

对于喜欢更复杂事物的人：

EL UL (Value at Risk – VaR) – , ( 99%) .

PD, LGD, EAD , .

3. 9. .

9 :

( );
( «Lifetime-» «Lt») PD, LGD, EAD, ; ECL — Expected Credit Losses;
( ).

9 :

9 DS ML-.

?

29.12.2012 N 192- « »
6 2015 . № 483- « »
15 2015 . N 3624- « »
6 2015 . № 3752- « , »
[13].

有关法规和说明，阅读过书籍，但是DS在哪里？如所承诺的-DS在组件的~~细节中~~。但这是一个完全不同的故事。在本周期的下一篇文章中，我们将更详细地分析对PD，LGD和EAD组件进行建模的功能，并且在介绍性文章的末尾，我们将提供一个表格，其中提供了在每个任务的上下文中将统计方法和机器学习算法应用于风险建模领域的选项。

	评分模型	授信	计算预期损失水平
问题解决与 DS / ML	-确定评级算法； -确定批准的门槛； - 校准。	-开发优化程序； -开发用于选择贷款建议的模型。	-PD，LGD，EAD组件的建模； - 校准。

结论

为我们撰写介绍性文章后的主要结论（abv_gbc， Alisaalisa， Artysav， eienkotowaru）如下：简述信用风险计算中出现的三个问题是极其困难的。为什么？

已经为这些任务开发了详细的方法，这为ML和DS思维提供了有益的食物。这些思考提出了应对日益复杂的市场挑战的方法。基于这些方法的工具，从互补的方法开始，逐渐成为决策中的主要工具。所有这些共同使风险建模的最佳实践和直觉可以转移到其他行业（电信，保险，工业）。哪个？我们将在本周期的下一篇文章中告诉您。

使用的术语列表

违约-未履行贷款协议下的义务。通常，默认情况下，违约被视为根据合同在90天内未付款。
PD-违约概率-违约概率。
EAD – exposure at default – . , , = + .
LGD – loss given default – EAD, .
EL – expected loss – .
EL – expected credit loss – .
– , .
- – .
SCF – supply chain finance – — - .
RWA – risk-weighted assets – , ; .
(IRB) – , , , .
9 (IFRS9) – , , , .
VaR – , .

[1]利奥·马丁（Leo Martin），苏尼尔·夏尔马（Suneel Sharma）和科伊拉昆特拉（Koilakuntla Maddulety）。 “银行风险管理中的机器学习：文献综述。”风险7.1（2019）：29。

[2] en.wikipedia.org/wiki/Altman_Z评分

[3] www.youtube.com/watch?v=rfCamyEURyw&list=PLLQmSdmAWzkKeiOC1b-nxpoACqgfTc0G5&index=7。[4

] Breeden Joseph “信用风险中的机器学习调查”。（2020）。

[5]亚历山大·索罗金（Sorokin Alexander）。 “使用逻辑回归模型构建计分卡。”在线科学学报2（21）（2014）。

[6] Baesens Bart，Daniel Roesch，Harald Scheule。信用风险分析：SAS中的度量技术，应用程序和示例。约翰·威利父子（John Wiley＆Sons），2016年。

[7] github.com/MykolaHerasymovych/Optimization-Acceptance-Threshold-in-Credit-Scoring-using-Reinforcement-Learning

[8] riskconference.ru/wp-content/uploads/2019/10/%D0%A1%D1%83%D1 ％80％D0％B6％D0％BA％D0％BE_％D0％92％D0％A2％D0％91.pdf

[9] Masyutin Alexey。“基于社交网络数据的信用评分。” 商业信息学3（33）（2015）。

[10] habr.com/ru/company/vtb/blog/508012

[11] vc.ru/finance/83771-kak-formiruetsya-procentnaya-stavka-po-kreditam

[12] Farrakhov Igor。“ IFRS 9：估计预期信用损失的规定。” 银行评论。申请“最佳实践2（2018）。

[13]贝里尼·提兹阿诺。IFRS 9和CECL信用风险建模和验证：R和SAS中包含示例的实用指南。学术出版社，2019年。

ML和DS信用风险管理的阴影