NLP-скоринг как инструмент управления кредитным риском в корпоративном сегменте коммерческого банка: концепция, экономический эффект и регуляторный контекст

Тяпина Арина

1. Введение

Цифровая трансформация банковского сектора в последнее десятилетие существенно расширила инструментарий управления финансовыми рисками. Если в 2010-х годах машинное обучение (ML) рассматривалось как экзотическое дополнение к традиционным скоринговым картам, то к середине 2020-х оно превратилось в стандарт отрасли — по меньшей мере в розничном кредитовании [1]. Иная картина складывается в корпоративном сегменте: здесь во многих банках по-прежнему доминирует экспертный анализ финансовой отчётности, лишь частично автоматизированный. Причина — объективные особенности корпоративного кредитования: малый объём обучающей выборки (тысячи кредитов, а не миллионы), высокая гетерогенность заёмщиков и специфика принятия решений на уровне кредитного комитета.

Вместе с тем именно в корпоративном сегменте сосредоточена основная часть кредитного риска системно значимых банков. По данным ПАО ВТБ, корпоративный кредитный портфель банка на конец 2024 года составил 15,9 трлн рублей — более 60 % совокупного кредитного портфеля [2]. В этих условиях даже умеренное улучшение дискриминационной способности кредитных моделей способно генерировать многомиллиардный экономический эффект. Технологии NLP открывают возможность преодолеть ограничение малой выборки за счёт извлечения кредитных сигналов из текстовых источников — новостного потока, судебных документов, финансовой отчётности, — что успешно реализовано рядом крупнейших зарубежных банков [3, 4].

Цель настоящей статьи — разработать концепцию NLP-модуля корпоративного кредитного скоринга и оценить его экономическую эффективность применительно к российским условиям с учётом регуляторных ограничений и особенностей информационного поля.

2. Постановка проблемы: структурный разрыв в управлении риском

Анализ системы управления кредитным риском ПАО ВТБ позволил зафиксировать парадокс, характерный для большинства крупных российских банков: существенный разрыв в технологической зрелости между розничным и корпоративным кредитным анализом.

В розничном сегменте ВТБ применяет ML-модели на основе gradient boosting и нейронных сетей, обеспечивающие автоматическое принятие решений по кредитам до 30 млн рублей; доля автоматизированных решений у лидеров рынка (Сбербанк, Т-Банк) превышает 90 % [5]. Обучающая выборка в розничном скоринге исчисляется миллионами наблюдений, что позволяет достигать высокой дискриминационной способности (коэффициент Gini 0,65–0,80).

В корпоративном сегменте ситуация принципиально иная. Исторические данные о дефолтах корпоративных заёмщиков в российской банковской системе ограничены несколькими тысячами наблюдений, что исключает прямое применение стандартных ML-алгоритмов. Кредитный анализ строится преимущественно на изучении структурированной финансовой отчётности и экспертном суждении, при этом потенциал текстовых данных — новостного поля, судебной активности, риторики менеджмента — системно не используется.

Именно этот разрыв и составляет исследовательскую проблему настоящей работы: при наличии доступных технологий NLP и сформированной инфраструктуры данных применение этих инструментов в корпоративном кредитном анализе остаётся минимальным, тогда как зарубежные аналоги — JPMorgan Chase (NLP-анализ финансовой отчётности), DBS Bank (интеграция новостного потока в кредитный мониторинг), HSBC (NER в анализе судебных рисков) — демонстрируют измеримый прирост качества моделей [3].

3. Теоретическая рамка: NLP в кредитном скоринге

Применение NLP в кредитном анализе опирается на концепцию альтернативных данных — нетрадиционных источников информации о заёмщике, дополняющих структурированную финансовую отчётность. Теоретическим основанием служит гипотеза информационной асимметрии [6]: банк располагает лишь частью информации о заёмщике, а текстовые источники позволяют существенно сократить этот разрыв.

Систематический обзор 63 эмпирических исследований за 2018–2024 годы подтвердил, что интеграция NLP-признаков в кредитные модели повышает коэффициент Gini в диапазоне 5–15 п.п. в зависимости от состава источников данных и архитектуры модели [7]. Наиболее значимые результаты достигаются при использовании текстовой части финансовой отчётности (раздел MD&A, аудиторское заключение), данных судебных реестров и новостного потока [4].

Ключевым препятствием для масштабирования NLP в корпоративный скоринг является проблема интерпретируемости: регулятор и кредитный комитет требуют объяснения алгоритмических решений, тогда как NLP-модели — особенно построенные на языковых трансформерах (BERT, RuBERT) — относятся к категории «чёрного ящика» [8]. Решением служат методы explainability: SHAP (SHapley Additive exPlanations) для атрибуции значимости признаков и LIME (Local Interpretable Model-agnostic Explanations) для локальных объяснений конкретных решений [9].

4. Концепция nlp-модуля корпоративного кредитного скоринга

Предлагаемая архитектура основана на ensemble-подходе, позволяющем инкрементально интегрировать NLP-компоненту без замены действующей PD-модели. Итоговая оценка вероятности дефолта определяется по формуле:

PD_final = w₁ × PD_traditional + w₂ × PD_NLP, w₁ + w₂ = 1,

где w₁ и w₂ — веса традиционной и NLP-компоненты соответственно. На начальном этапе рекомендуется консервативное распределение весов (w₁ = 0,8; w₂ = 0,2) с последующим наращиванием доли NLP-компоненты по результатам бэк-тестирования. Аналогичный подход применён JPMorgan Chase при интеграции NLP в корпоративный скоринг и показал устойчивую сходимость весов к значению w₂ = 0,35–0,40 через 18 месяцев эксплуатации [3].

Источниками данных для NLP-компоненты служат пять классов текстовых источников, описанных в таблице 1.

Таблица 1

Источники альтернативных данных для NLP-скоринга корпоративных заёмщиков

Класс данных	Метод NLP	Кредитный сигнал	Частота обновления
Новостной поток	Sentiment analysis, NER, topic modeling	Публичный имидж, упоминание санкций, конфликтов, смены менеджмента	Ежедневно
Судебные реестры	Классификация документов, NER	Активные иски, налоговые претензии, банкротные процедуры	Еженедельно
МСФО-отчётность (текст)	Анализ тональности, going concern NER	Оговорки аудитора, смена учётной политики, риторика MD&A	Ежеквартально
Отраслевые обзоры	Topic modeling, trend extraction	Отраслевая конъюнктура, регуляторные изменения	Ежемесячно
ФНС / Росстат	NER, структурированный парсинг	Налоговая нагрузка, отраслевые сравнения, изменения в структуре собственности	Ежеквартально

Источник: составлено автором.

Принципиальной особенностью предложенной архитектуры является встроенная регуляторная совместимость: параллельно с NLP-модулем внедряется трёхуровневая система объяснимости. Первый уровень — SHAP-анализ для валидаторов модели и Банка России (глобальная атрибуция значимости признаков). Второй уровень — LIME-объяснения для риск-менеджеров (локальная интерпретация конкретного кредитного решения). Третий уровень — контрфактические объяснения для клиентских менеджеров («что следует изменить заёмщику, чтобы получить иную оценку»). Такой подход соответствует ожидаемым требованиям Банка России к объяснимости ИИ-систем, сформулированным в докладе 2023 года [10].

Дорожная карта внедрения предусматривает три этапа: теневой скоринг (0–6 месяцев) — модель работает параллельно с действующей, не влияя на решения, формируется статистика прогнозных ошибок; частичная интеграция (6–12 месяцев) — NLP-компонента подключается для пограничных случаев (PD в диапазоне 0,015–0,035), вес w₂ = 0,1–0,2; полное развёртывание (12–24 месяца) — применение на всём корпоративном портфеле с интеграцией в систему раннего предупреждения (EWS).

5. Модельный расчёт экономического эффекта

Расчёт выполнен на условном пилотном портфеле объёмом 1 трлн рублей (около 6,3 % корпоративного портфеля ВТБ) при следующих параметрах: PD = 2,5 %, LGD = 40 %, ставка резервирования по Положению № 590-П — 3,0 %. Выбор консервативного масштаба портфеля обусловлен стремлением получить нижнюю оценку эффекта, поддающуюся верификации.

Экономический эффект реализуется по трём независимым каналам: снижение фактических кредитных потерь вследствие более ранней идентификации дефолтных заёмщиков; оптимизация резервирования за счёт точной сегментации заёмщиков по категориям качества ссуды; высвобождение регуляторного капитала через снижение взвешенных по риску активов (RWA). Многоканальная структура эффекта обеспечивает его устойчивость: даже при реализации пессимистичных допущений по одному из каналов совокупный результат остаётся значимым.

Результаты расчёта по трём сценариям представлены в таблице 2.

Таблица 2

Модельный расчёт экономического эффекта NLP-модуля по сценариям

Показатель	Консервативный (+5 п.п. Gini)	Базовый (+10 п.п. Gini)	Оптимистичный (+15 п.п. Gini)
Снижение NPL, млрд руб./год	1,4–1,8	2,8–3,5	4,2–5,3
Экономия на резервировании, млрд руб./год	2,5	5,0	7,5
Высвобождение капитала, млрд руб./год	0,5	1,0	1,5
Совокупный годовой эффект, млрд руб.	3,0–3,5	6,0–7,0	9,0–10,5
Инвестиции (единовременно), млн руб.	330–480 (одинаково для всех сценариев)
NPV за 5 лет (ставка дисконтирования 20 %), млрд руб.	7–9	15–20	22–28

Источник: расчёты автора. Портфель — 1 трлн руб., PD = 2,5 %, LGD = 40 %, ставка резервирования = 3 %.

При базовом сценарии NPV проекта за пять лет составляет 15–20 млрд рублей при инвестициях 330–480 млн рублей. Соотношение NPV/CAPEX равно 31–60, что существенно превышает среднеотраслевые ориентиры для ИТ-проектов в банковском секторе (10–15) [11]. Срок окупаемости проекта при базовом сценарии — менее одного квартала с момента запуска промышленной эксплуатации. При масштабировании на весь корпоративный портфель ВТБ (15,9 трлн рублей) эффект возрастает пропорционально и составит по базовому сценарию 95–111 млрд рублей в год.

6. Регуляторный контекст и ограничения внедрения

Внедрение NLP-скоринга в российских условиях осуществляется в рамках многоуровневого регуляторного периметра. Ключевые нормативные ограничения определяются тремя блоками документов.

Первый блок — требования к управлению моделями. Указание Банка России № 4927-У устанавливает обязанность кредитных организаций обеспечивать документирование, тестирование и независимую валидацию моделей, применяемых в кредитном процессе. Применительно к NLP-моделям это означает необходимость бэк-тестирования на исторических данных и периодического мониторинга дрейфа модели (model drift). Система объяснимости (SHAP/LIME) формирует техническую основу для выполнения этих требований.

Второй блок — требования к качеству данных. Федеральный закон № 152-ФЗ «О персональных данных» ограничивает использование персонализированных данных без информированного согласия субъекта. Для корпоративных заёмщиков — юридических лиц — данное ограничение распространяется только на персональные данные физических лиц — бенефициаров и руководителей. Публично доступные корпоративные данные (судебные реестры, данные ФНС, публичная отчётность) под действие ФЗ-152 не подпадают.

Третий блок — требования к резервированию (Положение № 590-П). Применение ML-модели для определения категории качества ссуды возможно при условии её одобрения надзорным органом и соответствия требованиям профессионального суждения. Ensemble-подход с сохранением веса традиционной компоненты w₁ = 0,8 обеспечивает преемственность с действующей методологией, что снижает регуляторный риск внедрения.

Среди ограничений, не связанных с регуляторной средой, следует выделить проблему дефицита данных о корпоративных дефолтах в российской банковской системе. Формирование репрезентативной обучающей выборки потребует 3–5 лет накопления данных в режиме shadow scoring. Частичным решением может служить transfer learning — перенос весов моделей, обученных на зарубежных рынках, с последующей дообучением на российских данных, — однако применимость этого подхода требует отдельной верификации.

7. Заключение

Проведённое исследование позволяет сформулировать следующие основные выводы.

Во-первых, в крупнейших российских банках сложился устойчивый структурный разрыв между технологической зрелостью розничного и корпоративного кредитного скоринга. Преодоление этого разрыва посредством NLP-инструментов является следующим рубежом цифровизации банковского риск-менеджмента.

Во-вторых, предложенная концепция ensemble-подхода (PD_final = w₁ × PD_traditional + w₂ × PD_NLP) обеспечивает инкрементальную интеграцию NLP-компоненты при сохранении преемственности с действующей методологией, что минимизирует регуляторный риск внедрения.

В-третьих, модельный расчёт подтверждает высокую экономическую эффективность проекта: при базовом сценарии NPV за пять лет составляет 15–20 млрд рублей на пилотном портфеле 1 трлн рублей при инвестициях 330–480 млн рублей. Соотношение NPV/CAPEX (31–60) значительно превышает отраслевой ориентир для ИТ-проектов.

В-четвёртых, встроенная система explainability (SHAP/LIME) формирует техническую основу соответствия ожидаемым требованиям Банка России к объяснимости ИИ-моделей, снижая регуляторный барьер для внедрения.

Перспективы дальнейших исследований связаны с эмпирической верификацией модели на реальных данных кредитного портфеля, изучением применимости transfer learning для преодоления ограничений малой выборки в российском корпоративном сегменте, а также с разработкой методологии оценки дрейфа NLP-модели в условиях быстро меняющегося информационного поля.

Литература:

Siddiqi N. Intelligent Credit Scoring: Building and Implementing Better Credit Risk Scorecards. 2nd ed. Wiley, 2017. 320 p.
ПАО ВТБ. Годовой отчёт за 2024 год. Москва: ВТБ, 2025. URL: https://www.vtb.ru/akcionery-i-investory/raskrytie-informacii/ (дата обращения: 15.03.2025).
Gentzkow M., Kelly B., Taddy M. Text as Data // Journal of Economic Literature. 2019. Vol. 57(3). P. 535–574.
Loughran T., McDonald B. Textual Analysis in Accounting and Finance: A Survey // Journal of Accounting Research. 2016. Vol. 54(4). P. 1187–1230.
TAdviser. Искусственный интеллект в банках: обзор рынка 2024–2025. URL: https://www.tadviser.ru (дата обращения: 01.02.2025).
Stiglitz J. E., Weiss A. Credit Rationing in Markets with Imperfect Information // American Economic Review. 1981. Vol. 71(3). P. 393–410.
Hlongwane N. W., Seetharam Y. The use of machine learning models for credit scoring in South Africa and their explainability // Finance Research Letters. 2024. Vol. 62. Article 105099.
Rudin C. Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead // Nature Machine Intelligence. 2019. Vol. 1(5). P. 206–215.
Lundberg S. M., Lee S. I. A Unified Approach to Interpreting Model Predictions // Advances in Neural Information Processing Systems 30 (NeurIPS 2017). P. 4765–4774.
Банк России. Применение методов искусственного интеллекта в финансовом секторе: доклад для общественных консультаций. Москва: Банк России, 2023.
McKinsey Global Institute. The Age of Analytics: Competing in a Data-Driven World. McKinsey & Company, 2016.

Молодой учёный

NLP-скоринг как инструмент управления кредитным риском в корпоративном сегменте коммерческого банка: концепция, экономический эффект и регуляторный контекст

NLP-скоринг как инструмент управления кредитным риском в корпоративном сегменте коммерческого банка: концепция, экономический эффект и регуляторный контекст

Молодой учёный