1. Введение
Цифровая трансформация банковского сектора в последнее десятилетие существенно расширила инструментарий управления финансовыми рисками. Если в 2010-х годах машинное обучение (ML) рассматривалось как экзотическое дополнение к традиционным скоринговым картам, то к середине 2020-х оно превратилось в стандарт отрасли — по меньшей мере в розничном кредитовании [1]. Иная картина складывается в корпоративном сегменте: здесь во многих банках по-прежнему доминирует экспертный анализ финансовой отчётности, лишь частично автоматизированный. Причина — объективные особенности корпоративного кредитования: малый объём обучающей выборки (тысячи кредитов, а не миллионы), высокая гетерогенность заёмщиков и специфика принятия решений на уровне кредитного комитета.
Вместе с тем именно в корпоративном сегменте сосредоточена основная часть кредитного риска системно значимых банков. По данным ПАО ВТБ, корпоративный кредитный портфель банка на конец 2024 года составил 15,9 трлн рублей — более 60 % совокупного кредитного портфеля [2]. В этих условиях даже умеренное улучшение дискриминационной способности кредитных моделей способно генерировать многомиллиардный экономический эффект. Технологии NLP открывают возможность преодолеть ограничение малой выборки за счёт извлечения кредитных сигналов из текстовых источников — новостного потока, судебных документов, финансовой отчётности, — что успешно реализовано рядом крупнейших зарубежных банков [3, 4].
Цель настоящей статьи — разработать концепцию NLP-модуля корпоративного кредитного скоринга и оценить его экономическую эффективность применительно к российским условиям с учётом регуляторных ограничений и особенностей информационного поля.
2. Постановка проблемы: структурный разрыв в управлении риском
Анализ системы управления кредитным риском ПАО ВТБ позволил зафиксировать парадокс, характерный для большинства крупных российских банков: существенный разрыв в технологической зрелости между розничным и корпоративным кредитным анализом.
В розничном сегменте ВТБ применяет ML-модели на основе gradient boosting и нейронных сетей, обеспечивающие автоматическое принятие решений по кредитам до 30 млн рублей; доля автоматизированных решений у лидеров рынка (Сбербанк, Т-Банк) превышает 90 % [5]. Обучающая выборка в розничном скоринге исчисляется миллионами наблюдений, что позволяет достигать высокой дискриминационной способности (коэффициент Gini 0,65–0,80).
В корпоративном сегменте ситуация принципиально иная. Исторические данные о дефолтах корпоративных заёмщиков в российской банковской системе ограничены несколькими тысячами наблюдений, что исключает прямое применение стандартных ML-алгоритмов. Кредитный анализ строится преимущественно на изучении структурированной финансовой отчётности и экспертном суждении, при этом потенциал текстовых данных — новостного поля, судебной активности, риторики менеджмента — системно не используется.
Именно этот разрыв и составляет исследовательскую проблему настоящей работы: при наличии доступных технологий NLP и сформированной инфраструктуры данных применение этих инструментов в корпоративном кредитном анализе остаётся минимальным, тогда как зарубежные аналоги — JPMorgan Chase (NLP-анализ финансовой отчётности), DBS Bank (интеграция новостного потока в кредитный мониторинг), HSBC (NER в анализе судебных рисков) — демонстрируют измеримый прирост качества моделей [3].
3. Теоретическая рамка: NLP в кредитном скоринге
Применение NLP в кредитном анализе опирается на концепцию альтернативных данных — нетрадиционных источников информации о заёмщике, дополняющих структурированную финансовую отчётность. Теоретическим основанием служит гипотеза информационной асимметрии [6]: банк располагает лишь частью информации о заёмщике, а текстовые источники позволяют существенно сократить этот разрыв.
Систематический обзор 63 эмпирических исследований за 2018–2024 годы подтвердил, что интеграция NLP-признаков в кредитные модели повышает коэффициент Gini в диапазоне 5–15 п.п. в зависимости от состава источников данных и архитектуры модели [7]. Наиболее значимые результаты достигаются при использовании текстовой части финансовой отчётности (раздел MD&A, аудиторское заключение), данных судебных реестров и новостного потока [4].
Ключевым препятствием для масштабирования NLP в корпоративный скоринг является проблема интерпретируемости: регулятор и кредитный комитет требуют объяснения алгоритмических решений, тогда как NLP-модели — особенно построенные на языковых трансформерах (BERT, RuBERT) — относятся к категории «чёрного ящика» [8]. Решением служат методы explainability: SHAP (SHapley Additive exPlanations) для атрибуции значимости признаков и LIME (Local Interpretable Model-agnostic Explanations) для локальных объяснений конкретных решений [9].
4. Концепция nlp-модуля корпоративного кредитного скоринга
Предлагаемая архитектура основана на ensemble-подходе, позволяющем инкрементально интегрировать NLP-компоненту без замены действующей PD-модели. Итоговая оценка вероятности дефолта определяется по формуле:
PD_final = w₁ × PD_traditional + w₂ × PD_NLP, w₁ + w₂ = 1,
где w₁ и w₂ — веса традиционной и NLP-компоненты соответственно. На начальном этапе рекомендуется консервативное распределение весов (w₁ = 0,8; w₂ = 0,2) с последующим наращиванием доли NLP-компоненты по результатам бэк-тестирования. Аналогичный подход применён JPMorgan Chase при интеграции NLP в корпоративный скоринг и показал устойчивую сходимость весов к значению w₂ = 0,35–0,40 через 18 месяцев эксплуатации [3].
Источниками данных для NLP-компоненты служат пять классов текстовых источников, описанных в таблице 1.
Таблица 1
Источники альтернативных данных для NLP-скоринга корпоративных заёмщиков
|
Класс данных |
Метод NLP |
Кредитный сигнал |
Частота обновления |
|
Новостной поток |
Sentiment analysis, NER, topic modeling |
Публичный имидж, упоминание санкций, конфликтов, смены менеджмента |
Ежедневно |
|
Судебные реестры |
Классификация документов, NER |
Активные иски, налоговые претензии, банкротные процедуры |
Еженедельно |
|
МСФО-отчётность (текст) |
Анализ тональности, going concern NER |
Оговорки аудитора, смена учётной политики, риторика MD&A |
Ежеквартально |
|
Отраслевые обзоры |
Topic modeling, trend extraction |
Отраслевая конъюнктура, регуляторные изменения |
Ежемесячно |
|
ФНС / Росстат |
NER, структурированный парсинг |
Налоговая нагрузка, отраслевые сравнения, изменения в структуре собственности |
Ежеквартально |
Источник: составлено автором.
Принципиальной особенностью предложенной архитектуры является встроенная регуляторная совместимость: параллельно с NLP-модулем внедряется трёхуровневая система объяснимости. Первый уровень — SHAP-анализ для валидаторов модели и Банка России (глобальная атрибуция значимости признаков). Второй уровень — LIME-объяснения для риск-менеджеров (локальная интерпретация конкретного кредитного решения). Третий уровень — контрфактические объяснения для клиентских менеджеров («что следует изменить заёмщику, чтобы получить иную оценку»). Такой подход соответствует ожидаемым требованиям Банка России к объяснимости ИИ-систем, сформулированным в докладе 2023 года [10].
Дорожная карта внедрения предусматривает три этапа: теневой скоринг (0–6 месяцев) — модель работает параллельно с действующей, не влияя на решения, формируется статистика прогнозных ошибок; частичная интеграция (6–12 месяцев) — NLP-компонента подключается для пограничных случаев (PD в диапазоне 0,015–0,035), вес w₂ = 0,1–0,2; полное развёртывание (12–24 месяца) — применение на всём корпоративном портфеле с интеграцией в систему раннего предупреждения (EWS).
5. Модельный расчёт экономического эффекта
Расчёт выполнен на условном пилотном портфеле объёмом 1 трлн рублей (около 6,3 % корпоративного портфеля ВТБ) при следующих параметрах: PD = 2,5 %, LGD = 40 %, ставка резервирования по Положению № 590-П — 3,0 %. Выбор консервативного масштаба портфеля обусловлен стремлением получить нижнюю оценку эффекта, поддающуюся верификации.
Экономический эффект реализуется по трём независимым каналам: снижение фактических кредитных потерь вследствие более ранней идентификации дефолтных заёмщиков; оптимизация резервирования за счёт точной сегментации заёмщиков по категориям качества ссуды; высвобождение регуляторного капитала через снижение взвешенных по риску активов (RWA). Многоканальная структура эффекта обеспечивает его устойчивость: даже при реализации пессимистичных допущений по одному из каналов совокупный результат остаётся значимым.
Результаты расчёта по трём сценариям представлены в таблице 2.
Таблица 2
Модельный расчёт экономического эффекта NLP-модуля по сценариям
|
Показатель |
Консервативный (+5 п.п. Gini) |
Базовый (+10 п.п. Gini) |
Оптимистичный (+15 п.п. Gini) |
|
Снижение NPL, млрд руб./год |
1,4–1,8 |
2,8–3,5 |
4,2–5,3 |
|
Экономия на резервировании, млрд руб./год |
2,5 |
5,0 |
7,5 |
|
Высвобождение капитала, млрд руб./год |
0,5 |
1,0 |
1,5 |
|
Совокупный годовой эффект, млрд руб. |
3,0–3,5 |
6,0–7,0 |
9,0–10,5 |
|
Инвестиции (единовременно), млн руб. |
330–480 (одинаково для всех сценариев) | ||
|
NPV за 5 лет (ставка дисконтирования 20 %), млрд руб. |
7–9 |
15–20 |
22–28 |
Источник: расчёты автора. Портфель — 1 трлн руб., PD = 2,5 %, LGD = 40 %, ставка резервирования = 3 %.
При базовом сценарии NPV проекта за пять лет составляет 15–20 млрд рублей при инвестициях 330–480 млн рублей. Соотношение NPV/CAPEX равно 31–60, что существенно превышает среднеотраслевые ориентиры для ИТ-проектов в банковском секторе (10–15) [11]. Срок окупаемости проекта при базовом сценарии — менее одного квартала с момента запуска промышленной эксплуатации. При масштабировании на весь корпоративный портфель ВТБ (15,9 трлн рублей) эффект возрастает пропорционально и составит по базовому сценарию 95–111 млрд рублей в год.
6. Регуляторный контекст и ограничения внедрения
Внедрение NLP-скоринга в российских условиях осуществляется в рамках многоуровневого регуляторного периметра. Ключевые нормативные ограничения определяются тремя блоками документов.
Первый блок — требования к управлению моделями. Указание Банка России № 4927-У устанавливает обязанность кредитных организаций обеспечивать документирование, тестирование и независимую валидацию моделей, применяемых в кредитном процессе. Применительно к NLP-моделям это означает необходимость бэк-тестирования на исторических данных и периодического мониторинга дрейфа модели (model drift). Система объяснимости (SHAP/LIME) формирует техническую основу для выполнения этих требований.
Второй блок — требования к качеству данных. Федеральный закон № 152-ФЗ «О персональных данных» ограничивает использование персонализированных данных без информированного согласия субъекта. Для корпоративных заёмщиков — юридических лиц — данное ограничение распространяется только на персональные данные физических лиц — бенефициаров и руководителей. Публично доступные корпоративные данные (судебные реестры, данные ФНС, публичная отчётность) под действие ФЗ-152 не подпадают.
Третий блок — требования к резервированию (Положение № 590-П). Применение ML-модели для определения категории качества ссуды возможно при условии её одобрения надзорным органом и соответствия требованиям профессионального суждения. Ensemble-подход с сохранением веса традиционной компоненты w₁ = 0,8 обеспечивает преемственность с действующей методологией, что снижает регуляторный риск внедрения.
Среди ограничений, не связанных с регуляторной средой, следует выделить проблему дефицита данных о корпоративных дефолтах в российской банковской системе. Формирование репрезентативной обучающей выборки потребует 3–5 лет накопления данных в режиме shadow scoring. Частичным решением может служить transfer learning — перенос весов моделей, обученных на зарубежных рынках, с последующей дообучением на российских данных, — однако применимость этого подхода требует отдельной верификации.
7. Заключение
Проведённое исследование позволяет сформулировать следующие основные выводы.
Во-первых, в крупнейших российских банках сложился устойчивый структурный разрыв между технологической зрелостью розничного и корпоративного кредитного скоринга. Преодоление этого разрыва посредством NLP-инструментов является следующим рубежом цифровизации банковского риск-менеджмента.
Во-вторых, предложенная концепция ensemble-подхода (PD_final = w₁ × PD_traditional + w₂ × PD_NLP) обеспечивает инкрементальную интеграцию NLP-компоненты при сохранении преемственности с действующей методологией, что минимизирует регуляторный риск внедрения.
В-третьих, модельный расчёт подтверждает высокую экономическую эффективность проекта: при базовом сценарии NPV за пять лет составляет 15–20 млрд рублей на пилотном портфеле 1 трлн рублей при инвестициях 330–480 млн рублей. Соотношение NPV/CAPEX (31–60) значительно превышает отраслевой ориентир для ИТ-проектов.
В-четвёртых, встроенная система explainability (SHAP/LIME) формирует техническую основу соответствия ожидаемым требованиям Банка России к объяснимости ИИ-моделей, снижая регуляторный барьер для внедрения.
Перспективы дальнейших исследований связаны с эмпирической верификацией модели на реальных данных кредитного портфеля, изучением применимости transfer learning для преодоления ограничений малой выборки в российском корпоративном сегменте, а также с разработкой методологии оценки дрейфа NLP-модели в условиях быстро меняющегося информационного поля.
Литература:
- Siddiqi N. Intelligent Credit Scoring: Building and Implementing Better Credit Risk Scorecards. 2nd ed. Wiley, 2017. 320 p.
- ПАО ВТБ. Годовой отчёт за 2024 год. Москва: ВТБ, 2025. URL: https://www.vtb.ru/akcionery-i-investory/raskrytie-informacii/ (дата обращения: 15.03.2025).
- Gentzkow M., Kelly B., Taddy M. Text as Data // Journal of Economic Literature. 2019. Vol. 57(3). P. 535–574.
- Loughran T., McDonald B. Textual Analysis in Accounting and Finance: A Survey // Journal of Accounting Research. 2016. Vol. 54(4). P. 1187–1230.
- TAdviser. Искусственный интеллект в банках: обзор рынка 2024–2025. URL: https://www.tadviser.ru (дата обращения: 01.02.2025).
- Stiglitz J. E., Weiss A. Credit Rationing in Markets with Imperfect Information // American Economic Review. 1981. Vol. 71(3). P. 393–410.
- Hlongwane N. W., Seetharam Y. The use of machine learning models for credit scoring in South Africa and their explainability // Finance Research Letters. 2024. Vol. 62. Article 105099.
- Rudin C. Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead // Nature Machine Intelligence. 2019. Vol. 1(5). P. 206–215.
- Lundberg S. M., Lee S. I. A Unified Approach to Interpreting Model Predictions // Advances in Neural Information Processing Systems 30 (NeurIPS 2017). P. 4765–4774.
- Банк России. Применение методов искусственного интеллекта в финансовом секторе: доклад для общественных консультаций. Москва: Банк России, 2023.
- McKinsey Global Institute. The Age of Analytics: Competing in a Data-Driven World. McKinsey & Company, 2016.

