Отправьте статью сегодня! Журнал выйдет ..., печатный экземпляр отправим ...
Опубликовать статью

Молодой учёный

Разработка системы обнаружения мошеннических транзакций в финансовых данных с использованием алгоритмов машинного обучения

Научный руководитель
Информационные технологии
06.06.2026
3
Поделиться
Аннотация
В настоящее время стремительное развитие цифрового банкинга и электронных платежных систем привело к значительному увеличению объема финансовых операций. Одновременно с этим наблюдается рост количества мошеннических действий в финансовой сфере. Традиционные системы контроля, основанные на заранее заданных правилах, не всегда способны эффективно выявлять сложные и постоянно изменяющиеся схемы мошенничества. В связи с этим применение технологий машинного обучения становится одним из наиболее перспективных направлений обеспечения финансовой безопасности. В данной статье рассматриваются вопросы разработки системы обнаружения мошеннических транзакций в финансовых данных. Проведен сравнительный анализ алгоритмов Random Forest, Logistic Regression и XGBoost. Результаты исследования показывают, что методы машинного обучения позволяют существенно повысить точность выявления мошеннических операций.
Библиографическое описание
Сагимбай, Ганихан Ерболулы. Разработка системы обнаружения мошеннических транзакций в финансовых данных с использованием алгоритмов машинного обучения / Ганихан Ерболулы Сагимбай. — Текст : непосредственный // Молодой ученый. — 2026. — № 23 (626). — С. 87-90. — URL: https://moluch.ru/archive/626/137870.


За последние годы уровень цифровизации финансового сектора значительно вырос. Онлайн-платежи, мобильный банкинг и электронная коммерция стали неотъемлемой частью современной экономики. Несмотря на очевидные преимущества цифровых технологий, их развитие сопровождается увеличением количества мошеннических операций.

Одной из ключевых задач финансовых организаций является своевременное выявление незаконных транзакций и предотвращение финансовых потерь. Традиционные методы обнаружения мошенничества основаны на наборе заранее определенных правил и сценариев. Однако современные мошеннические схемы быстро адаптируются к существующим механизмам защиты, что снижает эффективность подобных систем [1].

В связи с этим особую актуальность приобретают методы машинного обучения, позволяющие автоматически анализировать большие объемы данных и выявлять скрытые закономерности, характерные для мошеннических действий.

Объект исследования и анализ предметной области

Финансовое мошенничество представляет собой совокупность противоправных действий, направленных на получение незаконной выгоды посредством проведения финансовых операций.

К основным видам мошенничества в банковской сфере относятся:

— использование украденных банковских карт;

— проведение фиктивных транзакций;

— несанкционированный доступ к учетным записям клиентов;

— операции по отмыванию денежных средств;

— мошенничество с использованием методов социальной инженерии.

Процесс обнаружения мошеннических операций осложняется тем, что доля незаконных транзакций обычно составляет незначительную часть общего объема финансовых операций. Кроме того, характеристики мошеннических и легитимных транзакций часто имеют схожие признаки, что усложняет задачу классификации [2].

Методы исследования

В рамках исследования были использованы методы контролируемого машинного обучения.

Разработка системы включала следующие этапы:

— Сбор данных.

— Предварительная обработка данных.

— Формирование признаков.

— Обучение моделей.

— Оценка качества классификации.

Для оценки эффективности моделей использовались следующие метрики:

— Accuracy;

— Precision;

— Recall;

— F1-score;

— ROC-AUC.

Логистическая регрессия была выбрана как базовый алгоритм бинарной классификации благодаря простоте реализации и высокой интерпретируемости результатов [3].

Алгоритм Random Forest представляет собой ансамбль деревьев решений и отличается устойчивостью к переобучению и шумам в данных [4].

Алгоритм XGBoost основан на методе градиентного бустинга и демонстрирует высокую эффективность при решении задач классификации финансовых данных [5].

Разработка системы обнаружения мошеннических транзакций

В рамках исследования были использованы методы контролируемого машинного обучения.

Разработка системы включала следующие этапы:

— Сбор данных.

— Предварительная обработка данных.

— Формирование признаков.

— Обучение моделей.

— Оценка качества классификации.

Для оценки эффективности моделей использовались следующие метрики:

— Accuracy;

— Precision;

— Recall;

— F1-score;

— ROC-AUC.

Логистическая регрессия была выбрана как базовый алгоритм бинарной классификации благодаря простоте реализации и высокой интерпретируемости результатов [3].

Алгоритм Random Forest представляет собой ансамбль деревьев решений и отличается устойчивостью к переобучению и шумам в данных [4].

Алгоритм XGBoost основан на методе градиентного бустинга и демонстрирует высокую эффективность при решении задач классификации финансовых данных [5].

Предлагаемая система состоит из следующих функциональных модулей:

— Модуль сбора данных.

— Модуль предварительной обработки.

— Модуль извлечения признаков.

— Модуль машинного обучения.

— Модуль принятия решений.

Для анализа транзакций используются следующие параметры:

— сумма операции;

— время проведения транзакции;

— тип платежа;

— географическое местоположение клиента;

— идентификатор устройства;

— поведенческие характеристики пользователя.

На этапе предварительной обработки выполняется очистка данных, удаление пропущенных значений, кодирование категориальных признаков и нормализация числовых параметров.

Для обучения моделей данные были разделены на обучающую и тестовую выборки в соотношении 80 % и 20 % соответственно.

Результаты экспериментов

Таблица 1

Сравнительная оценка эффективности трех алгоритмов машинного обучения

Алгоритм

Accuracy

Precision

Recall

F1-score

Logistic Regression

0.945

0.881

0.832

0.856

Random Forest

0.978

0.942

0.917

0.929

XGBoost

0.986

0.963

0.948

0.955

Результаты экспериментов показали, что алгоритм XGBoost продемонстрировал наилучшие показатели по всем основным метрикам качества классификации.

Высокие значения Precision и Recall свидетельствуют о способности модели эффективно обнаруживать мошеннические операции при минимальном количестве ложноположительных и ложноотрицательных решений.

Заключение

В данной работе была разработана система обнаружения мошеннических транзакций в финансовых данных на основе алгоритмов машинного обучения.

Проведенный сравнительный анализ алгоритмов Logistic Regression, Random Forest и XGBoost показал, что наилучшие результаты продемонстрировал алгоритм XGBoost. Полученные результаты подтверждают перспективность применения методов машинного обучения для повышения уровня финансовой безопасности в банковской сфере.

Практическое применение разработанной системы позволит своевременно выявлять подозрительные операции, снижать финансовые риски и повышать качество обслуживания клиентов.

В дальнейшем планируется расширить исследование за счет использования глубоких нейронных сетей, графовых моделей и технологий анализа данных в режиме реального времени.

Литература:

  1. Ngai E., Hu Y., Wong Y., Chen Y. The application of data mining techniques in financial fraud detection // Decision Support Systems. — 2011. — Vol. 50. — P. 559–569.
  2. Phua C., Lee V., Smith K., Gayler R. A comprehensive survey of data mining-based fraud detection research // Artificial Intelligence Review. — 2010. — Vol. 34. — P. 1–14.
  3. Hosmer D., Lemeshow S. Applied Logistic Regression. — New York: Wiley, 2013.
  4. Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45. — P. 5–32.
  5. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proceedings of the 22nd ACM SIGKDD Conference. — 2016. — P. 785–794.
  6. Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques. — Morgan Kaufmann, 2012.
  7. Goodfellow I., Bengio Y., Courville A. Deep Learning. — MIT Press, 2016.
Можно быстро и просто опубликовать свою научную статью в журнале «Молодой Ученый». Сразу предоставляем препринт и справку о публикации.
Опубликовать статью
Молодой учёный №23 (626) июнь 2026 г.
Скачать часть журнала с этой статьей(стр. 87-90):
Часть 2 (стр. 67-139)
Расположение в файле:
стр. 67стр. 87-90стр. 139
Похожие статьи
Интеллектуальная система оценки риска мошеннических финансовых операций на основе машинного обучения
Гибридные модели машинного обучения для обнаружения финансового мошенничества в потоковых данных
Использование российскими и зарубежными банками методов интеллектуального анализа данных при проведении расчетных операций
Применение искусственного интеллекта при расследовании преступлений в сфере кредитного мошенничества
Использование методов интеллектуального анализа данных ПАО Сбербанк России
Использование методов интеллектуального анализа данных в процессе управления банковскими рисками: зарубежный и российский опыт
Перспективы повышения эффективности технологий искусственного интеллекта при работе с банковскими картами
Правовые вызовы и возможности применения ИИ-систем в деятельности кредитных организаций в целях противодействие легализации (отмыванию) доходов, полученных преступным путем, и финансированию терроризма
Использование методов интеллектуального анализа данных в процессе банковского кредитования: зарубежный и российский опыт
Контроль банковских операций в целях противодействия легализации и отмыванию доходов

Молодой учёный