This article discusses the development of a mobile application for automated boxing training analysis using computer vision technologies. The proposed solution performs local video data processing directly on a mobile device, detects athletes' punches, and calculates basic training indicators. The study examines the application of human pose estimation and hand motion analysis algorithms based on MediaPipe and OpenCV. Particular attention is paid to the punch detection mechanism, which uses temporal analysis of frame sequences and a system of sensitivity coefficients. The advantages of local video analysis, methodological limitations, and factors affecting recognition accuracy are also considered.
Keywords: mobile development, computer vision, video analysis, MediaPipe, OpenCV, machine learning, boxing, motion detection, mobile applications.
В современных условиях методы компьютерного зрения активно применяются в спортивной аналитике [1]. Автоматизированная обработка видеоданных позволяет количественно оценивать тренировочную активность спортсменов без применения специализированного оборудования. Особую актуальность данный подход приобретает в единоборствах.
Целью настоящей работы является разработка мобильного приложения для анализа боксерских тренировок, функционирующего непосредственно на мобильном устройстве пользователя без обращения к внешним облачным сервисам. Приложение предназначено для обработки видеозаписей тренировочного процесса, определения ударных движений и расчета базовых боксерских показателей.
Пользователь может записать тренировку через камеру смартфона либо загрузить готовое видео, после чего выполняется анализ и отображение результатов.
Обработка видеоданных осуществляется покадрово. Видеопоток разбивается на последовательность кадров, которые передаются в модуль компьютерного зрения. Для решения задачи распознавания движений используется комбинированный подход, основанный на библиотеках MediaPipe и OpenCV [2, 3]. MediaPipe Hands используется для распознавания кистей, MediaPipe Pose — для анализа положения тела и суставов, а OpenCV обеспечивает обработку видеопотока [2, 3]. Архитектурная схема взаимодействия основных модулей мобильного приложения приведена на рисунке 1.
Рис. 1. Архитектура приложения
Распознавание ударов осуществляется по временной последовательности кадров, что позволяет учитывать скорость движения руки, изменение положения суставов и интервалы между действиями [4].
Алгоритм детекции удара основан на анализе нескольких признаков: положения кулака, скорости перемещения запястья и разгибания руки относительно локтя [2, 5]. Логика определения ударного действия на основе анализа временной последовательности кадров показана на рисунке 2.
Рис. 2. Алгоритм детексии ударного движения.
В реальных условиях видеосъемки кисть спортсмена может частично перекрываться корпусом, боксерскими перчатками либо выходить из зоны уверенного распознавания. Для повышения устойчивости алгоритма используется резервный механизм детекции, основанный на данных MediaPipe Pose. В этом случае основным источником информации становятся координаты суставов руки и оценка кинематических изменений положения конечности.
Коэффициенты чувствительности позволяют адаптировать алгоритм к различным условиям съемки. Используются пороговые значения временного интервала между ударами, скорости движения и смещения запястья, что снижает вероятность ложных срабатываний.
Результатом обработки видеозаписи является набор аналитических показателей. Приложение вычисляет количество ударов, длительность тренировки. На основе временных меток кадров и параметров движения руки могут быть рассчитаны дополнительные аналитические показатели.
Одним из преимуществ предлагаемого решения является локальная обработка данных. В отличие от облачных систем анализа видео, мобильное приложение выполняет все вычисления непосредственно на устройстве пользователя. Такой подход уменьшает задержки обработки, исключает необходимость постоянного интернет-соединения и повышает уровень конфиденциальности пользовательских данных. Кроме того, локальное выполнение алгоритмов обеспечивает возможность многократного быстрого анализа после изменения параметров чувствительности [2].
Несмотря на функциональные преимущества, разработанный подход имеет ряд ограничений. Приложение не определяет реальную физическую силу удара, поскольку для такой задачи необходим учет массы конечности, ускорения, контактных взаимодействий или использование специализированных датчиков. Анализ осуществляется исключительно на основе визуальных признаков движения. Точность распознавания также зависит от внешних факторов, включая освещенность сцены, частоту кадров камеры, качество стабилизации изображения, ракурс съемки и степень видимости рук спортсмена [1, 5].
Таким образом, разработанное мобильное приложение представляет собой автономный инструмент анализа боксерских тренировок на основе методов компьютерного зрения. Использование локальной обработки и алгоритмов анализа движений обеспечивает практическую применимость решения для спортивной аналитики. Перспективы развития связаны с внедрением нейросетевой классификации ударов и расширением набора рассчитываемых метрик.
Литература:
- Szeliski R. Computer Vision: Algorithms and Applications. 2nd ed. Cham: Springer, 2022. 979 p.
- Lugaresi C., Tang J., Nash H. et al. MediaPipe: A Framework for Building Perception Pipelines // Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2019.
- Bradski G. The OpenCV Library // Dr. Dobb’s Journal of Software Tools. 2000.
- Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MIT Press, 2016. 775 p.
- Bishop C. M. Pattern Recognition and Machine Learning. New York: Springer, 2006. 738

