Методика «Реализация до использования» в преподавании основ компьютерного зрения старшеклассникам в профильных классах

Курсанов Евгений Андреевич

Введение

Стратегия научно-технологического развития Российской Федерации в качестве одного из приоритетных направлений определяет развитие интеллектуальных систем и технологий машинного обучения. Реализация этой стратегии невозможна без ранней системной подготовки соответствующих кадров [9]. Это актуализирует задачу интеграции элементов этих областей знаний в школьное образование. Компьютерное зрение, будучи одной из наиболее динамичных, визуально наглядных и практически ориентированных ветвей искусственного интеллекта, закономерно вызывает познавательный интерес у старшеклассников, особенно у мотивированных участников олимпиад, хакатонов и проектных смен [1].

Анализ существующих образовательных ресурсов выявляет структурную проблему, которую можно охарактеризовать как «дидактический разрыв». С одной стороны, действующие школьные учебно-методические комплексы (УМК) по информатике для профильных 10–11-х классов затрагивают тему обработки изображений на прикладном, а не алгоритмическом уровне [2, 7]. Основное внимание уделяется вопросам дискретизации и кодирования графической информации и формированию пользовательских навыков работы в графических редакторах. Алгоритмическая реализация инструментов редактирования изображений не изучается. Для учащегося внутренняя логика работы графического редактора остается «черным ящиком».

С другой стороны, открытые онлайн-курсы по компьютерному зрению содержат актуальный и глубокий материал, но их целевая аудитория — студенты технических специальностей или практикующие разработчики. Для старшеклассника эти курсы обладают высоким порогом вхождения: они предполагают владение математическим анализом (производные, градиент), линейной алгеброй (операции с матрицами, свертки), теорией вероятностей и продвинутыми навыками программирования на Python с использованием библиотек NumPy, OpenCV, PyTorch. Педагогическая методология курсов по компьютерному зрению строится на строгом математическом описании принципов работы алгоритмов и демонстрации их работы с помощью библиотечных функций [5, 6].

Таким образом, между базовыми понятиями школьной информатики и сложными, целостными знаниями, необходимыми для практической работы в области компьютерного зрения, существует явный дидактический разрыв.

Целью данной статьи является описание, обоснование и представление результатов апробации авторского элективного курса по компьютерному зрению.

Описание курса

Курс рассчитан на 34 часа. При нагрузке 2 часа в неделю курс длится одно учебное полугодие. По завершении курса проводится конференция по защите итоговых проектов, посвященных разделам курса.

Курс состоит из 6 модулей:

Модуль 1: Основы работы с изображениями как с данными (6 часов).

Теория: цифровое изображение как матрица, пиксель, цветовые модели RGB и HSV, глубина цвета.

Практика: загрузка и отображение изображения, обращение к пикселю по координатам, попиксельные операции (инверсия цвета, изменение яркости, корректировка контраста), ручное преобразование между цветовыми пространствами (из RGB в градации серого по формуле).

Дидактическая цель: сформировать представление об изображении не как о картинке, а как о структурированном наборе числовых данных.

Модуль 2: Матричные операции и пространственная фильтрация (6 часов).

Теория: понятие окрестности пикселя, операция свертки, ядро (матрица) свертки, типы фильтров: размывающие (низкочастотные), повышающие резкость, выделяющие границы.

Практика: самостоятельная реализация операции свертки с использованием вложенных циклов, применение свертки с различными ядрами для размытия изображения и выделения горизонтальных и вертикальных линий, сравнение результатов самостоятельной реализации с вызовом функций cv2.filter2D и cv2.GaussianBlur , анализ влияния размера ядра на результат.

Дидактическая цель: добиться интуитивного и технического понимания свертки как фундаментальной операции преобразования изображения.

Модуль 3: Выделение границ и признаков (6 часов).

Теория: понятие градиента яркости, оператор Собеля (оценка градиента), оператор Лапласа (поиск перегибов), алгоритм Кэнни как стандарт детектирования границ.

Практика: реализация упрощенных версий операторов Собеля и Лапласа на основе собственной функции свертки, использование встроенных функций cv2.Sobel , cv2.Laplacian , изучение работы cv2.Canny с подбором порогов, построение простой пирамиды изображений (уменьшение разрешения).

Дидактическая цель: показать, как на базе операции свертки строятся более сложные алгоритмы анализа изображения, сформировать понимание границы объектов на изображении как зоны резкого изменения сигнала.

Модуль 4: Введение в машинное обучение для изображений (6 часов).

Теория: задача классификации, искусственный нейрон и перцептрон, идея обучения с учителем, обзор архитектур нейронных сетей для изображений.

Практика: работа с набором данных MNIST (рукописные цифры), нормализация данных, создание и обучение простой полносвязной нейронной сети с использованием фреймворка высокого уровня (Keras/TF или PyTorch). Оценка точности на тестовой выборке, визуализация ошибок.

Дидактическая цель: продемонстрировать связь между извлеченными признаками (которые можно получать изученными ранее методами) и решением интеллектуальной задачи, дать первичный опыт работы с машинным обучением.

Модуль 5: Основы детекции объектов (4 часа).

Теория: отличие детекции от классификации, каскады Хаара и признаки Виолы-Джонса, метрики оценки детектора.

Практика: использование предобученного каскадного классификатора cv2.CascadeClassifier для детекции лиц или глаз на фотографиях, анализ качества работы при изменении параметров масштаба.

Дидактическая цель: показать эволюцию задачи: от «что на изображении?» к «где на изображении?», познакомить с готовыми практическими инструментами для типовых задач.

Модуль 6: Проектная деятельность и разработка приложений (6 часов).

Содержание: индивидуальная или парная работа над итоговым проектом, консультации с преподавателем, основы создания простого графического интерфейса (GUI) на Tkinter или аналогичной библиотеке для интеграции алгоритмов в приложение, подготовка презентации и отчета.

Дидактическая цель: интегрировать полученные знания и навыки в целостный продукт, развить навыки планирования и исследования.

Методический подход «Реализация до использования»

Основным методическим подходом в изучении основ компьютерного зрения стал принцип «Реализация до использования». Его реализация состоит из трех последовательных этапов:

Этап 1. Погружение и ручная реализация. Учащимся предлагается задача, для решения которой необходим новый алгоритм (например, размытие изображения). Дается формальное описание (псевдокод, формула свертки). Необходимо написать работающую функцию на Python, реализующую этот алгоритм в упрощенном виде. Акцент делается на корректности логики, а не на оптимизации скорости. На этом этапе допустимо и даже полезно возникновение ошибок и неэффективностью собственного кода.

Этап 2. Верификация и сравнительный анализ. Созданная функция применяется к изображению. Затем к тому же самому изображению применяется стандартная функцию из библиотеки OpenCV. Учащиеся проводят сравнительный анализ: визуальный результат должен быть визуально похожим. Это момент «озарения», когда абстрактная библиотечная функция перестает быть «черным ящиком» и становится эффективной реализацией алгоритма.

Этап 3. Инструментальное применение и рефлексия. После того как суть алгоритма понята и осмыслена, учащиеся получают разрешение использовать библиотечную функцию в дальнейшей работе. Это снимает когнитивную нагрузку и позволяет сосредоточиться на решении более сложных прикладных задач. Важным элементом является рефлексия: обсуждение преимуществ библиотечной реализации (скорость, точность, обработка граничных случаев) и образовательного эффекта самостоятельной реализации (понимание деталей, отладка).

Об апробации курса

Апробация курса была проведена на базе ФГКОУ «Оренбургское президентское кадетское училище» в двух группах учащихся профильных 10–11-х классов (по 10 человек в группе). Занятие продолжительностью 1,5 часа имело комбинированную структуру: 30–40 минут теории и постановки проблемы, 50 минут практической работы за компьютером. Итоговой формой аттестации стала защита индивидуальных или парных проектов. Важной методической находкой стал этап начала проектной деятельности: темы не задавались в начале курса, а формировались у учащихся естественным образом к 8–10-му занятию по мере освоения инструментария.

Тематика проектов, представленных на защите, продемонстрировала широкий спектр применения усвоенных знаний: персональные графические редакторы, прототипы систем стеганографии, системы отслеживания объектов, системы обнаружения и распознавания автомобильных номеров.

Количественные и качественные результаты

Из 20 учащихся, начавших курс, до этапа защиты итоговых проектов дошли и успешно выступили 18 человек (90 %). Основные причины отсева, выявленные в ходе бесед, являются: высокая учебная загруженность кадет (основная учебная программа, дополнительные занятия) и первоначальная недооценка объема и сложности именно практической работы по программированию. Все 18 кадет, завершивших курс, представили работающее программное обеспечение и обосновали его применимость, что является объективным показателем усвоения ключевых компетенций.

Качественные результаты, выявленные через анкетирование и наблюдение:

— Рост мотивации фиксировался в момент самостоятельной реализации алгоритмов компьютерного зрения и в период работы над личным проектом.

— В обратной связи кадеты отмечали, что им было интересно разобраться, как работают фильтры для фото из социальных сетей и как происходит поиск лиц на изображении.

— Учащиеся продемонстрировали развитие навыков отладки кода и работы с технической документацией, что подтвердилось в ходе защиты проектов.

Затруднения и способы их решения

Выполнение операций над двумерными списками (матричные операции) вызывает сложность у учащихся, привыкших к линейной обработке данных. Методическое решение заключается в использовании визуализации процесса вычисления, в частности анимации, в которой ядро свертки «скользит» по изображению. Работа с матрицами 3x3 вручную позволяет преодолеть барьер восприятия операции свертки. Акцент делается на том, что результат свертки в одной точке — это взвешенная сумма соседей.

При изучении цветовых пространств возникает сложность в изменении цвета через отдельные цветовые каналы. С цветовым пространством RGB учащиеся знакомятся в 7 классе на уроках информатики, однако для них цвет — это прежде всего качественная характеристика. Изменение цвета является линейной операцией, но интуитивно воспринимается сложно. Также перевод между цветовыми пространствами по линейным формулам остается нетривиальной операцией. Методическое решение заключается в серии наглядных экспериментов: отображении каждого цветового канала (R, G, B) отдельно как черно-белого изображения, переводе в HSV и демонстрации того, как параметр «Оттенок» (Hue) соответствует интуитивному понятию «цвет». Эффективным оказывается практическое задание по выделению объекта по цветовому диапазону в HSV-пространстве, которое было невозможно выполнить в RGB.

При изучении математических формул и терминов возникает «боязнь» сложных выражений. Увидев в описании оператора Собеля упоминание о «градиенте» и «частных производных», часть учащихся психологически «отключается». Методическое решение заключается в сознательном отказе от строгого математического вывода в пользу геометрической и алгоритмической интерпретации. Используется формулировка: «Давайте забудем на время слово «производная». Оператор Собеля — это просто два специальных ядра свертки, которые очень чутко реагируют на резкие перепады яркости слева-направо и сверху-вниз». Математический аппарат не упрощается, но его подача переводится в инженерно-алгоритмическую плоскость.

Существует сложность отладки алгоритмов работы с изображениями. Ошибка в цикле или индексе может привести не к явной ошибке в коде, а к генерации визуально странного, «шумного» изображения. Решением этой проблемы является формирование навыка использования вывода отладочной информации (значений небольшого фрагмента матрицы), а также сравнение промежуточных результатов с расчетами на бумаге для микро-примеров.

При проведении курса наибольшую сложность вызывает у учащихся модуль 4. Действительно, помимо сложности алгоритмов компьютерного зрения добавляется сложность архитектур нейросетей для анализа изображений. В зависимости от уровня подготовки группы допускается исключение этого модуля из курса и перераспределение этих учебных часов на итоговые проекты учащихся.

Заключение

Систематизация результатов показывает, что преодоление «дидактического разрыва» при изучении компьютерного зрения возможно при использовании методики «Реализация до использования».

Ручная реализация формирует понимание логики, но требует визуализации для снижения трудоёмкости; верификация устраняет эффект «черного ящика» через сравнение с библиотечными функциями; инструментальное применение закрепляет навыки в проектной деятельности. Структура курса допускает адаптацию модуля машинного обучения в зависимости от подготовки группы.

Практическая рекомендация состоит в оценке эффективности на этапе защиты проектов и приоритете инженерно-алгоритмической интерпретации над строгим математическим выводом в рамках всего педагогического конвейера.

Литература:

IT-Соревнования для специалистов и начинающих. — Текст: электронный // cups.online: [сайт]. — URL: https://cups.online/ru/ (дата обращения: 26.02.2026).
Босова Л. Л. Информатика. 10 класс. Базовый уровень / Л. Л. Босова, А. Ю. Босова. — М.: БИНОМ. Лаборатория знаний, 2017. — 288 с.: ил.
Гарсия Г. Б. Обработка изображений с помощью OpenCV / Гарсия Г. Б., Суарес О. Д., Аранда Х. Л. Э. и др.; пер. с англ. А. А. Слинкина. — М.: ДМК Пресс, 2016. — 210 с.
Грузман И. С. Цифровая обработка изображений в информационных системах: Учебное пособие./ Грузман И. С., Киричук В. С., Косых В. П., Перетягин Г. И. — Новосибирск: Издательство НГТУ, 2000. — 168 с.
Курс «Компьютерное зрение». — Текст: электронный // openedu.ru: [сайт]. — URL: https://openedu.ru/course/hse/COMPVISION/ (дата обращения: 26.02.2026).
Курс «Нейронные сети и компьютерное зрение». — Текст: электронный // stepik.org: [сайт]. — URL: https://stepik.org/course/50352/syllabus (дата обращения: 26.02.2026).
Поляков К. Ю. Информатика. Углубленный уровень: учебник для 11 класса: в 2 ч. Ч. 2 / К. Ю. Поляков, Е. А. Еремин. —М.: БИНОМ. Лаборатория знаний, 2013.— 304 с.: ил.
Старовойтов В. В. Цифровые изображения: от получения до обработки / Старовойтов В. В., Голуб Ю. И. — Минск: ОИПИ НАН Беларуси, 2014. — 202 с.
О Стратегии научно-технологического развития Российской Федерации [утв. Указом Президента РФ от 28 февраля 2024 г. № 145]. URL: http://www.kremlin.ru/acts/bank/50358 (дата обращения: 26.02.2026).

Молодой учёный

Методика «Реализация до использования» в преподавании основ компьютерного зрения старшеклассникам в профильных классах

Методика «Реализация до использования» в преподавании основ компьютерного зрения старшеклассникам в профильных классах

Молодой учёный