Введение
Процессы цифровой трансформации в образовании стимулируют активное внедрение генеративных моделей в разработку учебных материалов и индивидуальное сопровождение обучающихся. В областях, которые связаны с программированием, большие языковые модели показывают потенциал в автоматизации создания задач, эталонных решений и тестовых наборов. Вместе с тем неконтролируемое применение таких моделей связано с рисками нестабильности результатов, нарушений академической честности и несоответствия установленным образовательным стандартам. Цель настоящего исследования — разработать обоснованную методику промпт-инжиниринга с жесткими педагогическими ограничениями, которые обеспечивают воспроизводимую генерацию адаптивных заданий по программированию, которые соответствуют таксономическим и когнитивным критериям.
1. Эволюция промпт-инжиниринга и ограничения LLM в образовании
Большие языковые модели обладают способностью анализировать цифровые следы деятельности обучающихся, выявлять пробелы в знаниях и динамически адаптировать сложность учебных материалов в рамках концепции массовой индивидуализации [8, 6]. В программировании архитектуры, обученные на репозиториях кода, обеспечивают генерацию и анализ алгоритмических конструкций [7,9]. Однако выявлены системные ограничения: высокая вычислительная нагрузка, потеря логической последовательности при длительной генерации, склонность к генерации неточностей (до 20 % заданий содержат скрытые ошибки) [5,10], а также риски для академической честности при смещении акцента с освоения компетенций на взаимодействие с ИИ [4].
Промпт-инжиниринг прошел путь от эвристического подбора формулировок к формализованному процессу. Стратегии Chain-of-Thought , ReAct и Role Prompting улучшают логическую связность ответа, однако без параметризации педагогических требований генерация остается вероятностной [3]. Существенным шагом стало внедрение constraint-based prompting , предполагающего кодирование требований в структурированные схемы ( JSON/YAML ), которые сужают пространство вывода и обеспечивают типовую безопасность [1,9]. Для образовательных заданий целесообразна детерминированная оркестрация с константными правилами валидации, исключающая оптимизацию промптов под технические метрики в ущерб педагогической корректности.
2. Формализация педагогических требований в машиночитаемые ограничения
Генерация заданий по программированию требует сбалансирования внутренней когнитивной нагрузки и внешних факторов. Для уменьшения перегрузки вводятся параметры, перечень необходимых предварительных знаний, а также уровень абстракции, который формализует принцип «от конкретного к абстрактному» [9].
Классификация образовательных результатов с опорой на таксономию Блума преобразуется в технические параметры, управляющие процессом генерации следующим образом:
– Анализ обозначается параметром requires_trace: true , предполагающим создание задания с логической ошибкой и трассировкой до точки сбоя. Проверка выполняется в изолированной программной среде с оценкой расхождения с эталоном.
– Синтез характеризуется design_required: true , формируя открытое задание с возможностью выбора архитектурного подхода. Валидация учитывает покрытие тестами и оценку оригинальности по разделам.
– Систематизация требований осуществляется посредством единой машиночитаемой модели, формулируемой как задача удовлетворения ограничений [1].
3. Архитектура конвейера генерации и гибридной валидации
Разработанная методика выполнена в форме многоэтапного оркестрационного конвейера, которая обеспечивает замкнутый цикл обратной связи:
– Планирование, преобразование педагогических параметров в DSL-конфигурацию.
– Генерация, вызов LLM с применением Chain-of-Thought и Role Prompting в рамках структурных ограничений.
– Валидация схемы, проверка формата через JSON и регулярные выражения.
– Изолированное исполнение, запуск кода в Docker с ограничениями по времени выполнения и памяти [3].
– Педагогическая оценка, применение LLM в роли судьи, откалиброванного на экспертных выборках, расчет индекса соответствия раздела и проверка на академическую честность [2].
– Самокоррекция, при обнаружении отклонений модель получает структурированный обратный ответ и повторяет генерацию [2].
4. Сравнительный анализ и перспективы внедрения
Существующие методы не достигают одновременно детерминированности формата, автоматической проверки педагогической релевантности и воспроизводимости. Эвристический промптинг, основанный на ручной проверке, демонстрирует низкий уровень соответствия педагогическим нормам и высокую вариативность вывода. Методы цепочек рассуждений ( CoT/ReAct ) улучшают логическую последовательность, но не обеспечивают изолированное исполнение кода и зависят от настройки гиперпараметров. Многоэтапные «оркестраторы» с использованием изолированной программной среды представляют оптимальную архитектуру для промышленного внедрения, сочетая гибридную валидацию и автоматическую коррекцию, но обладают чувствительностью к настройкам «модели-судьи».
Предложенная методика устраняет выявленные недостатки через четырехуровневую систему ограничений: подавление случайности декодирования за счет фиксации гиперпараметров и структурных контрактов. Интеграцию разнородных валидаторов в единый конвейер с ветвлением и самокоррекцией. Представленное решение может служить архитектурным шаблоном для интеграции LLM в системы управления обучением и адаптивные платформы.
Заключение
Разработанная методика промпт-инжиниринга с педагогическими ограничениями обеспечивает переход от эмпирического взаимодействия с большими языковыми моделями к инженерному обоснованному процессу генерации адаптивных заданий по программированию. Формализация таксономических, когнитивных и структурных требований в машиночитаемые схемы, многоступенчатая валидация с изолированным исполнением кода и протоколы воспроизводимости позволяют снизить влияние вероятностной природы генерации, обеспечивая педагогическую релевантность и академическую корректность формируемых материалов. Представленная методика формирует теоретико-методологическую основу для создания информационных систем адаптивного обучения и открывает перспективы для последующих экспериментальных исследований в области цифрового образования.
Литература:
- Nikolic S. Assessment Integrity and Validity in the Teaching Laboratory: Adapting to GenAI by Developing an Understanding of the Verifiable Learning Objectives Behind Laboratory Assessment Selection / S. Nikolic [et al.] // European Journal of Engineering Education. — 2025. — Т. 50, № 4. — С. 673–701.
- Paiva J. C. Automated Assessment in Computer Science Education: A State-of-the-Art Review / J. C. Paiva, J. P. Leal, A. Figueira // ACM Transactions on Computing Education. — 2022. — Т. 22, № 3. — С. 1–40.
- Wei J. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models / J. Wei [et al.] // Advances in Neural Information Processing Systems. — 2022. — Т. 35. — С. 24824–24837.
- Жуков А. Д. Генеративный искусственный интеллект в образовательном процессе: вызовы и перспективы //Вестник Московского государственного университета культуры и искусств. — 2023. — №. 5 (115). — С. 66–75.
- Захарова И. Г. Большие языковые модели в образовании: создание тестовых заданий с помощью ChatGPT // Информатизация образования и методика электронного обучения: цифровые технологии в образовании. — 2023. — С. 1100–1104.
- Константинова Л. В. и др. Генеративный искусственный интеллект в образовании: дискуссии и прогнозы //Открытое образование. — 2023. — Т. 27. — №. 2. — С. 36–48.
- Леонов А. Г. и др. Области применения больших языковых моделей для цифровых образовательных платформ //Труды НИИСИ. — 2025. — Т. 15. — №. 2. — С. 09–15.
- Поспелова Е. А. и др. Генеративный искусственный интеллект в образовании: анализ тенденций и перспектив //Профессиональное образование и рынок труда. — 2024. — Т. 12. — №. 3 (58). — С. 6–21.
- Сазонов А. П. Использование ИИ в программировании //Universum: технические науки. — 2024. — Т. 1. — №. 3 (120). — С. 46–52.
- Чунгулова Г. К., Оразалиева Э. Н. Возможности и проблемы больших языковых моделей в образовании на примере ChatGPT //Наука и реальность/Science & Reality. — 2024. — №. 4 (20). — С. 85–91.

