Автоматизированная оценка качества презентаций на базе нейросетевых моделей

Семёнов Вадим Дмитриевич; Калиниченко Кирилл Сергеевич

Введение

В последние десятилетия развитие вычислительных технологий и увеличение объёмов данных привели к революционным изменениям в области искусственного интеллекта. Одним из ключевых факторов этого прорыва стало активное использование нейронных сетей — математических моделей, вдохновлённых биологическими нейронными системами.

Изначально предложенные ещё в середине XX века, нейронные сети долгое время оставались теоретической концепцией, ограниченной недостатком вычислительных ресурсов и данных. Однако с появлением глубокого обучения, усовершенствованием алгоритмов обратного ошибки и развитием параллельных вычислений на графических процессорах, нейронные сети превратились в мощный инструмент решения широкого спектра задач — от распознавания образов и обработки естественного языка, до прогнозирования временных рядов и управления сложными системами. [2, с. 112–115]

Именно эта способность нейронных сетей (решать сложные, неструктурированные задачи) открывает новые горизонты для их применения в областях, где ключевую роль играет коммуникация. Ярким примером является создание и оценка презентаций — одного из ключевых инструментов коммуникации в бизнесе, образовании и научной деятельности. Качество презентации напрямую влияет на восприятие информации, вовлеченность аудитории и эффективность донесения ключевых сообщений. Однако ручная оценка и улучшение презентаций — трудоёмкий и субъективный процесс. Современные технологии, в частности методы искусственного интеллекта (ИИ), позволяют автоматизировать анализ и оптимизацию презентаций, делая этот процесс объективным, масштабируемым и эффективным.

Актуальность работы

Презентации — критически важный инструмент в бизнесе и образовании, напрямую влияющий на принятие решений и усвоение информации. Требования к их качеству постоянно растут.
Существующий процесс проверки презентаций человеком — субъективный, трудоемкий и не масштабируемый, что замедляет и усложняет работу
Современные технологии искусственного интеллекта и глубокого обучения позволяют автоматизировать комплексный анализ визуальных и текстовых данных [2, с. 215–220], но ещё не применялись системно для решения задачи объективной и быстрой оценки качества презентаций.

Цель работы

Разработка и экспериментальная верификация системы автоматизированной оценки качества презентаций на основе методов глубокого обучения, обеспечивающей объективность и масштабируемость анализа.

Основные задачи работы

Провести анализ существующих подходов к оценке презентаций и современных методов машинного обучения.
Сформировать эталонную коллекцию презентаций, прошедших процедуру экспертной оценки по визуальным, текстовым и структурным критериям качества.
Разработать архитектуру нейронной сети, адаптированную для анализа специфики слайдовых данных.
Реализовать прототип системы, включающий модули предобработки данных, нейросетевой оценки и формирования интерпретируемого отчета.
Провести тестирование системы, измерив точность её работы и сравнив результаты с экспертными оценками и базовыми методами.

Методы исследования

В качестве исходных данных использовались 25 презентации в формате PPTX, подготовленные студентами в рамках курса «Правоведение». Такой выбор обусловлен наличием готового массива работ и возможностью привлечения эксперта — преподавателя данной дисциплины. Все презентации были оценены одним экспертом по 100-балльной шкале на основе общих критериев качества (структура, оформление, содержание). Полученные оценки составили вектор целевых значений output_data (диапазон от 8.9 до 96.2 балла).

Извлечение признаков

Из каждой презентации программно извлекались четыре количественных признака, отражающих, с точки зрения эксперта, ключевые аспекты качества:

Общее количество слайдов — полученных через библиотеку python-pptx. Предполагается, что слишком короткие или излишне длинные презентации могут снижать оценку.

Общее количество слов — текст из всех слайдов сохранялся в файл и подсчитывалось число слов, разделённых пробелами. Признак косвенно характеризует информационную насыщенность.

Количество ссылок на источники — маркер начала библиографической ссылки. Наличие ссылок повышает академическую ценность работы.

Количество изображений — презентация конвертировалась в PDF с помощью Aspose.Slides, после чего библиотекой PyMuPDF (fitz) подсчитывалось число встроенных растровых изображений. Признак отражает визуальное разнообразие.

Все признаки формируют вектор [x1, x2, x3, x4], который подаётся на вход модели.

Архитектура нейросетевой модели

Разработана полносвязная нейронная сеть прямого распространения (multilayer perceptron), реализованная с использованием Keras/TensorFlow [3, с. 215–218]. Перед обучением признаки нормализовались с помощью StandardScaler. После обучения модель и скейлеры сохраняются для использования в веб-приложении.

Формирование текстовой обратной связи

Помимо числовой оценки, система генерирует текстовые рекомендации на основе правил, анализирующих среднее количество слов на слайд (x2/x1), количество ссылок (x3) и количество изображений (x4). Правила были разработаны эмпирически и реализованы в функции OTV(). Несмотря на простоту, такой подход обеспечивает интерпретируемость результатов и полезен для пользователя [1, с. 45–47].

Программная реализация

Система развёрнута как веб-приложение на Flask. Пользователь загружает PPTX-файл, после чего в фоновом потоке запускается извлечение признаков, предсказание модели и формирование отчёта. Результат отображается на отдельной странице. Такой интерфейс удобен для тестирования и демонстрации.

Научная новизна работы

Разработка системы оценивания, которая не только выдает итоговый балл, но и предоставляет обратную связь по конкретным критериям (например, «низкая контрастность», " нехватка сносок на источники "), что решает проблему «черного ящика» для пользователей.
Создание корпуса презентаций в качестве эталонной основы для обучения и сравнительного анализа моделей. Поскольку открытые коллекции для подобной задачи отсутствуют, в рамках работы была вручную разработана база презентаций различного качества и тематик.
Разработка многомерной оценочной модели, объединяющей анализ визуального дизайна и текстового контента. В отличие от существующих подходов, фокусирующихся на изолированных аспектах (например, только читаемости текста или цветовой палитре), предложенная интегральная модель оценки анализирует и взвешивает два ключевых модуля: визуально-композиционный и текстово-самантический [2, с. 308–310].

Описание Web — приложения

Разработанное веб-приложение реализует трехзвенную архитектуру клиент-серверного взаимодействия с интегрированной нейросетевой моделью глубокого обучения. Система спроектирована как микросервисное приложение, объединяющее фронтенд-интерфейс на HTML/CSS/JavaScript, бэкенд-логику на Python Flask и модель машинного обучения на основе TensorFlow/Keras [4].

При запуске приложения автоматически открывается веб-браузер с адресом локального сервера (127.0.0.1:5000), что обеспечивает немедленный доступ пользователя к интерфейсу системы без необходимости ручного ввода URL. Пользователю предоставляется интуитивно понятный интерфейс с двумя основными разделами:

 Главная страница с формой загрузки презентации

 Информационная страница с дата сетом презентаций

Нейросетевая модель оценки

Извлечение данных

Используется библиотека python-pptx для парсинга структуры презентации. Текстовый контент экспортируется в отдельный текстовый файл для последующего анализа. Выполняется подсчет статистических параметров: общее количество слов, наличие библиографических ссылок.

Применяется Aspose.Slides для преобразования.pptx в формат PDF. Обеспечивается кроссплатформенная совместимость обработки: используется PyMuPDF для извлечения графических элементов из PDF. Выполняется количественный анализ визуального контента

Архитектура модели

Разработанная нейронная сеть представляет собой полносвязную многослойную сеть прямого распространения (Feedforward Neural Network)архитектуры типа «полносвязный персептрон» (на рис.1 представлено изображение двуслойной нейронной сети такого типа), оптимизированную для регрессионного анализа.

Полносвязный персептрон

Рис. 1. Полносвязный персептрон

Архитектура сети состоит из четырех основных компонентов: входного слоя, двух скрытых слоев и выходного слоя. Такая конфигурация позволяет модели выявлять как простые линейные зависимости, так и сложные нелинейные взаимодействия между анализируемыми параметрами презентации [3, с. 220–225].

Входные параметры нормализуются с использованием предобученного стандартного скейлера (StandardScaler), что обеспечивает стабильность модели к вариациям масштаба данных. Нормализованные данные пропускаются через последовательность плотных слоев с функцией активации ReLU.

Система формирует трехуровневый отчет:

1. Количественная оценка: итоговый балл по 100-балльной шкале;

2. Качественный анализ: текстовые рекомендации с конкретными указаниями.

Процесс обучения модели

Для обучения модели была составлена выборка, содержащая 25 примеров презентаций по дисциплине «Правоведение». Эта дисциплина сочетает в себе строгую формальную логику (статьи законов) с необходимостью ясной и убедительной интерпретации (правовая позиция). Такой подход позволяет модели освоить универсальные принципы построения качественной презентации — от структурной целостности до ясности изложения, — которые впоследствии могут быть применены к материалам из любых других дисциплин.

В качестве функции потерь выбрана среднеквадратичная ошибка (Mean Squared Error, MSE), которая вычисляет среднее значение квадратов разностей между предсказанными и истинными значениями (экспертной оценки) [3, с. 125–127]. Данная метрика оптимальна для задач регрессии, так как дифференцируема во всех точках, обеспечивает квадратичный штраф за большие ошибки и имеет четкую статистическую интерпретацию.

Для оптимизации параметров модели используется алгоритм Adam (Adaptive Moment Estimation) — адаптивный метод градиентного спуска, который автоматически настраивает скорость обучения для каждого параметра на основе оценок первых и вторых моментов градиентов. Алгоритм Adam сочетает преимущества двух других популярных методов — AdaGrad и RMSProp, демонстрируя высокую эффективность на широком классе задач глубокого обучения [2, с. 189–192].

Экспериментальные результаты и сравнения

Разработанная нейросетевая модель была успешно обучена на коллекции из 25 презентаций, размеченных экспертом в области правоведения. В процессе обучения достигнута высокая степень соответствия предсказанных оценок экспертным: средняя абсолютная ошибка на обучающей выборке составила менее 5 баллов, что свидетельствует о способности модели эффективно аппроксимировать экспертные суждения на основе выделенных признаков.

Сформированные в системе текстовые рекомендации, базирующиеся на анализе соотношения текста, количества ссылок и изображений, продемонстрировали содержательность и практическую полезность при тестировании на новых презентациях. Пилотные запуски веб-приложения с файлами, не участвовавшими в обучении, показали, что итоговые оценки и советы модели субъективно согласуются с мнением независимого эксперта, подтверждая корректность заложенных критериев.

Таким образом, предложенный подход доказал свою работоспособность и потенциал для автоматизации оценки презентационных материалов. Полученные результаты служат основой для дальнейшего развития системы — расширения набора признаков, увеличения объёма обучающей выборки и адаптации под различные предметные области.

Сравнительный анализ убедительно подтвердил, что разработанная нейросетевая модель значительно превосходит классические методы машинного обучения, такие как линейная регрессия и случайный лес, по точности предсказания экспертных оценок [1, с. 85–88]. Благодаря способности глубокой архитектуры выявлять сложные нелинейные зависимости между анализируемыми признаками, предлагаемый подход обеспечивает более тонкое и адекватное моделирование экспертных суждений, что открывает широкие перспективы для его применения в задачах автоматизированной оценки презентационных материалов.

Ограничения и перспективы

Следует отметить, что текущий объем выборки (25 примеров) является пилотным и достаточным для доказательства концепции (Proof of Concept), однако требует расширения для повышения обобщающей способности модели в промышленной эксплуатации [2, с. 405–408]. Перспективные направления развития включают:

Увеличение размера обучающей выборки за счет краудсорсинга экспертных оценок.
Внедрение методов компьютерного зрения (CNN) для прямого анализа растровых изображений слайдов без промежуточной конвертации в признаки.
Адаптация модели под различные предметные области и стили презентаций.

Заключение

Проведённое исследование позволило разработать и внедрить функциональную систему для автоматизированной оценки качества презентаций на базе нейросетевых моделей. Результаты работы подтверждают возможность эффективного применения методов глубокого обучения для анализа презентационных материалов.

Экспериментально подтверждена принципиальная возможность автоматизации экспертной оценки презентаций. Выявлено, что наибольший вклад в итоговую оценку вносят признаки визуального контраста и структурной целостности, в то время как текстовые признаки требуют дальнейшей настройки. Предложенная архитектура системы демонстрирует устойчивость работы и масштабируемость для различных предметных областей.

Таким образом, исследование подтверждает целесообразность и эффективность интеграции технологий искусственного интеллекта в процессы оценки коммуникационных материалов, открывая новые возможности для автоматизации экспертной деятельности в образовательной и профессиональной среде.

Литература:

1. Ветров Д. П., Кропотов Д. А. Алгоритмы выбора моделей и построения коллективных решений в задачах классификации, основанные на принципе устойчивости. Москва, URSS, 2006. 112 с.

2. Просиз Дж., Прикладное машинное обучение и искусственный интеллект для инженеров: Пер. с англ. -Астана: АЛИСТ, 2024. — 432 с.

3. Вьюгин В. В., Математические основы машинного обучения и прогнозирования. Москва, издательство МЦНМО, 2018. 384 с.

4. Информационно-аналитический ресурс по машинному обучению: сайт [Электронный ресурс] // MachineLearning.ru. URL: http://www.machinelearning.ru/wiki/index.php (дата обращения: 01.04.2026)

Молодой учёный

Автоматизированная оценка качества презентаций на базе нейросетевых моделей

Автоматизированная оценка качества презентаций на базе нейросетевых моделей

Молодой учёный