Исследование процессов обработки и преобразования параметров тестовых заданий в интеллектуальной обучающей системе | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Библиографическое описание:

Прошкина, Е. Н. Исследование процессов обработки и преобразования параметров тестовых заданий в интеллектуальной обучающей системе / Е. Н. Прошкина, И. Ю. Балашова. — Текст : непосредственный // Современные тенденции технических наук : материалы VI Междунар. науч. конф. (г. Казань, май 2018 г.). — Казань : Молодой ученый, 2018. — С. 13-16. — URL: https://moluch.ru/conf/tech/archive/300/13986/ (дата обращения: 16.12.2024).



В статье рассматриваются вопросы калибровки банка тестовых заданий в интеллектуальной обучающей системе. Выделяются уровни сложности заданий, что позволяет наложить на них дополнительные ограничения, и приводится диапазон сложности заданий для каждого уровня.

Ключевые слова: подготовленность испытуемого, трудность задания, логит, уровень сложности, однопараметрическая модель Раша.

В настоящее время в результате высокой востребованности образовательной услуги возникает необходимость произвести преобразование системы образования с использованием современных информационных технологий. Особое внимание уделяется созданию и сопровождению интеллектуальных обучающих систем открытого и дистанционного обучения, развитию новых объектных технологий, созданию баз учебных материалов, наряду с развитием традиционных технологий.

Интеллектуальная обучающая система (ИОС) — это автоматизированная обучающая система, имеющая интеллектуальный интерфейс, позволяющая в процессе обучения вести диалог, отвечать на вопросы и выполнять задания на естественном языке. Целью ИОС, помимо предоставления информации, является диагностика знаний обучающегося и предоставление возможности исправления им ошибок.

С начала XXI в. в образовании появилось новое направление оценки знаний обучающихся — компьютерное тестирование. Тестирование является одним из основных этапов промежуточной и итоговой аттестации в образовательных учреждениях [1]. Основным критерием подготовленности испытуемых при обычном тестировании является набранный балл обучающихся — первичный балл. Однако первичный балл является всего лишь сравнительной оценкой. Он существенно зависит от случайного выбора тестовых заданий и при другом тестировании может оказаться иным [2]. При этом необходимо понимать, что уровень подготовки является латентным (скрытым) параметром и непосредственному измерению не поддается — он может быть только оценен на этапе проверки знаний с определенной вероятностью.

Для объективной оценки подготовленности испытуемых использование модели тестирования с привлечением только классической теории тестов является недостаточной, так как уровень приобретенных знаний и уровень сложности тестовых заданий имеют разную метрику [3].

В основе современной теории тестов лежит Item Response Theory (IRT). IRT предназначена для выполнения оценки латентных параметров испытуемых и заданий тестов на основе математико-статистических моделей измерения. IRT является частью более общей теории латентно-структурного анализа (LSA). Данная теория намного эффективнее традиционной теории тестов, поскольку позволяет получать более высокие величины таких параметров, как точность, уровень измерений и качество тестов [4]. Основным предположением IRT является наличие взаимосвязи между наблюдаемыми результатами учебных достижений, латентными свойствами самих тестируемых (подготовленность по предмету на момент тестирования) и характеристиками используемых тестовых заданий (уровнями трудности).

Будем использовать в качестве математической модели однопараметрическую модель Раша. В рамках этой модели задания характеризуются только одним параметром — трудностью. Вероятность правильного ответа на задание трудностью для испытуемого с уровнем подготовленности выражается зависимостью:

,

где — уровни учебных достижений испытуемых, — номера испытуемых, а — количество участников тестирования; — уровни трудности тестовых заданий, — номера заданий, а — общее число заданий в тесте при условии, что параметры и оцениваются в одной и той же шкале. В качестве такой единой шкалы Г. Раш ввел интервальную шкалу логитов.

При практическом применении теории IRT высчитывают начальные оценки параметра подготовленности испытуемых и параметра трудности тестовых заданий. Начальные оценки параметра подготовки учащихся в логитах находят по формуле:

,

где — уровень подготовленности i-го ученика, и — доли правильных и неправильных ответов соответственно, подсчитанные по матрице наблюдаемых результатов выполнения теста. Начальные оценки параметра трудности заданий получают по формуле:

,

где — уровень трудности j-го задания, и — доли правильных и неправильных ответов соответственно на j-е задание, подсчитанные по матрице наблюдаемых результатов выполнения теста.

Указанные параметры, уровень подготовленности и значение трудности задания, представляют наибольший интерес при создании нашей интеллектуальной обучающей системы.

Для создания адаптивного теста необходимо иметь хороший банк тестовых заданий с известными уровнями трудности (калиброванных заданий). Базу тестовых заданий предварительно будем разделять на различные уровни сложности: легкий (первый уровень сложности), средний (второй уровень), высокий (третий уровень). Будем считать, что уровень сложности указывается экспертом на этапе регистрации тестового задания.

Введем следующие правила:

– логика «И» — это правило, по которому начисляется максимальное количество баллов при условии, что выбраны все правильные варианты ответа и не выбраны неправильные;

– логика «ИЛИ» — правило, по которому начисляются баллы ответа при условии, что выбран хотя бы один правильный ответ и отнимаются баллы ответа, если выбран неправильный.

Дополнительно введем ограничения:

– для первого уровня сложности допускаются только задания с однозначным выбором ответов;

– для второго уровня сложности допускаются задания с множественным выбором с добавкой веса по логике «ИЛИ», вопросы с множественным выбором по логике «И» и вопросы с однозначным ответом;

– для третьего уровня сложности допускаются задания любого типа.

При оценке ответов первого уровня сложности будем считать, что за правильное решение начисляется 1 балл, за неправильное — 0 баллов.

При оценке ответов второго уровня сложности будем считать, что за правильное решение заданий с однозначным выбором ответов начисляется 2 балла, за неправильное — 0 баллов. За решение заданий с выбором ответом будем исходить из следующего принципа: за правильное решение — 2 балла, за решение, в котором правильно более 50 % вариантов — 1 балл, иначе 0 баллов:

,

где — это балл за решение задания, – количество правильно выбранных ответов в задании.

При оценке ответов третьего уровня сложности будем считать, что за правильное решение заданий с однозначным выбором ответов начисляется 4 балла, за неправильное — 0 баллов. За решение заданий с выбором ответом будем исходить из следующего принципа: за правильное решение — 4 балла; за решение, в котором правильно более 75 % вариантов — 3 балла; за решение, в котором правильно более 50 % вариантов, но менее 75 % — 2 балла; за решение, в котором правильно более 25 % вариантов, но менее 50 % — 1 балл, иначе 0 баллов:

Ранее было определено, что порядок сложности задания задается на этапе регистрации задания в банке заданий. При этом необходимо учитывать, что в результате выполнении калибровки может оказаться, что задание не соответствует изначально указанному уровню сложности. Поэтому процесс калибровки базы заданий будем выполнять по следующему алгоритму.

Степень сложности задания определим, как это было описано выше. Допустим, что при выполнении калибровки банка заданий участвуют n групп испытуемых. Пусть — количество испытуемых в группе ; — набор заданий. Матрица уровней сложности заданий в таком случае будет иметь следующий вид:

Номера столбцов матрицы B соответствуют номерам предложенных при тестировании заданий, номера строк соответствуют номерам испытуемых групп.

Дополнительно введем обозначение — процент испытуемых, правильно решивших j-ое задание. Определим для каждого типа задания процент испытуемых, справившихся с заданием и уровень сложности заданий согласно вышеприведенным формулам. Результаты представим в виде таблицы (табл. 1).

Таблица 1

Параметры калибровки заданий

Уровень сложности

Первый уровень

Второй уровень

Третий уровень

Тип заданий

однозначный

однозначный

ИЛИ

И

однозначный

ИЛИ

И

% решений

[75;100]

[50;90]

[40;90]

[40;80]

[10;50]

[0;40]

Степень сложности

[-]

[-2,197; 0]

[-2,197; 0,405]

[-1,386; 0,405]

[0; 2,197]

[0,405; +]

Составленная таблица позволяет соотносить между собой результаты по различным тестам.

Таким образом, деление банка тестовых заданий по уровням сложности с применением калибровки внутри каждого уровня позволит более эффективно организовать банк тестовых заданий, так как деление на группы сложности позволяет наложить дополнительные ограничения на задания и установить диапазон допустимой сложности заданий.

Литература:

  1. Алещанова И. В., Фролова Н. А. Тестирование как средство повышения качества контроля и оценки эффективности учебного процесса в вузе // Современные проблемы науки и образования.–2007.–№ 6.–С.13–14.
  2. Аванесов В. С. Композиция тестовых заданий — М.: Центр тестирования, 2002. — 237 с.
  3. Челышкова М. Б. Теория и практика конструирования педагогических тестов — М.: Логос, 2002. — 432 с.
  4. Майоров А. Н. Теория и практика создания тестов для системы образования — М.: «Интеллект-центр», 2001. — 296 с.
Основные термины (генерируются автоматически): IRT, уровень сложности, задание, балл, интеллектуальная обучающая система, однозначный выбор ответов, правильное решение, уровень, множественный выбор, однопараметрическая модель.

Ключевые слова

подготовленность испытуемого, трудность задания, логит, уровень сложности, однопараметрическая модель Раша

Похожие статьи

Сбалансированность тестовых заданий как один из важных элементов обеспечения их качества

В статье обсуждается балансированность дистракторов тестовых заданий, используемых при контроле знаний учащихся, приводятся экспериментальные результаты в виде таблиц и круговых диаграмм.

Обслуживание неординарного потока требований

В статье исследуются вопросы, связанные с обслуживанием неординарного потока заявок одним прибором. Целью исследования, проведенного в статье, является нахождение условий, при которых существуют предельные распределения величин числа требований в оче...

Методы верификации программного обеспечения

В статье идет речь об исследовании и классификации методов верификации программного обеспечения (ПО). Осуществлен обзор имеющихся статических методов верификации, исследованы характеристики методов и осуществлено исследование на обнаружение зависимос...

Математическая модель и интерпретация эффекта Даннинга-Крюгера

В статье проведён анализ поведения кривой эффекта Даннинга-Крюгера и в результате обработки получена пара взаимосвязанных уравнений, описывающих поведение уровня самооценки в зависимости от уровня квалификации на этапах обучения и набора опыта. Получ...

Рассуждения в условиях неопределенности при создании экспертной системы

В данной статье рассматриваются способы устранения неопределенностей при разработке экспертной системы, что является главным преимуществом системы.

Проверка численных моделей открытых СМО с ограничениями

Рассматривается численная модель открытой системы массового обслуживания, степень влияния соотношения входных параметров системы на погрешность вычисляемых динамических значений характеристик.

Качественные методы оценки рисков

Качественные методы. Методы выбора рисков. Экспертные оценки. На современном этапе оценка риска заключается в сравнении уровня риска с уровнем приемлемости, которые сильно разнятся от проекта к проекту Основанием для отнесения к группе приемлемых рис...

Проблемы внедрения системы тестирования в высшей школе

В статье рассмотрены положительные и отрицательные аспекты тестовой формы контроля знаний и наиболее общие проблемы связанные с анализом тестовых заданий, а также возможности компьютерного тестирования.

Анализ CRM-систем, используемых в образовательных организациях, по критерию функциональной полноты

В статье проводится сравнительно-сопоставительный анализ CRM-систем, используемых частными образовательными организациями в своей маркетинговой и управленческой деятельности. Выбор перечня функциональных возможностей объясняется потребностями образов...

Моделирование многоканальной открытой системы массового обслуживания с ограничениями. Определение аналитических формул

Рассматривается численная модель открытой системы массового обслуживания с ограничениями. Изложен процесс получения некоторых неизвестных аналитических формул характеристик системы на основе вспомогательных функций программы, реализующей данную модел...

Похожие статьи

Сбалансированность тестовых заданий как один из важных элементов обеспечения их качества

В статье обсуждается балансированность дистракторов тестовых заданий, используемых при контроле знаний учащихся, приводятся экспериментальные результаты в виде таблиц и круговых диаграмм.

Обслуживание неординарного потока требований

В статье исследуются вопросы, связанные с обслуживанием неординарного потока заявок одним прибором. Целью исследования, проведенного в статье, является нахождение условий, при которых существуют предельные распределения величин числа требований в оче...

Методы верификации программного обеспечения

В статье идет речь об исследовании и классификации методов верификации программного обеспечения (ПО). Осуществлен обзор имеющихся статических методов верификации, исследованы характеристики методов и осуществлено исследование на обнаружение зависимос...

Математическая модель и интерпретация эффекта Даннинга-Крюгера

В статье проведён анализ поведения кривой эффекта Даннинга-Крюгера и в результате обработки получена пара взаимосвязанных уравнений, описывающих поведение уровня самооценки в зависимости от уровня квалификации на этапах обучения и набора опыта. Получ...

Рассуждения в условиях неопределенности при создании экспертной системы

В данной статье рассматриваются способы устранения неопределенностей при разработке экспертной системы, что является главным преимуществом системы.

Проверка численных моделей открытых СМО с ограничениями

Рассматривается численная модель открытой системы массового обслуживания, степень влияния соотношения входных параметров системы на погрешность вычисляемых динамических значений характеристик.

Качественные методы оценки рисков

Качественные методы. Методы выбора рисков. Экспертные оценки. На современном этапе оценка риска заключается в сравнении уровня риска с уровнем приемлемости, которые сильно разнятся от проекта к проекту Основанием для отнесения к группе приемлемых рис...

Проблемы внедрения системы тестирования в высшей школе

В статье рассмотрены положительные и отрицательные аспекты тестовой формы контроля знаний и наиболее общие проблемы связанные с анализом тестовых заданий, а также возможности компьютерного тестирования.

Анализ CRM-систем, используемых в образовательных организациях, по критерию функциональной полноты

В статье проводится сравнительно-сопоставительный анализ CRM-систем, используемых частными образовательными организациями в своей маркетинговой и управленческой деятельности. Выбор перечня функциональных возможностей объясняется потребностями образов...

Моделирование многоканальной открытой системы массового обслуживания с ограничениями. Определение аналитических формул

Рассматривается численная модель открытой системы массового обслуживания с ограничениями. Изложен процесс получения некоторых неизвестных аналитических формул характеристик системы на основе вспомогательных функций программы, реализующей данную модел...