Программное обеспечение для формирования частотных словарей в процессе обучения английскому языку в техническом вузе | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Библиографическое описание:

Ржеуцкая, С. Ю. Программное обеспечение для формирования частотных словарей в процессе обучения английскому языку в техническом вузе / С. Ю. Ржеуцкая, Т. В. Мальцева. — Текст : непосредственный // Современные тенденции технических наук : материалы II Междунар. науч. конф. (г. Уфа, май 2013 г.). — Т. 0. — Уфа : Лето, 2013. — С. 14-16. — URL: https://moluch.ru/conf/tech/archive/74/3835/ (дата обращения: 20.04.2024).

Изучение иностранных языков — труд нелегкий, независимо от того, самостоятельно ли учится человек или под руководством преподавателя. Последний вариант, безусловно, представляется более предпочтительным, поскольку преподаватель, даже не являясь носителем языка, является носителем культуры изучения языков (или какого-либо конкретного иностранного языка), отражающей громадный опыт предыдущих поколений, тщательно выбиравших наиболее оптимальный путь для достижения поставленной цели. Тем не менее, современные информационные технологии способны внести определенные новшества, оптимизирующие процессы запоминания иностранных слов, чтения оригинальных текстов в определенной предметной области.

Интересным и сравнительно новым средством обучения, которое может помочь в освоении англоязычной профессионально-ориентированной лексики, являются частотные словари. Частотные словари отражают относительную частоту использования слов в каком-либо тексте, коллекции текстов определенной тематики или в разговорной практике.

Чем же может помочь частотный словарь преподавателю, студенту технического вуза? Прежде всего, частотный словарь, полученный путем анализа достаточно большого текстового фрагмента на английском языке (например, подборка англоязычных материалов из Интернета по теме «Databases»), демонстрирует богатство используемых англоязычных технических терминов. Также преподаватель, используя частотный словарь, может определить необходимый словарный запас своих студентов для успешного чтения того или иного текста. При этом, если текст достаточно большой, студенту в первую очередь необходимо изучить слова и сочетания слов, наиболее часто встречающиеся в нем (например, более двух-трех раз). Выделить такие слова и сочетания можно автоматически, сформировав частотный словарь на основе изучаемого текста или коллекции текстов по определенной теме. Таким образом, частотные словари позволяют оптимизировать процесс освоения англоязычной лексики, соответствующей будущей профессии студентов.

В реалиях современного мира существует множество частотных словарей общеупотребительного английского языка. Однако словари по узким предметным областям найти достаточно сложно, да и самому преподавателю английского языка сложно составить подобный словарь или выбрать термины, которые необходимы для изучения студентами какой-то конкретной специальности. Ведь, как известно, профессиональная терминология студента-экономиста и студента-программиста сильно различается и для успешного делового общения в будущем таких студентов необходимо обучать разным нюансам языка, что позволит рационализировать процесс обучения. В связи с этим актуальной является задача построения частотных словарей для различных предметных областей с целью повышения качества профессионально-ориентированного обучения английскому языку.

Целью работы, представленной в докладе, являетсяразработка программного обеспечения, которое будет анализировать коллекцию технических текстов определенной тематики на английском языке и автоматически формировать частотный словарь используемых слов или сочетаний слов, включая также и их перевод. Наличие такого словаря позволяет студенту быстрее изучить тему и запомнить сложные профессиональные термины вместе с их англоязычными эквивалентами.

Итак, функционально, разрабатываемая система должна позволять преподавателю английского языка выбрать тексты для частотного анализа, выбрать слова, которые следует исключить из частотного словаря, провести частотный анализ, просмотреть и сохранить частотный словарь, выбрать параметры для формирования словаря, исключить уже изученные слова из словаря.

В процессе выполнения данного проекта была подобрана коллекция профессионально-ориентированных аутентичных текстов на английском языке по теме «Информационные технологии». Следует учитывать, что чем больше коллекция, тем более предметно-ориентированным получается частотный словарь.

При реализации проекта была выработана следующая стратегия обработки текстов:

1.                  Не учитываются слова, длина которых меньше трех букв.

2.                  Проводится процедура исключения словоформ (ведется поиск форм слов таких как: множественное/единственное число существительного, настоящее/прошедшее время глаголов)

3.                  Обрабатываются окончания –ing

4.                  Пропускаются слова из списка исключаемых слов (артикли, предлоги, союзы, а также слова, которые изучаются еще в школе).

5.                  Для словаря также исключаются слова, которые выбрал преподаватель, например, слова, которые студенты уже изучили.

При выборе методики решения были рассмотрены два способа представления данных: двоичные деревья и хэш-таблица. Приведем некоторые результаты сравнения:

1.         Сортировка результата. Если результат должен быть отсортирован, хеш-таблицы представляются не вполне подходящими, поскольку их элементы заносятся в таблицу в порядке, определяемом только их хеш-значениями. При проходе дерева в обратном порядке получаем отсортированный список.

2.         Память. Минимизация памяти, которая уходит на «накладные расходы», особенно важна, когда нужно хранить много маленьких узлов. Для хеш-таблиц требуется только один указатель на узел. Кроме того, требуется память под саму таблицу. Для двоичных деревьев необходимо хранить значения ключа, указатели на левое и правое поддерево.

3.         Время. Алгоритм должен быть эффективным. Это особенно важно, когда ожидаются большие объемы данных. Хеш-таблица работает быстрее.

По результатам сравнения для реализации был выбран метод на основе построения хеш-таблицы как наиболее оптимальный для решения данной задачи. С учетом вышеизложенного было разработано программное обеспечение для формирования частотных словарей в среде Visual C++ (Microsoft Visual Studio).

Перечислим основные результаты выполненного проекта:

1.                  Выявлены требования к разрабатываемому программному обеспечению, определены функциональные особенности системы, выбрана методика решения.

2.                  Разработано программное обеспечение, которое будет анализировать коллекцию текстов на английском языке и автоматически формировать частотный словарь.

3.                  Подобрана коллекция профессионально-ориентированных аутентичных текстов по теме «Информационные технологии».

В будущем планируется доработка, включающая реализацию словаря по заданным преподавателем параметрам, доработка интерфейса с целью повышения эргономики программного продукта.

Применение разработанного программного обеспечения дает возможность повысить эффективность и качество обучения студентов технических вузов английскому языку, а также сделать это обучение профессионально-ориентированным и коммуникативно-направленным.

Литература:

1.                  Алексеев П. М. Частотные словари: Учебное пособие. — СПб.: Изд-во С.-Петерб. Ун-та, 2001–156 с.

2.                  Ахо, А. Структуры данных и алгоритмы/ А.Ахо, Д. Хопкрофт, Д. Ульман; пер. с англ. — М.: Вильямс, 2000. — 384 с.

Основные термины (генерируются автоматически): частотный словарь, английский язык, слово, коллекция текстов, программное обеспечение, словарь, текст, результат сравнения, сочетание слов, частотный анализ.

Похожие статьи

Разработка алгоритмов для построения частотных словарей

Частотный словарь — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов...

Частотный минимум 90 префиксов английского языка

префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Определение авторства текста по частотным характеристикам

Приведём примеры существующего программного обеспечения по определению авторства текста.

Программа учитывает следующие характеристики языка автора: число служебных слов; используемые морфемы; уровень сложности употребленных грамматических...

Частотный минимум 90 суффиксов современного английского...

Частотный минимум 90 префиксов английского языка. префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Применение методов text mining для классификации информации...

Ключевые слова: анализ текста, ключевые слова, выделение ключевых слов, дидактические.

Ключевые слова: словарь сентиментов, тональность. Анализ тональности текста — это сложный

Определение авторства текста по частотным характеристикам.

Частотный аффиксальный минимум для чтения физической...

префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Разработка программного продукта для определения авторства...

анонимный текст, сравнительный анализ, автор, мера, частотный анализ, текст, программный продукт, шаг, баз данных программы, авторство текста.

Соотношение параметров частотности существительных с их...

Ключевые слова: существительные, частотность, коэффициент корреляции Коула, соотношение признаков, семантика.

В словаре маркируются три наиболее частотных класса устной речи и три наиболее частотных класса письменной речи.

Методы выделения ключевых слов в контексте электронных...

Ключевые слова: анализ текста, ключевые слова, выделение ключевых слов, дидактические единицы, электронное обучение.

В связи с ежегодным увеличением объемов информации, возникает проблема анализа текстов и систематизации результатов анализа текстовой...

Похожие статьи

Разработка алгоритмов для построения частотных словарей

Частотный словарь — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов...

Частотный минимум 90 префиксов английского языка

префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Определение авторства текста по частотным характеристикам

Приведём примеры существующего программного обеспечения по определению авторства текста.

Программа учитывает следующие характеристики языка автора: число служебных слов; используемые морфемы; уровень сложности употребленных грамматических...

Частотный минимум 90 суффиксов современного английского...

Частотный минимум 90 префиксов английского языка. префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Применение методов text mining для классификации информации...

Ключевые слова: анализ текста, ключевые слова, выделение ключевых слов, дидактические.

Ключевые слова: словарь сентиментов, тональность. Анализ тональности текста — это сложный

Определение авторства текста по частотным характеристикам.

Частотный аффиксальный минимум для чтения физической...

префикс, английский язык, модельная частотность, слово, убывание величин, суммарная частотность, частотный словарь, СУФФИКС, величина, группа.

Разработка программного продукта для определения авторства...

анонимный текст, сравнительный анализ, автор, мера, частотный анализ, текст, программный продукт, шаг, баз данных программы, авторство текста.

Соотношение параметров частотности существительных с их...

Ключевые слова: существительные, частотность, коэффициент корреляции Коула, соотношение признаков, семантика.

В словаре маркируются три наиболее частотных класса устной речи и три наиболее частотных класса письменной речи.

Методы выделения ключевых слов в контексте электронных...

Ключевые слова: анализ текста, ключевые слова, выделение ключевых слов, дидактические единицы, электронное обучение.

В связи с ежегодным увеличением объемов информации, возникает проблема анализа текстов и систематизации результатов анализа текстовой...