Упрощение текстов через чат GPT при обучении иностранным языкам | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 27 июля, печатный экземпляр отправим 31 июля.

Опубликовать статью в журнале

Автор:

Рубрика: Филология, лингвистика

Опубликовано в Молодой учёный №25 (524) июнь 2024 г.

Дата публикации: 23.06.2024

Статья просмотрена: 7 раз

Библиографическое описание:

Шумилова, В. А. Упрощение текстов через чат GPT при обучении иностранным языкам / В. А. Шумилова. — Текст : непосредственный // Молодой ученый. — 2024. — № 25 (524). — С. 375-378. — URL: https://moluch.ru/archive/524/115946/ (дата обращения: 17.07.2024).



Данная статья рассматривает применение чата GPT для упрощения текстов в контексте обучения иностранному языку. Цель статьи — исследование процесса упрощения сложных текстов с помощью чата GPT Prompt Perfect версии 3.5, который делает их более доступными и понятными для учащихся. В качестве материала была взята заметка из французского журнала Science & Vie Junior за март 2024 года, которая подверглась упрощению, выполненному с помощью чата. Упрощенная версия была проанализирована, были выявлены лексические и синтаксические изменения. В заключении делается вывод об эффективности упрощения текстов чатом GPT, при этом подчеркивается необходимость наличия профессионала при данном процессе для получения лучшего результата.

Ключевые слова: упрощение текста; чат GPT; иностранный язык; автоматическая обработка текстов; лексико-синтаксические трансформации.

При преподавании иностранного языка использование текстов для чтения способствует развитию лексических навыков и навыков чтения, а также обогащают социокультурные знания учащихся. Однако, аутентичные тексты могут вызывать сложности в понимании у учеников, особенно если в текстах присутствуют специализированные термины или сложные грамматические конструкции.

Чтобы облегчить понимание трудного для восприятия текста существуют стратегии по его адаптации, благодаря которой текст преобразуется, чтобы соответствовать уровню языковой подготовки учащихся. Адаптированные тексты способны помочь обучающимся лучше усвоить новую информацию, а также мотивировать их к дальнейшему изучению языка.

При упрощении текстов может быть использован чат GPT (Generative Pre-trained Transformer) — модель искусственного интеллекта, в функции которой входит общение, создание контента и упрощение текстов на основе входных данных. Возможности чата GPT позволяют эффективно упрощать содержание, сохраняя при этом основные идеи и смысл. Данная статья посвящена рассмотрению различных стратегий адаптации текста при автоматической обработке на примере упрощенного текста на французском языке, сделанного одним из популярных французских чатов GPT.

Одной из моделей адаптации текстов является симплификация — упрощение языка изложения путем сокращения предложений, упрощения синтаксических связей и использования более простой лексики [2]. При обработке текстов с целью обучения иностранным языкам часто применяется именно эта модель адаптации.

Первухиной выделяются следующие стратегии по симплификации текста: лексическое упрощение, синтаксическое упрощение и компрессия (сжатие) [2]. Франкоязычные лингвисты (Гала, Франсуа, Жавури-Древе, Зилгер) выделяют такие уровни симплификации как лексический, синтаксический и дискурсивный [6]. На дискурсивном уровне при симплификации происходит замена личных местоимений именной группой, объяснение логических связей, добавление пояснений и примеров. [6].

Лексическое упрощение включает в себя замену заимствованных слов, абстрактной и специальной лексики более употребимыми словами. При синтаксическом упрощении происходит замена мало употребимых (или книжных) времен, разделение сложных предложений на простые и замена сложных грамматических конструкций [7]. Компрессия подразумевает сжатие текста, при котором остается только основная информация и удаляется дополнительная. Существует несколько видов компрессии: лексическая, графическая, семантическая, стилистическая и синтаксическая [3]. Основные языковые приемы сжатия текста включают исключение, обобщение и упрощение [1].

Процесс упрощения текстов с использованием чата GPT включает несколько этапов. Сначала пользователь предоставляет исходный текст и дает конкретные команды для модели GPT (при этом основной запрос должен заключаться в упрощении). Затем чат генерирует упрощенную версию текста, учитывая указанные команды. После этого пользователь рассматривает получившийся текст и, в случае необходимости, продолжает взаимодействие с чатом, чтобы добиться желаемого результата.

Как правило, автоматическое упрощение фокусируется на двух задачах: лексическом и синтаксическом упрощении. Лексическое упрощение направлено на выявление и замену сложных слов более простыми синонимами. Синтаксическое упрощение заключается в упрощении структуры предложения. Нейросетью выявляются сложные синтаксические структуры, например, сложноподчиненные предложения, которые могут вызывать трудности у читателей [8].

В работе Реми Кардона описывается следующая последовательность действий при автоматическом упрощении на синтаксическом уровне:

1) «выполнение синтаксического анализа предложения;

2) применение правил, позволяющих упростить синтаксическую структуру на уровне предложения;

3) произведение синтаксического упрощения в тексте».

В той же работе описан процесс автоматического упрощения на лексическом уровне:

1) «обнаружение слов, которые могут представлять трудности для понимания;

2) составление списка возможных эквивалентов слова для замены;

3) поиск наиболее простого и адекватного в контексте эквивалента;

4) произведение лексической замены» [5].

Для более полного понимания процесса упрощения текстов с использованием чата GPT, проанализируем текст на французском языке, упрощенный нейросетью. Для исходного текста возьмем небольшую заметку «Qui fait le show dans le ciel austral?» из французского журнала Science & Vie Junior за март 2024 года (161 слово):

Notre étoile a la manie de nous bombarder de particules cosmiques. En percutant l'atmosphère, elles créent des flashs lumineux près des pôles: des aurores, qui prennent des couleurs variées selon les gaz rencontrés. Lors des orages géomagnétiques — périodes de forte excitation solaire, les aurores se manifestent plus souvent et plus loin des pôles, comme ici au-dessus de la Nouvelle-Zélande, début décembre, mais le photographe a capturé ce jour-là une merveille bien plus rare. Le halo tout en haut de l’image est un arc rouge auroral stable. Peu visible à fosil nu, ce phénomène n’a été découvert qu'en 1956. Contrairement aux couleurs dansantes de aurore, l'arc auroral reste fixe. Son mécanisme de formation, encore discuté, serait lié à un flux de chaleur dans les hautes couches de l'atmosphère, qui provoque cette libération d'énergie lumineuse. Sachant que l'activité solaire, qui suit des cycles de onze ans, devrait atteindre son maximum cette année, des shows du même type risquent donc de se multiplier.

Данный текст был упрощен чатом GPT Prompt Perfect, которому задалась следующая команда: Simplifier le texte. Чат упростил заметку следующим образом:

Le soleil envoie souvent des particules qui, en touchant l'air près des pôles terrestres, créent des aurores aux couleurs variées. Quand il y a beaucoup d'activité solaire, ces aurores se voient plus fréquemment et plus loin des pôles, comme récemment en Nouvelle-Zélande. Là, un photographe a pris en photo une aurore fixe, un phénomène rare et peu visible découvert pour la première fois en 1956. On pense que cette aurore stable est formée par de la chaleur dans les hautes couches de l'air. Comme l'activité solaire est plus intense tous les onze ans et attend son pic cette année, on pourrait observer plus souvent de telles aurores (108 слов).

При преобразовании текста чат произвел лексические и синтаксические изменения. Также можно видеть, что чат уменьшил объем текста примерно на треть, при этом сократив количество предложений (из 8 предложений осталось 5).

Рассмотрим, какие лексические упрощения были проделаны чатом. Нейросеть заменила сложные астрономические термины более простыми и понятными аналогами. Из словосочетания particules cosmiques было удалено прилагательное cosmiques , в итоге осталось существительное particules . Вместо словосочетания forte excitation solaire было употреблено beaucoup d'activitésolaire . Словосочетание percuter l'atmosphère изменилось не только лексически, но и грамматически: инфинитив percuter был преобразован в participe présent touchant , а существительное l'atmosphère заменилось на l'air ; в итоге получилось touchant l'air . Также некоторые слова были заменены на синонимы, соответствующие контексту: инфинитив bombarder изменился на более простой глагол в той же грамматической форме envoyer ; аналогичное изменение произошло и с инфинитивом se manifester , ставшим se voir . Наречие lors было заменено на более употребимое и понятное quand . В другом предложении чат преобразовал сказуемое serait lié, выбрав новый менее сложный для понимания глагол, в итоге получилось est formée . Слово des shows , подразумевавшее северные сияния, чат решить убрать из текста и вставить вместо него уже встречавшееся ранее существительное des aurores.

Помимо удачных лексических упрощений, осуществленных нейросетью, стоит отметить и спорные. Существительное phénomène заменило начальный вариант merveille, однако нельзя сказать, что этот синоним значительно проще прошлой версии. Также неоднозначным преобразованием стала замена существительного maximum на близкий по сложности для понимания эквивалент pic в словосочетании atteindre son pic. Также стоит отметить, что в словосочетании suivre des cycle de 11 ans чат посчитал необходимым осуществить не только лексическое преобразование, но и переписать число 11 буквами: être plus intense tous les onze ans . Несмотря на это, словосочетание сохранило научный стиль и, соответственно, свою сложность.

Нами была подготовлена таблица на основе анализа лексических изменений в тексте:

Лексические преобразования

Исходный текст

Текст, упрощенный чатом GPT

particules cosmiques

particules

forte excitation solaire

beaucoup d'activitésolaire

percuter l'atmosphère

touchant l'air

bombarder

envoyer

se manifester

se voir

lors

quand

shows

des aurores

merveille

phénomène

serait lié

est formée

maximum

pic

suivre des cycle de 11 ans

être plus intense tous les onze ans

Проанализируем синтаксические изменения. В процессе упрощения чат изменил структуру некоторых предложений и уменьшив их количество с 8 до 5, сократив объем информации и объединив некоторые фразы. Рассмотрим, как изменилась структура предложений в упрощенном тексте. В седьмой фразе о природе северного сияния чат изменил структуру предложения, выбрав новый глагол и упростив его форму: Son mécanisme de formation (…) serait lié à un flux de chaleur (…). -> On pense que cette aurore stable est form é e par de la chaleur dans les hautes couches de l'air. В исходном тексте используется пассивная форма conditionnel présent, однако в процессе упрощения чат выбрал для него время présent, при этом сохранив пассивную форму глагола. Также была переформулирована первая часть фразы: из предложения в пассивном залоге данная часть фразы была преобразована в сложноподчиненное предложение. Сделано это было следующим образом: определение encore discuté , выраженное наречием и глаголом в participe passé encore discuté в первом варианте фразы Son mécanisme de formation, encore discuté, serait lié à(…) было преобразовано в более простую для понимания безличную конструкцию On pense que , которая и сделала предложение сложноподчиненным: On pense que cette aurore stable est formée par (…).

Также при преобразовании текста чатом GPT происходит объединение некоторых предложений. При упрощении нейросетью были объединены первое и второе предложения из журнала: Notre étoile a la manie de nous bombarder de particules cosmiques. En percutant l'atmosphère, elles créent des flashs lumineux près des pôles: des aurores, qui prennent des couleurs variées selon les gaz rencontrés. -> Le soleil envoie souvent des particules qui, en touchant l’air près des pôles terrestres, créent des aurores aux couleurs variées. При объединении двух фраз структура полученного на выходе предложения изменилась — оно стало сложносочиненным. Однако в процессе объединения чат не убрал форму gérondif, представленную в словосочетании en percutant l'atmosphère . Нейросеть лишь заменила данное словосочетание на более простое для понимания en touchant l’air и поместила его в середину фразы. Также чат объединил часть третьего, четвертое предложения в одно, сокращая избыточную информацию и передавая основные идеи более компактно. Чат выделил из третьего предложения информацию о фотографе, запечатлевшем похожее на северное сияние явление — красные полярные дуги, и вынес ее в отдельное предложение. Lors des orages géomagnétiques- périodes de forte excitation solaire, les aurores se manifestent plus souvent et plus loin des pôles, comme ici au-dessus de la Nouvelle-Zélande, début décembre, mais le photographe a capturé ce jour-là une merveille bien plus rare. - > Là, un photographe a pris en photo une aurore (…). Затем нейросеть добавила в нее основную информацию из следующих трех предложений. От четвертого предложения осталось только прилагательное rouge , которое вводило новую информацию о цвете северного сияния. Аналогичная ситуация произошла и с шестым предложением: чат сохранил лишь прилагательное fixe, которое описывало фиксированное положение дуги северного сияния в небе. Из пятого предложения была взята информация о дате открытия красных полярных дуг как отдельного природного явления. Peu visible à fosil nu, ce phénomène n’a été découvert qu'en 1956. ->(…) un phénomène rare et peu visible découvert pour la première fois en 1956. В итоге получилось следующее предложение: Là, un photographe a pris en photo une aurore rouge fixe, un phénomène rare et peu visible découvert pour la première fois en 1956.

Анализ синтаксических изменений в тексте помог нам подготовить следующую таблицу:

Синтаксические преобразования

Исходный текст

Текст, упрощенный чатом GPT

Son mécanisme de formation, encore discuté, serait lié à un flux de chaleur dans les hautes couches de l'atmosphère, qui provoque cette libération d'énergie lumineuse.

On pense que cette aurore stable est formée par de la chaleur dans les hautes couches de l'air.

Notre étoile a la manie de nous bombarder de particules cosmiques. En percutant l'atmosphère, elles créent des flashs lumineux près des pôles: des aurores, qui prennent des couleurs variées selon les gaz rencontrés.

Le soleil envoie souvent des particules qui, en touchant l’air près des pôles terrestres, créent des aurores aux couleurs variées.

(…) mais le photographe a capturé ce jour-là une merveille bien plus rare.Le halo tout en haut de l’image est un arc rouge auroral stable. Peu visible à fosil nu, ce phénomène n’a été découvert qu'en 1956. Contrairement aux couleurs dansantes de aurore, l'arc auroral reste fixe.

Là, un photographe a pris en photo une aurore rouge fixe, un phénomène rare et peu visible découvert pour la première fois en 1956.

При упрощении чатом текста также происходит исключение. Например, из первого предложения исходной версии было удалено дополнение, описывающее явление северного сияния des flashs lumineux près des pôles . Также было исключено объяснение, такие как описание образования цвета у северного сияния в зависимости от газов в атмосфере qui prennent des couleurs variées selon les gaz rencontrés . Помимо этого, из третьего предложения было исключено уточнение des orages géomagnétiques , касающееся периодов высокой активности солнца. Также в 7 предложении первоначального варианта был изъят отрывок об освобождении световой энергии qui provoque cette libération d'énergie lumineuse , который относился к существительному un flux de chaleur . В конечном варианте предложение преобразовалось следующим образом: Son mécanisme de formation, encore discuté, serait lié à un flux de chaleur dans les hautes couches de l'atmosphère, qui provoque cette libération d'énergie lumineuse. -> On pense que cette aurore stable est formée par de la chaleur dans les hautes couches de l’air.

Проанализировав упрощенный текст, можно сказать, что чат GPT успешно справился со своей задачей, хотя некоторые его преобразования нельзя назвать упрощениями. В обработанном тексте чат использовал два основных подхода к упрощению: лексический и синтаксический. В упрощенной версии сохранена основная информация о явлении северного сияния, в то же время использованы более простые конструкции, что делает текст доступнее для изучающих французский язык.

Эффективность упрощения текстов с использованием чата GPT при обучении иностранному языку подтверждается его способностью автоматически упрощать сложные тексты и делать их более доступными для учащихся. В свою очередь, упрощенные тексты помогают студентам лучше понимать содержание материала на иностранном языке, улучшая их навыки чтения. Однако, даже при положительных результатах использования чата GPT для упрощения текстов, необходимо отметить, что он всего лишь инструмент в руках человека, который может быть использован в образовательных целях, но при обязательном участии человека-профессионала.

Несмотря на эти трудности, чат GPT остаётся перспективным инструментом при обучении иностранным языкам. С дальнейшим развитием технологий можно ожидать еще более эффективных и инновационных подходов к упрощению текстов, которые в свою очередь потребуют экспертной оценки.

Литература:

  1. Андреянова И. Э. Сжатое изложение. Приемы компрессии текста. [Электронный ресурс]: // 2013 URL: https://nsportal.ru/shkola/materialy-k-attestatsii/library/2013/11/08/szhatoe-izlozhenie-priyomy-kompressii-teksta
  2. Первухина С. В. Особенности номинаций в адаптированных текстах [Электронный ресурс]: состояние проблемы и перспективы исследований // Киберленинка. 2013. URL: https://cyberleninka.ru/article/n/osobennosti-nominatsiy-v-adaptirovannyh-tekstah
  3. Толстолуцкая Е. В., Синельников Ю. Г. Классификация основных способов компрессии информации в текстах малого формата современной французской прессы [Электронный ресурс]: // Киберленинка. 2012. URL: https://cyberleninka.ru/article/n/klassifikatsiya-osnovnyh-sposobov-kompressii-informatsii-v-tekstah-malogo-formata-sovremennoy-frantsuzskoy-pressy
  4. Brouwers L., Bernhard D., Ligozat A., François T. Syntactic sentence simplification for French [Электронный ресурс] // Aclanthology. 2014. URL: https:// aclanthology.org/W14–1206/
  5. Cardon R. Simplification Automatique de Textes Techniques et Spécialisés [Электронный ресурс] // 2021. URL: https://hal.science/tel-03343769/document#page107
  6. Gala N., François T., Javourey-Drevet L., Ziegler J. C. La simplification de textes, une aide à l’apprentissage de la lecture [Электронный ресурс] // Cairn.info. 2018. № 199. URL: https://www.cairn.info/revue-langue-francaise-2018–3-page-123.htm
  7. Elguendouze S. Text simplification (State of the art) [Электронный ресурс] // ResearchGate. 2020. URL: https://www.researchgate.net/publication/346970112_Text_simplification_State_of_the_art
  8. Althunayyan S., Azmi A. Automated Text Simplification: A Survey [Электронный ресурс] // ResearchGate. 2021. URL: https://www.researchgate.net/publication/349899397_Automated_Text_Simplification_A_Survey
Основные термины (генерируются автоматически): GPT, чат, предложение, северное сияние, текст, иностранный язык, исходный текст, синтаксическое упрощение, упрощение текстов, автоматическое упрощение.


Ключевые слова

иностранный язык, упрощение текста, чат gpt, автоматическая обработка текстов, лексико-синтаксические трансформации

Похожие статьи

Задать вопрос