Возможности использования лингвистических корпусов для исследования немецких образных сравнений с компонентом Lavastrom | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Автор:

Рубрика: Филология, лингвистика

Опубликовано в Молодой учёный №37 (327) сентябрь 2020 г.

Дата публикации: 12.09.2020

Статья просмотрена: 47 раз

Библиографическое описание:

Годяева, Ю. И. Возможности использования лингвистических корпусов для исследования немецких образных сравнений с компонентом Lavastrom / Ю. И. Годяева. — Текст : непосредственный // Молодой ученый. — 2020. — № 37 (327). — С. 145-146. — URL: https://moluch.ru/archive/327/73498/ (дата обращения: 19.11.2024).



Настоящая статья исследует возможности применения лингвистического корпуса для исследования немецких образных сравнений с secundum «Lavastrom», а также проводится семантический анализ приведенных лексических единиц с этим компонентом.

Ключевые слова: корпус, образное сравнение, Lavastrom.

На сегодняшний день лингвистический корпус можно по праву отнести к универсальным инструментам решения различных лингвистических задач.

В рамках данной работы представлены возможности применения электронных корпусов в качестве инструмента корпусной лингвистики, позволяющего произвести поиск в определенных параметрами контекстах. Исследование проводится на материале немецкого языка, его исходным объектом являются образные сравнения с союзом wie — как. Корпусный анализ этой конструкции имеет прикладное значение: с его помощью можно осуществить поиск переводческого эквивалента, адекватного тексту оригинала, а также решить конкретные исследовательские задачи, например:

1) Описать семантические особенности представленных образных сравнений;

2) Определить лингвистический статус сравнений;

3) Установить степень вариативности предложенных лексических единиц;

4) Определить, в каких ситуациях могут употребляться данные лексические единицы.

Актуальность корпусной тематики обусловлена активным развитием электронных иноязычных и русскоязычных собраний текстов, представляющих ценный языковой материал для лингвистики и литературоведения. Корпусная лингвистика существует чуть более полувека, однако за это время она успела стать одним из ведущих направлений современного языкознания. Согласно данным корпусов английского языка, термин corpus linguistics был впервые использован в 1977 году, а в России это, по сути, наука XXI века: ее активное развитие пришлось на самое начало третьего тысячелетия.

Каждый год появляются новые корпусы, новые форматы и новые типы данных. Значительное число корпусов создается и уже создано для многих языков. Они активно используются как для лингвистических исследований, так и в прикладных целях. Два крупнейших специализированных каталога CLARIN (www.clarin.eu/) и ELRA (http://www.elra.info/) содержат информацию о более чем трех тысячах корпусов. У любого пользователя есть возможность посмотреть, сколько ресурсов создано для английского языка, сколько для русского, немецкого, французского или для любого другого.

Крупнейшим корпусом русского языка является НКРЯ, созданный по инициативе лингвистов из Москвы, Санкт-Петербурга, Воронежа и других городов. Что касается немецкого языка, большую известность получили Корпус немецкого языка Cosmas II — крупнейшее в мире электронное собрание немецких текстов, поддерживаемое Институтом немецкого языка в Маннгейме — и Корпус немецкого языка DWDS, созданный Берлинско-Бранденбургской Академией наук.

В частности, данное исследование отталкивается от текстов современного швейцарского писателя Мартина Зутера. Так, в его романе «Лила, Лила» в описании состояния героя по имени Джекки, который уже на протяжении долгого времени страдает от изжоги, присутствует компонент Lavastrom : «Meistens war es die Magensäure, die ihn weckte. Wie ein Lavastrom schoss sie aus seinem Magen und versengte ihm die Speiserohre”. Автор книги сопоставляет изжогу с излиянием лавы, придавая тем самым яркую эмоциональную окраску описанию физического состояния героя. В качестве основания сравнения выступает признак «горячий, обжигающий», характеризующий и извергающуюся вулканическую лаву, и симптомы больного. Последние могут быть описаны выражением «Brennen hinter dem Brustbein — жжение за грудиной», что также поддерживается значением глагола «versengen — обжигать». Таким образом, создается экспрессивное описание неприятных симптомов недуга.

Для того, чтобы решить поставленные ранее исследовательские задачи, обратимся к корпусу DWDS и изучим иные значения компонента Lavastrom. Корпус предлагает следующие контексты с лексемой Lavastrom в роли образа сравнения:

(1) «Links und rechts winden sich die schmutzig braunen Häuser der Favelas wie erkaltete Lavaströme die Hänge hinab, vorbei an den weißen Gebäuden der vornehmen Viertel». [Die Zeit, 15.10.2009, Nr. 43]. Здесь компонент Lavastrom в соединении с причастием II «erkaltet» выступает в качестве образа сравнения при описании фавел (трущоб) в Рио-де-Жанейро, построенных в 70-е гг. XX в. в результате ложной урбанизации. При помощи сравнения автор статьи выделяет цвет, который также символически (на фоне белых вилл богатого района) указывает на состояние жилого массива, шаткость, абсолютную непригодность для проживания граждан в нем.

(2) «Man fährt praktischerweise hinter den Reisebussen her oder dorthin, woher die Touristen wie Lavaströme den Hügel herablaufen.» [Die Zeit, 17.05.2001, Nr. 21]. В приведенном примере объектом сравнения выступает компонент, представленный в виде одушевленного существительного «Touristen”; описываются не цвет и состояние, а движение общественных масс, подчеркнутое значением глагола «herablaufen — вытекать».

(3) «Blut, das dem Tier wie ein dunkler Lavastrom aus dem Rachen quoll». [Dürrenmatt, Friedrich: Der Richter und sein Henker, Reinbek bei Hamburg: Rowohlt 1965 [1952], S. 42]. Здесь автор сравнивает цвет крови с цветом раскаленной вулканической лавы, подчеркивая его описательным определением «dunkel».

В ходе анализа мы также обратились к параллельному корпусу Национального Корпуса Русского Языка и обнаружили пример, в котором компонент «кровь» является не объектом сравнения, а, наоборот, образом, в то время как «лава» становится primum (объектом): «Словно кровь из раны, фонтаном бьёт раскалённая лава». [«Словно кровь из раны, бьёт раскалённая лава»: екатеринбургский фотограф снял извержение вулкана на Камчатке, 18.10.2016]. Следовательно, можно констатировать устойчивую связь между компонентами «кровь» и «лава», в которых tertium comparationis, основанием сравнения, выступает цвет. Можно также предположить, что сходства между кровью и лавой основаны не только на цвете, но и на физическом свойстве текучих тел — вязкости.

В Мангеймском корпусе немецкого языка (ReDeKo) находим пример: «Die bleierne Zeit floss wie ein Lavastrom dahin.”, в котором объектом сравнения выступает фразеологическая единица — die bleierne Zeit (свинцовые времена: время, не оставляющее надежды на изменения и вызывающее чувство безысходности), а образом сравнения — поток лавы. Благодаря компоненту ‘wie ein Lavastrom’ создается эффект медленного течения этого времени, бесконечно долгого и тяжелого, как стекающая вниз по горе вулканическая лава.

Значение данного примера существенно отличается от предыдущего сравнения: «…wie ein Lavastrom unaufhörlich heiß brodelnd, flossen die Songs von Deep Purple...” Перевод: «…песни Deep Purple лились, подобно непрерывно кипящему потоку вулканической лавы…». При помощи компонента Lavastrom автор статьи указывает на ошеломительный успех известной в 60-е гг. 20 в. британской рок-группы Дип Пёрпл. Значение выражения подчеркивается лексическими единицами unaufhörlich heiß brodelnd и fließen.

Таким образом, можно сделать вывод, что компонент Lavastrom способен употребляться в разных образных сравнениях в сочетании с различными лексическими единицами, описывая не только специфическую боль, которую испытывает человек при изжоге, но и цвет («Blut...wie ein dunkler Lavastrom»), состояние предмета («Häuser... wie erkältete Lavaströme»), движение огромного потока людей («wie Lavaströme…herablaufen»), скорость и степень протекания какого-либо явления. Несмотря на то, что данные образные сравнения фиксируются в корпусах (но не словарях), сам компонент «Lavastrom», в качестве secundum достаточно прозрачен и имеет следующие значения: «багровый, темно-красный», «разрушенный, пришедший в упадок, обветшалый», «медленный, неподвижный», «ошеломительный, быстрый».

Так, используя данные лингвистических корпусов, можно решить конкретные прикладные задачи и получить достоверные сведения о существовании, распространении, функционировании и частотности употребления той или иной лексической единицы в языке, что является немаловажным для проведения исследований в области языкознания.

Основные термины (генерируются автоматически): немецкий язык, DWDS, корпус, компонент, активное развитие, английский язык, вулканическая лава, корпусная лингвистика, лингвистический корпус, Русский Язык.


Ключевые слова

корпус, образное сравнение, Lavastrom

Похожие статьи

Особенности корпусного анализа немецкого образного сравнения с компонентом «Ангела Меркель»

В настоящей статье рассматриваются немецкие образные wie-сравнения с прецедентным именем «Ангела Меркель», а также проводится анализ компаративных структур с применением лингвистического корпуса DWDS и его специальных инструментов.

Сравнительный анализ методов Наивного Байеса и SVM алгоритмов при классификации текстовых документов

В статье раскрывается понятие классификации текстовых документов для автоматического обнаружения категорий по текстам. Проводится сравнительный анализ двух самых главных алгоритмов, которыми являются методы наивного Байеса и SVM. Делается вывод, что ...

Парсинг сайтов как метод сбора данных для лингвистических исследований

В статье автор делится кодом на языке программирования Python для сбора лингвистических данных, а также проводит исследование с полученными данными, используя количественный метод анализа.

Анализ тональности высказываний в Twitter

В данной работе рассматривается применение методов машинного обучения с учителем к анализу тональности русскоязычных высказываний в социальной сети Twitter. Подробно разбираются методы предварительной обработки текста, описываются способы анализа тон...

PlantUML: создание диаграмм с использованием текстового синтаксиса

В статье автор рассматривает PlantUML как эффективный инструмент для создания диаграмм в разработке программного обеспечения, преимущества использования текстового синтаксиса, разнообразие поддерживаемых диаграмм.

Автоматизированная разметка набора открытых данных с применением больших языковых моделей

В статье автор описывает процесс автоматизированной разметки набора текстовых данных посвящённых тематике вакцинации с применением больших языковых моделей.

Сравнительный анализ методов поиска особых точек и дескрипторов при группировке изображений по схожему содержанию

В данной работе проводится сравнительный анализ методов ORB, BRISK, AKAZE, обнаруживающих особые точки и описывающих их дескрипторы на изображении. Разработан алгоритм, который на основе работы данных методов группирует фотографии по степени сходства...

Преимущества использования данных Corpus of Contemporary American English при обучении грамматике английского языка

В статье автор анализирует функции Corpus of Contemporary American English и выделяет его основные преимущества, которые помогут преподавателям и обучающимся в изучении грамматики английского языка.

Использование гиперграфовой базы данных HypergraphDB для работы со словарями WordNet

В данной статье рассматриваются ключевые аспекты работы с лингвистической моделью WordNet внутри графовой базы данных HypergraphDB.

Векторизация слов для нечеткого поиска в вопросно-ответных системах

В статье автор исследует применение векторизации слов для нечеткого поиска в вопросно-ответных системах, путем улучшения точности через современные подходы к векторизации слов и поиск семантически близких слов.

Похожие статьи

Особенности корпусного анализа немецкого образного сравнения с компонентом «Ангела Меркель»

В настоящей статье рассматриваются немецкие образные wie-сравнения с прецедентным именем «Ангела Меркель», а также проводится анализ компаративных структур с применением лингвистического корпуса DWDS и его специальных инструментов.

Сравнительный анализ методов Наивного Байеса и SVM алгоритмов при классификации текстовых документов

В статье раскрывается понятие классификации текстовых документов для автоматического обнаружения категорий по текстам. Проводится сравнительный анализ двух самых главных алгоритмов, которыми являются методы наивного Байеса и SVM. Делается вывод, что ...

Парсинг сайтов как метод сбора данных для лингвистических исследований

В статье автор делится кодом на языке программирования Python для сбора лингвистических данных, а также проводит исследование с полученными данными, используя количественный метод анализа.

Анализ тональности высказываний в Twitter

В данной работе рассматривается применение методов машинного обучения с учителем к анализу тональности русскоязычных высказываний в социальной сети Twitter. Подробно разбираются методы предварительной обработки текста, описываются способы анализа тон...

PlantUML: создание диаграмм с использованием текстового синтаксиса

В статье автор рассматривает PlantUML как эффективный инструмент для создания диаграмм в разработке программного обеспечения, преимущества использования текстового синтаксиса, разнообразие поддерживаемых диаграмм.

Автоматизированная разметка набора открытых данных с применением больших языковых моделей

В статье автор описывает процесс автоматизированной разметки набора текстовых данных посвящённых тематике вакцинации с применением больших языковых моделей.

Сравнительный анализ методов поиска особых точек и дескрипторов при группировке изображений по схожему содержанию

В данной работе проводится сравнительный анализ методов ORB, BRISK, AKAZE, обнаруживающих особые точки и описывающих их дескрипторы на изображении. Разработан алгоритм, который на основе работы данных методов группирует фотографии по степени сходства...

Преимущества использования данных Corpus of Contemporary American English при обучении грамматике английского языка

В статье автор анализирует функции Corpus of Contemporary American English и выделяет его основные преимущества, которые помогут преподавателям и обучающимся в изучении грамматики английского языка.

Использование гиперграфовой базы данных HypergraphDB для работы со словарями WordNet

В данной статье рассматриваются ключевые аспекты работы с лингвистической моделью WordNet внутри графовой базы данных HypergraphDB.

Векторизация слов для нечеткого поиска в вопросно-ответных системах

В статье автор исследует применение векторизации слов для нечеткого поиска в вопросно-ответных системах, путем улучшения точности через современные подходы к векторизации слов и поиск семантически близких слов.

Задать вопрос