Библиографическое описание:

Кузнецов А. В. Методология исследования немецкоязычной интернет-коммуникации [Текст] // Филологические науки в России и за рубежом: материалы II междунар. науч. конф. (г. Санкт-Петербург, ноябрь 2013 г.). — СПб.: Реноме, 2013. — С. 57-59.

В статье описывается принцип сбора корпусов немецких интернет-текстов и методика их анализ на предмет установления их лингвистических особенностей, связанных с воздействием Интернета.

Ключевые слова: корпусная лингвистика, немецкий язык, интернет-коммуникация

Целью данной работы является комплексное лингвистическое исследование немецкоязычной Интернет-коммуникации. Суть работы, таким образом, заключается в поиске ответов на следующие вопросы:

1)        Каким образом Интернет влияет на язык≤ Есть ли прямая связь между техническими параметрами общения в Интернете и языковыми изменениями≤

2)        Вызывает ли Интернет какие-то принципиально новые, неизвестные ранее языковые изменения≤ Есть ли возможность выработать некую общую теорию, которая обладала бы достаточной объяснительной силой, чтобы охарактеризовать все языковые изменения в Интернет-коммуникации≤

3)        Могут ли языковые особенности коммуникации в Интернете (если таковые будут обнаружены в ходе данного исследования) проникать в другие виды коммуникации≤ Оказывает ли общение в Интернете влияние на литературный немецкий язык или на другие формы существования языка≤ Если да, то можно ли описать пути и механизм этого влияния≤

Центральной задачей данного исследования является выработка методологии, с помощью которой можно анализировать языковые изменения в Интернет-коммуникации, а также создание корпуса Интернет-текстов, который сделает такой анализ возможным. Необходимость выработки специальной методологии исследования обусловлена тем, что, несмотря на значительный научный интерес к изучению особенностей общения в Интернете и значительное количество работ по этой проблематике, методология лингвистического изучения Интернет-коммуникации пока находится в стадии формирования.

Это связано в первую очередь с отсутствием крупных корпусов Интернет-текстов, на основе которых можно было бы проводить такие исследования. Это обстоятельство может показаться достаточно странным, поскольку Интернет обеспечивает доступ к неограниченному количеству текстов любого вида на любом языке. Основная трудность состоит в сборе корпусов текстов таких жанров, как сообщение в социальной сети, программах обмена мгновенными сообщениями, сообщение электронной почты, поскольку они обслуживают в основном сферу личных контактов пользователя и не являются публичными. Тем не менее, значительное количество текстов этих Интернет-жанров публикуется самими пользователями на специализированных веб-сайтах, в том числе лингвистических.

Для проведения настоящего исследования удалось собрать корпус Интернет-текстов различных жанров.

Тексты для корпуса отбирались в течение двух лет из различных открытых источников в Интернете. Для разработки корпуса была создана специальная компьютерная программа, работающая по принципу «поискового робота» [3]. Данная программа ежедневного анализировала соответствующие Интернет-страницы, извлекая Интернет-тексты соответствующих жанров, и объединяла их отдельную текстовую базу данных.

В состав корпуса вошли тексты следующих жанров Интернет-коммуникации:

5773 сообщения пользователей из социальных сетей и программ мгновенного обмена сообщениями

8441 сообщения в Твиттере

1256 комментариев из форумов и социальных сетей

1295 записей в форумах и социальных сетях.

2931 сообщение электронной почты

1343 записи в блоге

Материал собирался таким образом, чтобы общий объем текстов различных жанров в корпусе был одинаковым.

В состав корпуса не вошли такие статичные Интернет-тексты, как веб-страницы. Данный жанр носит скорее информативный характер, поэтому представляется возможным исключить их из исследования Интернет-коммуникации.

Сообщения датируются периодом от 2004 до сентября 2012 года. Каждое сообщение принадлежит отдельному автору, что обеспечивает достаточную репрезентативность выборки и минимизирует влияние различных региональных особенностей немецкого языка.

Представляется необходимым привести также формальное описание собранного корпуса с позиций корпусной лингвистики [1].

Данный корпус следует причислить к исследовательским, предназначенным в первую очередь для изучения различных аспектов функционирования языковой системы.

С точки зрения временного периода, который охватывает данный корпус, его можно отнести к динамическим корпусам, направленным на выявление функционирования языковых феноменов на временной шкале. Данные виды корпусов также носят название мониторных.

По способу представления и хранения корпуса данных данный корпус является структурированным — вся информация в нем хранится в определенным образом организованной текстовой базе данных.

Отдельно следует отметить единица хранения корпуса данных. В корпусе хранятся как отдельные тексты различных Интернет-жанров (электронные письма, записи в блоге, форуме, комментарии, сообщения в Твиттере), так и, для отдельных жанров Интернет-коммуникации (сообщений в социальных сетям и программах мгновенного обмена сообщениями), так называемые сеансы коммуникации, состоящие из нескольких сообщений различных пользователей, представляющих диалогическое единство и объединенных общей темой. Это необходимо, поскольку сообщения в социальной сети а любом случае носят диалогический характер, и их лингвистический анализ невозможен в отрыве от диалога.

Кроме того, к каждому тексту в корпусе приложено описание на метаязыке, соответствующим требованиям корпусной лингвистики. В данном описании содержится вся необходимая информация о данном тексте.

Единица хранения выглядит следующим образом:

содержание:

haha hatte ich gern geguckt gehabt *laach tootal klasse:-) un gesung hatte ich au damals mit wenn das geguckt hatte hihihi

жанр: комментарий

источник: http://www.youtube.com/user/112gecko

год: 2011

содержание:

1. Der Kohnen ist ja so geil

2. Warum≤

1. Naja, wir sin bei mir durch die Ortschaft gefahren.. Etwas zu schnell natürlich.

2. Dann war da eine Polizeikontrolle und die haben uns angehalten, zwar nicht geblitzt aber haben uns halt verwarnt, wir seien zu schnell gefahren

1. aha un dann≤

2. Kohnen saß nur aufm Beifahrersitz weil er übelst breit war.

1. Was macht er≤ Klappt das Handschuhfach auf und ruft «BRÜCKE AN MASCHINENRAUM, WENIGER KOHLE! WIR FAHREN ZU SCHNELL!"

2. WTF! Komm mal auf so n Scheiß

1. Da musste sogar der Polizist grinsen und hat uns weitergewunken..:D

жанр: мгновенное сообщение ICQ

источник: http://german-bash.org/286596

год: 2009

Данный корпус представляется достаточным для проведения Интернет-коммуникации. Он удовлетворяет всем требованиям корпусной лингвистики, предъявляемым к корпусам такого рода. Он является, в частности:

-          репрезентативным: объем корпуса обеспечивает отражение всех особенностей Интернет-коммуникации, релевантных для данного лингвистического исследования.

-          структурированным: данные в корпусе снабжены описанием, в котором все единицы характеризуются по параметрам, необходимым для исследования.

-          обеспечивающим компьютерную поддержку: работа с корпусом осуществляется с помощью специально разработанной компьютерной программы, которая позволяет автоматизировать все поисковые операции и на порядок уменьшает усилия по извлечению нужной информации и сама производит все рутинные операции по составлению статистики.

Принцип действия данной программы неразрывно связан с методологией изучения Интернет-коммуникации.

В основе исследования лежит сравнение двух вариантов языка: литературного немецкого языка, норма которого закреплена, например, в словаре Duden Band 4, и того варианта языка или функционального подъязыка, который используется в Интернет-коммуникации. Отличия, которые будут выявлены в ходе этого сравнения, и послужат материалом для анализа. Основным методом исследования, таким образом, служит метод внутриязыкового сравнения.

В исследовании также используются общелингвистические методы лексико-семантического, функционального, грамматического и контекстного анализа, а также количественный метод и методы статистического анализа.

Кроме того, данное исследование основывается на методах корпусной лингвистики.

Методика анализа в данном исследовании проходила в три этапа:

На первом этапе были проанализированы 3 % текстов корпуса каждого жанра на предмет наличия в них отличий от литературного немецкого языка.

Затем все обнаруженные особенности, частотность которых была существенной, систематизировались и классифицировались по соответствующим уровням языковой системы.

На втором этапе корпус был проанализирован автоматически, чтобы получить точные статистические данные о распространенности того или иного языкового явления. Анализ осуществлялся с помощью специально разработанной компьютерной программы.

Принцип ее работы соответствует принципу работы любой поисковой системы. Она способна находить определенные комбинации символов в корпусе, а также, при определенной настойке, выполнять более рафинированные функции: искать определенные синтаксические конструкции или фразеологизмы. Это позволило значительно ускорить работу по анализу корпуса. Программа также позволяет анализировать информацию отдельно в текстах разных лет, что дает возможность проверить, существуют ли колебания в распространенности данного явления, и представляет результаты анализа в виде таблиц или диаграмм. Это позволяет получить точные статистические данные о распространенности того или иного языкового явления.

На третьем этапе делалась попытка установить связь данных явлений с воздействием Интернета, или, если не удалось обнаружить прямой зависимости, объяснить данное языковое явлениями другими факторами, и все же попытаться обнаружить какое-то опосредованное влияние Интернета.

Подробные результаты анализа корпуса должны быть подробно изложены в отдельных статьях. В рамках данной работы представляется возможным отметить, что анализ корпуса позволил выявить некоторые тенденции развития языковой системы немецкого языка, а также по-новому взглянуть на ту форму существования языка, которая традиционно носит название «разговорная речь».

Литература

1.      Баранов А. Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001. — 360 с.

2.      Зубов А. В., Зубова И. И. Информационные технологии в лингвистике. М.: Академия, 2004. — 208 с.

Обсуждение

Социальные комментарии Cackle