Библиографическое описание:

Грахольская М. И. Соотношение параметров частотности существительных с их семантическими характеристиками (на материале словаря Longman) [Текст] // Современная филология: материалы IV междунар. науч. конф. (г. Уфа, март 2015 г.). — Уфа: Лето, 2015. — С. 36-38.

Данная статья посвящена выявлению соотношений семантических признаков высокочастотной именной лексики с частотными параметрами, а также сопоставлению частотного ядра с семантикой существительных общеязыковой системы. Для достижения поставленной задачи используется коэффициент корреляции Коула.

Ключевые слова: существительные, частотность, коэффициент корреляции Коула, соотношение признаков, семантика.

 

В современной филологии много внимания уделяется выявлению соотношений между отдельными элементами языковой системы, а также сопоставительному анализу общеязыковой системы и различных ее участков [1; 3; 5; 6]. Однако, такой участок языковой системы, как высокочастотная лексика, не получил до сих пор системного исследования в плане выявления соотношений между разноуровневыми и разноаспектными признаками частотных единиц, определяющими их специфику и позволяющими выявить наиболее важные виды структурной организации этой группы лексических единиц.

В данном исследовании главной задачей является выявление корреляций между различными рангами частотности существительных и их семантическими характеристиками. Нам представляется интересным сопоставить лексические единицы, относящиеся к разным рангам частотности, и выявить уровень их сходства и различия в пространстве семантических параметров.

Наше исследование основано на изучении существительных с разными показателями употребительности, включенных в толковый словарь Longman Dictionary of Contemporary English [10], в котором отдельно учитывается частотность использования слова как в устной речи, так и в письменной речи. Их число достигает 25 282. В соответствии с данными словаря, выделяется четыре основных ранга частотности (класса). В словаре маркируются три наиболее частотных класса устной речи и три наиболее частотных класса письменной речи. Четвёртый класс обозначен отсутствием специальных помет (немаркированный) и представляет собой конъюнкцию частотности устной и письменной речи. В качестве помет в словаре выбраны S с индексом 1, 2, 3 для устной речи и W с индексом 1, 2, 3 для письменной речи: S 1 указывает на то, что слово входит в состав 1000 наиболее употребительных слов в устной речи; S 2 — в диапазон от 1001 и 2000; S 3 –в диапазон от 2001 и 3000; W 1 — указывает на то, что слово входит в состав 1000 наиболее употребительных слов в письменной речи; W 2 — в диапазон от 1001 и 2000; W 3 — в диапазон от 2001 и 3000. Стоит отметить, что в результате нашего отбора одно и то же слово не попадает в несколько выделенных групп, а относится к своему частотному классу.

В состав первых трех тысяч общеупотребительных слов входит 1432 существительных, т. е. количество существительных, относящихся к четвертому рангу, равно 23 850. По таблице случайных чисел было отобрано 1192 лексических единицы, что составляет 5 % от общего числа. Из 1432 частотных существительных были исключены случаи, когда слово является частотным только в устной или только в письменной речи, а также чьи показатели для устной и письменной речи не совпадают. Общее число существительных, привлекаемых к исследованию, составило, таким образом, 1810 единиц, их распределение показано в таблице 1. В качестве помет в нашей работе выбраны Р-1, Р-2, Р-3, указывающие на то, что слово входит в состав 1000, 2000 и 3000 наиболее употребительных слов соответственно. Показатель Р-4 относится к остальным лексическим единицам.

Таблица 1

Распределение существительных по частотности

Р-1

Р-2

Р-3

Р-4

265

231

122

1192

 

Для описания материала в пространстве семантических признаков используется схема, апробированная в работе Е. А. Жоголева «Факторы, определяющие аффиксальную сочетаемость существительных в современном английском языке» [4] и включающая наиболее распространенные семантические характеристики имени существительного. К ним относятся: исчисляемость ИСЧ (fact), неисчисляемость НИСЧ (light), абстрактность АБСТ (duty), конкретность КНКР (board), собирательность СБРТ (community), вещественность ВЩСТ (blood), имя деятеля ИДТ (teacher), имя действия ИДС (pressure), имя места ИМТ (town). Стоит отметить, что учитывается основное значение существительного, т. к. именно в этом значении данное слово является наиболее употребительным. Необходимо указать, что ряд слов в своих основных значениях могут выступать (а) как исчисляемые, (б) как неисчисляемые (effect, mind и др.).

В таблице 2 показано количество существительных в каждой группе, обладающих определенным набором семантических признаков. Эта таблица состоит из двух частей: в левой части помещены абсолютные числа, в правой части — их процентные соотношения.

Таблица 2

Семантика существительных (абсолютные числа и процентные соотношения)

Признаки

Р-1

Р-2

Р-3

Р-4

Р-1

Р-2

Р-3

Р-4

 

265

231

122

1192

100 %

100 %

100 %

100 %

ИСЧ

216

178

102

829

81,5

77,1

83,6

69,5

НИСЧ

85

89

36

463

32,1

38,5

29,5

38,8

АБСТ

110

66

39

244

41,5

28,6

32,0

20,5

КНКР

126

163

83

702

47,5

70,6

68,0

58,9

СБРТ

35

15

6

49

13,2

6,5

4,9

4,1

ВЩСТ

9

7

3

73

3,4

3,0

2,5

6,1

ИДС

38

45

20

247

14,3

19,5

16,4

20,7

ИДТ

7

11

9

155

2,6

4,8

7,4

13,0

ИМТ

38

12

9

54

14,3

5,2

7,4

4,5

 

Для выявления взаимосвязей между частотными и семантическими параметрами существительных, принадлежащих к различным классам частотности, привлекается корреляционный анализ (мера Коула) [2; 7; 8; 9; 10]. Помещенная ниже корреляционная таблица содержит значения меры Коула для данных соотношений. В строках таблицы 3 помещены частотные характеристики. В столбцах указаны семантические признаки.

Таблица 3

Коэффициент корреляции Коула частотных и семантических характеристик существительных

 

ИСЧ

НИСЧ

АБСТ

КНКР

СБРТ

ВЩСТ

ИДС

ИДТ

ИМТ

Р-1

0,27

-0,17

0,12

-0,08

0,05

-0,40

-0,11

-0,70

0,16

Р-2

0,15

0,02

0,06

0,25

0,05

-0,40

-0,02

-0,53

-0,10

Р-3

0,39

-0,20

0,10

0,19

0,00

-0,51

-0,17

-0,27

0,02

Р-4

-0,25

0,10

-0,15

-0,08

-0,13

0,42

0,09

0,55

-0,22

 

Статистически значимые корреляции выделены жирным шрифтом. В дальнейшем учитываются только эти корреляции. Уровень значимости принимается равным р=0,01 (df = ∞). В нашей работе при анализе коэффициентов корреляции мы будем условно рассматривать все значения коэффициента корреляции Коула по модулю от 0 до 0,1 как слабые, от 0,1 до 0,3 — как средние по силе, от 0,3 до 0,6 — сильные. Коэффициенты от 0,6 до 1 считаются сверхсильными.

Отмечено 29 статистически значимых корреляций из 36 возможных (80,6 %). Из них 15 положительных (51,7 %), 14 отрицательных (48,3 %). Среди сильных положительных корреляций стоит выделить соотношение между признаками Р-3 и ИСЧ (certificate, shelf), Р-4 и ВЩСТ (batter, ivory), Р-4 и ИДТ (inheritor, robber).

Положительная корреляция означает взаимную обусловленность признаков, их совместную встречаемость в лексической единице. При отрицательной корреляции имеет место взаимная несовместимость характеристик.

Указанные четыре класса вступают в ряд контрарных (наличие статистически значимой зависимости для одних и тех же признаков в обеих соотносимых выборках, но с различными знаками) и контрадикторных (наличие значимой корреляции в одной выборке при отсутствии зависимости в другой) оппозиций [7] относительно семантических параметров. Между признаками, отражающими 1 и 2 ранги частотности, отмечено две контрадикторных и одна контрарная оппозиция. Две контрадикторных оппозиции и одна контрарная наблюдается при сопоставлении 1 и 3 частотных классов. Между 2 и 3 классами насчитывается две контрадикторных оппозиции, контрарных оппозиций нет.

Больший интерес представляет их сопоставление с четвертым рангом. Наиболее диагностически значимыми оказываются признаки ИСЧ, АБСТ, КНКР, ВЩСТ, ИДТ. Первые три класса оказываются противопоставленными четвертому относительно параметров ИСЧ, АБСТ, ВЩСТ, ИДТ. Признак ИДС оказывается абсолютно нерелевантным для первых трех частотных классов, но обнаруживается слабая положительная корреляция с четвертым классом.

Таким образом, ранг частотности существительных оказывается довольно важным маркером семантического облика этих лексических единиц. С другой стороны, семантические параметры выступают фактором для диагностирования того или иного ранга частотности существительных. Наблюдается целый ряд случаев, дифференцирующий частотную и общеязыковую именную лексику по семантическим параметрам.

 

Литература:

 

1.                  Андреев, С. Н. Семантические метаязыки: сходства и различия // Известия Смоленского государственного университета. 2012. № 2 (18). С.137–146.

2.                  Андреев, С. Н. Устойчивость результатов исследования языкового материала // Иностранные языки в высшей школе. — Рязань, 2005. Вып.2. — С.93–105.

3.                  Гращенков, А. С. Факторы, определяющие деривационную сочетаемость английских глаголов и существительных в подъязыке делового общения: автореф. дис. … канд. филол. наук: 10.02.04 / Гращенков Александр Сергеевич. — Смоленск, 2012–24 с.

4.                  Жоголев, Е. А. Факторы, определяющие аффиксальную сочетаемость существительных в современном английском языке: автореф.дис. … канд.филол.наук: 10.02.04 / Жоголев Евгений Александрович. — Смоленск, 2006. — 18 с.

5.                  Зиновьева, И. В. Факторы, определяющие аффиксальную сочетаемость английских глаголов в подъязыке медицины: автореф. дис. … канд. филол. наук: 10.02.04 / Зиновьева Ирина Викторовна. — Смоленск, 2009. — 24 с.

6.                  Никифорова, Н. А. Структурные особенности английского семантического метаязыка (на материале глагольной лексики дефиниций словаря «Macmillan English Dictionary»): автореф. дис... канд. филол. наук: 10.02.04 / Никифорова Наталья Александровна. — Смоленск, 2011a. — 21 с.

7.                  Сильницкий, Г. Г. Соотношение глагольных признаков различных уровней в английском языке / Г. Г. Сильницкий, С. Н. Андреев, Л. А. Кузьмин, М. И. Кусков. — Минск: Наука и техника. — 1990. — 182 с.

8.                  Тулдава, Ю. А. Об измерении связи качественных признаков в лингвистике: сопряженность альтернативных признаков // Квантитативная лингвистика и автоматический анализ текстов: уч. зап. Тарт. ун-та. 1988. Вып. 827. С. 146–162.

9.                  Тулдава, Ю. А. Проблемы и методы квантитативно-системного исследования лексики / Ю. А. Тулдава. — Таллин: Валгус. — 1987. — 204 с.

10.              Cole, L. C. The measurement of Interspecific Association // Ecology. 1949. Vol. 30, № 4. P. 411–424.

11.              Longman Dictionary of Contemporary English. 4th ed. Harlow: Pearson Education Ltd, 2006. 1950 p.

Обсуждение

Социальные комментарии Cackle