Исследование формантных частот якутских гласных | Статья в сборнике международной научной конференции

Библиографическое описание:

Слепцов И. А. Исследование формантных частот якутских гласных [Текст] // Технические науки: проблемы и перспективы: материалы II Междунар. науч. конф. (г. Санкт-Петербург, апрель 2014 г.). — СПб.: Заневская площадь, 2014. — С. 15-18. — URL https://moluch.ru/conf/tech/archive/89/5426/ (дата обращения: 14.11.2018).

Якутский язык — язык одного из восточных тюрских народов Российской Федерации (самоназванием саха). Якуты — коренное население республика Саха (Якутия) Общая численность якутов по данным всероссийской переписи населения 2010 г. составляло 478,1 тысяч человек.

В современном якутском языке имеется 20 гласных фонем — 8 кратких и соответствующих им 8 долгих гласных, а также 4 дифтонга: и, ү, ы, у, э, ө, о, а, ии, үү, ыы, уу, ээ, өө, аа, оо, иэ, үө, ыа, уо [1, с. 19].

Ударение в якутском языке падает в основном на последний слог слова. В ударяемом слоге гласные длительнее и интенсивнее, чем в безударных слогах. В отдельных случаях ударяемые гласные имеют тональный контраст по отношению к безударным гласным.

Гласные имеют различную длительность в зависимости от характера слога, а от длительности гласного обычно зависит и его качество [1, с. 58].

Особенно важно изучение якутских гласных с технической стороны для систем синтеза и распознавания языка, т. к. синтез речи является важным элементом речевой технологии, который обеспечивает получение информации в речевой форме от различных источников. Например, когда зрительный канал не работает, при осуществлении связи на расстоянии по телефону, при автоматизированных системах управления, при общении с банком знаний или искусственным интеллектом [2, с. 8].

Для нахождения формантных частот начали с якутских гласных “Үү”, “ү”, “өө” и“ө”. “Үү”, “ү”, “өө”и “ө” — гласные звуки переднего ряда, лабиализованные. Степень подъема языка у “үү”, “ү” по таблице Щербы — шестая, а у “өө”, “ө” — третья снизу, но самый открытый вариант [1, с. 63].

Резонансные пики, наблюдающиеся в спектральной картине звуков речи, называются формантами. Частотное положение максимумов, т. е. формантные частоты, весьма близки к соотвественным максимумам спектра звука.

Формантные частоты обозначаются символами F1, F2, F3 и т. д., в порядке их следования по шкале частот [3, с. 32].

Гласные произносятся относительно открытым речевым трактом. Основная акустическая особенность гласных — это местоположение первых трех формантных частот (F1-F3) [4, с. 182]

Из множество программ мы выбрали программу SpeechAnalyzer версии 3.0.1 фирмы SIL International, который является свободным и профессиональным инструментом. Он позволяет выполнить фонетический анализ записи голоса диктора, включая спектрогамму, спектральный анализ и т. д. Можно одновременно индифицировать три форманты (F1-F3) к рассмотрению спектрограммы и спектра.

Нахождение формантных частот четырех фонем“ө”, “өө”, “ү’ и “үү” якутского языка проводилось с помощью программы SpeechAnalyzer версии 3.0.1 фирмы SIL International. Фонемы были записаны на компьютере с микрофона на программе SoundForge в формате wav. Диктор мужчина средних лет, носитель якутского языка.

Рис.1. Форма сигнала по времени, спектрограмма и спектр фонемы “ө” диктором мужского пола, носителем якутского языка

На рисунке 1 показаны форма сигнала по времени, спектрограмма и спектр гласной “ө”. На спектрограмме более темная область характеризует интенсивность частоты. Темные области соответствуют формантным частотам, которые отражают резонансы речевого тракта и появляются, как пики в спектре линейного кодирование с предсказанием [4, с. 182].

Из рисунка 1 видно гласной “ө” первая форманта приблизительно равна 470 Гц, вторая 1500 Гц, третья 2600 Гц и четвертая 3600 Гц.

Рис.2 Форма сигнала по времени, спектрограмма и спектр фонемы “өө” диктором мужского пола, носителем якутского языка

На рисунке 2 видим форму сигнала по времени, спектрограмму и спектр долгой гласной “өө”. Формантные частоты приблизительно равны F1–440 Гц, F2–1500 Гц, F3–2600 Гц и F4–3500 Гц.

Рис. 3. Форма сигнала по времени, спектрограмма и спектр фонемы “ү” диктором мужского пола, носителем якутского языка

Рис. 4. Форма сигнала по времени, спектрограмма и спектр фонемы “үү” диктором мужского пола, носителем якутского языка

На 3 и 4 рисунках форма сигнала по времени, спектрограмма и спектр гласных “ү” и “үү”. Формантные частоты F1 -170 Гц, F2–2200 Гц, F3 -3100 Гц гласной “ү” и формантные частоты F1–260 Гц, F2–1900 Гц, F3–2300 Гц,F4–3300 Гц долгой гласной “үү”, соответственно.

Таблица 1

Формантные частоты якутских гласных “ө”,“өө”, “ү” и “үү”

Фонемы

Формантные частоты (Гц)

F1

F2

F3

F4

ө

470

1500

2600

3600

өө

440

1500

2600

3500

ү

170

2200

3100

үү

260

1900

2300

3300

Оформив в виде таблицы 1 найденные формантные частоты фонем “ө”, “өө”, “ү” и “үү”, путем сравнение форматных частот гласных, мы видим, что гласная “ө” и долгая гласная “өө” более близки друг другу, чем гласная “ү” и долгая гласная “үү”. Данная разница частот показала изменение ударения между гласными “ү” и “үү”.

Найдены формантные частоты гласных фонем якутского языка. Составлена таблица частот для использования в системах синтеза и распознавания языка.

Литература:

1.                   Дьячковский Н. Д. Звуковой строй якутского языка: часть 1 вокализм. — Якутск: Якутское книжное издательство, 1971 г. — с. 192.

2.                   Сорокин В. Н. Синтез речи. — М.: Наука. Гл.ред.физ.-мат.лит., 1992. — с. 392.

3.                   Фант Г. Акустическая теория речеобразования: Пер. с англ. Л. А. Варшавского, В. И. Медведева / Под ред. В. С. Григорьева. — М. Наука 1964 г. — с. 284.

4.                   Reetz Н., Jongman A. Phonetics: transcription, production, acoustics and perception. — 2009. — 309 p. — (Blackwell textbooks in linguistics).

Основные термины (генерируются автоматически): якутский язык, форма сигнала, частота, гласный, спектр фонемы, SIL, спектрограмма, распознавание языка, система синтеза, время.

Похожие статьи

Использование преобразования Гильберта-Хуанга для...

Использование преобразования Гильберта-Хуанга для формирования моделей фонем русского языка в задаче распознавания речи. Предварительная обработка речевых сигналов для системы распознавания речи.

Предварительная обработка речевых сигналов для системы...

Программная оболочка реализована на языке программирования C#.

Каждый сегмент соответствует набору чисел, характеризующих амплитудные спектры сигнала. Выделение границ фонем речевого сигнала с помощью...

О долготе гласных фонем хорезмского диалекта узбекского языка

Гласные узбекского литературного языка, как и гласные русского литературного языка, в количественном отношении неодинаковы: одни гласные оказываются более длительными, другие — менее; в одних фонетических условиях гласные приобретают длительность...

Методы распознавания речи | Статья в журнале «Молодой ученый»

Одно из основных направлений разработок с этой области — системы распознавания речи.

– преобразование сигнала из аналоговой формы в цифровую

из фонем, которая в наибольшей степени соответствует исходному отрезку речевого сигнала.

Сегментация, шумоподавление и фонетический анализ в задаче...

Данная форма, синтезированная по результатам анализа встречаемости фонем

1) Разложение исходного речевого сигнала в спектр квазигармонических компонент (задача 1).

В настоящее время популярными алгоритмами оценивания частоты основного тона речевого...

Сравнительный анализ методов синтеза речи | Статья в журнале...

Синтезом речи называется процесс восстановления формы речевого сигнала по его параметрам.

Использование преобразования Гильберта-Хуанга для формирования моделей фонем русского языка в задаче распознавания речи.

Базовые принципы построения системы синтеза речи

Синтезом речи называется процесс восстановления формы речевого сигнала по его параметрам.

Это могут быть фонемы, аллофоны, или даже целые слова [1]. Формат для каждой конкретной системы синтеза речи определяется из учета особенностей языка и...

Выделение границ фонем речевого сигнала с помощью...

В акустико-фонетическом подходе к автоматическому распознаванию речи выделение границ фонем — одна из

Рис.1 График зависимости амплитуды сигнала от времени для слова «два».

К каждому кадру применяется преобразование Фурье — получаем спектр сигнала.

Сравнительный анализ фонетики английского и якутского языков

Язык возник и существует как средство общения людей, прежде всего в звуковой, устной форме. Письмо является лишь условным изображением звуковой формы языка.

Система гласных звуков якутского и английского языков.

Обсуждение

Социальные комментарии Cackle

Похожие статьи

Использование преобразования Гильберта-Хуанга для...

Использование преобразования Гильберта-Хуанга для формирования моделей фонем русского языка в задаче распознавания речи. Предварительная обработка речевых сигналов для системы распознавания речи.

Предварительная обработка речевых сигналов для системы...

Программная оболочка реализована на языке программирования C#.

Каждый сегмент соответствует набору чисел, характеризующих амплитудные спектры сигнала. Выделение границ фонем речевого сигнала с помощью...

О долготе гласных фонем хорезмского диалекта узбекского языка

Гласные узбекского литературного языка, как и гласные русского литературного языка, в количественном отношении неодинаковы: одни гласные оказываются более длительными, другие — менее; в одних фонетических условиях гласные приобретают длительность...

Методы распознавания речи | Статья в журнале «Молодой ученый»

Одно из основных направлений разработок с этой области — системы распознавания речи.

– преобразование сигнала из аналоговой формы в цифровую

из фонем, которая в наибольшей степени соответствует исходному отрезку речевого сигнала.

Сегментация, шумоподавление и фонетический анализ в задаче...

Данная форма, синтезированная по результатам анализа встречаемости фонем

1) Разложение исходного речевого сигнала в спектр квазигармонических компонент (задача 1).

В настоящее время популярными алгоритмами оценивания частоты основного тона речевого...

Сравнительный анализ методов синтеза речи | Статья в журнале...

Синтезом речи называется процесс восстановления формы речевого сигнала по его параметрам.

Использование преобразования Гильберта-Хуанга для формирования моделей фонем русского языка в задаче распознавания речи.

Базовые принципы построения системы синтеза речи

Синтезом речи называется процесс восстановления формы речевого сигнала по его параметрам.

Это могут быть фонемы, аллофоны, или даже целые слова [1]. Формат для каждой конкретной системы синтеза речи определяется из учета особенностей языка и...

Выделение границ фонем речевого сигнала с помощью...

В акустико-фонетическом подходе к автоматическому распознаванию речи выделение границ фонем — одна из

Рис.1 График зависимости амплитуды сигнала от времени для слова «два».

К каждому кадру применяется преобразование Фурье — получаем спектр сигнала.

Сравнительный анализ фонетики английского и якутского языков

Язык возник и существует как средство общения людей, прежде всего в звуковой, устной форме. Письмо является лишь условным изображением звуковой формы языка.

Система гласных звуков якутского и английского языков.

Задать вопрос