Библиографическое описание:

Полторак В. П., Моргаль О. М., Заика Ю. А. Оценка качества передачи речи в IP-телефонии // Молодой ученый. — 2014. — №4. — С. 121-123.

В статье рассматриваются методы оценки качества передачи речи в сетях IP-телефонии, с целью минимизировать затраты на повторную оценку, при изменении факторов влияния. Обоснован выбор метода оценки качества. Составлена сравнительная характеристика рассматриваемых методов. Проанализированы параметры, оцениваемые при подходе каждого из методов.

Ключевые слова:IP-телефония, MOS, PESQ, R-фактор, Е-модель.

К параметрам, которые связаны с терминалом и влияют на качество предоставляемых услуг на основании методики QoS для канального уровня модели OSI, относится тип кодека и задержка, а к параметрам связанным с сетью относятся потери пакетов, задержка и вариации задержки. Это означает, что для обеспечения некоторого уровня, качество необходимо рассматривать как терминал и сеть в комплексе, предъявляя к каждому из них определенный набор требований.

Общая задержка складывается из задержки кодирования и пакетизации речевого сигнала, задержки маршрутизации в сети, задержки распространения сигнала и задержки связанной с емкостью буфера, а также то, что джиттер вносится сетью, но компенсируется терминалом, можно сделать вывод, что задержка на терминале — величина постоянная, а задержка в сети является функцией от расстояния и точек маршрутизации.

Следовательно, появляется задача выбрать метод, который в своей оценки охватывает факторы которые влияют на передаваемую речь на всем пути от говорящего к слушающему. Также требуется определить метод, который при изменении параметров качества, будет переоценивать именно изменения, внося коррективы в уже имеющуюся оценку.

Для каждого из классов качества QoS определены требования предъявляемые к длительности задержек из конца в конец:

-                   4 «Высший» задержка до 10 мс;

-                   3 «Высокий» задержка до 100мс;

-                   2 «Средний» задержка до 150 мс;

-                   1 «Доступный» задержка до 400мс.

Время установления соединения определяется как время задержки после набора. Базовые требования ко времени задержки после набора определены Рекомендацией МСЭ-Т Е.721:

-                   местный вызов < 3 мс;

-                   междугородний вызов < 5 мс;

-                   международный вызов < 8 мс;

Существует три класса сетей, в которых учитывается вариация задержки, потери пакетов, но не учитывается задержка распространения и задержка маршрутизации.

Таблица 1

Класс

Потери пакетов

Вариация задержки

I

0.5 %

до 10 мс

II

1 %

до 20 мс

III

2 %

до 40 мс

При оценке качества услуг в сетях IP необходимо учитывать, что требования к сетевым характеристикам со стороны приложений данных и приложений, связанных с передачей голоса, существенно различаются. Разработаныразные методы для оценки качества передаваемого голоса в сетях IP-телефонии. Каждый из них отличается алгоритмами оценивания, параметрами для оценки и собственно оценочной шкалой. В связи с этим нужно проанализировать подходы к оценке разных типов методов, провести их сравнение. И определить какой метод выставляет оценку учитывая влияние которое оказывает сеть и терминал.

Субъективные методы оценки качества основываются на статистической обработке результатов работы определенного большого числа слушателей-экспертов. Эти оценки существенно зависят от возраста и пола диктора, скорости произнесения фраз и других обстоятельств. Тесты при получении субъективных оценок проводят с имитацией реальных условий, например, посторонний шум, фоновая речь других людей и т. п. Количественные результаты этих тестов отображают усредненное качество, уровень усилий слушателя, разборчивость, естественность звучания.

Наиболее широко используемая методика субъективной оценки качества описана в Рекомендации МСЭ Р.800 и известна как методика MOS. В соответствии с ней качество речи, получаемое при прохождении сигнала от говорящего (источник) через систему связи к слушающему (приемник), оценивается как арифметическое среднее от всех оценок, выставляемых экспертами после прослушивания тестируемого тракта передачи.

В основу объективного метода положена так называемая Е-модель, которая, связанна с измерением характеристик терминалов и сетей. После создания Е-модели было проведено большое число испытаний, в которых менялся уровень воздействия искажающих сетевых факторов. Данные этих тестов были использованы в Е-модели для вычисления объективных оценок. Результатом вычислений в соответствии с Е-моделью является число, называемое R-фактором («коэффициентом рейтинга»).

Е-модель является многокритериальной оценкой качества передаваемой речи в сетях IP и R-фактор определяется в соответсвии с ней в диапазоне значений от 0 до 100, где 100 соответствует самому высокому уровню качества. Но теоретическое значение R-фактора уменьшается от 100 до 93,2, что соответствует оценке MOS, равной 4,4.

На практике величина R-фактора меняется от 0 до 93,2, что соответствует изменению

оценок MOS от 1 до 4,4. Значение R-фактора определяется по следующей формуле:

R = Rо — Is — Id — Ie + A,

где: Ro = 93,2 — исходное значение R-фактора;

Is — искажения, вносимые кодеками и шумами в канале;

Id — искажения за счет суммарной сквозной задержки («из конца в конец») в сети;

Iе — искажения, вносимые оборудованием, включая и потери пакетов;

А — так называемый фактор преимущества.

Психоакустические методы оценки качества учитывают особенности человеческого восприятия звука в целом и речи в частности. Особенность данных методов в том, что оценивается только субъективное качество сигнала с помощью технических и программных средств. Таким образом они больше относятся к объективным методам, но построены исходя из особенностей субъективного восприятия звука человеком.

Задача любого метода оценки качества речевого сигнала в том, чтобы достичь высокой степени корреляции с субъективно-статистическими испытаниями, которые до сих пор остаются наиболее точной оценкой качества речи.

Большинство методов основано на сравнении оригинального и кодированного сигналов с помощью некоторой психоакустической модели. Оценивается степень заметности искажений в кодированном сигнале для человека. Психоакустическая модель это модель, которая преобразует звуковой сигнал в его внутреннее представление с точки зрения слухового аппарата человека, которое и сравнивается с внутренним представлением исходного сигнала.

Наиболее распространенными является оценка PESQ, определенная в рекомендации МСЭ-Т P.862. Она представляет собой объективную методику определения качества речевой связи в телефонных системах, которая прогнозирует результаты субъективной оценки качества этого вида связи слушателями-экспертами. Для определения качества передачи речи в PESQ предусмотрено сравнение входного, или эталонного, сигнала с его искаженной версией на выходе системы связи.

Результатом сравнения входного и выходного сигналов является оценка качества связи, которая аналогична усредненной субъективной оценке MOS. Далее полученные результаты оценки PESQ калибруются с использованием огромной базы данных оценок MOS.

Чтобы сравнить выше описанные методы, необходимо задаться параметрами влияющими на уровень искажения голоса, естественность его звучания, и задержками привносимые сетью и терминалом. Поэтому для сравнения методов оценки качества были выбраны параметры, дав оценку которым, можно отнести предоставляемые услуги передачи речи, а также параметры сети и терминала к определенному классу качества.

Основными качественными характеристиками были выбраны:

-                   суммарная задержка передачи речевой информации между абонентами;

-                   время установления соединения;

-                   вероятность потери пакетов;

-                   уровень искажения голоса;

-                   отсутствие либо наличие эха;

-                   искажения, вносимые кодеками.

Основными количественными характеристиками были выбраны следующие параметры:

-                   общая оценка качества передачи;

-                   качество речи, воспринимаемым слушателем;

-                   задержка из конца в конец.

Методика MOS дает оценку отсутствию либо наличию эхо, искажению голоса, задержке из конца в конец, общую оценку качества речи, как субъективную оценку экспертов. Эта оценка формируется как арифметическое среднее, где основными оценочными параметрами являются: разборчивость, естественность звучания голоса и уровень усилий слушателя. Эта методика не применима для математической модели сравнения и как результат, не дает возможности выявить влияние какого-то отдельного фактора.

С этой точки зрения можно рассмотреть метод E-модели и PESQ. Е-модель дает характеристику практически всем выбранным параметры, кроме оценки качества речи непосредственно слушателем. Этот метод оценивает искажения привносимые терминалам и сетью каждым в отдельности. В расчете R-фактора учитывается 20 параметров, где основными параметрами являются:

-                   однонаправленная задержка;

-                   коэффициент потери пакетов;

-                   потери данных из-за переполнения буфера джиттера;

-                   искажения, вносимые при преобразовании аналогового сигнала в цифровой и последующем сжатии (обработка сигнала в кодеках);

-                   влияние эхо;

-                   суммарная сквозная задержка (из конца в конец);

-                   искажения вносимые оборудованием.

Оценка PESQ учитывает следующие факторы:

-                   искажение сигнала при кодировании;

-                   ошибки при передаче;

-                   потерю покатов;

-                   время задержки передачи пакетов и флуктуацию этого времени;

-                   фильтрацию сигналов в аналоговых сетевых компонентах.

Но при этом в ее оценку не входят некоторые факторы, зависящие от параметров сети и восприятия речи:

-                   изменение уровня сигнала сети;

-                   наличие эхо сигнала;

-                   круговой задержки.

Из этого следует, что оценка PESQ похожа на E-модель, но дает оценку меньшему количеству факторов сети.

Таблица 2

Сравнительная характеристика методов оценки качества

Факторы

MOS

E-модель

PESQ

Суммарная задержка передачи речевой информации между абонентами

-

+

+

Время установления соединения

-

+

-

Вероятность потери пакетов

-

+

+

Уровень искажения голоса

+

+

+

Отсутствие либо наличие эха

+

+

-

Искажения вносимые кодеками

-

+

+

Общая оценка качества передачи

+

+

+

Качество речи, воспринимаемое слушателем

+

-

-

Задержка из конца в конец

-

+

-

Таким образом методика оценки MOS дает однозначную оценку качества, но при этом является невозможным обнаружение конкретных параметров, которые не соответствуют характеристикам классов сетей. Так же при изменении параметров сетей, терминалов, кодирования и т. д. потребуется повторный набор группы экспертов, что является трудоемким процессом. Методы оценки с помощью Е-модели и PESQ более точно связывают качество передаваемой речи с классами предоставляемых услуг и сетей, указывают на конкретные параметры, которые могут быть усовершенствованы. Их оценка зависит от использованного при тестах кодека, поэтому при изменении кодеков оценку качества необходимо повторить. С точки зрения используемых параметров Е-модель является более точным методом оценки качества передаваемой речи.

Литература:

1.                      Сергеенко В. С., Баринов В. В., Сжатие данных, речи, звука и изображений в телекоммуникационных системах, 2009, ИП «РадиоСофт»

2.                      МСЭ-Т P.800

3.                      МСЭ-Т P.862

4.                      «IP-телефония», А. В. Росляков, М. Ю. Самсонов, И. В. Шибаева. Из-во «Эко-трендз», 2001г.

Обсуждение

Социальные комментарии Cackle