Отправьте статью сегодня! Журнал выйдет ..., печатный экземпляр отправим ...
Опубликовать статью

Молодой учёный

Применение сервисов автоматической транскрипции в качественных исследованиях

Информационные материалы
2
Поделиться
Библиографическое описание
Применение сервисов автоматической транскрипции в качественных исследованиях. — Текст : непосредственный // Молодой ученый. — 2020. — № 9 (299). — URL: https://moluch.ru/archive/299/137413.

Исследовательская деятельность неразрывно связана с  экспертными интервью, различными аудиозаписями, которые необходимо расшифровывать. Работа по транскрибации важна в разных сферах – в  психологии, педагогических исследованиях, соцопросах, журналистике, многих других областях. Ранее это приходилось делать вручную. И на обработку даже небольшого фрагмента затрачивалось немало времени и сил. Однако сегодня расшифровать любой аудиоматериал можно буквально за минуты в автоматическом режиме – с помощью специальных сервисов.

Проблемы ручной транскрипции

Чтобы расшифровать часовой аудиофрагмент, специалисту необходимо затратить немало времени. Это может занять от четырех до восьми часов, исходя из качества исходника, тематики и компетенции.

При этом ручная расшифровка часто сопряжена с:

  • Ошибками. Превращая аудио в текст, специалист может пропускать отдельные слова, искажать термины и смысловую составляющую. Это случается не только по незнанию, но и вследствие некачественного исходного фрагмента.
  • Усталостью. Транскрибация – достаточно трудоемкий процесс. Обработка большого массива данных требует от человека немало сил. А это приводит к усталости, из-за которой снижается скорость работы. К тому же это провоцирует ошибки.
  • Высокой стоимостью. Услуги компетентного эксперта стоят достаточно дорого. А если он работает с большим массивом аудио, кратно увеличивается и ценник за такой объем.
  • Сложностью. Если аудиоматериал не слишком хорошего качества, имеет посторонние шумы и дефекты, то распознать его для человеческого уха непросто. Аналогичная ситуация, когда фрагмент на иностранном языке, произносится спикером с сильным акцентом или имеющим нечеткую дикцию.

Автоматические сервисы помогать избежать этих проблем, сократить время на транскрибацию, кратно уменьшить трудоемкость процесса.

Как работают современные сервисы транскрипции

Сервисы автотранскрипции производят преобразование устной речи в текстовый формат. Для этого достаточно загрузить аудио или видео. Сервис конвертирует материал, убирает эхо и фоновые шумы, при необходимости сжимает. Если это продолжительная аудиодорожка, он делит ее на несколько единичных фрагментов для обработки. Далее производится лингвистический анализ содержимого, включая определение тембра, акцента, контекст каждого слова. После этого происходит постобработка, расставляются знаки препинания, форматирование.

Современные сервисы автотранскрипции применяют технологии искусственного интеллекта, а потому быстро и с высокой точностью справляются с расшифровкой. При этом они:

  • Распознают любую речь. Это не только иностранные аудио, но и исходники на русском языке.
  • Выполняют разделение спикеров – диаризацию. Это позволяет сохранить структуру диалога с указанием спикеров или их имен, избежать сплошного текстового полотна.
  • Поддерживают разные форматы mp3, mp4, wav и другие. Это дает гибкость выбора относительно скорости и объема хранилища, качества распознавания текста.
  • Действуют на основе метрики точности WER – главном отраслевом стандарте для определения точности автораспознавания речи. Word Error Rate показывает процентное содержание ошибочных лингвистических единиц, пропусков, некорректных замен, в сравнении с исходными данными в аудио. И на основе этого корректирует и формирует итоговый текст.

Обзор сервисов: популярные продукты для удобства работы

В числе наиболее популярных сервисов транскрипции:

  • Speech2Text – продукт иностранной разработки для работы с аудио и видеофайлами. Действует с использованием Google Speech API, поддерживает экспорт в TXT с субтитрами. Сервис функционирует бесплатно для коротких аудио – до пятнадцати минут. Если файл длинный, то нужна платная подписка. Программа хорошо транскрибирует английским язык, с русским иногда случаются сбои, по отзывам пользователей. В Speech2Text можно загружать исходники из разных источников.
  • Транскрипта – российский продукт с высокой точностью обработки до 99 %. Действует на базе технологии машинного обучения, транскрибирует девяносто девять языков. В нем доступна загрузка файлов объемом  до 500 МБ как в аудио, так и видео формате, полученных с разных устройств. Осуществляется транскрибация MP4, MOV, AVI, MKV, WebM и других типов. В «Транскрипте» предусмотрена возможность экспорта в TXT DOCX, PDF. При необходимости можно воспользоваться функцией редактирования непосредственно на сайте. Пользователь может самостоятельно менять имена спикеров. Пробная версия для ознакомления с инструментарием предоставляется бесплатно. Сервис доступен как для частных лиц, так и для юридических – учебных заведений, исследовательских бюро и других организаций.
  • Scriptario - продукт иностранной разработки, способной один час аудио обрабатывать примерно за 3 минуты, и с  высокой точностью обработки до 99%. Поддерживает более 100 языков, включая английский, испанский, вьетнамский и суахили. Транскрипция с использованием ИИ форматов: MP3, WAV, MP4, MOV, можно вставить ссылку на YouTube, Zoom или Google Drive. Можно научить Scriptario специфическим терминам из вашей области (имена, продукты, жаргон), чтобы избежать ошибок в распознавании.
  • Teamlogs - это продукт российской разработки с платной подпиской. Специализируется на автоматической транскрипции. Поддерживает несколько языков (до 50–70) и форматов – например, OGG, M4A, AVI, MKV, MOV, MP3, WAV, MP4 и другие. В нем можно экспортировать файлы в DOCX и TXT с таймкодами, редактировать информацию и слушать прямо в браузере. Инструмент сохраняет историю заказов в профиле, позволяет выбрать в настройках автоматическое или ручное распознавание языка. Сервис не только расшифровывает, но и генерируется отчет для подкастов, исследований и интервью, совещаний, лекций

Как применять в исследованиях?

Использование сервиса достаточно простое:

  • Исследователь загружает запись.
  • Программа обрабатывает исходный материал и выдает результат.
  • Далее текст можно вычитывать и использовать «по назначению».

При этом автоматическая расшифровка аудио в текст  происходит всего за несколько минут вместо часов кропотливой ручной работы транскрибатора. Пользователь может выбрать подходящий формат выгрузки, редактировать на свое усмотрение, применять другой инструментарий под свои нужды.

Заключение

Автоматизированные сервисы транскрибации текста серьезно экономят время на исследованиях. Они помогают повысить качество полученного текстового материала, избежать неточностей и критических ошибок, позволяют сократить трудовые затраты, которые необходимы для обработки данных. Кроме того, с ними возможна транскрипция внушительных массивов в короткое время.

Используйте удобный вариант для исследователей transcripta.ru, сервис, который быстро и просто поможет расшифровать запись интервью онлайн, обработает любые другие аудио и видеоформаты, сделает научную, исследовательскую деятельность более продуктивной и интересной.

Можно быстро и просто опубликовать свою научную статью в журнале «Молодой Ученый». Сразу предоставляем препринт и справку о публикации.
Опубликовать статью

Молодой учёный