Алгоритм распознавания текстовой информации на изображении с помощью ЭВМ | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 22 августа, печатный экземпляр отправим 9 сентября.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №28 (266) июль 2019 г.

Дата публикации: 14.07.2019

Статья просмотрена: 360 раз

Библиографическое описание:

Ломанов, Д. К. Алгоритм распознавания текстовой информации на изображении с помощью ЭВМ / Д. К. Ломанов. — Текст : непосредственный // Молодой ученый. — 2019. — № 28 (266). — С. 14-16. — URL: https://moluch.ru/archive/266/61607/ (дата обращения: 14.08.2020).



Одним из самых быстрых и удобных способов перевода информации из физического формата в электронный вид является сканирование документов. Результатом данного процесса будет электронный файл, представленный в виде графического изображения. Графическое изображение не позволяет производить необходимый набор действий, как при работе с текстом, что делает его менее функциональным. Основные отличия хранения текстовой информации, в отличии от графической: экономия затрат на хранении, более обширный список сценариев использование документа.

OCR — это система оптического распознавания символов. В настоящее время данная система имеет большую популярность, она применяется в большом количестве программ, связанных с распознаванием текста.

Алгоритм работы распознания текста всегда строится одинаково.В систему загружается отсканированный файл, представленный в виде растрового изображения страницы документа. Качества изображения играет важную роль в распознании текста: чем выше качество, тем выше точность. Поэтому первым этапом будет являться обработка поступившего изображения: снижение шума, повышения контраста, повышение резкости, бинаризация изображения, выравнивание угла наклона [1].

Обработанный файл передается в модуль сегментации, задачей которого является выявление структурных единиц текста — страниц, строк, слов и символов. После сегментации полученные данные собираются в обратном порядке в готовый файл.

Рис. 1. Порядок сегментации

Для начала документ делится на страницы, далее определяются текстовые блоки. Для выявления слов из текстового блока производится определение угла наклона текста, для уменьшения будущих погрешностей, поиск вертикальных просветов в тексте, показывающих границы слова [2].

Для разбивки слова на символы проводится аналогичный процесс, только с меньшими просветами. Данные операции будут более точными, если текст будет черного цвета на белом фоне, если оригинальный текст иного цвета, то применяется бинаризация изображения.

Рис. 2. Пример входного текстового блока

На выходе из модуля сегментации будут получены данные, в состав которых входят структуры и местоположение текстовых блоков на странице, строки в этих блоках и их сегментация на слова и символы. Данные могут содержать не только информацию об обычном текстом блоке, а также о колонках, таблицах и т. д.

Рис. 3. Пример обработанного текстового блока

Определенные фрагменты слов и символов отправляются в модуль классификатора, результатом работы которого будет являться информация о принадлежности символа к определенной букве или символу. Нейронная сеть для каждого входящего символа, используя его пиксельное изображение, определяет признаки принадлежности буквы к нечеткому множеству.

После определения признаков у символа начинается процесс составление из символов слов. Для этого нейронная сеть сравнивает возможность написания отдельных букв, частоту сочетаний букв в языке, производится проверка по модели слова и словарю [3].

Модель слова — модель, разделяющая слова на определенные типы, такие как сокращения, аббревиатуры, обычные слова, имена собственные, числа и т. д.

С этого момента проверяется насколько хорошо подходит к данной модели полученное слово.

.

Рис. 4. Пример модели слова

Таблица 1

Пример списка моделей слов

Вариант распознания слова

Модель

TONS

Заглавные буквы

tons

Прописные буквы

Tons

Первая заглавная буква в слове

Tens

Первая заглавная буква в слове

Tans

Первая заглавная буква в слове

70NS

Сокращение

70ns

Число с подстрочным знаком

Для определения языка классификатор объединяет символы в массив, исключая повторяющиеся, затем сравнивает с существующими наборами графем присущими определенному алфавиту [4].

Литература:

  1. Квасников В. П. Улучшение визуального качества цифрового изображения путем поэлементного преобразования: учеб. пособие / В. П. Квасников, А. В. Дзюбаненко; Авиационно-космическая техника и технология, Москва, 2009 г., -204 c.
  2. Арлазаров В. Л. Распознавание строк печатных текстов: учеб. пособие / В. Л. Арлазаров, П. А. Куратов, О. А. Славин; Эдиториал, Москва, УРСС, 2000 г. -51 c.
  3. Выбор признаков для распознавания печатных кириллических символов: учеб. пособие / И. А. Багрова [и др.]; под ред. А. А. Грицай: Изд-во: Вестник Тверского Государственного Университета, СПБ, 2010 г. -73 c.
  4. Выделение графических примитивов и текстовых блоков на изображениях документов с помощью морфологических операций: учеб. пособие / А. В. Куроптев [и др.]; под ред. Д. П. Николаев: Изд-тво: МФТИ, Москва, 2008 г. -31.
Основные термины (генерируются автоматически): заглавная буква, модель слова, OCR, TONS, графическое изображение, модуль сегментации, нейронная сеть, символ, слово.


Похожие статьи

Применение нейронных сетей в распознавании рукописного текста

Различие написанных слов в изображении и выделение букв в словах является довольно

Чанчикова Е. В. Использование искусственных нейронных сетей для распознавания

искусственные нейронные сети, применение, графическая информация. Похожие статьи.

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов текстовых изображений представлена в таблице 1. Исходя из нее, для нашей работы была выбрана многослойная нейронная сеть с обратным распространением ошибки с обучением с учителем. Таблица 1.

Распознавание английского текста сверточной нейронной сетью

Рис. 5. Пример работы нейронной сети для одной буквы с добавлением различного шума

Сегментация текста на изображении. Для использования полученной нейронной сети для

К полученным фрагментам изображения применялась нейронная сеть, которая присваивала...

Практическое применение искусственных нейронных сетей...

Ключевые слова: искусственные нейронные сети, применение, графическая информация. Прежде чем начать рассматривать практическое

Искусственная нейронная сеть (ИНС) — математическая модель, а также её программное или аппаратное воплощение, построенная по...

Прецедентные тексты и графические символы... | Молодой ученый

Гриценко Л. М. Прецедентные тексты и графические символы в чат-коммуникации (к проблеме интерпретации невербально выраженных

4. графическое изображение в некоторых случаях может выступать как прецедентный текст. При этом графические компоненты, используемые в...

Метод распознавания шрифта текста с изображения

Ключевые слова: компьютерное зрение, распознавание шрифта, контурный анализ, OpenCV, iOS.

Для распознавания шрифта текста используется методы контурного анализа. Контур буквы или цифры с входного изображения сравниваются с контуром этого же символа в...

Обзор методов распознавания изображений | Статья в сборнике...

Свёрточная нейронная сеть (Convolutional neural network или CNN) — специальная архитектура нейронных сетей, предложенная в 1988 году и предназначенная для распознавания изображений. Архитектура вдохновлена некоторыми особенностями коры головного мозга, в...

Разработка сервиса распознавания брендовых лейблов

Ключевые слова: алгоритм распознавания брендовых лейблов, классификация объектов на изображении, распознавание на большой базе графических

Если же рассматривать методы сегментации, то часто приходится рассматривать полное совпадение всей картины объекта.

GRU и LSTM: современные рекуррентные нейронные сети

Каждый символ в тексте, отдельные слова, знаки препинания и даже целые фразы — все это может являться атомарным элементом входной последовательности. На каждом шаге обучения значение скрытого слоя рекуррентной нейронной сети вычисляется следующим образом

Похожие статьи

Применение нейронных сетей в распознавании рукописного текста

Различие написанных слов в изображении и выделение букв в словах является довольно

Чанчикова Е. В. Использование искусственных нейронных сетей для распознавания

искусственные нейронные сети, применение, графическая информация. Похожие статьи.

Математическое моделирование систем распознавания...

Формулировка задачи распознавания символов текстовых изображений представлена в таблице 1. Исходя из нее, для нашей работы была выбрана многослойная нейронная сеть с обратным распространением ошибки с обучением с учителем. Таблица 1.

Распознавание английского текста сверточной нейронной сетью

Рис. 5. Пример работы нейронной сети для одной буквы с добавлением различного шума

Сегментация текста на изображении. Для использования полученной нейронной сети для

К полученным фрагментам изображения применялась нейронная сеть, которая присваивала...

Практическое применение искусственных нейронных сетей...

Ключевые слова: искусственные нейронные сети, применение, графическая информация. Прежде чем начать рассматривать практическое

Искусственная нейронная сеть (ИНС) — математическая модель, а также её программное или аппаратное воплощение, построенная по...

Прецедентные тексты и графические символы... | Молодой ученый

Гриценко Л. М. Прецедентные тексты и графические символы в чат-коммуникации (к проблеме интерпретации невербально выраженных

4. графическое изображение в некоторых случаях может выступать как прецедентный текст. При этом графические компоненты, используемые в...

Метод распознавания шрифта текста с изображения

Ключевые слова: компьютерное зрение, распознавание шрифта, контурный анализ, OpenCV, iOS.

Для распознавания шрифта текста используется методы контурного анализа. Контур буквы или цифры с входного изображения сравниваются с контуром этого же символа в...

Обзор методов распознавания изображений | Статья в сборнике...

Свёрточная нейронная сеть (Convolutional neural network или CNN) — специальная архитектура нейронных сетей, предложенная в 1988 году и предназначенная для распознавания изображений. Архитектура вдохновлена некоторыми особенностями коры головного мозга, в...

Разработка сервиса распознавания брендовых лейблов

Ключевые слова: алгоритм распознавания брендовых лейблов, классификация объектов на изображении, распознавание на большой базе графических

Если же рассматривать методы сегментации, то часто приходится рассматривать полное совпадение всей картины объекта.

GRU и LSTM: современные рекуррентные нейронные сети

Каждый символ в тексте, отдельные слова, знаки препинания и даже целые фразы — все это может являться атомарным элементом входной последовательности. На каждом шаге обучения значение скрытого слоя рекуррентной нейронной сети вычисляется следующим образом

Задать вопрос