Префиксный метод кодирования текстовой информации на основе остатка от приведенной частоты использования символа | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Авторы: ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №8 (298) февраль 2020 г.

Дата публикации: 23.02.2020

Статья просмотрена: 260 раз

Библиографическое описание:

Сегедин, Р. А. Префиксный метод кодирования текстовой информации на основе остатка от приведенной частоты использования символа / Р. А. Сегедин, В. А. Лебеденко. — Текст : непосредственный // Молодой ученый. — 2020. — № 8 (298). — С. 16-17. — URL: https://moluch.ru/archive/298/67666/ (дата обращения: 24.04.2024).



Актуальность работы заключается в том, что в настоящее время, с развитием научно-технического прогресса, при многократно возросших объёмах информации возникает проблема сжатия данных. Для сжатия информации применяется кодирование. Так как при кодировании сокращается время передачи информации, а скорость передачи информации увеличивается. Применение кодирования позволяет решать целый спектр научно-технических проблем. Целью работы является упрощения алгоритма формирования префиксного кода, используемого для передачи информации.

Ключевые слова: кодирование, алгоритм, вероятность, префикация, ошибки.

Предполагаемый метод относится к области методов кодирования текстовой информации префиксными кодами, у которых длина кода и алгоритм кодирования зависит от частоты использования символов.

Прототипом предполагаемого алгоритма является алгоритм кодирования методом Хаффмана [1, с. 23]. Метод предлагаемого кодирования включает алгоритм получения кода — это, прежде всего, формирование двоичного кода остатка от приведенной частоты использования символа.

Рассмотрим кодирование на конкретном примере.

Рассмотрим задачу полностью. Пусть дан текст. Анализ текста определяет количество символов в тексте (см. второй столбец табл. 1).

Например, буква «А» встречается 36 раз в тексте, буква «Б» встречается 24 раза в тексте, буква «В» встречается 12 раз в тексте, и так далее.

Таблица 1

Пример получения предлагаемого кода

Наименование символов

Кол-во символов втексте, шт.

Поведенная частота символов

Остаток от приведенной частоты

Остаток от приведенной частоты вдвоичном коде

Остаток от приведенной частоты вдвоичном коде без нулей вправой части

Двоичный префиксный код

А

36

0,424

0,576471

0.10010011100

0.100100111

10010011

Б

24

0,282

0,294118

0.01001011010

0.0100101101

01001011

В

12

0,141

0,153

0.00100111001

0.00100111001

00100111

Г

5

0,059

0,094

0.00011000000

0.00011

00011

Д

5

0,059

0,035

0.00001001000

0.00001001

00001001

Е

1

0,012

0,023

0.00000110000

0.0000011

0000011

Ж

1

0,012

0,011

0.00000011000

0.00000011

00000011

З

1

0,012

0

0

0.0

1111

85

1

Далее, производится определение вероятности появления этого символа, исходя из того, что сумма вероятностей всех символов равно единице. См. табл. 1 столбец 3.

Выполнение поиска остатка от вероятности по правилу

R (1 символа) =1 — P (1 символа)

R (i символа) = R ((i — 1) символа) — P (i символа)

где, i — номер символа.

Например, для буквы А и Б

R(А)=1–0,423529= 0,576471

R(Б)= 0,576471–0,282353= 0,294118 и т. д.

Смотри таблицу 1 столбец 4. Тем самым, получаем различное (неповторяемое) для каждого символа число.

Далее, приводится выполнение перевода полученных значений из десятичной системы счисления в двоичную систему. См табл. 1 столбец 4.

После этого, выполняется исключение нулей из полученной дробной части (не значащиеся нули справа). См. табл. 1 столбец 5. Это необходимо для сокращения длины общей записи.

Далее, рассмотрим выполнение операции префикации [2, с. 32]. Смысл этой операции заключается в исключении одинаковых начальных кодовых комбинаций (для исключения двоякого понимания символов), например, буква З при прямом переводе получает значение кодировки 0. Буква Б, В, Г, Д, Е, Ж начинается со значения 0. Следовательно может быть двоякое толкование. Заменим кодировку буквы З — 0 на 1111. Такая комбинация в кодовых комбинации других букв отсутствует, следовательно, данный код обладает уникальной комбинацией битов, и данная операция по добавлению нулей или единиц, относится к операции префикации. Смотри таблицу 1 столбец 7.

После получения кодовых выражений для символов выполняется кодировка текста.

Например, текст АБВ будет иметь код

100100111 0100101101 00100111001.

После получения полного текста приемный абонент проверяет правильность пришедшего кода текста путем проверки на количество указанных частот появления символов и определения остатков в двоичном коде. В случае совпадения кодировки символов с исходными кодами делается вывод об идентичности текстов (отсутствии ошибок).

Таким образом, предлагается использовать отличный метод кодирования. Данный метод кодирования позволяет выполнять проверку принятого текста на наличии ошибки в принятых символах.

Задачей данного метода является устранение недостатка кода Хаффмана. А именно невозможность анализа о наличии ошибки в переданном тексте.

Предлагаемый код обладает данным качеством.

Таким образом, предложенный код обладает информацией об ошибках в передаче символов за счет алгоритма формирования самого кода символа, в котором заложена информация частоты использования символа.

Литература:

1. В. Н. Потапов Теория информации. Кодирование дискретных вероятностных источников. Новосибирск, 1999. — с. 23–26.

  1. Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин Методы сжатия данных. Москва.: Диалог-Мифи, 2003, с. 32–34
Основные термины (генерируются автоматически): символ, приведенная частота, алгоритм кодирования, код, кодирование, наличие ошибки, предлагаемый код, столбец, текст.


Ключевые слова

алгоритм, ошибки, вероятность, кодирование, префикация

Похожие статьи

QR-коды, их свойства и применение | Статья в журнале...

Представлены характеристики QR-кодов, алгоритмы их создания и расшифровки. Приведены примеры визуальных изменений картинки кода и использования

Тогда японцы начали экспериментировать с кодированием небольшого количества информации в одной картинке.

Алгоритм сжатия текстовых файлов | Статья в журнале...

В статье рассматривается метод эффективного кодирования текстовой информации. В отличие от большинства существующих методов, большая эффективность кодирования и сжатия текста достигается за счет учета вероятностей положения алфавита символов на...

Информационная безопасность, кодирование и декодирование...

Код — это совокупность знаков, каждый из которых имеет соответствие с другими

Коды для кодирования данных, бывают разными. Каждый из них отличается своим

Помимо цифр и букв, кодируются и символы. Данный этап обязателен в работе любого устройства.

Разработка алгоритма эффективного кодирования на основе...

Разработаны новые алгоритмы эффективного кодирования и декодирования информации на основе неравенства Крафта и алгоритм эффективной упаковки

Библиографическое описание: Белягова Е. В., Ломакин Д. В. Разработка алгоритма эффективного кодирования на основе...

Исследование LDPC декодеров | Статья в журнале...

Также код можно описать с помощью представления в виде двудольного графа Таннера, состоящего из двух типов вершин: проверочных и кодовых.

Алгоритм MSупрощает вычисления, но при этом снижается энергетический выигрыш от кодирования.

Алгоритмы помехоустойчивого кодирования и их аппаратная...

Кодирование и декодирование кодов Рида — Соломона является довольно сложной задачей. Его решение выливается в громоздкий, запутанный и крайне неочевидный код, который требует широких знаний от разработчика во многих областях высшей математики [3].

Алгоритм Хаффмана для передачи большого объема...

Кодирование — это преобразование сообщений в сигнал, т. е. Для кодирования текстовой информации я изучила алгоритм Хаффмана.

Для этого предлагаю внедрить в исследовательский космический аппарат алгоритм эффективного кодирования информации...

Алгоритм адаптивной обработки для ΣΔ-АЦП на основе метода...

По мере кодирования, просматривает текст символ за символом, и

Из таблицы можно сделать вывод, что предложенный алгоритм производит преобразования с

Таким образом, алгоритм адаптивной обработки на основе метода кодирования Лемпеля-Зива-Велча...

Методы сжатия изображений | Статья в журнале «Молодой ученый»

Алгоритмы помехоустойчивого кодирования и их аппаратная... Кодирование и декодирование кодов Рида — Соломона является довольно сложной

Такой способ замены скрывает частоту появления букв в исходном тексте, а блоки, если их размер достаточно велик, практически не...

Похожие статьи

QR-коды, их свойства и применение | Статья в журнале...

Представлены характеристики QR-кодов, алгоритмы их создания и расшифровки. Приведены примеры визуальных изменений картинки кода и использования

Тогда японцы начали экспериментировать с кодированием небольшого количества информации в одной картинке.

Алгоритм сжатия текстовых файлов | Статья в журнале...

В статье рассматривается метод эффективного кодирования текстовой информации. В отличие от большинства существующих методов, большая эффективность кодирования и сжатия текста достигается за счет учета вероятностей положения алфавита символов на...

Информационная безопасность, кодирование и декодирование...

Код — это совокупность знаков, каждый из которых имеет соответствие с другими

Коды для кодирования данных, бывают разными. Каждый из них отличается своим

Помимо цифр и букв, кодируются и символы. Данный этап обязателен в работе любого устройства.

Разработка алгоритма эффективного кодирования на основе...

Разработаны новые алгоритмы эффективного кодирования и декодирования информации на основе неравенства Крафта и алгоритм эффективной упаковки

Библиографическое описание: Белягова Е. В., Ломакин Д. В. Разработка алгоритма эффективного кодирования на основе...

Исследование LDPC декодеров | Статья в журнале...

Также код можно описать с помощью представления в виде двудольного графа Таннера, состоящего из двух типов вершин: проверочных и кодовых.

Алгоритм MSупрощает вычисления, но при этом снижается энергетический выигрыш от кодирования.

Алгоритмы помехоустойчивого кодирования и их аппаратная...

Кодирование и декодирование кодов Рида — Соломона является довольно сложной задачей. Его решение выливается в громоздкий, запутанный и крайне неочевидный код, который требует широких знаний от разработчика во многих областях высшей математики [3].

Алгоритм Хаффмана для передачи большого объема...

Кодирование — это преобразование сообщений в сигнал, т. е. Для кодирования текстовой информации я изучила алгоритм Хаффмана.

Для этого предлагаю внедрить в исследовательский космический аппарат алгоритм эффективного кодирования информации...

Алгоритм адаптивной обработки для ΣΔ-АЦП на основе метода...

По мере кодирования, просматривает текст символ за символом, и

Из таблицы можно сделать вывод, что предложенный алгоритм производит преобразования с

Таким образом, алгоритм адаптивной обработки на основе метода кодирования Лемпеля-Зива-Велча...

Методы сжатия изображений | Статья в журнале «Молодой ученый»

Алгоритмы помехоустойчивого кодирования и их аппаратная... Кодирование и декодирование кодов Рида — Соломона является довольно сложной

Такой способ замены скрывает частоту появления букв в исходном тексте, а блоки, если их размер достаточно велик, практически не...

Задать вопрос