Оптимизация размещения данных по узлам информационно-вычислительной сети | Статья в сборнике международной научной конференции

Библиографическое описание:

Зинкин С. А., Белецкий П. А. Оптимизация размещения данных по узлам информационно-вычислительной сети [Текст] // Современные тенденции технических наук: материалы II Междунар. науч. конф. (г. Уфа, май 2013 г.). — Уфа: Лето, 2013. — С. 29-31. — URL https://moluch.ru/conf/tech/archive/74/3863/ (дата обращения: 20.09.2018).

В статье представлен метод для оптимизации размещения данных по узлам информационно-вычислительной сети.

Ключевые слова:оптимизация, данные, информационно-вычислительные сети.

Одним из приоритетных и необходимых направлений развития информационных технологий является географически распределенная обработка информации в информационно-вычислительной сети. Это вызвано необходимостью интеграции информационных ресурсов, находящихся в разных географических локациях. Важной задачей проектирования таких сетей становится размещение файлов по узлам сети.

Для достижения поставленных задач повсеместно используют распределенные базы данных. Оптимальное размещение баз данных и файлов в узлах распределенных систем с учетом приведенных затрат на размещение и обслуживание позволит получить значительный экономический эффект при создании и эксплуатации больших кластерных систем.

С начала построения информационно-вычислительных систем для работы с базами данных они имели централизованную структуру. Необходимая информация хранилась на одном сервере. Достоинством использования такой организации является облегчение задачи обеспечения безопасности и целостность файлов и таблиц.

Но при использовании сетей, работающих с централизованной организацией, с увеличением объема хранимых данных и прибавлением все новых клиентов, обращающихся к ней, а также с распределенным территориальным размещением кластерных систем, возникает потребность в распределенной обработке информации, выявляются значительные недостатки, присущие централизованной организации. В результате возрастает объем обмена информацией, происходит снижение надежности процесса обмена файлами, уменьшение общей производительности, и в значительной степени увеличивается объем средств, необходимых на организацию и эксплуатацию баз данных.

Выходом из сложившейся ситуации является построение распределенной базы данных. При таком способе организации сети появляются возможности увеличения параметра эффективности обработки файлов, снижение затрат при эксплуатации, упрощение процесса управления информационно-вычислительной системой. В распределенной базе данных файлы хранятся на нескольких узлах. Обработка информации и передача между различными узлами осуществляется в результате выполнения запросов. Процесс распределения файлов по узлам может осуществляться посредством размещения таблиц по разным узлам или распределения различных составляющих одной таблицы по узлам.

Оптимальный выбор количества файлов и их размещение в узлах сети может значительно увеличить эффективность сети. Поэтому первоочередной задачей становится наилучшее распределение файлов по узлам. Из-за большой размерности очень трудно получить точное решение. По решению этой проблемы неоднократно проводились исследования [1–3].

В данной статье предлагается алгоритм оптимального размещения файлов. Критерием является суммарный объем запросов. Файлы хранятся в базах так, что имеется только единственная копия файла.

Введем обозначения: - множество узлов информационной сети. - множество файлов. - файл . - узел . - объем памяти узла . - объем файла. - интенсивность запросов узла  к файлу. - объем запроса к файлу . - затраты на хранение файла  на узле .

где - числовой аргумент функции .

Необходимые для правильного выполнения ограничения функции перечислены ниже:

 (1);  (2), где .

 (3).

Функция размещения, определяющая наименьшую стоимость хранения файлов, будет иметь следующий вид:

 (4)

В данной статье для решения поставленной задачи предлагается использование разработанного алгоритма:

1)                 Для каждой пары  вычисляем значения величины .

2)                 Распределяем значения  по убыванию.

3)                 Очередному  определить номер файла  и номер узла . Если файл  пока не размещен в  узле, проверить выполнимость ограничений (1)-(3). Если поставленные ограничения выполняются — происходит размещение файла.

4)                 Если файлы размещены в сети, вычисляем значения функции (4).

Компьютерные системы развиваются со стремительной скоростью. Но даже такое стремительное развитие зачастую не способно удовлетворить требованиям инженеров. В большинстве случаев для вычислений необходим по меньшей мере кластер персональных машин. В итоге выполнение инженерных целей может стать очень труднодостижимой задачей, а в отдельных случаях невыполнимой. В случае выполнения задачи, когда получается использовать множество компьютеров, серверов, кластеров, баз данных, размещенных по всему миру, можно добиться решения проблемы.

Литература:

1.                 Захаров Г. П. Методы исследования сетей передачи данных. — М: Радио и связь. — 1982. — 208с.

2.                 Мартин Дж. Вычислительные сети и распределенная обработка данных: программное обеспечение, методы и архитектура.. — М.: Финансы и статистика. — 1979. — 256с.

3.                 Шастова Г. А., Коекин А. И. Выбор и оптимизация структуры информационных систем. — М.: Энергия. — 1972. — 256с.

Основные термины (генерируются автоматически): узел, файл, распределенная база данных, объем, распределенная обработка информации, централизованная организация, узел сети, баз данных, информационно-вычислительная сеть, система.

Похожие статьи

Взаимодействие компонента «дерево элементов» TreeView...

узел, файл, распределенная база данных, объем, распределенная обработка информации, централизованная организация, узел сети, баз данных, информационно-вычислительная сеть, система. Обзорное описание метода Multi-Fragment-ReplicationJoin...

узел, файл, распределенная база данных, объем...

Оптимизация размещения данных по узлам... узел, файл, распределенная база данных, объем, распределенная обработка информации, централизованная организация, узел сети, баз данных, информационно-вычислительная сеть, система.

Проблемы распределённых СУБД | Статья в журнале...

Оптимизация размещения данных по узлам информационно-вычислительной сети.

Резервное копирование данных в локальной вычислительной сети. Восстановление данных на уровне приложения.

Использование современных СУБД в информационных системах...

Системы управления базами данных по типу управляемой БД

В файл-серверных системах файлы располагаются централизованно на файл-сервере СУБД.

Проблемы организации СУБД при параллельной архитектуре...

Создание хранилища данных для распределённой системы

В данной работе рассматривается реализация модуля хранения данных в распределённой системе, решающей задачи хранения и анализа файлов, содержащих данные в виде текста. Задачами модуля являются размещение файлов, а также управление загруженными файлами.

Организация сбора технологических данных с буровой...

PostgreSQL- свободная объектно-реляционная система управления базами данных (СУБД).

Курсы Построение распределенных систем на Java А. Н. Свистунов.

Организация автоматизированной системы управления... Операционная база данных.

Динамическое управление структурой распределенной базы...

Распределенная база данных — это децентрализованная информационная система, устроенная таким образом

О динамическом управлении размещением фрагментов данных, входящих в состав единой распределенной базы данных (РБД), говорят и пишут давно [1–3].

Проектирование подсистемы сетевого сервиса | Статья в журнале...

Распределённость администрирования

ActiveDirectory (служба активного каталога) — распределенная база данных, которая содержит все объекты домена.

Анализ системы мультиплексирования данных...

Ключевые слова:распределенные сети, сетевые протоколы, сетевые атаки, маршрутизируемый сервис, мультиплексирование трафика. На сегодняшний день наибольшее значение приобретают распределенные информационные вычислительные сети и...

Обсуждение

Социальные комментарии Cackle

Похожие статьи

Взаимодействие компонента «дерево элементов» TreeView...

узел, файл, распределенная база данных, объем, распределенная обработка информации, централизованная организация, узел сети, баз данных, информационно-вычислительная сеть, система. Обзорное описание метода Multi-Fragment-ReplicationJoin...

узел, файл, распределенная база данных, объем...

Оптимизация размещения данных по узлам... узел, файл, распределенная база данных, объем, распределенная обработка информации, централизованная организация, узел сети, баз данных, информационно-вычислительная сеть, система.

Проблемы распределённых СУБД | Статья в журнале...

Оптимизация размещения данных по узлам информационно-вычислительной сети.

Резервное копирование данных в локальной вычислительной сети. Восстановление данных на уровне приложения.

Использование современных СУБД в информационных системах...

Системы управления базами данных по типу управляемой БД

В файл-серверных системах файлы располагаются централизованно на файл-сервере СУБД.

Проблемы организации СУБД при параллельной архитектуре...

Создание хранилища данных для распределённой системы

В данной работе рассматривается реализация модуля хранения данных в распределённой системе, решающей задачи хранения и анализа файлов, содержащих данные в виде текста. Задачами модуля являются размещение файлов, а также управление загруженными файлами.

Организация сбора технологических данных с буровой...

PostgreSQL- свободная объектно-реляционная система управления базами данных (СУБД).

Курсы Построение распределенных систем на Java А. Н. Свистунов.

Организация автоматизированной системы управления... Операционная база данных.

Динамическое управление структурой распределенной базы...

Распределенная база данных — это децентрализованная информационная система, устроенная таким образом

О динамическом управлении размещением фрагментов данных, входящих в состав единой распределенной базы данных (РБД), говорят и пишут давно [1–3].

Проектирование подсистемы сетевого сервиса | Статья в журнале...

Распределённость администрирования

ActiveDirectory (служба активного каталога) — распределенная база данных, которая содержит все объекты домена.

Анализ системы мультиплексирования данных...

Ключевые слова:распределенные сети, сетевые протоколы, сетевые атаки, маршрутизируемый сервис, мультиплексирование трафика. На сегодняшний день наибольшее значение приобретают распределенные информационные вычислительные сети и...

Задать вопрос