Авторы: ,

Рубрика: Информатика

Опубликовано в Молодой учёный №26 (130) декабрь 2016 г.

Дата публикации: 05.12.2016

Статья просмотрена: 127 раз

Библиографическое описание:

Ахмедов Д. Ш., Байдалиев А. Г. Сравнительный анализ программного обеспечения систем мониторинга кластерных вычислительных систем // Молодой ученый. — 2016. — №26. — С. 131-134. — URL https://moluch.ru/archive/130/36215/ (дата обращения: 21.04.2018).



В настоящее время для решения ресурсоемких вычислительных задач активно применяются кластерные вычислительные системы, так как такие задачи, как правило, требуют наличия мощных вычислительных процессоров, большого объема оперативной памяти, эффективной сетевой архитектуры с учетом пропускной способности и минимальных задержек сетевых пакетов, эффективной системой отвода тепла от нагревающихся элементов вычислительной системы. Кластерные вычислительные системы обладают свойством масштабируемости и не так дороги по сравнению с традиционными суперкомпьютерными системами, что делает их более доступными для решения высокопроизводительных задач.

Как и любые сложные системы, кластерные вычислительные системы требуют периодического проведения технического обслуживания для поддержания стабильного состояния. Для обеспечения непрерывной работы системы требуется своевременное реагирование на отклонение ее параметров от нормы, для этого используются различные диагностические программные средства. Выполнение диагностики кластерной системы программными средствами является неотъемлемой частью ее технического обслуживания, так как некоторые нештатные ситуации, например, выход из строя модулей оперативной памяти, не могут быть обнаружены визуально. Наличие таких программных средств является одним из основных требований, предъявляемых к составу программного обеспечения кластерных вычислительных систем.

Одним из таких программных средств является система мониторинга физических параметров компонентов кластерной системы. Под физическими параметрами понимаются такие численные показатели как:

‒ процентная загруженность ядер центральных процессоров;

‒ процентная загруженность графических процессоров;

‒ занятый объем оперативной памяти;

‒ занятый объем жестких дисков;

‒ занятый объем твердотельных накопителей;

‒ температура центральных процессоров;

‒ температура графических процессоров;

‒ температура материнской платы;

‒ объем трафика сетевой карты.

И это не полный перечень списка, ведь основываясь только на малом количестве данных невозможно представить всю полноту работы системы. Также отображение только численных параметров не дает полного понимания о состоянии системы. В свою очередь визуализация этих численных параметров через кривые графиков наглядно демонстрируют состояние работоспособности системы. Первоочередная цель систем мониторинга — это предоставление наиболее полной отчетности для администраторов вычислительных систем.

Следует отметить, что однажды разработанные кластерные вычислительные системы периодически подвергаются модернизации, ремонту и сопутствующей замене их устаревших компонентов. С учетом непрерывного развития компонентной базы кластерных вычислительных систем актуальной задачей является модификация программного обеспечения их систем мониторинга при модернизации аппаратного обеспечения кластерных вычислительных систем.

Для получения наиболее полного представления о том, что из себя представляют системы мониторинга кластерных вычислительных систем, рассмотрим существующие системы мониторинга, созданные как за рубежом, так и в Казахстане.

Ganglia. Представляет собой масштабируемое программное обеспечение с открытым исходным кодом для мониторинга высокопроизводительных вычислительных кластеров, grid-систем, дата-центров и др. [1]. Система мониторинга Ganglia состоит из следующих компонентов, осуществляющих сбор данных о системе, хранение полученных данных, а также их визуализацию [2].

Nagios. Представляет собой программное обеспечение систем мониторинга, которое позволяет просматривать, запрашивать и анализировать данные. Сервер предназначен для анализа, сбора и хранения данных и предоставляет пользователям понятное описание системы с учетом ее специфики. Сервер Nagios предоставляет пользователям возможность анализировать сохраненные данныt [3].

Zabbix. Представляет собой программное обеспечение с открытым исходным кодом для мониторинга. Сервер zabbix автоматически собирает и анализирует данные от требуемых компонентов. Администраторам доступна информация о производительности системы через web-интерфейс. Zabbix-сервер соединен с агентами, которые реализованы для многих операционных систем. Так же Zabbix работатет без агента, для этого используется общие протоколы мониторинга, такие как протокол управления сетью или интеллектуальный интерфейс управления платформой [4].

Cacti. Представляет собой графическое решение. Для хранения данных использует циклическую базу данных на основе которой производит построение графиков. Программное обеспечение Cacti также обеспечивает сбор данных, настройку графиков, также управляет учетными записями [5].

Система диагностики состояния кластерной гибридной вычислительной системы на базе графических процессоров. Представляет собой комплексное программное обеспечение, осуществляющее сбор, хранение и визуализацию полученных данных от компонентов кластерной системы.

Наибольший интерес представляет программное обеспечение системы мониторинга кластерной гибридной вычислительной системы на базе графических процессоров (КГВС), разработанной в Институте космической техники и технологий (Казахстан), так как в составе данной вычислительной системы присутствуют графические процессоры. Рассмотрим более детально архитектуру программного обеспечения системы мониторинга кластерной гибридной вычислительной системы на базе графических процессоров.

На данный момент программное обеспечение системы мониторинга кластерной гибридной вычислительной системы на базе графических процессоров выполняет следующие функции:

‒ сбор данных;

‒ фильтрация данных;

‒ хранение данные;

‒ визуализация данных.

Архитектура программного обеспечения системы мониторинга состоит из трех подсистем (Рисунок 1):

‒ Подсистема “ядро”. Данная подсистема осуществляет сбор физических параметров с компонентов системы;

‒ Подсистема хранения данных. Данная подсистема получает данные от подсистемы сбора данных и осуществляет хранение в базе данных;

‒ Подсистема Web-интерфейс. Данная подсистема визуализирует в браузере данные из баз данных.

Рис. 1. Архитектура системы диагностики состояния

В свою очередь подсистема “Ядро” делится на три основных модуля:

‒ Модуль аналитики;

‒ Модуль сбора и обработки данных;

‒ Модуль управления учетными записями.

Одной из важных частей подсистемы “ядро” является модуль аналитики. Модуль аналитики призван решать такие задачи как оповещение пользователя в моменты выхода из нормального состояния работоспособности определенных компонентов. В данном случае модуль аналитики анализирует последние внесенные данные (физические показатели компонентов) содержащиеся в подсистеме хранения данных. Оповещение данного модуля осуществляется через модуль web-интерфейс, используя определенные цветовые обозначения, такие как зеленый, желтый, красный.

В свою очередь модуль сбора и обработки данных осуществляет сбор физических параметров с компонентов системы, далее модуль обрабатывает полученные данные оставляя только необходимые значения.

Модуль управления учетными записями реализует основную политику безопасности, предоставляя данные только авторизованным пользователям.

В качестве примера на рисунке 2 представлен результат визуализации используемого объема оперативной памяти. Точки на графике отображают используемый объем оперативной памяти в узле в некоторый момент времени.

Рис. 2. Модуль web-интерфейс. Отчет по использованию оперативной памяти

Исходя из результатов рассмотрения программного обеспечения системы мониторинга кластерной гибридной вычислительной системы можно сделать вывод, что в силу интенсивного развития новых технологий представляется целесообразным провести модификацию программного обеспечения системы мониторинга кластерной системы с целью поддержки компонентов нового поколения, в частности графических процессоров. Также имеет место проведение модификации программного обеспечения системы мониторинга в части обеспечения более гибкой масштабируемости кластерной вычислительной системы.

Литература:

1. http://ganglia.info;

2. https://github.com/ganglia/monitor-core/wiki/Ganglia-Documents;

3. https://nagios.org;

4. http://zabbix.com;

5. http://cacti.net.

Основные термины (генерируются автоматически): системы мониторинга, системы мониторинга кластерной, вычислительной системы, гибридной вычислительной системы, кластерной гибридной вычислительной, мониторинга кластерной гибридной, кластерных вычислительных систем, кластерной системы, обеспечения системы мониторинга, программного обеспечения системы, кластерные вычислительные системы, компонентов кластерной системы, систем мониторинга, обеспечение системы мониторинга, базе графических процессоров, мониторинга кластерных вычислительных, программное обеспечение, оперативной памяти, программное обеспечение системы, мониторинга кластерной системы.

Обсуждение

Социальные комментарии Cackle
Задать вопрос