Библиографическое описание:

Романов А. М. Сравнительный анализ систем удаленного управления кластером // Молодой ученый. — 2011. — №5. Т.1. — С. 126-129.

В настоящее время существует достаточно много прикладных и научных задач, требующих для своего решения больших вычислительных мощностей, предоставляемых суперкомпьютерными технологиями. Высокопроизводительные вычисления используются в самых различных областях, в таких как моделирование погоды, компьютерное управление производственными процессами, анализ фондового рынка, обработка потоков информации в распределенных базах данных, автоматизация проектирования, управление сотовой связью, биоинформатика, биохимия, биофизика, теплофизика, динамика жидкостей и газов, электромагнетизм и др.

В высокопроизводительных системах задействуется все больше ученых, инженеров, любителей. Управление, администрирование и даже простой запуск задач на кластере предполагает достаточно высокие требования к знанию дополнительной массы деталей, по сути чисто технического характера, которые необходимы специалисту в своей области, помимо свойств применяемых пакетов программ и их специфического языка.

Стандартным интерфейсом работы с суперкомпьютером является консоль (командная строка). Консольный интерфейс позволяет максимально использовать возможности операционной системы, но сложен в изучении, требует глубоких знаний команд. Для неподготовленного пользователя суперкомпьютера консоль оказывается барьером в его освоении.

Для просмотра статистики по запущенным задачам, нагрузки системы, результатов вычислений требуется физическое присутствие человека за главным компьютером кластера. Отсутствие средств самодиагностики суперкомпьютера приводит к тому, что ошибки могут жить неделями. Это сильно сказывается на качестве предоставляемых сервисов.

Часто у суперкомпьютера отсутствует средство сбора статистики использования ресурсов и автоматического построения отчетов.

В случае возникновения проблем с высокопроизводительной системой требуется высококвалифицированный специалист, который должен всегда находиться в непосредственной близости с кластером.

Системы удаленного управления кластером позволяют решать вышеописанные проблемы. В данной статье сравним следующие системы удаленного управления кластером, представленные на рисунке 1.

Рисунок 1 –Классификация удаленного управления

Выделим следующие критерии сравнения:

Независимость от операционной системы. Управление и доступ к компьютеру при выключенной системе.

Внешние коммуникационные соединения. Признак описывает интерфейсы решения, через которые можно действовать извне. Коммуникации могут осуществляться по внешнему (Out of Band, OoB) и основному (In Band, IB) каналам.

Доступ к коду загрузки/BIOS. В качестве кода загрузки компьютера обычно обозначают ту часть программного обеспечения энергонезависимой памяти, выполнение которой происходит непосредственно после включения системы. С его помощью задаются основные параметры системы и осуществляется управление самим процессом загрузки. Если код загрузки рабочей станции с сокращенным набором команд (RISC) обращается чаще всего к последовательной консоли, то код загрузки компьютера (традиционно обозначаемый как BIOS) предполагает наличие соответствующей графической карты VGA.

Безопасность. Цель удаленного управления заключается в обеспечении глобального доступа к устройству, что означает доступность высокопроизводительной системы для всего мира. Таким образом, ясно, что концепция безопасности решения удаленного управления должна быть тщательно продумана и отработана. Шифрование, подтверждение подлинности и контроль доступа — традиционно применяемые для этого технологии.

Внутреннее соединение. Критерий определяет, через какие интерфейсы администратор осуществляет удаленное управление контролируемым компьютером. Помимо типичных аппаратных интерфейсов, таких, как выход VGA или кнопка сброса, распространены и программные интерфейсы.

Виртуальные устройства. Они дают возможность системе управления эмулировать на компьютере оборудование, которое в действительности к нему не подсоединено. Чаще всего виртуальные устройства используются для того, чтобы загрузить компьютер с альтернативного образа диска, передача которого осуществляется через управляющее соединение.

Программное обеспечение управления. Наибольшее распространение получили две концепции: система управления может использовать нестандартный или стандартный протокол. В первом случае требуется применение специального программного обеспечения. Во втором — можно применять любое соответствующее стандарту программное обеспечение. Промежуточное положение занимает выбор в качестве коммуникационного протокола НТТР или telnet. Эти протоколы стандартизированы, следовательно, вполне подойдет стандартное ПО, например браузер Web. Правда, они не поддерживают определение и обмен метаинформацией, каковая описывает функциональность решений. Это значит, что собственные интерфейсы пользователей, в свою очередь, нестандартны.

Распространение. Распространенность решения определяется тем, насколько оно значимо практически или как проверено на практике.

В группе оборудование имеется удлинитель интерфейса. Под этим понимается дополнительное аппаратное обеспечение, позволяющее удлинение существующего интерфейса, поэтому его рассматривать в сравнении не будем.

Для устройств, к которым не применимы вышеописанные критерии сравнения, не будет указан критерий. Сравнительные характеристики приведены в таблице 1.

Таблица 1 – Сравнительные характеристики


Класс

Независимость от операционной системы.

Внешние коммуникационные соединения

Доступ к коду загрузки/BIOS

Безопасность

Внутреннее соединение

Виртуальные устройства

Программное обеспечение управления

Распространение

Платы дистанционного управления

Доступ /оборудование /провайдер

да

Ethernet, модем (ISDN)

да

SSL и авторизация

Питание, сброс, напряжение, VGA, клавиатура, мышь, IPMI

да

На базе Web или нестандартное

На серверах и зависимы от изготовителя

Последовательные консоли

Доступ /оборудование/адаптер

да

Ethernet, модем (ISDN)

да

SSL

RS232

нет

telnet, ssh

вычислительные центры с компьютерами UNIX

Устройства управления клавиатурой, монитором и мышью (Keyboard, Video, Mouse, KVM)

Доступ /ПО/сервер

нет

Все интерфейсы хоста

нет

SSL

клавиатура, монитор, мышь

возможны, но не загрузка

Любое стандартное идущее в комплекте с ОС, нестандартное

Широкое применение для управления и удаленной поддержки

Программное обеспечение удаленного доступа

протокол

-

-

-

аутентификация/ шифрование

-

-

Любое клиентское ПО с поддержкой SNMP

Широко распространен в сетевом оборудовании

Простой протокол управления сетью (Simple Network Management Protocol, SNMP)

протокол

-

-

-

аутентификация/ шифрование

-

-

Любое клиентское ПО с поддержкой SNMP

Широко распространен в сетевом оборудовании

Управление на базе Web (Web Based Enterprise Management, WBEM)

протокол

-

-

-

HTTPS/SSL

-

-

Браузер Web, нестандартное

Мало распространены


В таблице были рассмотрены изолированно друг от друга различные системы. Однако зачастую лишь умелая комбинация технологий приводит к желаемой программе управления. Типичным примером является подключение устройства для работы с клавиатурой, монитором и мышью по IP к компьютеру, у которого одновременно должны быть в распоряжении и другие параметры платы, в частности сброс и питание. Подключение реализуется очень просто при помощи IPMI, естественно, если компьютер и работающее через IP устройство KVM его поддерживают.
Наиболее дороги из всех обсуждаемых технологий дистанционного управления работающие по IP устройства KVM. Расходы можно снизить путем их комбинирования с традиционными переключателями KVM, у которых есть все необходимое для переключения подсоединенного компьютера на аналоговый путь.

Однако важный вопрос остается без ответа: «Как со всеми этими возможностями, которые дает мне в руки удаленное управление, решить мою собственную проблему? К примеру, что делать, если не загружается мой управляющий компьютер?» Ноу-хау администраторов имеет решающее значение для беспрепятственной эксплуатации оборудования, а удаленное управление между тем позволит значительно снизить затраты и сократить время на решение определенных задач.


Литература:

  1. Baker M. et al. Cluster Computing White Paper. Final Release, Version 2.0.

  2. Описание виртуальных сетевых вычислений (http://www.uk.research.att.com/vnc)

  3. Ройзензон Г.В. СППР для выбора вычислительных кластеров // Труды международных научно-технических конференций «Интеллектуальные системы» (IEEE AIS’03) и «Интеллектуальные САПР» (CAD-2003). Т. 1. М.: Физмат-лит, 2003. С. 443–448.

  4. Андреев А.Е., Попов Д.С., Жариков Д.Н. Building of high-performance cluster system based on existing pool of computers using GNU/ Linux operating system. Известия ВолгГТУ, №6(54), 2009. С. 48-51.

  5. Рабочая группа по распределенному управлению DMTF (http://www.dmtf.org/standards/)

Обсуждение

Социальные комментарии Cackle