Библиографическое описание:

Григорьев И. В., Шангареева Г. Р., Мустафина С. А. Сравнительный анализ численного решения задач оптимального управления // Молодой ученый. — 2016. — №23. — С. 12-15.



Данная работа посвящена анализу численных методов решения задач оптимального управления: метода последовательных приближений и метода вариации. Работа данных алгоритмов была апробирована на конкретном тестовом примере с известным аналитическим решением.

Ключевые слова: метод последовательных приближений, метод вариаций, оптимальное управление, фазовые ограничения

Проблеме численного решения задач оптимизации химико-технологических процессов уделяют особое внимание [1]. Во многих практических задачах правые части уравнений математической модели процессов имеют сложный вид, поэтому уравнения принципа максимума Понтрягина не всегда удается решить аналитически. Задача разработки или выбора наиболее эффективных численных алгоритмов в данном случае играет очень важную роль [2].

Пусть состояние физического процесса или объекта характеризуется переменными состояния (фазовыми координатами) . Физический процесс или динамика объекта описывается системой дифференциальных уравнений (уравнениями состояния):

(1)

где — функция, характеризующая управляющее воздействие, – время.

Задача оптимального управления заключается в определении функции управления в интервале которая обеспечивает экстремум (максимум и минимум) критерия качества, заданного в виде функционала:

(2)

и удовлетворяет ограничению:

(3)

где — заданные непрерывно дифференцируемые функции [4].

Рассмотрим различные алгоритмы для решения задач оптимального управления.

Алгоритм метода последовательных приближений.

Задача оптимального управления (1) — (3) с помощью принципа максимума может быть сведена к решению краевой задачи системы дифференциальных уравнений 2n-го порядка.

Введем мерный вектор сопряженных переменных (импульсов) и функцию Гамильтона :

.(4)

Запишем сопряженную систему:

(5)

с граничными условиями:

.(6)

Согласно принципу максимума искомое оптимальное управление доставляет функции максимум по при любом , если и удовлетворяют системе (1) и граничным условиям (6).

Одним из наиболее распространенных методов решения указанной краевой задачи является метод последовательных приближений в пространстве управлений.

Задаем в качестве первого приближения некоторое допустимое управление , (выбор его может быть основан на каких-либо физических соображениях) и полагаем счётчик числа итераций равным 0.

Метод итерационный и итерация заключается в следующем:

  1. Интегрируем управляемую систему с управлением до момента . При этом определяется траектория и граничные условия для сопряженной системы.
  2. Интегрируем сопряженную систему от момента до при , — определяем сопряженные переменные на интервале .
  3. Определяем новое приближение на интервале из максимума функции :

(7)

  1. Если условие (7) определяет неединственным образом, то выбираем любое из возможных значений. После этого переходим к следующей итерации и т. д.

Если процесс последовательных приближений сходится, то продолжаем его до тех пор, пока последующие приближения не будут отличаться друг от друга в пределах заданной точности [5]. Полученное после сходимости решение будет удовлетворять принципу максимума. Следует также отметить, что сходимость итерационного процесса существенно зависит от выбора первого приближения.

Алгоритм метода вариаций.

Положим, что известно некоторое управление , которое будем называть невозмущенным управлением.

В методе вариаций на каждой итерации вариация управления определяется путем минимизации линейной части приращения функционала , вызванного этой вариацией:

.

Здесь – некоторая малая окрестность невозмущенного управления .

Общая схема метода вариаций в пространстве управлений:

  1. Полагаем счётчик числа итераций равным нулю и задаем начальное приближение к оптимальному управлению .
  2. Решаем задачу Коши для системы дифференциальных уравнений (1) с управлением, полученным на предыдущем шаге — получаем фазовую траекторию .
  3. Вычисляем — значение функционала качества (3) на невозмущенной траектории . Запоминаем значение критерия и управление в достаточном числе точек.
  4. В окрестности невозмущенной траектории выполняем линеаризацию задачи — вычисляем функциональную производную и определяем окрестность невозмущенной траектории.
  5. Из условия

находим приращение управления

  1. Полагаем .
  2. Повторяем цикл с п.2 до тех пор, пока не выполнится условие [6].

Вычислительный эксперимент.

На основе созданных алгоритмов реализован программный комплекс на языке Object Pascal в среде Delphi [7-8], который включает возможности остановки процесса. При этом погрешности будут рассчитываться по евклидовой норме [9]:

Тестовый пример. Пусть управляемый процесс описывается системой дифференциальных уравнений:

(8)

с начальными условиями:

,(9)

и следующими ограничениями на переменную времени:

(10)

и на управление:

(11)

Критерий оптимизации имеет вид

(12)

Требуется найти оптимальное программное управление и соответствующую ему траекторию , которые удовлетворяют уравнениям (8)-(9), ограничениям (10)-(11) и условию (12).

При отсутствии фазового ограничения оптимальное управление в задаче можно найти, используя принцип максимума для задачи со свободным правым концом.

Результат аналитического решения задачи представлен в работе [1].

В таблице 1 и представлен сравнительный анализ результатов численного решения задачи (8)-(12) методом вариации и методом последовательных приближений.

Полученные результаты показывают удовлетворительное согласование с аналитическим решением.

Таблица 1

Сравнительный анализ результатов решения задачи при точности вычислений 10-3

Начальное приближение

Скорость вычислений, с

Погрешность

Значение функционала

Метод вариаций

0,9

3,84

2,962

0,016

0,017

-3,996

Метод последовательных приближений

0,9

0,54

0,998

1,419

1,419

-3,783

Литература:

  1. Григорьев И. В., Мифтахов Э. Н., Мустафина С. А. Математическое моделирование процесса полимеризации стирола с малеиновым ангидридом // Вестник технологического университета. 2015. Т. 18, № 15. С. 211-217.
  2. Григорьев И. В., Мифтахов Э. Н., Мустафина С. А. Математическое моделирование процесса полимеризации стирола с малеиновым ангидридом в гомогенной среде // В сборнике: Математическое и компьютерное моделирование естественно-научных и социальных проблем материалы X Международной научно-технической конференции молодых специалистов, аспирантов и студентов. Под редакцией И. В. Бойкова. 2016. С. 248-252.
  3. Григорьев И. В., Михайлова Т. А., Мустафина С. А. О численном алгоритме метода вариаций в пространстве управлений // Фундаментальные исследования. 2015. № 5-2. С. 279-283.
  4. Григорьев И. В., Мустафина С. А. Алгоритм глобальной оптимизации функций с использованием параллельных технологий. // Научный вестник. 2014. № 2 (2). С. 145-153.
  5. Григорьев И. В., Мустафина С. А. Нахождение оптимального программного управления методом вариации // Альтернативные источники энергии в транспортно-технологическом комплексе: проблемы и перспективы рационального использования. 2015. Т. 2. № 1. С. 254-257.
  6. Григорьев И. В., Мустафина С. А. Нахождение оптимального программного управления методом итераций // Путь науки. 2015. № 5 (15). С. 10-13.
  7. Шангареева Г. Р., Григорьев И. В., Мустафина С. А. Программное средство «SAOptimal» для решения задач оптимального управления // Хроники объединенного фонда электронных ресурсов Наука и образование. 2015. № 8-9 (75-76). С. 52.
  8. Григорьев И. В., Шангареева Г. Р., Мустафина С. А. Программный продукт «VarOptimalControl» решения задач оптимального управления // Хроники объединенного фонда электронных ресурсов Наука и образование. 2015. № 8-9 (75-76). С. 46.
  9. Григорьев И. В., Мустафина С. А. Реализация численного алгоритма решения задач оптимального управления с фазовыми ограничениями // Аспирант. 2015. № 5-1 (10). С. 49-51.

Обсуждение

Социальные комментарии Cackle