Применение необходимых условий оптимальности в форме лагранжа -понтрягина
Применение необходимых условий оптимальности в форме лагранжа -понтрягина
8.1.
Цели исследования. Оптимальное управление движущимся объектом
Рассмотрим постановки и решения ряда задач оптимального управления для непрерывных и многошаговых (дискретных) процессов. Необходимые условия оптимизации в форме Лаг-ранжа—Понтрягина являются аппаратом оптимизации процесса. В соответствии с теоремой 6.2 дополнительного доказательства оптимальности во всех рассматриваемых случаях не требуется, так как в разд. 8.1 решается линейная задача, а в разд. 8.2 и 8.3 — две содержательно сходные задачи соответственно для многошаговых и непрерывных процессов с выпуклыми функционалами и линейными ограничениями.
Для линейной задачи краевая задача решается точно и оказывается возможным провести некоторый качественный анализ еще до получения решения; для многошаговых и непрерывных процессов краевые задачи решаются приближенно численным методом прямой прогонки (см. разд. 1.6).
Две последние задачи, содержательно между собой очень близкие, приводятся вместе для сопоставления техники математических выкладок и расчетных схем. Это дает возможность увидеть сходство и различие в однотипных постановках задач и подходах к их решению.
Последний разд. 8.4 этой главы можно рассматривать как завершение магистральной теории(сл*. разд. 5.2).
На представленных в данной главе примерах имеется возможность убедиться в инвариантном характере методов ТОУ. Первый пример относится к механике как разделу физики, остальные три к экономике. Последнее неслучайно, так как учебное пособие ориентировано прежде всего на экономистов. Важно, чтобы они знали об универсальности методов изучаемой ими теории.
Пример 8.1. Рассмотрим прямолинейное движение некоторого объекта с двигателем (например, автомобиля). Объект имеет массу /г?, а двигатель обеспечивает воздействие на него силы F, не превышающей по абсолютной величине значения у, И ^ Y-Если приложенная сила разгоняет объект, то ее значение принимается положительным, если тормозит — отрицательным.
Пусть в момент / = 0 начальные путь и скорость нулевые, т.е. объект находится в покое: s(0) = ^(0) = 0; s(t) и v(t) — соответственно пройденный путь и скорость в произвольный момент /.
Требуется найти такой оптимальный режим управления (разгона и торможения), чтобы объект прошел заданный путь L в минимальное время и остановился.
Построим математическую модель движения объекта. Для этого воспользуемся вторым законом Ньютона, в соответствии с которым произведение массы объекта на ускорение его движения равно приложенной силе F. Ускорение равно производной от скорости по времени. Скорость движения — это, в свою очередь, производная от пройденного пути по времени.
На основе сказанного запишем дифференциальные уравнения
т
dv _ F ds
dt ' dt
(8.1)
ограничения для рассматриваемого процесса
F|<y;
(8.2)
5(0)= 0,1/(0) = 0;
(8.3)
s(T) = L,u(T) = 0
(8.4)
и функционал
Т —> min,
(8.5)
который отражает достижение конечной цели (8.4) за минимальное время.
Итак, математическая модель движения управляемого объекта построена. Дифференциальные уравнения (8.1) это уравнения процесса, причем скорость v и путь s — компоненты вектора состояния, сила F — параметр управления. Это вытекает из общей постановки задач оптимального управления и отвечает формальным признакам, позволяющим отличить параметры состояния системы (входят в уравнения процесса как сами по себе, так и со своими производными) от параметра управления (сила F входит в одно из уравнений процесса (8.1) только сама по себе, без производной).
Неравенство (8.2) задает ограничение на управление, условия (8.3) и (8.4) — соответственно начальное и конечное состояния системы, (8.5) — функционал, характеризующий задачу о быстродействии. Так называют задачи ТОУ, в которых функционал отражает цель оптимизации управления — достижение некоторого предусмотренного результата за минимальное время.
До сих пор рассматривались управляемые процессы, для которых время Г считалось заданным. При этом система дифференциальных уравнений метода Лагранжа—Понтрягина включала 2п уравнений с 2п искомыми функциями. Соответственно было 2п граничных условий, включая, если необходимо, условия трансверсальности (6.18). В данном случае при тех же 2п дифференциальных уравнениях и 2п искомых функциях появляется еще одна неизвестная — величина Г. Для однозначного решения системы с 2п + 1 уравнениями и с таким же количеством неизвестных требуется дополнительное условие трансверсальности. Оно имеет вид
Н(Т,х*(Т)МТ), и*(Т)) =
dF(x) дТ
х*(Т) >
(8.6)
вывод приведен в [12, с. 190, формула (8.30)]. Условием трансверсальности (8.6) воспользуемся ниже в процессе решения задачи.
Последовательность решения задачи (8.1) (8.5) в целом соответствует процедуре реализации принципа максимума, только лишь следует дополнительно использовать формулу (8.6) для определения времени движения объекта Т. В рассматриваемой задаче, учитывая, что в функционале (8.5) подынтегральная функция /°(/, х, и) = 0, а терминальный член F(x(t)) = Г, на основе формулы (8.6) получаем
Н(Т,х*(Т),у(Т)9и*(Т)) = . <8-7)
В соответствии с постановкой задачи (8.1) (8.5) функция Гамильтона будет иметь вид
Я(/ х, |/, и) = |/, — + |/2*л <8-8) m
где х — (v, s) и = F.
Максимизация функции (8.8) по управлению /"дает
F(yx) = arg max Я (t,x, |/,w) = |F|<y
у, у|/,>0;
-у, у! < 0;
VFe[-Y;y], Vl=0.
(8.9)
Теперь составим систему уравнений принципа максимума:
m =р(щ) at
ds
(8.10)
dyx(t) _ дН _
dt rfy2(0
эя
" ds
(8.11)
Здесь краевые условия задаются равенствами (8.3) и (8.4).
Сопряженные уравнения (8.11), как и должно быть в линейных задачах, интегрируются независимо от исходных уравнений процесса (8.10). Решение второго уравнений (8.11) сразу дает |/2 = = Сх. Интегрируя затем первое уравнение (8.11), получаем
щ=-СхГ + С2, (8.12) где С, и С2 произвольные постоянные.
Из формул (8.9) и (8.12) еще до получения оптимального решения можно сделать вывод: так как линейная функция (8.12) может иметь не более одной перемены знака, то оптимальный режим управления будет заключаться не более чем в одном переключении двигателя рассматриваемого объекта.
При этом одно переключение двигателя должно быть обязательным, ибо в противном случае функция \fx(t) не будет менять при t є [0; Т знака. Следовательно, согласно формуле (8.9) действующая сила будет максимальной по абсолютной величине и равной ±у, т.е. объект будет двигаться под действием максимальной силы тяги двигателя в нужном или противоположном направлении и никогда не остановится. Переключение двигателя может иметь место, но при этом величина \f{(t) при W є [0; 7] не будет менять знак. Этот случай, по существу, оказывается аналогичным предыдущему, и его также следует исключить из рассмотрения. Если при изменении знака функции vj/^O при te [0; 7] она сначала будет отрицательной, а после переключения знака — положительной, то объект вначале поедет в противоположную от необходимого направления сторону, а затем — в нужную. Ясно, что при этом длина общего проезда увеличится, и минимальным время движения Т быть не может. Остается один вариант: сначала объект разгоняется под действием силы тяги двигателя у, а затем тормозится с силой торможения —у и в результате останавливается, пройдя путь s за минимальное время. Итак, выбрав на качественном уровне стратегию управления (сначала разгон, затем торможение), продолжим необходимые расчеты. В этом случае на первом этапе разгона получаем систему уравнений
dv ds dt 1 dt
(8.13)
5(0)=0;р(0)=0;/є[0;т], (8.14) где т < Т — момент переключения двигателя с разгона на торможение. Уравнения (8.13) без труда интегрируются:
m
s(t) = 1— + CV + C4, m 2
где C3 и C4 — произвольные постоянные.
Учитывая начальные условия (8.14), получаем С3 = С4 = 0. В результате решение дифференциальных уравнений (8.13), удовлетворяющее начальным условиям (8.14), имеет вид
V(t) = l-ts(t) = — t2. (8Л5) m 2m
Момент t = т, соответствующий переключению двигателя с разгона на торможение, с учетом формулы (8.12), отвечает условию
|/1(т) = -С1т + С2 =0,
откуда
T = £l .(8.16)
На временном отрезке Г є [т; 7] функция |/j(7) < 0, F= -у и уравнения (8.1) примут вид
m^ = -r^ = ^ (8.17) dt dt
Начальным условием для уравнений (8.17) будет состояние системы в момент t = т, отвечающее формулам (8.15) и (8.16). С учетом этого для двух дифференциальных уравнений (8.17) получаем начальные условия
"(*)=^;Ф) = -Ч£)2.
m C[ 2m C,
(8.18)
Интегрируя уравнения (8.17) с учетом начальных условий (8.18), получим при ґє [т; 7]
р(0 =
5(0 =
t
— + 2
-1( + ^2 т
_х
т
/и С,
(8.19)
Чтобы определить произвольные постоянные Cj и С2, необходимо удовлетворить в решении (8.19) двум граничным условиям (8.4). Но при этом появится третья неизвестная величина Т. Для определения трех искомых величин Ср С2, Г воспользуемся, кроме двух соотношений (8.19), третьим условием трансверсальности (8.7).
Итак, получены три алгебраических уравнения:
,(Л = -ХгЗ^=0; т т Сх
s(T) = -
V 1 J
т С,
(8.20)
(-ClT + C2)(-j-) + Civ(T) = l.
Решение системы уравнений (8.20) имеет следующий вид:
С &С2=^;Г = 2& <8-21) Ly у V У
С Т
При этом оказывается, что Т = 2-рг или т = —» т.е. переклюЧ 2
чение двигателя с разгона на торможение в оптимальном режи-152 ме должно осуществляться посередине интервала движения. Пройденный путь с учетом второй формулы (8.15) и третьей (8.21) также будет равен половине необходимого для прохождения пути:
s(x) = s= -. 2 2
Итак, рассмотрен режим, удовлетворяющий необходимым условиям оптимальности, при этом поставленную краевую задачу (8.10), (8.11), (8.3), (8.4) удалось решить в аналитической форме.
Вследствие линейности задачи доказательства оптимальности полученного решения не требуется (см. разд. 6.3).
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы