6.3. принцип максимума как достаточное условие оптимальности
6.3. принцип максимума как достаточное условие оптимальности
Рассмотрим, чем обусловлено название «принцип максимума» и к чему оно относится, если функционал в форме интеграла, оценивающий качество управляемого процесса (х*(0, м*(0) (см. разд. 6.1, формула (6.5)), устремляется к минимуму. Можно, конечно, подынтегральную функцию брать со знаком минус, и тогда на том же оптимальном процессе (х*(0, м*(0) интеграл (6.5) будет достигать максимума. Однако этот искусственный прием вряд ли служит основанием для названия метода.
Суть дела в том, что из всех операций метода, изложенных в разд. 6.2, максимизация функции Гамильтона (см. условие 1 теоремы 6.1) при большой размерности векторов состояния х и управления и — наиболее трудоемкий процесс. Эта самая сложная операция и дала название методу.
Принцип максимума как необходимое условие оптимизации управляемых процессов не гарантирует оптимальности. Он только позволяет отсекать из множества допустимых заведомо неоптимальные процессы, когда его условия не выполняются, а остальные процессы, удовлетворяющие принципу максимума, следует воспринимать лишь как кандидаты в оптимальные. Даже если такой кандидат один, из содержательных условий задачи должно вытекать знание о наличии оптимального процесса. Тогда этот процесс и будет оптимальным. Однако при строгих рассуждениях это неубедительно, нужны более точные аналитические оценки. Они существуют и формулируются в виде следующей теоремы.
Теорема 6.2. Для задачи
т
j = 1 f°(t,x,u)dt + F(x(T)) -> min; о
dx
— = f(t,x,u) dt
u(t)eUl
x(0) = x0;x(T)eVx
принцип максимума обеспечивает оптимальность найденного процесса, если:
а) подынтегральная функция /°(/, jc, и) выпукла по х и и
в каждый момент времени te (0; 7);
б) терминальный член F(x(T)) — также выпуклая по х
функция;
в) дифференциальные уравнения процесса линейны, т.е.
имеют вид
dx п г -г = X aij(t)Xj + X ^(0; / = І.»."; dt j= к=
г) множества Vі и vj выпуклы, при этом множество vj
может вырождаться в одну конечную точку х(Т)е Vx .
В этом случае имеем задачу с обоими закрепленными концами.
Поскольку в разд. 6.2 рассмотрено решение линейного примера 6.1, а он выпуклый и вогнутый одновременно (в данном случае нам нужна только выпуклость), то было получено оптимальное решение.
Доказательство. Проведем те же операции, с помощью которых были выведены уравнения принципа максимума, но при этом покажем, что при сделанных в условиях теоремы 6.1 предположениях они обеспечивают не только необходимые, но и достаточные условия оптимальности процесса.
В теореме о достаточных условиях оптимальности необходимо найти такую допустимую векторную пару (х*, и*), чтобы выполнялись два условия:
l)tf(f,jc*,h*)= max R(tyxyu)y Vre (0;f); (jc,w>=v'
Я(Лх.И) = І^//(івх.И)-/°(г.х.И)3;
i=i дхі dt
2)Ф(**(Г))= min Ф(х).
При выводе уравнений принципа максимума (см. формулу (6.10)) было показано, что
Эф
/?(/,**, и*) = max R(tyx*yu) = max H(tyx*y\fyu) +
uevu uzvu at
a / ч (6-33)
w> - э Ho'
В результате этого имеем
и * (г) = arg max R(ty х * (г), и(г)) = arg max Я (г, * * (О, V, и).
Далее при фиксированном и= u*(t) максимизация функции R(t, х, и) была заменена лишь необходимыми условиями максимизации ^R(t,x,u *(0) | _ ^ j = ^ 2,.,,, Пу откуда получили сопряdxj
женную систему уравнений
x*(t),u*(t) •
d\fj _ дН(гухМ*1")
dt dxj
Покажем, что для рассматриваемого в этой теореме класса процессов операция
dR(tyxyu). . (6 34)
—^— Ио,«*(0 = °»■/ = !>2>->я» 1 '
эквивалентна maxtf(r,jt,w) при / є (0; 7). В данном случае
Ж*.х.И)-І^Л(».х.«)-Л».х.И)3,=1 э*( э'
/=1
= £Эср(г,х)
Эх,-
л г у=1 *=1
Эг
Функции у.(f) задаются формулой (6.33). Поскольку фигурирующая в теореме о достаточных условиях оптимальности функция ф(/, jc) в некоторой степени произвольная, зададим ее в виде
п
<р(',*) = 5>, (О*,-.
В результате получаем
Л(^«0 = 5>,-(0 /=1 п г
2aij(t)Xj+^bik(t)uk
7=1 к=
(6.35)
1=1 dt
Кроме функции f°(t, х, w), во все остальные слагаемые выражения (6.35) переменные входят линейно. Функция /°(г, х, и) по условию теоремы выпукла по х и и. Следовательно, функция —/°(/, х, и) вогнута, т.е. имеет вид параболоида («колокола») ветвями вниз. Остальные слагаемые в функции (6.35) линейные и, как известно из теории математического программирования, не изменяют характер вогнутости. Поэтому функция /?(/, х, и) вогнута по х и и и ее максимум по х при фиксированном и = и* достигается в стационарной точке исходя из условия
dR{t,x,u (t) - = о, 7 = 1,2,..., /і. Таким образом, в данном случае dxj
условие (6.34) является не только необходимым, но и достаточным для максимизации функции Л(/, х, и *) по х.
Остается доказать, что условия трансверсальности (6.18) в рассматриваемом случае эквивалентны удовлетворению второго требования (4.11) теоремы 4.2 о достаточных условиях оптимальности.
В данном случае
Ф(х) = ср(7 х) + F(x) = t Уі(Т)х( + F(x).
Первое слагаемое V|(T)jc,линейно по х, второе — по усло-/=1
вию теоремы выпукло. Следовательно, Ф(х) — выпуклая функция. Поскольку рассматривается только случай неограниченных значений х при / = Г (это оговорено при выводе условий трансверсальности), то минимум функции Ф(х) достигается в стацио
нарнои точке — = o,i = l,..., п, откуда |/z (Т) = —-—х*<ту
ох,ОХ;
Таким образом, если в общем случае условия трансверсальности являются только необходимыми условиями оптимальности процесса, то в данном случае они и достаточные.
Теорема 6.2 полностью доказана.
Следствие. Для линейных задач оптимального управления принцип максимума обеспечивает необходимые и достаточные условия оптимальности. Действительно, в данном случае подынтегральная функция /°(/, х, и) и терминальный член F(x) линейные функции своих аргументов. Поскольку линейная функция одновременно и выпуклая, и вогнутая, то требование выпуклости удовлетворяется.
Множество допустимых управлений Vu образовано линейными ограничениями, если задача линейная. А это, как известно из теории линейного программирования, — выпуклое многогранное множество [2]. Следовательно, для линейных задач ТОУ все условия доказанной теоремы выполняются.
Заметим, что принципиально таким же по своим условиям и ограничениям, по общей идее доказательства является суть аналогичной теоремы для многошаговых (дискретных) процессов. Поэтому в главе 7, посвященной методу Лагранжа для многошаговых процессов управления, ее доказывать не будем.
Пример 6.2. Рассмотрим задачу оптимального управления
т j J = j(x2 + u2)dt+-x2(T)-> min; 0 2 dx //чч dt °
Построим, как и в примере 6.1, функцию Гамильтона #(/, х, |/, и) и воспользуемся соотношениями принципа максимума. Согласно формуле (6.9) имеем
Я(Г, х, |/, и) = у(х + и) и2 х2,
откуда из необходимого условия максимума функции #(/, х, ц/,
и) по и — = 0 (максимум действительно имеет место, так как ди
д2Н
ограничений на и нет и —2"<0) получаем выражение через соди
пряженную переменную
и* = ! (6.36)
2"
Если теперь, как и в примере 6.1, составить сопряженную систему, получим
dx 11/
= x + — dt 2
dif _
= 2x-\f. dt
(6.37)
Условие трансверсальности (6.18) дает соотношение
V(7) = -*(7). (6.38)
Таким образом, если учесть начальное условие х(0) = х0, то для нахождения оптимальной траектории x*(t) получаем краевую задачу для системы (6.37). Для отыскания решения краевой задачи найдем общее решение системы (6.37). Его можно получить, исключив в системе дифференциальных уравнений (6.37) одну из переменных х или у и сведя эту систему к одному линейному дифференциальному уравнению второго порядка с постоянными коэффициентами (см. разд. 1.5).
Исключив из второго дифференциального уравнения системы (6.37) величину х, получим
,=!^+!¥. (6.39)
2 dt 2
Далее в первое уравнение системы (6.37) нужно подставить
значения х и —. Поэтому продифференцируем обе части соот dt
ношения (6.39), вследствие чего будем иметь
dx ^d ^ ldp (640) dt 2 dt2 2 dt '
Подставляя выражения (6.39) и (6.40) в первое уравнение системы (6.37), находим
^-2V = 0. (641) dt
Составляем согласно разд. 1.5 характеристическое уравнение для дифференциального уравнения (6.41): р2 2 = 0.
его корни будут Р*Р2 =±л/2.
Следовательно, общее решение дифференциального уравнения (6.41) будет иметь вид
Для определения функции х(і) во втором уравнении (6.37)
потребуется вычислить —, что согласно формуле (6.42) дает
dt
^ = Cie^V2-C2e-^V2. (6-43) dt
Подставляя соотношения (6.42) и (6.43) во второе уравнение системы (6.37) и разрешая ее относительно x(t), получим
^) = £Le^(l + V2)-^e-^(V2-l). (6-44)
Произвольные С, С2 (в общем решении (6.44)) определяем из начального условия jc(0) = х0 и условия трансверсальности (6.38).
Опуская промежуточные трудоемкие, но тривиальные вычисления, будем иметь
yf2T
fc/2-l)e^ + (V2 + l)e-^ (V2-l)(.
+е
J2T . „->/2Гч '
(6.45)
1 +V2
с, =
2*0 + С2(>/2-1)
i+S
(6.46)
Величина С2 в формуле (6.46) определяется по формуле (6.45). В результате оптимальные значения состояния x*(t) и управления u*(t) согласно формулам (6.44) и (6.36) имеют вид
x*(t)
^eA(l + >/5)-|e-A(>/24); "*(0 = ^(С,е^ЧС2е-^).
(6.47)
(6.48)
Значения С, и С2 в формулах (6.47) и (6.48) определяются соотношениями (6.45) и (6.46).
Полученное решение не требует доказательства оптимальности, так как все условия теоремы 6.2 выполнены.
То, что данное решение удалось получить в аналитической форме, — далеко не правило, а скорее «счастливое исключение». В главе 8 мы встретимся с экономическими задачами, где численное решение неизбежно.
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы