Метод лагранжа-понтрягина для непрерывных управляемых процессов
Метод лагранжа-понтрягина для непрерывных управляемых процессов
6.1.
Уравнения метода
Теоретической основой всех рассматриваемых нами вычислительных методов ТОУ являются достаточные условия оптимальности В.Ф. Кротова. Эти условия проявляются как признак оптимальности применительно к непрерывным и дискретным управляемым процессам (х*, и*) в общем виде. Ставя при формулировке задач ТОУ ряд дополнительных ограничений на постановку задачи, получаем соотношения в форме Лаг-ранжа—Понтрягина как необходимые условия оптимальности. Последние вытекают из теорем о достаточных условиях оптимальности, отвечая необходимым условиям выполнения этих достаточных условий*. Применительно к непрерывным управляемым процессам (двухточечная краевая задача для системы дифференциальных уравнений) они известны в виде принципа максимума Понтрягина. Говорят и о дискретном принципе максимума [1], однако со школой Л.С. Понтрягина он не связан, и мы в главах 7 ив будем называть его методом Лагранжа.
* Напомним, что условие А необходимо для выполнения условия В, если из ложности А (обозначается А — не А) следует В. Из истинности А может следовать A v А.
Рассмотрим следующую задачу ТОУ для непрерывной системы: пусть заданы дифференциальные уравнения процесса — = /'(Лл,м),і =l,2,...,/i; (6.1)
x = (xx2t...txn) u = (ul9u29...9ur)9
где x — л-мерный вектор состояния системы; и r-мерный вектор управления.
На управление может быть наложено ограничение
и є £/', (6.2)
где U* є Rt — некоторая область возможных значений управления (R -множество действительных чисел, векторов), которая может изменяться во времени.
Для дифференциальных уравнений (6.1) будем считать заданным начальное состояние системы в виде совокупности условий:
Л0) = *ю,/ = 1,2,...,л. <6-3)
Кроме того, может быть задано состояние системы в конечный момент времени t = Т
х1(Т) = хП91 = 9 29...9т9 m<n9 <6-4)
представляющее дополнительное ограничение на протекающий в ней процесс (х(0, и(0). Ограничения (6.4) могут быть заданы не по всем переменным, а лишь по некоторой их части, в данном случае — по первым т.
Будем считать, что качество процесса оценивается функционалом
т
J = j(t9x9u)dt + F(x(T))^>min. (6-5) о
Если правый конец траектории процесса зафиксирован с помощью соотношений (6.4), то второе слагаемое в формуле (6.5) является постоянной величиной и не влияет на нахождение оптимального решения.
Требуется определить процесс (х*(0, н*(0)> удовлетворяющий ограничениям (6.1) — (6.4) и минимизирующий функционал (6.5). Такой процесс, как уже известно, называют оптимальным.
Рассматриваемая задача — частный случай общей задачи ТОУ, поставленной в разд. 4.2; в ней по сравнению с общим случаем отсутствуют ограничения на состояние системы, множество допустимых управлений U не зависит от состояния х. Все это будет использоваться в дальнейшем.
Предположим, что (x*(t), u*(t)) — допустимый процесс, удовлетворяющий теореме 4.2 о достаточных условиях оптимальности (см. разд. 4.2). Это означает, что существует функция ср (/, х), обладающая тем свойством, что выражение
н(^и) = ^І^ґ(^и)-/\%^ (6.6)
* ,=1 дх1
достигает при V/є [0; Т максимума по переменным х, ив точке (x*(t), u*(t)), а функция
<&(x) = <p(T,x) + F(x)
(6.7)
принимает минимальное значение при х = х*(7). Если условия
на правом конце траектории заданы для всех m = л, то требование минимума выражения (6.7) превращается в тривиальное, так как множество, на котором определена функция Ф(х), вырождается в единственную точку.
Процесс (x*(f), u*(f)), удовлетворяя достаточным условиям оптимальности (см. теорему 4.2), является оптимальным. С учетом отмеченных выше частных особенностей системы (6.1) —
выведем из нее некоторые следствия.
Принимая во внимание свойства функции ср (/, х) (см. разд. 4.2), введем в рассмотрение переменные
^^lxM)=V,-W. і = 1.2..... л. (6.8)
Вектор-функция x*(t) справа от вертикальной черты в соотношении (6.8) означает, что после вычисления градиента по
х ^ вектор х должен принять значение x*(t). Аналогич-дх
ные обозначения будут использоваться и в последующем. Вектор-функция V(0 = (Vi(0,V2(0..».Vn(0) при каждом фиксированном значении t— градиент функции ф (t, х) в точках оптимальной траектории х = x*(t).
Введем в рассмотрение так называемую функцию Гамильтона (другое название — гамильтониан):
//(/,*, м) = £ ЩҐіг^и) f°(t,x,u). <6-9) /=і
С ее помощью функция R(t, jc, и) может быть записана в виде
Rit,x,u)=Q + H(t,x,^,u). (6-Ю) at дх
Так как процесс (x*(t), uf)) удовлетворяет достаточным условиям оптимальности, то согласно условию 1 теоремы 4.2 при
V/є [0; Т
R(t,x*(t), uV))>R«,x, и) (6.11)
для всех (х, и) є Vх. Отсюда, в частности, вытекает, что неравенство
R(t,x*(t), uV))>R(t,x(t), и)
выполняется для всех допустимых значений управления и є Vх.
Сравнивая последнее неравенство с (6.10), получаем в качестве следствия (так как слагаемое не зависит от и), что
dt
H(t,x*(t)Mt)>u*(t))^H(t,x*(t)Mt)*u)Это неравенство говорит о том, что выражение #(/, x*(t), |/(0, м), рассматриваемое при каждом фиксированном значении t є [0, Т как функция от и, достигает максимального значения при и = и *(t). Это обстоятельство может быть выражено в следующей форме: //(r,jc*(r)>|f(r),n*(0) = max//(r,jc*(r),|f(r)>ii(r)) (6.12)
ueU1
или, что то же самое,
w * (г, д: * (r),|/(r)) = arg max Я (г, д: *
ugU1
Таким образом, в качестве следствия из существования функции ф (t, х) установлено, что существуют такие векторные функции |/(/) = |/,(/), |/2(/),-., yn(t)), при которых выражение H(t, **(/)> |/(/), u(t)) удовлетворяет условию максимума (6.12).
Из неравенства (6.11) при произвольных значениях /, х и и = = н*(0 следует, что функция R(t, х, u*{f)) при х =x*(t) достигает максимального значения. Так как в рассматриваемой задаче ТОУ ограничений на вектор состояния системы не накладывается, то в точке максимума х = x*(t) частные производные функции
R(t,x,u)x*(t)M*(t):
ах
Подставляя в последнее выражение формулу (6.6), получаем, что при х = x*(t) должно выполняться равенство
Э2ф(г,х),
" Э2ф(г,л0,
drdx y=i [ dx dxJ
, Эф(Г,х), Э/У(Г,*,ц*(р), І Э/°(Г,*,ц*(Г)), _ (613)
«= 1,2 п.
Левую часть выражения (6.13) представим в виде двух слагаемых:
! _Э2Ф(г,х) "Э2Ф(и) f^rrn^l
drdx 7=i dxdx7 (6.14)
і = 1,2,...,л;
с2_£ЭФ(г,*), dfi(t,x,u*(t)){ Э/°(г,*,и*(г)),
7=1 Э*' дх дх (615)
і = 1,2 п.
Для преобразования выражения (6.14) вычислим производную cWjitj/dt.
Согласно формуле (6.8) будем иметь
dVj(t) _ d Эф(Г,*)ч,
Используя правило вычисления производной сложной функции, получим
<f|ff(r)_32<p(r,*)4, , £ Э2<р(г,лс), <fcJ(Q ._
^r=^^)U')+;?1^ru')^T'J=u
Так как х*(0 удовлетворяет вместе с u*(t) уравнениям процесса (6.1), то
Сопоставляя теперь последние два равенства с условием (6.14), получим
5«.4Ш ,.1,2. ,.
а/
Заменив теперь в выражении (6.15) дфОу*) на|/;(г), с учетом формулы (6.9) можем получить, что
c2_dH(t,xM0,u*(t)){
~ И*). — 1,^,...,AZ.
Теперь соотношение (6.13) можно с учетом условий (6.14) и
1 2
(6.15) и полученных выражений для St и S, записать в виде
107
^sjHjt,xMiU*«)) i= (616)
dt dx1 (h
Следовательно, из существования ф(г, х) вытекает, что задаваемая равенством (6.8). функция |/(г) удовлетворяет вместе с x*(t) и u*(t) системе уравнений (6.16).
Как следует из условия 2 теоремы 4.2 и соотношения (4.11), в конечный момент времени / = Г для состояния x*(t) справедливо неравенство
ф(7* *(Г)) + F(jc*(Г)) < ф(7 jc) + F(x) (6-17)
для Ухе Vlx возможных состояний системы. В рассматриваемой задаче множество V*x задается условием (6.4), согласно которому первые т координат хп, х21,..., хт1 вектора х(Т) заданы, остальные же могут принимать произвольные значения. Тогда функция Ф(Г, х) = ср(Г, х) + F(x) будет зависеть от п — m переменных Jcm+1, xm+2,..., хп. Так как на эти переменные никаких ограничений не накладывается вследствие необходимого условия оптимальности
ЭФ(7*) А . ,
— , = О, i=m + U m + 2,...yn,
дх1
получаем с учетом равенства (6.7) Эф(Г,дг), dF(x).
——— L*(7)=—г-rUr). + т + 2,...,л.
дх дх
Но левая часть последнего соотношения есть согласно определению (6.8) VI//7).
Следовательно, это соотношение принимает вид
у.(Т) = -?Щ±х*{Т), | = w + i, Ш + 2.....Л. (6Л8) Эх'
Соотношения (6.18) называются условиями трансверсальности. Полученные результаты можно сформулировать следующим образом. Пусть функция ф(/, х) и процесс (х*(0, «*(0) удовлетворяют теореме 4.2. Тогда существуют такие значения вектор-функции |/ = которые вместе с (x*(t), u*(t)) удовлетворяют условию (6.12) максимума функции Я (Г, х, у, и) и системе дифференциальных уравнений (6.1) и (6.16). Кроме того, в начальный момент времени / = 0 для состояния х(0 выполнены начальные условия (6.3), а в конечный момент t = Г переменные x(t) и |/(Г) удовлетворяют условиям (6.4) и (6.18). Перечисленные условия (6.1), (6.3), (6.4) (6.12), (6.16) и (6.18) представляют собой соотношения метода Лагранжа—Понтрягина, позволяющего получить решения задач ТОУ.
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы