Метод лагранжа-понтрягина для непрерывных управляемых процессов

Метод лагранжа-понтрягина для непрерывных управляемых процессов: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.

Метод лагранжа-понтрягина для непрерывных управляемых процессов

6.1.

Уравнения метода

Теоретической основой всех рассматриваемых нами вычислительных методов ТОУ являются достаточные условия оптимальности В.Ф. Кротова. Эти условия проявляются как признак оптимальности применительно к непрерывным и дискретным управляемым процессам (х*, и*) в общем виде. Ставя при формулировке задач ТОУ ряд дополнительных ограничений на постановку задачи, получаем соотношения в форме Лаг-ранжа—Понтрягина как необходимые условия оптимальности. Последние вытекают из теорем о достаточных условиях оптимальности, отвечая необходимым условиям выполнения этих достаточных условий*. Применительно к непрерывным управляемым процессам (двухточечная краевая задача для системы дифференциальных уравнений) они известны в виде принципа максимума Понтрягина. Говорят и о дискретном принципе максимума [1], однако со школой Л.С. Понтрягина он не связан, и мы в главах 7 ив будем называть его методом Лагранжа.

* Напомним, что условие А необходимо для выполнения условия В, если из ложности А (обозначается А — не А) следует В. Из истинности А может следовать A v А.

Рассмотрим следующую задачу ТОУ для непрерывной системы: пусть заданы дифференциальные уравнения процесса — = /'(Лл,м),і =l,2,...,/i; (6.1)

x = (xx2t...txn) u = (ul9u29...9ur)9

где x — л-мерный вектор состояния системы; и r-мерный вектор управления.

На управление может быть наложено ограничение

и є £/', (6.2)

где U* є Rt — некоторая область возможных значений управления (R -множество действительных чисел, векторов), которая может изменяться во времени.

Для дифференциальных уравнений (6.1) будем считать заданным начальное состояние системы в виде совокупности условий:

Л0) = *ю,/ = 1,2,...,л. <6-3)

Кроме того, может быть задано состояние системы в конечный момент времени t = Т

х1(Т) = хП91 = 9 29...9т9 m<n9 <6-4)

представляющее дополнительное ограничение на протекающий в ней процесс (х(0, и(0). Ограничения (6.4) могут быть заданы не по всем переменным, а лишь по некоторой их части, в данном случае — по первым т.

Будем считать, что качество процесса оценивается функционалом

т

J = j(t9x9u)dt + F(x(T))^>min. (6-5) о

Если правый конец траектории процесса зафиксирован с помощью соотношений (6.4), то второе слагаемое в формуле (6.5) является постоянной величиной и не влияет на нахождение оптимального решения.

Требуется определить процесс (х*(0, н*(0)> удовлетворяющий ограничениям (6.1) — (6.4) и минимизирующий функционал (6.5). Такой процесс, как уже известно, называют оптимальным.

Рассматриваемая задача — частный случай общей задачи ТОУ, поставленной в разд. 4.2; в ней по сравнению с общим случаем отсутствуют ограничения на состояние системы, множество допустимых управлений U не зависит от состояния х. Все это будет использоваться в дальнейшем.

Предположим, что (x*(t), u*(t)) — допустимый процесс, удовлетворяющий теореме 4.2 о достаточных условиях оптимальности (см. разд. 4.2). Это означает, что существует функция ср (/, х), обладающая тем свойством, что выражение

н(^и) = ^І^ґ(^и)-/\%^ (6.6)

* ,=1 дх1

достигает при V/є [0; Т максимума по переменным х, ив точке (x*(t), u*(t)), а функция

<&(x) = <p(T,x) + F(x)

(6.7)

принимает минимальное значение при х = х*(7). Если условия

на правом конце траектории заданы для всех m = л, то требование минимума выражения (6.7) превращается в тривиальное, так как множество, на котором определена функция Ф(х), вырождается в единственную точку.

Процесс (x*(f), u*(f)), удовлетворяя достаточным условиям оптимальности (см. теорему 4.2), является оптимальным. С учетом отмеченных выше частных особенностей системы (6.1) —

выведем из нее некоторые следствия.

Принимая во внимание свойства функции ср (/, х) (см. разд. 4.2), введем в рассмотрение переменные

^^lxM)=V,-W. і = 1.2..... л. (6.8)

Вектор-функция x*(t) справа от вертикальной черты в соотношении (6.8) означает, что после вычисления градиента по

х ^ вектор х должен принять значение x*(t). Аналогич-дх

ные обозначения будут использоваться и в последующем. Вектор-функция V(0 = (Vi(0,V2(0..».Vn(0) при каждом фиксированном значении t— градиент функции ф (t, х) в точках оптимальной траектории х = x*(t).

Введем в рассмотрение так называемую функцию Гамильтона (другое название — гамильтониан):

//(/,*, м) = £ ЩҐіг^и) f°(t,x,u). <6-9) /=і

С ее помощью функция R(t, jc, и) может быть записана в виде

Rit,x,u)=Q + H(t,x,^,u). (6-Ю) at дх

Так как процесс (x*(t), uf)) удовлетворяет достаточным условиям оптимальности, то согласно условию 1 теоремы 4.2 при

V/є [0; Т

R(t,x*(t), uV))>R«,x, и) (6.11)

для всех (х, и) є Vх. Отсюда, в частности, вытекает, что неравенство

R(t,x*(t), uV))>R(t,x(t), и)

выполняется для всех допустимых значений управления и є Vх.

Сравнивая последнее неравенство с (6.10), получаем в качестве следствия (так как слагаемое не зависит от и), что

dt

H(t,x*(t)Mt)>u*(t))^H(t,x*(t)Mt)*u)Это неравенство говорит о том, что выражение #(/, x*(t), |/(0, м), рассматриваемое при каждом фиксированном значении t є [0, Т как функция от и, достигает максимального значения при и = и *(t). Это обстоятельство может быть выражено в следующей форме: //(r,jc*(r)>|f(r),n*(0) = max//(r,jc*(r),|f(r)>ii(r)) (6.12)

ueU1

или, что то же самое,

w * (г, д: * (r),|/(r)) = arg max Я (г, д: *

ugU1

Таким образом, в качестве следствия из существования функции ф (t, х) установлено, что существуют такие векторные функции |/(/) = |/,(/), |/2(/),-., yn(t)), при которых выражение H(t, **(/)> |/(/), u(t)) удовлетворяет условию максимума (6.12).

Из неравенства (6.11) при произвольных значениях /, х и и = = н*(0 следует, что функция R(t, х, u*{f)) при х =x*(t) достигает максимального значения. Так как в рассматриваемой задаче ТОУ ограничений на вектор состояния системы не накладывается, то в точке максимума х = x*(t) частные производные функции

R(t,x,u)x*(t)M*(t):

ах

Подставляя в последнее выражение формулу (6.6), получаем, что при х = x*(t) должно выполняться равенство

Э2ф(г,х),

" Э2ф(г,л0,

drdx y=i [ dx dxJ

, Эф(Г,х), Э/У(Г,*,ц*(р), І Э/°(Г,*,ц*(Г)), _ (613)

«= 1,2 п.

Левую часть выражения (6.13) представим в виде двух слагаемых:

! _Э2Ф(г,х) "Э2Ф(и) f^rrn^l

drdx 7=i dxdx7 (6.14)

і = 1,2,...,л;

с2_£ЭФ(г,*), dfi(t,x,u*(t)){ Э/°(г,*,и*(г)),

7=1 Э*' дх дх (615)

і = 1,2 п.

Для преобразования выражения (6.14) вычислим производную cWjitj/dt.

Согласно формуле (6.8) будем иметь

dVj(t) _ d Эф(Г,*)ч,

Используя правило вычисления производной сложной функции, получим

<f|ff(r)_32<p(r,*)4, , £ Э2<р(г,лс), <fcJ(Q ._

^r=^^)U')+;?1^ru')^T'J=u

Так как х*(0 удовлетворяет вместе с u*(t) уравнениям процесса (6.1), то

Сопоставляя теперь последние два равенства с условием (6.14), получим

5«.4Ш ,.1,2. ,.

а/

Заменив теперь в выражении (6.15) дфОу*) на|/;(г), с учетом формулы (6.9) можем получить, что

c2_dH(t,xM0,u*(t)){

~ И*). — 1,^,...,AZ.

Теперь соотношение (6.13) можно с учетом условий (6.14) и

1 2

(6.15) и полученных выражений для St и S, записать в виде

107

^sjHjt,xMiU*«)) i= (616)

dt dx1 (h

Следовательно, из существования ф(г, х) вытекает, что задаваемая равенством (6.8). функция |/(г) удовлетворяет вместе с x*(t) и u*(t) системе уравнений (6.16).

Как следует из условия 2 теоремы 4.2 и соотношения (4.11), в конечный момент времени / = Г для состояния x*(t) справедливо неравенство

ф(7* *(Г)) + F(jc*(Г)) < ф(7 jc) + F(x) (6-17)

для Ухе Vlx возможных состояний системы. В рассматриваемой задаче множество V*x задается условием (6.4), согласно которому первые т координат хп, х21,..., хт1 вектора х(Т) заданы, остальные же могут принимать произвольные значения. Тогда функция Ф(Г, х) = ср(Г, х) + F(x) будет зависеть от п — m переменных Jcm+1, xm+2,..., хп. Так как на эти переменные никаких ограничений не накладывается вследствие необходимого условия оптимальности

ЭФ(7*) А . ,

— , = О, i=m + U m + 2,...yn,

дх1

получаем с учетом равенства (6.7) Эф(Г,дг), dF(x).

——— L*(7)=—г-rUr). + т + 2,...,л.

дх дх

Но левая часть последнего соотношения есть согласно определению (6.8) VI//7).

Следовательно, это соотношение принимает вид

у.(Т) = -?Щ±х*{Т), | = w + i, Ш + 2.....Л. (6Л8) Эх'

Соотношения (6.18) называются условиями трансверсальности. Полученные результаты можно сформулировать следующим образом. Пусть функция ф(/, х) и процесс (х*(0, «*(0) удовлетворяют теореме 4.2. Тогда существуют такие значения вектор-функции |/ = которые вместе с (x*(t), u*(t)) удовлетворяют условию (6.12) максимума функции Я (Г, х, у, и) и системе дифференциальных уравнений (6.1) и (6.16). Кроме того, в начальный момент времени / = 0 для состояния х(0 выполнены начальные условия (6.3), а в конечный момент t = Г переменные x(t) и |/(Г) удовлетворяют условиям (6.4) и (6.18). Перечисленные условия (6.1), (6.3), (6.4) (6.12), (6.16) и (6.18) представляют собой соотношения метода Лагранжа—Понтрягина, позволяющего получить решения задач ТОУ.

Оптимальное управление в экономике: теория и приложения

Оптимальное управление в экономике: теория и приложения

Обсуждение Оптимальное управление в экономике: теория и приложения

Комментарии, рецензии и отзывы

Метод лагранжа-понтрягина для непрерывных управляемых процессов: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.