4.2. достаточные условия оптимальности для непрерывных процессов
4.2. достаточные условия оптимальности для непрерывных процессов
Рассмотрим задачу ТОУ в следующем виде: т
J = J /°(Г, х, u)dt + F(x(T)) -> min; (4.7) О
— = /І"(г>х,и),і = 1,...>іі; (4.8) dt
x(0) = x0,(x(t), u{t))eVl. (4.9)
Требуется найти допустимый, удовлетворяющий ограничениям (4.8) и (4.9) процесс (x*(t), и*(/)), минимизирующий функционал (4.7). Предполагается, что вектор оптимального состояния x*(t) непрерывен при / є (0; 7), а вектор оптимального управления u*(t) в той же области значений t может иметь конечное число точек разрыва первого рода.
Пусть ф (t, х) непрерывная функция п + 1 переменной t, Xі, x2,...,jc", имеющая по всем этим переменным непрерывные частные производные по крайней мере до второго порядка*. Построим с помощью ф (/, х) функции Ф (х) и /?(/, х, и), определяемые по формулам
* Второй порядок частных производных функций ф (/, х) потребуется в разд. 6.1.
*(,, Xt И) = *Р+ х, „))-/<>(,, х, и); (4.10)
<D(jc) = <p(7jc) + F(jc),
(4.11)
где F(x) — терминальный член в формуле (4.7).
Второе слагаемое в правой части формулы (4.10) обозначает скалярное произведение двух векторов. Первый из них —
Эф Эф Эф Эф
^~ d^,3^"v''V ~ градиент функции ф (/, х) по компонентам вектора х, второй — /(/, х} и) — векторная функция, координаты которой указаны в формуле (4.8). Введя теперь необходимые обозначения, сформулируем теорему.
Теорема 4.2 (достаточные условия оптимальности для непрерывных процессов). Пусть допустимый процесс V* = = (х*(/), w*(0) е Ми некоторая функция ф (/, х) удовлетворяют условиям
Я (/,**(/),и *(/))= max /?(г,*,и)при V /є[0;Г];
(jc,w)gW
Ф(х*(7)) = min Ф(х).
Тогда процесс (х*(/), и*(0) является оптимальным. Примечание. М — множество допустимых процессов V. Доказательство. Введем вспомогательный функционал
т
Цл,и,ф) = -//?(Г,л,и)Л + Ф(л(7'))-ф(0,;с0). (4.12) о
Функционал (4.12) определен на множестве троек функций (х(/), "(0, Ф (t, х)). Если фиксировать ф (/, х), то получим функционал, заданный на парах (х(/), u(t)).
Будем рассматривать множество D таких пар (х(0, "(0), которые удовлетворяют при всех / є [0; 7] ограничениям (х(0, u(t)) є К', но могут не удовлетворять остальным ограничениям (4.8), (4.9). Очевидно, М с D.
Введенный функционал L (х, и, ф) будем при фиксированном значении функции ф (/, х) считать заданным на множестве D. Функционал /, определяемый соотношением (4.12), будем также рассматривать не только на множестве Л/, но и на множестве D.
Функционал L (х, и, ср) обладает следующим свойством, связывающим его с функционалом /.
Лемма 4.1. Для любой функции ср (/, х), имеющей непрерывные частные производные по всем своим аргументам, на множестве допустимых процессов значения функционалов L и J совпадают, т.е.
Цх(0, и (0),Ф (Г,х)) = J(x (г), и (г)) для V(x (0, и (0)є М. (4.13)
Доказательство. Преобразуем выражение (4.12) для функционала L (х, и, ф), учитывая, что процесс (х(/), u(t)), на котором вычисляется его значение, принадлежит множеству М. Подставим в формулу (4.12) выражения R (t, х, и) и Ф(х(7)) из соотношений (4.10) и (4.11).
По отмеченному выше свойству функция R (t, х, и) представляет разность величины
ч Эф(Г,х) "Эф(Г,х)_; ч
dt / = і ОХ/
или в векторном виде
^х,и) = ^ + [Щ^1,Пих,и)1 (4.14) dt dx
и подынтегральной функции /° (t, х, и) в формуле (4.10).
Таким образом, функцию R (t, х, и) при подстановке в нее допустимого процесса (х(/), u(i)) можно представить в виде
R(t,x (г), и (0) = d9{t'x{t))-f°{t,x,(t), и(0). Тогда интегральный член в формуле (4.12) окажется равным
-f Л (г,х (t)yu (t))dt = J ^Ф(Г,Д:(0) A + f/0(r^(0.n (0) А. (4.15)
о о ^г о
Вычисляя первое слагаемое в правой части равенства (4.15) по формуле Ньютона-Лейбница, получим 4^^л=яках(0))-ф(г>х(Г)).
о dt
Следовательно, выражение (4.15) преобразуется к виду
т т -J R(tjX (t)MO)dt =J f° (t,x(t),u (t))dt + ф (0, jcq) -ф (T,x (Г)). о 0
Вернемся к соотношению (4.12), преобразуя его правую часть с учетом предыдущего равенства. Получим
т
L(x(t)Mt)Mt,x)) = J /° (t,x (t),u (t))dt + о
+ ф(0,*(0) -ф(0, д:0) + Ф(х(Т)) -ф(7х (Г)).
Второе и третье слагаемые обращаются в нуль, так как х(0) = = х0. Два последних слагаемых преобразуем с учетом равенства (4.11):
Ф(х(Т))-ц>(Т,х(Т)) = ¥(х(Т)). Отсюда окончательно имеем
т
L(x(t)Mt)Mt,*)) = J f° {Ux (0,и (t))dt + F (х(Г)), О
что совпадает с соотношением (4.13), справедливость которого и следовало доказать.
Лемма 4.2. При выполнении условий 1 и 2 теоремы 4.2
функционал L(x, w, ф) достигает минимального значения на
множестве D при х = х*(0, и*(0, т.е.
Ц**(0,и*(0,Ф(',**))= min L(jc,m^). (4.16)
(x(t)M(t))ED
Действительно, функционал (4.12) состоит из трех слагаемых, последнее из которых — постоянная величина.
т
Рассмотрим первое слагаемое: -jR(t,x,u)dt.
о
Так как предполагается выполненным условие 1 теоремы 4.2, то при х = х*(0, w = u*(t) подынтегральное выражение R (/, х, и) достигает для всех t є [0; 7] максимального значения, а выражение —R (Г, х, w) минимального. Следовательно, в формуле (4.12) первое слагаемое будет минимальным.
Что касается второго слагаемого в функционале (4.12), то согласно условию 2 теоремы 4.2 оно также примет минимальное значение х = х*(7).
Таким образом, каждое из слагаемых в формуле (4.12) достигает на процессе (х*(/), u*(t)) минимального значения по сравнению с любым другим процессом (х(0, u(t)) на множестве D. Следовательно, этим свойством обладает и сумма этих слагаемых, что и требовалось доказать.
Рассмотрим теперь функционал /ф, заданный соотношением
/ф = min L (х, w, ф), (х(0, и(0) є D.
Тогда свойство (4.16), доказанное в лемме 4.2, можно записать в виде
L (х(0, и«)9 Ф(/, х)) > /ф, v W0, "(») є Д (4.17) М*Ч0, и40, ф(/, X)) < /ф. (4.18)
Теперь утверждение теоремы 4.2 доказывается просто. Поскольку множество М является подмножеством множества Д на нем также выполняется ограничение (4.17), т.е.
L (х(0, U(t), ф (Г, х)) > /ф, (х(0, 14(f)) є М.
Но в силу леммы 4.1 последнее неравенство принимает вид
/(х(0, и(0)>/ф' W)' и^е К (4Л9)
Поскольку по условию теоремы 4.2 (х*(0> и*(0) є Л/, выражение (4.18), в свою очередь, также равносильно равенству
J(xV), «Ч0) = /ф. (4.20) Сопоставляя соотношения (4.19) и (4.20), получим, что при всех (х(0, w(0) є Л/
/(х*(0, u*(t))<J(x(t), «(0), откуда и вытекает оптимальность процесса (х*(0> м*(0)-66
Теорема 4.2 доказана. Прокомментируем содержательный смысл теоремы 4.2 о достаточных условиях оптимальности.
Если среди всех допустимых, согласно условиям теоремы 4.2, процессов u(i)) установлен процесс Сх*(0, и*(0), то он будет оптимальным. Но как именно его определить, это процедура рассмотрения и анализа различных типов нижеследующих задач. Другими словами, доказанная теорема — признак оптимальности допустимого процесса, если он каким-либо способом найден.
Сделаем замечание, относящееся к формулировке теоремы
4.2 для задач ТОУ, в которых конечное состояние х{Т) = хх задат
но. В этом случае множество Vx состоит из одной точки. Таким образом, область определения функции Ф(х) — единственное значение х = которое и есть ее точка минимума. В связи с этим условие 2 теоремы 4.2 в задачах с фиксированным конечным состоянием выполняется тривиально, следовательно, для задач данного класса в формулировке этой теоремы актуально лишь условие 1.
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы