4.2. достаточные условия оптимальности для непрерывных процессов

4.2. достаточные условия оптимальности для непрерывных процессов: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.

4.2. достаточные условия оптимальности для непрерывных процессов

Рассмотрим задачу ТОУ в следующем виде: т

J = J /°(Г, х, u)dt + F(x(T)) -> min; (4.7) О

— = /І"(г>х,и),і = 1,...>іі; (4.8) dt

x(0) = x0,(x(t), u{t))eVl. (4.9)

Требуется найти допустимый, удовлетворяющий ограничениям (4.8) и (4.9) процесс (x*(t), и*(/)), минимизирующий функционал (4.7). Предполагается, что вектор оптимального состояния x*(t) непрерывен при / є (0; 7), а вектор оптимального управления u*(t) в той же области значений t может иметь конечное число точек разрыва первого рода.

Пусть ф (t, х) непрерывная функция п + 1 переменной t, Xі, x2,...,jc", имеющая по всем этим переменным непрерывные частные производные по крайней мере до второго порядка*. Построим с помощью ф (/, х) функции Ф (х) и /?(/, х, и), определяемые по формулам

* Второй порядок частных производных функций ф (/, х) потребуется в разд. 6.1.

*(,, Xt И) = *Р+ х, „))-/<>(,, х, и); (4.10)

<D(jc) = <p(7jc) + F(jc),

(4.11)

где F(x) — терминальный член в формуле (4.7).

Второе слагаемое в правой части формулы (4.10) обозначает скалярное произведение двух векторов. Первый из них —

Эф Эф Эф Эф

^~ d^,3^"v''V ~ градиент функции ф (/, х) по компонентам вектора х, второй — /(/, х} и) — векторная функция, координаты которой указаны в формуле (4.8). Введя теперь необходимые обозначения, сформулируем теорему.

Теорема 4.2 (достаточные условия оптимальности для непрерывных процессов). Пусть допустимый процесс V* = = (х*(/), w*(0) е Ми некоторая функция ф (/, х) удовлетворяют условиям

Я (/,**(/),и *(/))= max /?(г,*,и)при V /є[0;Г];

(jc,w)gW

Ф(х*(7)) = min Ф(х).

Тогда процесс (х*(/), и*(0) является оптимальным. Примечание. М — множество допустимых процессов V. Доказательство. Введем вспомогательный функционал

т

Цл,и,ф) = -//?(Г,л,и)Л + Ф(л(7'))-ф(0,;с0). (4.12) о

Функционал (4.12) определен на множестве троек функций (х(/), "(0, Ф (t, х)). Если фиксировать ф (/, х), то получим функционал, заданный на парах (х(/), u(t)).

Будем рассматривать множество D таких пар (х(0, "(0), которые удовлетворяют при всех / є [0; 7] ограничениям (х(0, u(t)) є К', но могут не удовлетворять остальным ограничениям (4.8), (4.9). Очевидно, М с D.

Введенный функционал L (х, и, ф) будем при фиксированном значении функции ф (/, х) считать заданным на множестве D. Функционал /, определяемый соотношением (4.12), будем также рассматривать не только на множестве Л/, но и на множестве D.

Функционал L (х, и, ср) обладает следующим свойством, связывающим его с функционалом /.

Лемма 4.1. Для любой функции ср (/, х), имеющей непрерывные частные производные по всем своим аргументам, на множестве допустимых процессов значения функционалов L и J совпадают, т.е.

Цх(0, и (0),Ф (Г,х)) = J(x (г), и (г)) для V(x (0, и (0)є М. (4.13)

Доказательство. Преобразуем выражение (4.12) для функционала L (х, и, ф), учитывая, что процесс (х(/), u(t)), на котором вычисляется его значение, принадлежит множеству М. Подставим в формулу (4.12) выражения R (t, х, и) и Ф(х(7)) из соотношений (4.10) и (4.11).

По отмеченному выше свойству функция R (t, х, и) представляет разность величины

ч Эф(Г,х) "Эф(Г,х)_; ч

dt / = і ОХ/

или в векторном виде

^х,и) = ^ + [Щ^1,Пих,и)1 (4.14) dt dx

и подынтегральной функции /° (t, х, и) в формуле (4.10).

Таким образом, функцию R (t, х, и) при подстановке в нее допустимого процесса (х(/), u(i)) можно представить в виде

R(t,x (г), и (0) = d9{t'x{t))-f°{t,x,(t), и(0). Тогда интегральный член в формуле (4.12) окажется равным

-f Л (г,х (t)yu (t))dt = J ^Ф(Г,Д:(0) A + f/0(r^(0.n (0) А. (4.15)

о о ^г о

Вычисляя первое слагаемое в правой части равенства (4.15) по формуле Ньютона-Лейбница, получим 4^^л=яках(0))-ф(г>х(Г)).

о dt

Следовательно, выражение (4.15) преобразуется к виду

т т -J R(tjX (t)MO)dt =J f° (t,x(t),u (t))dt + ф (0, jcq) -ф (T,x (Г)). о 0

Вернемся к соотношению (4.12), преобразуя его правую часть с учетом предыдущего равенства. Получим

т

L(x(t)Mt)Mt,x)) = J /° (t,x (t),u (t))dt + о

+ ф(0,*(0) -ф(0, д:0) + Ф(х(Т)) -ф(7х (Г)).

Второе и третье слагаемые обращаются в нуль, так как х(0) = = х0. Два последних слагаемых преобразуем с учетом равенства (4.11):

Ф(х(Т))-ц>(Т,х(Т)) = ¥(х(Т)). Отсюда окончательно имеем

т

L(x(t)Mt)Mt,*)) = J f° {Ux (0,и (t))dt + F (х(Г)), О

что совпадает с соотношением (4.13), справедливость которого и следовало доказать.

Лемма 4.2. При выполнении условий 1 и 2 теоремы 4.2

функционал L(x, w, ф) достигает минимального значения на

множестве D при х = х*(0, и*(0, т.е.

Ц**(0,и*(0,Ф(',**))= min L(jc,m^). (4.16)

(x(t)M(t))ED

Действительно, функционал (4.12) состоит из трех слагаемых, последнее из которых — постоянная величина.

т

Рассмотрим первое слагаемое: -jR(t,x,u)dt.

о

Так как предполагается выполненным условие 1 теоремы 4.2, то при х = х*(0, w = u*(t) подынтегральное выражение R (/, х, и) достигает для всех t є [0; 7] максимального значения, а выражение —R (Г, х, w) минимального. Следовательно, в формуле (4.12) первое слагаемое будет минимальным.

Что касается второго слагаемого в функционале (4.12), то согласно условию 2 теоремы 4.2 оно также примет минимальное значение х = х*(7).

Таким образом, каждое из слагаемых в формуле (4.12) достигает на процессе (х*(/), u*(t)) минимального значения по сравнению с любым другим процессом (х(0, u(t)) на множестве D. Следовательно, этим свойством обладает и сумма этих слагаемых, что и требовалось доказать.

Рассмотрим теперь функционал /ф, заданный соотношением

/ф = min L (х, w, ф), (х(0, и(0) є D.

Тогда свойство (4.16), доказанное в лемме 4.2, можно записать в виде

L (х(0, и«)9 Ф(/, х)) > /ф, v W0, "(») є Д (4.17) М*Ч0, и40, ф(/, X)) < /ф. (4.18)

Теперь утверждение теоремы 4.2 доказывается просто. Поскольку множество М является подмножеством множества Д на нем также выполняется ограничение (4.17), т.е.

L (х(0, U(t), ф (Г, х)) > /ф, (х(0, 14(f)) є М.

Но в силу леммы 4.1 последнее неравенство принимает вид

/(х(0, и(0)>/ф' W)' и^е К (4Л9)

Поскольку по условию теоремы 4.2 (х*(0> и*(0) є Л/, выражение (4.18), в свою очередь, также равносильно равенству

J(xV), «Ч0) = /ф. (4.20) Сопоставляя соотношения (4.19) и (4.20), получим, что при всех (х(0, w(0) є Л/

/(х*(0, u*(t))<J(x(t), «(0), откуда и вытекает оптимальность процесса (х*(0> м*(0)-66

Теорема 4.2 доказана. Прокомментируем содержательный смысл теоремы 4.2 о достаточных условиях оптимальности.

Если среди всех допустимых, согласно условиям теоремы 4.2, процессов u(i)) установлен процесс Сх*(0, и*(0), то он будет оптимальным. Но как именно его определить, это процедура рассмотрения и анализа различных типов нижеследующих задач. Другими словами, доказанная теорема — признак оптимальности допустимого процесса, если он каким-либо способом найден.

Сделаем замечание, относящееся к формулировке теоремы

4.2 для задач ТОУ, в которых конечное состояние х{Т) = хх задат

но. В этом случае множество Vx состоит из одной точки. Таким образом, область определения функции Ф(х) — единственное значение х = которое и есть ее точка минимума. В связи с этим условие 2 теоремы 4.2 в задачах с фиксированным конечным состоянием выполняется тривиально, следовательно, для задач данного класса в формулировке этой теоремы актуально лишь условие 1.

Оптимальное управление в экономике: теория и приложения

Оптимальное управление в экономике: теория и приложения

Обсуждение Оптимальное управление в экономике: теория и приложения

Комментарии, рецензии и отзывы

4.2. достаточные условия оптимальности для непрерывных процессов: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.