6.3. принцип максимума как достаточное условие оптимальности

6.3. принцип максимума как достаточное условие оптимальности: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.

6.3. принцип максимума как достаточное условие оптимальности

Рассмотрим, чем обусловлено название «принцип максимума» и к чему оно относится, если функционал в форме интеграла, оценивающий качество управляемого процесса (х*(0, м*(0) (см. разд. 6.1, формула (6.5)), устремляется к минимуму. Можно, конечно, подынтегральную функцию брать со знаком минус, и тогда на том же оптимальном процессе (х*(0, м*(0) интеграл (6.5) будет достигать максимума. Однако этот искусственный прием вряд ли служит основанием для названия метода.

Суть дела в том, что из всех операций метода, изложенных в разд. 6.2, максимизация функции Гамильтона (см. условие 1 теоремы 6.1) при большой размерности векторов состояния х и управления и — наиболее трудоемкий процесс. Эта самая сложная операция и дала название методу.

Принцип максимума как необходимое условие оптимизации управляемых процессов не гарантирует оптимальности. Он только позволяет отсекать из множества допустимых заведомо неоптимальные процессы, когда его условия не выполняются, а остальные процессы, удовлетворяющие принципу максимума, следует воспринимать лишь как кандидаты в оптимальные. Даже если такой кандидат один, из содержательных условий задачи должно вытекать знание о наличии оптимального процесса. Тогда этот процесс и будет оптимальным. Однако при строгих рассуждениях это неубедительно, нужны более точные аналитические оценки. Они существуют и формулируются в виде следующей теоремы.

Теорема 6.2. Для задачи

j = 1 f°(t,x,u)dt + F(x(T)) -> min; о

— = f(t,x,u) dt

u(t)eUl

x(0) = x0;x(T)eVx

принцип максимума обеспечивает оптимальность найденного процесса, если:

а) подынтегральная функция /°(/, jc, и) выпукла по х и и

в каждый момент времени te (0; 7);

б) терминальный член F(x(T)) — также выпуклая по х

функция;

в) дифференциальные уравнения процесса линейны, т.е.

имеют вид

dx п г -г = X aij(t)Xj + X ^(0; / = І.»."; dt j= к=

г) множества Vі и vj выпуклы, при этом множество vj

может вырождаться в одну конечную точку х(Т)е Vx .

В этом случае имеем задачу с обоими закрепленными концами.

Поскольку в разд. 6.2 рассмотрено решение линейного примера 6.1, а он выпуклый и вогнутый одновременно (в данном случае нам нужна только выпуклость), то было получено оптимальное решение.

Доказательство. Проведем те же операции, с помощью которых были выведены уравнения принципа максимума, но при этом покажем, что при сделанных в условиях теоремы 6.1 предположениях они обеспечивают не только необходимые, но и достаточные условия оптимальности процесса.

В теореме о достаточных условиях оптимальности необходимо найти такую допустимую векторную пару (х*, и*), чтобы выполнялись два условия:

l)tf(f,jc*,h*)= max R(tyxyu)y Vre (0;f); (jc,w>=v'

Я(Лх.И) = І^//(івх.И)-/°(г.х.И)3;

i=i дхі dt

2)Ф(**(Г))= min Ф(х).

При выводе уравнений принципа максимума (см. формулу (6.10)) было показано, что

Эф

/?(/,**, и*) = max R(tyx*yu) = max H(tyx*y\fyu) +

uevu uzvu at

a / ч (6-33)

w> - э Ho'

В результате этого имеем

и * (г) = arg max R(ty х * (г), и(г)) = arg max Я (г, * * (О, V, и).

Далее при фиксированном и= u*(t) максимизация функции R(t, х, и) была заменена лишь необходимыми условиями максимизации ^R(t,x,u *(0) | _ ^ j = ^ 2,.,,, Пу откуда получили сопряdxj

женную систему уравнений

x*(t),u*(t) •

d\fj _ дН(гухМ*1")

dt dxj

Покажем, что для рассматриваемого в этой теореме класса процессов операция

dR(tyxyu). . (6 34)

—^— Ио,«*(0 = °»■/ = !>2>->я» 1 '

эквивалентна maxtf(r,jt,w) при / є (0; 7). В данном случае

Ж*.х.И)-І^Л(».х.«)-Л».х.И)3,=1 э*( э'

/=1

= £Эср(г,х)

Эх,-

л г у=1 *=1

Эг

Функции у.(f) задаются формулой (6.33). Поскольку фигурирующая в теореме о достаточных условиях оптимальности функция ф(/, jc) в некоторой степени произвольная, зададим ее в виде

<р(',*) = 5>, (О*,-.

В результате получаем

Л(^«0 = 5>,-(0 /=1 п г

2aij(t)Xj+^bik(t)uk

7=1 к=

(6.35)

1=1 dt

Кроме функции f°(t, х, w), во все остальные слагаемые выражения (6.35) переменные входят линейно. Функция /°(г, х, и) по условию теоремы выпукла по х и и. Следовательно, функция —/°(/, х, и) вогнута, т.е. имеет вид параболоида («колокола») ветвями вниз. Остальные слагаемые в функции (6.35) линейные и, как известно из теории математического программирования, не изменяют характер вогнутости. Поэтому функция /?(/, х, и) вогнута по х и и и ее максимум по х при фиксированном и = и* достигается в стационарной точке исходя из условия

dR{t,x,u (t) - = о, 7 = 1,2,..., /і. Таким образом, в данном случае dxj

условие (6.34) является не только необходимым, но и достаточным для максимизации функции Л(/, х, и *) по х.

Остается доказать, что условия трансверсальности (6.18) в рассматриваемом случае эквивалентны удовлетворению второго требования (4.11) теоремы 4.2 о достаточных условиях оптимальности.

В данном случае

Ф(х) = ср(7 х) + F(x) = t Уі(Т)х( + F(x).

Первое слагаемое V|(T)jc,линейно по х, второе — по усло-/=1

вию теоремы выпукло. Следовательно, Ф(х) — выпуклая функция. Поскольку рассматривается только случай неограниченных значений х при / = Г (это оговорено при выводе условий трансверсальности), то минимум функции Ф(х) достигается в стацио

нарнои точке — = o,i = l,..., п, откуда |/z (Т) = —-—х*<ту

ох,ОХ;

Таким образом, если в общем случае условия трансверсальности являются только необходимыми условиями оптимальности процесса, то в данном случае они и достаточные.

Теорема 6.2 полностью доказана.

Следствие. Для линейных задач оптимального управления принцип максимума обеспечивает необходимые и достаточные условия оптимальности. Действительно, в данном случае подынтегральная функция /°(/, х, и) и терминальный член F(x) линейные функции своих аргументов. Поскольку линейная функция одновременно и выпуклая, и вогнутая, то требование выпуклости удовлетворяется.

Множество допустимых управлений Vu образовано линейными ограничениями, если задача линейная. А это, как известно из теории линейного программирования, — выпуклое многогранное множество [2]. Следовательно, для линейных задач ТОУ все условия доказанной теоремы выполняются.

Заметим, что принципиально таким же по своим условиям и ограничениям, по общей идее доказательства является суть аналогичной теоремы для многошаговых (дискретных) процессов. Поэтому в главе 7, посвященной методу Лагранжа для многошаговых процессов управления, ее доказывать не будем.

Пример 6.2. Рассмотрим задачу оптимального управления

т j J = j(x2 + u2)dt+-x2(T)-> min; 0 2 dx //чч dt °

Построим, как и в примере 6.1, функцию Гамильтона #(/, х, |/, и) и воспользуемся соотношениями принципа максимума. Согласно формуле (6.9) имеем

Я(Г, х, |/, и) = у(х + и) и2 х2,

откуда из необходимого условия максимума функции #(/, х, ц/,

и) по и — = 0 (максимум действительно имеет место, так как ди

д2Н

ограничений на и нет и —2"<0) получаем выражение через соди

пряженную переменную

и* = ! (6.36)

Если теперь, как и в примере 6.1, составить сопряженную систему, получим

dx 11/

= x + — dt 2

dif _

= 2x-\f. dt

(6.37)

Условие трансверсальности (6.18) дает соотношение

V(7) = -*(7). (6.38)

Таким образом, если учесть начальное условие х(0) = х0, то для нахождения оптимальной траектории x*(t) получаем краевую задачу для системы (6.37). Для отыскания решения краевой задачи найдем общее решение системы (6.37). Его можно получить, исключив в системе дифференциальных уравнений (6.37) одну из переменных х или у и сведя эту систему к одному линейному дифференциальному уравнению второго порядка с постоянными коэффициентами (см. разд. 1.5).

Исключив из второго дифференциального уравнения системы (6.37) величину х, получим

,=!^+!¥. (6.39)

2 dt 2

Далее в первое уравнение системы (6.37) нужно подставить

значения х и —. Поэтому продифференцируем обе части соот dt

ношения (6.39), вследствие чего будем иметь

dx ^d ^ ldp (640) dt 2 dt2 2 dt '

Подставляя выражения (6.39) и (6.40) в первое уравнение системы (6.37), находим

^-2V = 0. (641) dt

Составляем согласно разд. 1.5 характеристическое уравнение для дифференциального уравнения (6.41): р2 2 = 0.

его корни будут Р*Р2 =±л/2.

Следовательно, общее решение дифференциального уравнения (6.41) будет иметь вид

Для определения функции х(і) во втором уравнении (6.37)

потребуется вычислить —, что согласно формуле (6.42) дает

^ = Cie^V2-C2e-^V2. (6-43) dt

Подставляя соотношения (6.42) и (6.43) во второе уравнение системы (6.37) и разрешая ее относительно x(t), получим

^) = £Le^(l + V2)-^e-^(V2-l). (6-44)

Произвольные С, С2 (в общем решении (6.44)) определяем из начального условия jc(0) = х0 и условия трансверсальности (6.38).

Опуская промежуточные трудоемкие, но тривиальные вычисления, будем иметь

yf2T

fc/2-l)e^ + (V2 + l)e-^ (V2-l)(.

+е

J2T . „->/2Гч '

(6.45)

1 +V2

с, =

2*0 + С2(>/2-1)

i+S

(6.46)

Величина С2 в формуле (6.46) определяется по формуле (6.45). В результате оптимальные значения состояния x*(t) и управления u*(t) согласно формулам (6.44) и (6.36) имеют вид

x*(t)

^eA(l + >/5)-|e-A(>/24); "*(0 = ^(С,е^ЧС2е-^).

(6.47)

(6.48)

Значения С, и С2 в формулах (6.47) и (6.48) определяются соотношениями (6.45) и (6.46).

Полученное решение не требует доказательства оптимальности, так как все условия теоремы 6.2 выполнены.

То, что данное решение удалось получить в аналитической форме, — далеко не правило, а скорее «счастливое исключение». В главе 8 мы встретимся с экономическими задачами, где численное решение неизбежно.

Оптимальное управление в экономике: теория и приложения

Предмет: Экономика Автор: Лагоша Борис Александрович Год издания: 2008 Язык учебника: русский Рейтинг:

Просмотров: 371

Обсуждение Оптимальное управление в экономике: теория и приложения

Комментарии, рецензии и отзывы