Метод лагранжа для многошаговых процессов управления
Метод лагранжа для многошаговых процессов управления
7.1.
Уравнения метода. Условия оптимальности для многошагового процесса с неограниченным управлением
Выше отмечалось, что для дискретных (многошаговых) процессов не вполне корректно применение термина «принцип максимума» (хотя на практике его с известной долей условности используют [12]). Мы будем называть его методом Лагранжа, поскольку последнему принадлежат соответствующие идеи.
Конкретизируем общую постановку задачи без ограничений на управление.
Пусть заданы уравнения процесса
1) = /(>,*(», «(0), '=0, 1,..., Г-1, /= 1,2,.(7.1) краевые условия
jc'"(0) = 4,/ = 1,2 к, х1{Т) = хЛ = к + ....,п, (72)
и ограничения
u*(t)eVi, (73)
причем м*(0 внутренняя точка множества vj при всех t = 0, 1,..., Т-.
Обозначим через М множество допустимых пар v = (х(0, «(0), т.е. пар, удовлетворяющих условиям (7.1) и (7.2). Поставим задачу об отыскании пары v = (х(0, u(t)) є М, на которой
J= Y< f (t,x(tu(t)) + F(x(T))^mm. (7.4) /=о
Выведем уравнения метода Лагранжа аналогично непрерывному варианту, опираясь на достаточные условия оптимальности. Согласно последним (см. главу 4), если допустимый процесс (х*(0, u*(t)) и функция ф(/, х) такие, что выполняются условия
Я(г,**(0,и*(г))= max R(t9x (f),w (г)), Vr = 0,1 Г -1; (7.5)
U,ii)6V'
ф(х*(Т))= тіпФ(х)при* = 7 (7.6)
то процесс x*(t), u*(t) оптимален, т.е.
У(х*,и*) = min J(x,u).
Для задачи с закрепленным правым концом условие (7.6) удовлетворяется тривиально, так как при t = Т множество Ух состоит только из одной точки.
Согласно формуле (4.25) для задачи (7.1) — (7.4) функция R(t, х, и) имеет следующий вид:
R(tyx,u) = y(t + lf(t,x,u))-(p(t,x)-f0(tyxyu) ^
/(r,jc,M) = {/4r,jc,M)}, / = 1 #1Так как в модели (7.1)—(7.4) других ограничений, кроме краевых условий на состояние, нет, то множество vlx совпадает со всем пространством X. Пусть функция ф(/, х) дифференцируема по х, функции /'(/, х, «), /=1,...,л,/^, х, w), дифференцируемы по х, и в точках х*(0, u*(t). Тогда необходимыми условиями максимума функции R (/, х, и) по х (поскольку на х нет ограничений) и и являются следующие:
dR n ■ 1 dx
— Um*=0' 7 = 1-а-.
(7.8) (7.9)
dR I -У
OUJ i=iL
— ф(* + 1,/(Г,*,и))
Эх
I = 1,...,г,
Э/Ч/.^и*), Э/°,
эм> L*
или
Э/? і / пЭ/1', Э/°,
т-f Lc*,ii* 2г Vi V +1; —7 Lc*f и* "тук«*
aV /=і сиг oV
7 = l,...,r.
(7.12)
А с учетом соотношений (7.11) и (7.12) окончательно получаем л
dR Э
у І™,«по =T7H(t'x*{t)Mt+1}'и !«*(')=°'
(7.13)
У = 1....,г.
Теперь расшифруем другое необходимое условие (7.8). Учитывая выражение (7.7), найдем
x*(t),u*(t)
= 0,
— 1*чо.иЧО =-jH(uxMt + lU*(t))x4t) -|/ДО = 0, ох ох
(7.15)
откуда выводим сопряженную систему конечно-разностных уравнений:
Э
V/(0 = —jH(t,xMt + 1).и * (0)
(7.16)
/ = 1.....п.
Итак, в результате представленных преобразований получены необходимые условия оптимальности (7.13) и (7.16) многошаговых управляемых процессов. Неизвестными здесь являются «-мерный вектор оптимального состояния лс*(/), г-мерный вектор оптимального управления u*(t) и сопряженная «-мерная вектор-функция |/(/). Таким образом, число неизвестных будет равно 2п + г, а условия (7.13) и (7.16) задают всего п + /-уравнений. Недостающие п условий дают уравнения процесса (7.1) с учетом краевых условий (7.2). Следовательно, система уравнений для определения 2п + г неизвестных полностью определена.
Необходимые условия оптимальности воплощаются в следующей системе уравнений метода Лагранжа. Последовательность действий:
решаем систему г уравнений относительно компонент вектора u*(f) при фиксированных значениях остальных компонент:
|H(t, х * (t)Mt +1),"*) L*(0=°>
в результате получаем u*(t) с параметрами x*(f), |/(/ + 1), где #(/, х, у, и) — функция Гамильтона (гамильтониан);
составляем и решаем сопряженную систему и систему уравнений процесса:
dH(t,xMt + lU*(t))u .
W) g£ ) Иг).
х*(/ + 1) = /(г,л*(0,и*(0); 3) удовлетворяем краевым условиям
х*(0) = х0> = *i
или, если правый конец свободен, применяем условие трансверсальности
Пример 7.1. Рассмотрим управляемую систему с квадратичным функционалом и линейными ограничениями. Решение, как следует из разд. 6.3, будет оптимальным. Сформулируем задачу оптимального управления следующим образом:
J = i[xf(0 + j|(0 + «|2(0 + «2W]->min;
х,(г + 1) = .х,(0+дсг(')+«2('); дс2(/ + і) = де, (/)+«, (0;
*,(0) = -l; *2(0) = 1; x,(4) = 4; x2(4) = 0.
(7.17)
Решение
Составляем функцию Гамильтона:
H(t,x,\f,u) = \t{(x{ +Х2 + и2) + у2(х +их)-х-х-и}-и.
Вычисляем ее частные производные по их и и2:
f^(,+.),,m^=V2^ (718)
^U^l).m^0=V,(' + l)-2^(0 = 0=>^(0-^^. (7Л9)
Строим сопряженную систему уравнений:
¥l — Эх, =Vi С +1) + V2С +1)" 2*i (0;
ОХ'у
Э//(г,дг,|/(г + 1),и(0), «2
4. К заданной выше системе присоединяем уравнения процесса:
х1(; + 1) = *1(0 + *2(0+чм, ;
*2(f + l) = *,(*) +
2
М/2(' + 1) 2
Для удобства последующих расчетов в системе уравнений (п. 3 и 4) проведем некоторые преобразования, так чтобы в конечном счете в уравнениях слева иметь зависимости от t9 а справа от t + 1 (или наоборот) Получаем:
х*(Г) = х*(Г + 1)-^1/2(Г + 1);
х* (0 = x*(t +1) x2(t +1) і vi (г +1)+^ v2u +1);
Vl (0 = Vi (r + l) + 2|/2(r + l)-2x2(r + l);
|/2 (r) = 2|fi (f +1) 2x*(r +1) + 2x2(r +1) -|/2 (/ +1).
Это позволяет удобным образом вести итеративный процесс, последовательно понижая значения / от 4 до 0.
Исходя из последних четырех формул, с учетом граничных условий (7.17) получаем
при t = 3:
^(3) = -|v2(4);
**(3)=4-||/,(4) + ||/2(4);
Vl (3) = Vi (4) + 2v2(4); щ (3)=2|f, (4)-8-|/2 (4);
при t = 2:
(2) = де* (3) ^ |/2 (3) = 4 ^ v, (4) + ^ |f2 (4) 1 z 2 2 2
-Vi (4) + 4 +1 v, (4) = 8 -1V, (4) + |/2 (4);
**(2) = x*(3)-jr2(3)-^|/,(3) + ^V2(3) = -|v2(4)-4 + + (4) + |vi (4)-|v2(4)-|vi(4)-V2(4) = 4-2|/2(4);
V, (2)=|/i (3) + 2V2 (3)-2x^(3) =
= |f, (4) + 2|/2 (4) + 4|f, (4)-16-2v2 (4) = -16 + 5|f, (4);
|/2(2) = 2y, (3) 2x,*(3) + 2x2(3) V2(3) = 2|/, (4) + 4y2(4) + |/2(4) + +8-|f, (4) + y2 (4)-2|/1(4) + 8 + |f2(4) = 8-|/1(4) + 7|/2(4);
яри r = 1:
x*(l) = -x* (2) -1 V2(2) = 4 2|f2(4) 4 +1 |/, (4) -1 Mf2 (4) = = -8 + |vi(4)-yV2(4);
х (1) = х*(2) х (2) -1 у2(2) + і |f2(2) = 8 -1V, (4) + + V2(4) + 4 + 2V2(4) + 8-||/,(4) + 4-||f,(4) + ||/2(4) = = 24-4i|/,(4) + yV|/2(4);
|f, (1) = v, (2) + 2V2(2) 2x2(2) = -16 + 5ч/, (4) +16 -2|/, (4) + 14v|/2 (4) + 8 + 4|/2(4) = 8 + 3|/, (4) +18|/2(4);
V2 (1) = 2 Vi (2) 2x,*(2) + 2д:2 (2) Y|/2 (2) =
= -32 + 10y, (4)-16 + 3|f, (4)-v2(4)-8-4|/2(4)-8 +
+|/, (4) 7|/2(4) = -64 + 14y, (4) 12|/2(4);
я/ю f = 0 с учетом начальных условий (7.17) jc,(0) = — 1; х^О) = 1:
х|(0) = х (0) Uf2(1) = 24 -Щ (4) + у ¥2 (4) 4 --1 Vi (4) 9|/2 (4) = 20 у v, (4) -1 |/2 (4) = -1;
x2 (0) = x* (1) x (1) Ufx (1) +1у 2 (1) =
= -8 + yX|T, (4) у v2 (4) 24 + 4|/, (4) у |/2(4) 4 -1 V, (4) --9i|/2 (4) 32 + 7i|/, (4) 6|/2 (4) = -68 + 10v, (4) 27|/2 (4) = 1.
На последней, нулевой итерации значения |/,(0) и ¥2(0) даже не обязательно вычислять, так как уже имеется возможность удовлетворить начальным условиям (7.17). Последняя итерация приводит к двум линейным алгебраическим уравнениям с двумя неизвестными:
HV,(4) + 5|/2(4) = 42; 1 (7 20)
10v|/,(4)-27v|/2 (4) = 69.}
Решая эти уравнения, получаем: |/,(4) = 4,262; у2(4) = = —0,9769. Если теперь подставить найденные значения |/j(4) и |/2(4) в правые части проведенных выше итераций, то можно вычислить искомые функции оптимального состояния x](t),x2(t), сопряженные функции |/,(0, У2(0 и согласно формулам^. 18) и (7.19) — функции оптимального управления щ (г), u2(t). Обоснованность оптимального решения обсуждалась в разд. 6.3.
В рассмотренном случае решение краевой задачи и точное оптимальное решение задачи ТОУ удалось получить в аналитической форме. Это следствие ее относительной простоты: выпуклый квадратичный функционал и линейные ограничения. В результате система конечно-разностных уравнений оказалась линейной, что позволило в аналитическом виде «протащить» до конца (до нулевой итерации) неизвестные значения |/,(4) и |/2(4), а затем точно определить их, решая систему (7.20). В более сложных случаях аналитические прогонки затруднительны, а порой и просто невозможны. Нужно сразу задавать конечные значения у{(4) и |/2(4) в числовом виде, а дойдя до конца итераций, менять их, если не выполняются условия типа (7.20). Такие прогонки необходимо повторить многократного, и реализация процедуры итеративных расчетов до приемлемой точности возможна только с применением ЭВМ. Эта проблема уже обсуждалась в разд. 1.6. На практике мы столкнемся с ней в главе 8.
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы