7.2. условия оптимальности для многошагового процесса при наличии ограничений на управление
7.2. условия оптимальности для многошагового процесса при наличии ограничений на управление
Рассмотрим задачу (7.1) (7.4), в которой множество v*x по-прежнему совпадает со всем пространством X (i.t. других ограничений, кроме краевых условий (7.2), на состояние системы нет), a u*(t) не обязательно является внутренней точкой множества VMr. Пусть, кроме того, функция ф(/, х) дифференцируема по х, а функции/'(/, ху и), і = 1,2,..., я,/°(ґ, ху и) дифференцируемы по х, и в точках х*(0, u*(f).
Для представленной задачи нельзя использовать необходимое условие (7.9), выведенное в предположении, что u*(f) внутренняя точка множества КДля решения воспользуемся теоремой о достаточных условиях оптимальности, согласно которой следует обеспечить выполнение условий (7.5) и (7.6).
Условие (7.6) выполняется тривиально, поскольку правый конец траектории закреплен (см. соотношение (7.2)). Рассмотрим выполнение условий (7.5). Условия (7.8), (7.14) (7.16) имеют место на основании совпадения множества V*x со всем пространством X. Обеспечим выполнение условия max R(t, х, и) при фиксированном х, т.е.
/?(*,**(г),и*(*))= max /?(*,**(г),и(г)), t = 0,1,...,Г-1.
ueVx
Рассмотрим, как связан факт максимизации функции R(t, х, и) по иеУц со свойствами градиента этой функции по управлению.
Пусть и скляр. Тогда множество V* — отрезок: У*и = {и: a(t) < <и< b(t)}, t = О, 1,..., Г—1; момент времени / фиксирован.
Конкретизируем необходимые условия maxtf(f,x,w) при фикueV!,
сированном х в зависимости от расположения и* внутри отрезка или на его границах. Рассмотрим три случая (рис. 7.1).
grad^ N N дгадиН
4 1-+ 1 4Н ► ►
-1 0 < и
Рис. 7.1. Условия оптимальности для -г— sun —— > U
ои ои
1. Если и* є (а, Ь), т.е. и* — внутренняя точка отрезка, то
ЭЛ. _ЭЯ(;,х*(0,У(' + 1),Ц), _п (721)
2. Если и* = д, то необходимым условием тах/?(г,л:,м) ПрИ
ueV'
фиксированном х будет следующее ограничение на градиент функции:
|-Я(г,х*(0,Ч/(г + 1),іі))|иФ=в<0. (7.22)
3. Если w* = Ь, то необходимым условием тах/?(г,х,м) при
фиксированном х будет следующее ограничение на градиент функции #(/, х, |/, w):
|H(t,x*(t)M* + L*=^0. (7.23) сш
Пусть и вектор, a множество допустимых значений и с гладкой границей S. В каждой точке границы S можно построить к ней внешнюю нормаль N. Для наглядности примем г = 2, тогда VMr — плоскость. Рассмотрим два случая.
Если и* внутренняя точка множества vj, тогда необходимое условие max/?(r,x,w) при фиксированном х(0 будет
uev'
э17 u*(0'"*(0 Э^ L*(r)"
Если w* лежит на границе области 5, проведем внешнюю нормаль Nk границе S множества Ухи (рис. 7.2).
Тогда необходимым условием max/?(r,x,w) при фиксирование^'
ном x(t) будет ограничение на градиент функции
(yv,gradu//(r,x* (t)Mt +1), и) u4t)) > 0, (7'24)
в котором условие (7.24) отражает скалярное произведение соответствующих векторов.
Рис. 7.2. Внешняя нормаль и gradM H(t, х, у, и)
Итак, ограничения (7.24), а также их частный случай (7.21) -(7.23) являются только необходимыми условиями оптимальности, а состояние х*(0 и управление м*(0, полученные из них, -не более как подозрительные на оптимум, для которых может потребоваться проведение дополнительного исследования, аналогичного непрерывному варианту. В частности, если правые части уравнений процесса (7.1) линейны по и, то полученные с помощью сформулированных выше необходимых условий оптимальности состояние и управление являются оптимальными, т.е. эти необходимые условия оптимальности оказываются достаточными.
Существенная трудность метода (7.24), как видно из рис. 7.2, заключается в необходимости проверки ограничений (7.24) в каждой граничной точке области S. Уже для двумерной области таких точек бесконечное множество. Принятие для расчетов конечного числа точек чревато ошибками, хотя с использованием ЭВМ таких точек может быть взято достаточно много. Рассмотрим пример, на котором могут проясниться вычислительные аспекты.
Пример 7.2. В стандартной записи многошагового процесса (7.1)-(7.4) заданы:/0 = х{/1 =х{ +2х2 + u,f2 = u, F(x(T))= = 0, л = 2, г= 1>|< 1,х(0) = х0.
Так как на и есть ограничение, то быть уверенным в том, что u*(t) внутренняя точка допустимой области Vj, нельзя. Поэтому будем исходить из дополнительного ограничения (7.24).
Строим функцию Гамильтона:
H(t,x,\f,u) = \f](x] + 2x2 + u) + \f2u-xl • Из ограничения (7.24) (см. рис. 7.1) имеем:
ЭЯ(;,**(0,у(г + 1),и) ди
dH(t,x*(t)Mt + lU) ди
Вычисляем
ЭЯ(г,**(г),у(г + 1),и)
|w*(r)>0 при и*(t) = 1; Ur)<0 при и*(г) = -1.
L*(/)=ViU + l) + V2^ + 1)*
следовательно,
и*(0 =
1; Vi(f + l) + |f2(* +1)>0;
-1; \f(t +l) + \f2(t +1)<0;
Vmg[-1;1]; ^(f+1)+ |/2(ґ +1) = 0.
(7.25)
Остальные уравнения метода Лагранжа:
¥2 (0 = 1^" '^(/)' v(/+l)=2¥l (r+1}"
х*(г +1) = xi*(0 + 2^2(0 + и *(0;
*2(' + 1) = и*(0.
Начальные условия:
х (0)=х0]1х2(0)=х02.
Условия трансверсальности:
V,(7) = v2<7) = 0.
(7.26)
Постановка задачи метода Лагранжа закончена. Теперь приступаем к ее решению. Из условий трансверсальности (7.26) имеем
Ж,(7) + v2(7) = О,
откуда, используя выражение (7.25) для м*(ґ), получаем
и*(Г -l) = Vne[-l,l].
Для удобства вычислений постараемся выразить зависимости от t через зависимости от t + 1:
и * (О = X J (t +1) = sign (Vj (f + 1) + |f 2 (г +1));
2x*(0 + Vi(0 = Vi(*+1); |f2(0 = 2|f1(f+1);
дг*(0 +2^2(0 = **(* +l)-*2(f +1);
jf2(0 = sign (^(0 +¥г(0);
*l
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы