6.2. принцип максимума понтрягина
6.2. принцип максимума понтрягина
Соотношения (см. разд. 6.1), выполняющиеся на оптимальном процессе, с учетом ограничений в постановке задачи (нет ограничений на состояние, независимость множества допустимых управлений от состояния) позволили определить необходимые условия оптимальности процесса (х*(0, u*(t)). Полученные соотношения могут быть использованы для «сужения» исходного множества М допустимых процессов путем выделения из него только тех процессов, которые удовлетворяют необходимым условиям. Совокупность приведенных условий, как правило, дает возможность выделить единственную траекторию х*(0 из множества допустимых. Если при этом еще известно (например, из содержательной постановки задачи) о существовании оптимальной траектории, то тем самым х*(/) и отвечающее ему управление u*(t) и есть решение задачи оптимального управления.
Комплекс условий, которому должен удовлетворять оптимальный процесс, называется принципом максимума Понтрягина (ниже поясним суть названия). Сформулируем его в виде теоремы.
Теорема 6.1 (принцип максимума Понтрягина). Пусть (х*(/), u*(t)) оптимальный процесс в задаче оптимального управления (6.1) (6.5). Тогда существует вектор-функция |/(Г) = (|/,(0, (¥2(0,.., У„(0), удовлетворяющая вместе с данным процессом следующим условиям:
1. Функция #(/, х, |/, и) (см. определение 6.9) достигает максимального значения по и при х = x*(f), V = V(0 на зна~ чении и = u*(f) при всех t є [0; 7] (см. соотношение (6.12)).
Переменные |/(0 удовлетворяют системе дифференциальных уравнений (6.16).
В конечный момент времени t= ^оптимальная траектория удовлетворяет условиям трансверсальности (6.18).
Таким образом, система уравнений (6.1) и (6.17) может быть записана в следующей форме:
dx1 , — = /'(',*,«); dt
(6.19)
dt
dx1
L*(0» * = ^2,...,/i.
Пример 6.1. Проиллюстрируем применение алгоритма принципа максимума на простейшей задаче оптимального управления — линейной со свободным правым концом, когда при t = Т конечные условия не заданы. Рассмотрим функционал
У =]"(*! + 2x2-3w)dr + ;t1(3)—>min о
(6.20)
при условиях:
dx
dx2 ~dt
0<и<1;
(6.21)
jc1(0) = 1;jc2(0) = 0. Решение. По формуле (6.9) строим функцию Гамильтона:
H(t4x,\f,u) = yl(x] +х2) + Уги~х ~2х2 + 3и-= w(|/2 +3) + |/,(х1 +*2>-*l ~2х2
(6.22)
При фиксированных значениях |/,, |/2, xv х2 в силу линейности по управлению и (см. разд. 1.2) функция Гамильтона примет максимальное значение в случаях:
W*(f,JC,|/) =
1, |/2+3>0;
0, |/2 + 3 < 0;
Vwe[0;l], |/2 + 3 = 0.
(6.23)
Полученным по формуле (6.23) значением и* (t, x, |/) замыкается система дифференциальных уравнений (6.21). Сопряженная система в соответствии с формулой (6.16) имеет вид
л (6.24)
В общем случае для системы уравнений (6.21) и (6.24) с подстановкой в нее выражения (6.23) краевая задача должна решаться совместно. В данном случае, в частности вследствие линейности процесса, сопряженная система (6.24) интегрируется независимо от исходной (6.21). Это облегчает процесс решения краевой задачи.
Первая формула (6.24) — это уравнение с разделяющимися переменными. Читателю предлагается, опираясь на разд. 1.4, самостоятельно найти его общее решение. В силу отсутствия ограничений при t = 3 сопутствующая общему решению произвольная постоянная С{ легко определяется из условия трансверсальности (6.18). Последнее в данном случае имеет вид \f{(3) = = — 1. Из него находим произвольную постоянную интегрирования С, = —2е3, в результате чего получаем частное решение первого уравнения (6.24):
Vi(0 = 1 2е3"'. (6.25)
Подставляем решение (6.25) в правую часть второго уравнения (6.24) и интегрируем его, выражая произвольную постоянную С2 из условия трансверсальности |/2(3) = 0. В результате получаем
у2(3) = /2е3~'1.
Согласно формуле (6.23) знак выражения |/2(/) + 3, равного t 2е3~' + 2, определяет в каждый момент t значение оптимального управления и* (t). Нетрудно убедиться, что эта функция
монотонно возрастающая, так как — = 1 + 2е >0.
С учетом всех этих обстоятельств строим график (рис. 6.1).
u*(t) =
гє[0;т),
гє(т;3], Vmg[0;1], г = т.
(6.26)
Подставив значение u*(t) из формулы (6.26) в систему дифференциальных уравнений (6:21), получим две системы: 1) при t є [0; т)
dt 1 1
dx2 It
дг,(0) = 1;дс2(0)=0.
Интегрирование этой системы с учетом начальных условий дает
x{{t) = е'; x2(t) = 0; (6.27)
2) при t е (т; 3]
~dF~Xl**2'y (6.28) dx2=[ dt
В целях обеспечения непрерывности решения для выделенных двух систем дифференциальных уравнений в качестве начальных условий для второй системы согласно (6.27) следует принять
х,(т) = ех2(х) = 0, (6.29)
где т значение t на графике (см. рис. 6.1), при котором ц/2(0 + 3 = 0.
Интегрирование второго уравнения (6.28) с учетом второго начального условия (6.29) дает
x2(t) = t т. (6.30)
Подставив значение функций (6.30) в первое уравнение (6.28), получаем
^ = *1+г-т. (631) dt 1
Проинтегрируем уравнение (6.31) как линейное неоднородное, только вместо квадратного характеристического уравнения типа (1.7) будет линейное с одним корнем (см. разд. 1.5, формула (1.18)). В итоге имеем общее решение неоднородного уравнения:
x{(t) = С3 е' + т t1,
где С3 произвольная постоянная.
Определим С3 из первого начального условия (6.29): ет = = С3ет-1, откуда С3 = 1 + е~т.
Окончательно с учетом первого начального условия (6.29) находим
*,(/) = е' + е'-* + т t1. (6.32)
Объединяя результаты (6.27), (630) и (6.32) в одну формулу, получаем выражения оптимального состояния системы:
е', *є[0;т]; у+ем+т-г-1, ^[т;3]; О, гє[0;т]; ;-т, гє[т;3].
Оптимальное управление задается формулой (6.26). Число т является корнем уравнения
т 2е3"т + 2 = 0;0<т<3.
Оптимальность найденного процесса вытекает из линейности задачи, чему будут посвящены специальная теорема и следствие из нее в разд. 6.3.
Обсуждение Оптимальное управление в экономике: теория и приложения
Комментарии, рецензии и отзывы