6.2. принцип максимума понтрягина

6.2. принцип максимума понтрягина: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.

6.2. принцип максимума понтрягина

Соотношения (см. разд. 6.1), выполняющиеся на оптимальном процессе, с учетом ограничений в постановке задачи (нет ограничений на состояние, независимость множества допустимых управлений от состояния) позволили определить необходимые условия оптимальности процесса (х*(0, u*(t)). Полученные соотношения могут быть использованы для «сужения» исходного множества М допустимых процессов путем выделения из него только тех процессов, которые удовлетворяют необходимым условиям. Совокупность приведенных условий, как правило, дает возможность выделить единственную траекторию х*(0 из множества допустимых. Если при этом еще известно (например, из содержательной постановки задачи) о существовании оптимальной траектории, то тем самым х*(/) и отвечающее ему управление u*(t) и есть решение задачи оптимального управления.

Комплекс условий, которому должен удовлетворять оптимальный процесс, называется принципом максимума Понтрягина (ниже поясним суть названия). Сформулируем его в виде теоремы.

Теорема 6.1 (принцип максимума Понтрягина). Пусть (х*(/), u*(t)) оптимальный процесс в задаче оптимального управления (6.1) (6.5). Тогда существует вектор-функция |/(Г) = (|/,(0, (¥2(0,.., У„(0), удовлетворяющая вместе с данным процессом следующим условиям:

1. Функция #(/, х, |/, и) (см. определение 6.9) достигает максимального значения по и при х = x*(f), V = V(0 на зна~ чении и = u*(f) при всех t є [0; 7] (см. соотношение (6.12)).

Переменные |/(0 удовлетворяют системе дифференциальных уравнений (6.16).

В конечный момент времени t= ^оптимальная траектория удовлетворяет условиям трансверсальности (6.18).

Таким образом, система уравнений (6.1) и (6.17) может быть записана в следующей форме:

dx1 , — = /'(',*,«); dt

(6.19)

dt

dx1

L*(0» * = ^2,...,/i.

Пример 6.1. Проиллюстрируем применение алгоритма принципа максимума на простейшей задаче оптимального управления — линейной со свободным правым концом, когда при t = Т конечные условия не заданы. Рассмотрим функционал

У =]"(*! + 2x2-3w)dr + ;t1(3)—>min о

(6.20)

при условиях:

dx

dx2 ~dt

0<и<1;

(6.21)

jc1(0) = 1;jc2(0) = 0. Решение. По формуле (6.9) строим функцию Гамильтона:

H(t4x,\f,u) = yl(x] +х2) + Уги~х ~2х2 + 3и-= w(|/2 +3) + |/,(х1 +*2>-*l ~2х2

(6.22)

При фиксированных значениях |/,, |/2, xv х2 в силу линейности по управлению и (см. разд. 1.2) функция Гамильтона примет максимальное значение в случаях:

W*(f,JC,|/) =

1, |/2+3>0;

0, |/2 + 3 < 0;

Vwe[0;l], |/2 + 3 = 0.

(6.23)

Полученным по формуле (6.23) значением и* (t, x, |/) замыкается система дифференциальных уравнений (6.21). Сопряженная система в соответствии с формулой (6.16) имеет вид

л (6.24)

В общем случае для системы уравнений (6.21) и (6.24) с подстановкой в нее выражения (6.23) краевая задача должна решаться совместно. В данном случае, в частности вследствие линейности процесса, сопряженная система (6.24) интегрируется независимо от исходной (6.21). Это облегчает процесс решения краевой задачи.

Первая формула (6.24) — это уравнение с разделяющимися переменными. Читателю предлагается, опираясь на разд. 1.4, самостоятельно найти его общее решение. В силу отсутствия ограничений при t = 3 сопутствующая общему решению произвольная постоянная С{ легко определяется из условия трансверсальности (6.18). Последнее в данном случае имеет вид \f{(3) = = — 1. Из него находим произвольную постоянную интегрирования С, = —2е3, в результате чего получаем частное решение первого уравнения (6.24):

Vi(0 = 1 2е3"'. (6.25)

Подставляем решение (6.25) в правую часть второго уравнения (6.24) и интегрируем его, выражая произвольную постоянную С2 из условия трансверсальности |/2(3) = 0. В результате получаем

у2(3) = /2е3~'1.

Согласно формуле (6.23) знак выражения |/2(/) + 3, равного t 2е3~' + 2, определяет в каждый момент t значение оптимального управления и* (t). Нетрудно убедиться, что эта функция

монотонно возрастающая, так как — = 1 + 2е >0.

С учетом всех этих обстоятельств строим график (рис. 6.1).

В соответствии с графиком (см. рис. 6.1) и с учетом формулы (6.23) получаем аналитическую зависимость

u*(t) =

гє[0;т),

гє(т;3], Vmg[0;1], г = т.

(6.26)

Подставив значение u*(t) из формулы (6.26) в систему дифференциальных уравнений (6:21), получим две системы: 1) при t є [0; т)

Подпись: 11 = It
^0;

dt 1 1

dx2 It

дг,(0) = 1;дс2(0)=0.

Интегрирование этой системы с учетом начальных условий дает

x{{t) = е'; x2(t) = 0; (6.27)

2) при t е (т; 3]

~dF~Xl**2'y (6.28) dx2=[ dt

В целях обеспечения непрерывности решения для выделенных двух систем дифференциальных уравнений в качестве начальных условий для второй системы согласно (6.27) следует принять

х,(т) = ех2(х) = 0, (6.29)

где т значение t на графике (см. рис. 6.1), при котором ц/2(0 + 3 = 0.

Интегрирование второго уравнения (6.28) с учетом второго начального условия (6.29) дает

x2(t) = t т. (6.30)

Подставив значение функций (6.30) в первое уравнение (6.28), получаем

^ = *1+г-т. (631) dt 1

Проинтегрируем уравнение (6.31) как линейное неоднородное, только вместо квадратного характеристического уравнения типа (1.7) будет линейное с одним корнем (см. разд. 1.5, формула (1.18)). В итоге имеем общее решение неоднородного уравнения:

x{(t) = С3 е' + т t1,

где С3 произвольная постоянная.

Определим С3 из первого начального условия (6.29): ет = = С3ет-1, откуда С3 = 1 + е~т.

Окончательно с учетом первого начального условия (6.29) находим

*,(/) = е' + е'-* + т t1. (6.32)

Объединяя результаты (6.27), (630) и (6.32) в одну формулу, получаем выражения оптимального состояния системы:

е', *є[0;т]; у+ем+т-г-1, ^[т;3]; О, гє[0;т]; ;-т, гє[т;3].

Оптимальное управление задается формулой (6.26). Число т является корнем уравнения

т 2е3"т + 2 = 0;0<т<3.

Оптимальность найденного процесса вытекает из линейности задачи, чему будут посвящены специальная теорема и следствие из нее в разд. 6.3.

Оптимальное управление в экономике: теория и приложения

Оптимальное управление в экономике: теория и приложения

Обсуждение Оптимальное управление в экономике: теория и приложения

Комментарии, рецензии и отзывы

6.2. принцип максимума понтрягина: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.