Применение необходимых условий оптимальности в форме лагранжа -понтрягина

Применение необходимых условий оптимальности в форме лагранжа -понтрягина: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.

Применение необходимых условий оптимальности в форме лагранжа -понтрягина

8.1.

Цели исследования. Оптимальное управление движущимся объектом

Рассмотрим постановки и решения ряда задач оптимального управления для непрерывных и многошаговых (дискретных) процессов. Необходимые условия оптимизации в форме Лаг-ранжа—Понтрягина являются аппаратом оптимизации процесса. В соответствии с теоремой 6.2 дополнительного доказательства оптимальности во всех рассматриваемых случаях не требуется, так как в разд. 8.1 решается линейная задача, а в разд. 8.2 и 8.3 — две содержательно сходные задачи соответственно для многошаговых и непрерывных процессов с выпуклыми функционалами и линейными ограничениями.

Для линейной задачи краевая задача решается точно и оказывается возможным провести некоторый качественный анализ еще до получения решения; для многошаговых и непрерывных процессов краевые задачи решаются приближенно численным методом прямой прогонки (см. разд. 1.6).

Две последние задачи, содержательно между собой очень близкие, приводятся вместе для сопоставления техники математических выкладок и расчетных схем. Это дает возможность увидеть сходство и различие в однотипных постановках задач и подходах к их решению.

Последний разд. 8.4 этой главы можно рассматривать как завершение магистральной теории(сл*. разд. 5.2).

На представленных в данной главе примерах имеется возможность убедиться в инвариантном характере методов ТОУ. Первый пример относится к механике как разделу физики, остальные три к экономике. Последнее неслучайно, так как учебное пособие ориентировано прежде всего на экономистов. Важно, чтобы они знали об универсальности методов изучаемой ими теории.

Пример 8.1. Рассмотрим прямолинейное движение некоторого объекта с двигателем (например, автомобиля). Объект имеет массу /г?, а двигатель обеспечивает воздействие на него силы F, не превышающей по абсолютной величине значения у, И ^ Y-Если приложенная сила разгоняет объект, то ее значение принимается положительным, если тормозит — отрицательным.

Пусть в момент / = 0 начальные путь и скорость нулевые, т.е. объект находится в покое: s(0) = ^(0) = 0; s(t) и v(t) — соответственно пройденный путь и скорость в произвольный момент /.

Требуется найти такой оптимальный режим управления (разгона и торможения), чтобы объект прошел заданный путь L в минимальное время и остановился.

Построим математическую модель движения объекта. Для этого воспользуемся вторым законом Ньютона, в соответствии с которым произведение массы объекта на ускорение его движения равно приложенной силе F. Ускорение равно производной от скорости по времени. Скорость движения — это, в свою очередь, производная от пройденного пути по времени.

На основе сказанного запишем дифференциальные уравнения

т

dv _ F ds

dt ' dt

(8.1)

ограничения для рассматриваемого процесса

F|<y;

(8.2)

5(0)= 0,1/(0) = 0;

(8.3)

s(T) = L,u(T) = 0

(8.4)

и функционал

Т —> min,

(8.5)

который отражает достижение конечной цели (8.4) за минимальное время.

Итак, математическая модель движения управляемого объекта построена. Дифференциальные уравнения (8.1) это уравнения процесса, причем скорость v и путь s — компоненты вектора состояния, сила F — параметр управления. Это вытекает из общей постановки задач оптимального управления и отвечает формальным признакам, позволяющим отличить параметры состояния системы (входят в уравнения процесса как сами по себе, так и со своими производными) от параметра управления (сила F входит в одно из уравнений процесса (8.1) только сама по себе, без производной).

Неравенство (8.2) задает ограничение на управление, условия (8.3) и (8.4) — соответственно начальное и конечное состояния системы, (8.5) — функционал, характеризующий задачу о быстродействии. Так называют задачи ТОУ, в которых функционал отражает цель оптимизации управления — достижение некоторого предусмотренного результата за минимальное время.

До сих пор рассматривались управляемые процессы, для которых время Г считалось заданным. При этом система дифференциальных уравнений метода Лагранжа—Понтрягина включала 2п уравнений с 2п искомыми функциями. Соответственно было 2п граничных условий, включая, если необходимо, условия трансверсальности (6.18). В данном случае при тех же 2п дифференциальных уравнениях и 2п искомых функциях появляется еще одна неизвестная — величина Г. Для однозначного решения системы с 2п + 1 уравнениями и с таким же количеством неизвестных требуется дополнительное условие трансверсальности. Оно имеет вид

Н(Т,х*(Т)МТ), и*(Т)) =

dF(x) дТ

х*(Т) >

(8.6)

вывод приведен в [12, с. 190, формула (8.30)]. Условием трансверсальности (8.6) воспользуемся ниже в процессе решения задачи.

Последовательность решения задачи (8.1) (8.5) в целом соответствует процедуре реализации принципа максимума, только лишь следует дополнительно использовать формулу (8.6) для определения времени движения объекта Т. В рассматриваемой задаче, учитывая, что в функционале (8.5) подынтегральная функция /°(/, х, и) = 0, а терминальный член F(x(t)) = Г, на основе формулы (8.6) получаем

Н(Т,х*(Т),у(Т)9и*(Т)) = . <8-7)

В соответствии с постановкой задачи (8.1) (8.5) функция Гамильтона будет иметь вид

Я(/ х, |/, и) = |/, — + |/2*л <8-8) m

где х — (v, s) и = F.

Максимизация функции (8.8) по управлению /"дает

F(yx) = arg max Я (t,x, |/,w) = |F|<y

у, у|/,>0;

-у, у! < 0;

VFe[-Y;y], Vl=0.

(8.9)

Теперь составим систему уравнений принципа максимума:

m =р(щ) at

ds

(8.10)

Подпись: = 0.dyx(t) _ дН _

dt rfy2(0

эя

" ds

(8.11)

Здесь краевые условия задаются равенствами (8.3) и (8.4).

Сопряженные уравнения (8.11), как и должно быть в линейных задачах, интегрируются независимо от исходных уравнений процесса (8.10). Решение второго уравнений (8.11) сразу дает |/2 = = Сх. Интегрируя затем первое уравнение (8.11), получаем

щ=-СхГ + С2, (8.12) где С, и С2 произвольные постоянные.

Из формул (8.9) и (8.12) еще до получения оптимального решения можно сделать вывод: так как линейная функция (8.12) может иметь не более одной перемены знака, то оптимальный режим управления будет заключаться не более чем в одном переключении двигателя рассматриваемого объекта.

При этом одно переключение двигателя должно быть обязательным, ибо в противном случае функция \fx(t) не будет менять при t є [0; Т знака. Следовательно, согласно формуле (8.9) действующая сила будет максимальной по абсолютной величине и равной ±у, т.е. объект будет двигаться под действием максимальной силы тяги двигателя в нужном или противоположном направлении и никогда не остановится. Переключение двигателя может иметь место, но при этом величина \f{(t) при W є [0; 7] не будет менять знак. Этот случай, по существу, оказывается аналогичным предыдущему, и его также следует исключить из рассмотрения. Если при изменении знака функции vj/^O при te [0; 7] она сначала будет отрицательной, а после переключения знака — положительной, то объект вначале поедет в противоположную от необходимого направления сторону, а затем — в нужную. Ясно, что при этом длина общего проезда увеличится, и минимальным время движения Т быть не может. Остается один вариант: сначала объект разгоняется под действием силы тяги двигателя у, а затем тормозится с силой торможения —у и в результате останавливается, пройдя путь s за минимальное время. Итак, выбрав на качественном уровне стратегию управления (сначала разгон, затем торможение), продолжим необходимые расчеты. В этом случае на первом этапе разгона получаем систему уравнений

dv ds dt 1 dt

(8.13)

5(0)=0;р(0)=0;/є[0;т], (8.14) где т < Т — момент переключения двигателя с разгона на торможение. Уравнения (8.13) без труда интегрируются:

m

s(t) = 1— + CV + C4, m 2

где C3 и C4 — произвольные постоянные.

Учитывая начальные условия (8.14), получаем С3 = С4 = 0. В результате решение дифференциальных уравнений (8.13), удовлетворяющее начальным условиям (8.14), имеет вид

V(t) = l-ts(t) = — t2. (8Л5) m 2m

Момент t = т, соответствующий переключению двигателя с разгона на торможение, с учетом формулы (8.12), отвечает условию

|/1(т) = -С1т + С2 =0,

откуда

T = £l .(8.16)

На временном отрезке Г є [т; 7] функция |/j(7) < 0, F= -у и уравнения (8.1) примут вид

m^ = -r^ = ^ (8.17) dt dt

Начальным условием для уравнений (8.17) будет состояние системы в момент t = т, отвечающее формулам (8.15) и (8.16). С учетом этого для двух дифференциальных уравнений (8.17) получаем начальные условия

"(*)=^;Ф) = -Ч£)2.

m C[ 2m C,

(8.18)

Интегрируя уравнения (8.17) с учетом начальных условий (8.18), получим при ґє [т; 7]

Подпись: 2 {СПодпись: 4-І Jр(0 =

5(0 =

t

— + 2

-1( + ^2 т

т

/и С,

(8.19)

Чтобы определить произвольные постоянные Cj и С2, необходимо удовлетворить в решении (8.19) двум граничным условиям (8.4). Но при этом появится третья неизвестная величина Т. Для определения трех искомых величин Ср С2, Г воспользуемся, кроме двух соотношений (8.19), третьим условием трансверсальности (8.7).

Итак, получены три алгебраических уравнения:

,(Л = -ХгЗ^=0; т т Сх

Подпись: тs(T) = -

V 1 J

т С,

(8.20)

(-ClT + C2)(-j-) + Civ(T) = l.

Решение системы уравнений (8.20) имеет следующий вид:

С &С2=^;Г = 2& <8-21) Ly у V У

С Т

При этом оказывается, что Т = 2-рг или т = —» т.е. переклюЧ 2

чение двигателя с разгона на торможение в оптимальном режи-152 ме должно осуществляться посередине интервала движения. Пройденный путь с учетом второй формулы (8.15) и третьей (8.21) также будет равен половине необходимого для прохождения пути:

s(x) = s= -. 2 2

Итак, рассмотрен режим, удовлетворяющий необходимым условиям оптимальности, при этом поставленную краевую задачу (8.10), (8.11), (8.3), (8.4) удалось решить в аналитической форме.

Вследствие линейности задачи доказательства оптимальности полученного решения не требуется (см. разд. 6.3).

Оптимальное управление в экономике: теория и приложения

Оптимальное управление в экономике: теория и приложения

Обсуждение Оптимальное управление в экономике: теория и приложения

Комментарии, рецензии и отзывы

Применение необходимых условий оптимальности в форме лагранжа -понтрягина: Оптимальное управление в экономике: теория и приложения, Лагоша Борис Александрович, 2008 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Исследуется теоретический и прикладной аппарат оптимального управления в экономике. Основополагающие теоремы о достаточных условиях оптимальности доводятся до вычислительных методов принципа максимума и динамического программирования.