Реферат по предмету "Математика"


Задача оптимального управления, принцип максимума Понтрягина

Кыргызско-Российский Славянский Университет ЕТФ Кафедра математики Дисциплина Интегральные уравнения и вариационное исчисление На тему Задача оптимального управления. Принцип максимума Понтрягина Выполнил студент гр. ЕМЭ-1-00 Салихов Р.Р. Проверил к.ф м.н, доцент Шемякина Т.А. Бишкек-2002


Виды управления В задачах управления встречаются два вида управления. Один из них управление по разомкнутому контуру. В этом случае оптимальное управление определяется как функция времени ut. 1 Управление по разомкнутому контуру полностью определяется в начальный момент t0, а фазовая траектория x t отыскивается в результате интегрирования уравнений движения при фиксированных начальных условиях. Другой вид управления - управление по замкнутому контуру с обратной связью.


В этом случае оптимальное управление определяется как функция текущих фазовых координат и времени u xt, t 2 В отличие от управления по разомкнутому контуру, когда все решения принимаются заранее, при управлении по замкнутому контуру решения можно пересматривать с учетом новой информации, которую несут текущие фазовые координаты. Задача определения оптимального управления по замкнутому контуру называется задачей синтеза. Различия между управлением по разомкнутому контуру и управлением по замкнутому контуру


хорошо видны на примере работы двух простых устройств сушилки для белья и отопительной системы в здании. Большинство типов сушилок для белья представляет собой системы с управлением по замкнутому контуру режим работу их задается с помощью реле времени. Отопительная система, напротив, обычно регулируется с помощью термостата, который включает обогревающее устройство, если температура в помещении понизилась, и включает его, если температура становится слишком высокой.


Следовательно, управление обогревающим устройством зависит от текущего значения фазовой координаты температуры в помещении. Примеры этих двух видов управления существуют также и в экономике. Автоматические стабилизаторы, такие, как страхование по безработице и прогрессивный подоходный налог, представляют собой системы управления с обратной связью. Так, например, рост числа безработных приводит к росту суммы выплат пособий по безработице, что в свою


очередь противодействует росту безработицы. Аналогично этому расширение инфляции приводит при действующей системе прогрессивного налогообложения к соответствующему увеличению подоходного налога, что противодействует росту инфляции. Управляющие параметры в каждом из этих случаев пособия по безработице или налоговые отчисления соответствуют текущему состоянию экономики. Другой пример системы управления с обратной связью это денежная политика в том виде, как она осуществляется


федеральной резервной системой США, которая регулирует выпуск денег и определяет условия кредита в соответствии с текущими значениями экономических переменных. На рис.1 в виде схемы показаны два вида управления и некоторые другие аспекты задач управления на примере задачи с закрепленным временем. Здесь кружками обозначены исходные данные начальный момент и начальное состояние, уравнения движения, область множество управления и целевой функционал.


В прямоугольниках указано, что требуется найти управление и фазовую траекторию. Ромбами обозначены два вида управления управление по замкнутому контуру и управление по разомкнутому контуру. Взаимосвязи, существующие между различными частями задачи, показаны с помощью стрелок. Так, например, поскольку для определения скорости изменения фазовых координат с помощью уравнений движения используется текущее состояние, определенное управление и время, то эти величины влияют на фазовую траекторию.


В дальнейшем, как правило, предполагается, что задача управления не содержит случайных переменных и что все необходимые параметры, функции и множества полностью определены. В этом случае управление по замкнутому контуру и управление с обратной связью приводит к одинаковым результатам. Поэтому основное внимание будет уделено управлению по разомкнутому контуру, которое обычно легче определить, чем управление по замкнутому контуру.


Однако в двух типах задач управления, указанных ниже, управление по замкнутому контуру имеет преимущество перед управлением по разомкнутому контуру, так как первое доставляет большее максимальное значение целевого функционала. Этими двумя типами задач являются задачи стохастического управления, которые содержат случайные переменные с фиксированными распределениями, и задачи адаптивного управления, которые содержат неопределенности относительно начальных условий на параметры, функции или множества, которые уменьшаются или полностью


устраняются по мере развертывания процесса. Задача управления как задача программирования в бесконечномерном пространстве обобщенная теорема Вейерштрасса Задачу управления можно считать задачей математического программирования в бесконечномерном пространстве. Рассмотрим следующую задачу управления 3 t0 и xt0 x0 фиксированы, t1 фиксирован utU. Эта задача отличается следующими своими свойствами она автономна, т.е. уравнения движения и целевой функционал не зависят явно от времени данная задача относится к классу


задач Лагранжа, так как целевой функционал не зависит от конечного состояния или от конечного момента времени это задача с закрепленным временем, так как t1 задано, а xt1 произвольно задача содержит только один управляющий параметр и одну фазовую координату. Заданный промежуток времени t0tt1 можно разбить на N интервалов равной длины 4 Время измеряется в дискретных единицах 5 где индекс q изменяется от 0 что


соответствует tt0 до N что соответствует tt1. Состояния и управления замеряются в отмеченные дискретные моменты времени 6 Рассмотрим теперь задачу математического программирования с N1 переменной u0, u1 uN 7 где - фиксированный положительный параметр. Пределом целевой функции этой задачи при N, стремящемся к бесконечности, и , стремящемся к 0, и при фиксированной величине N, равной t1-t0, является целевой функционал задачи 3, т.е.


8 При указанном переходе к пределу разностные уравнения в 7 превращаются в дифференциальные уравнения задачи 3. Таким образом, задачу управления можно считать задачей математического программирования в бесконечномерном пространстве. Этим пространством является множество всех кусочно-непрерывных вещественных функций ut, определенных на промежутке t0tt1. Основная теорема математического программирования теорема Вейерштрасса указывает условия, достаточные для существования максимума.


Эти условия состоят в том, что целевая функция должна быть непрерывной, а допустимое множество компактным. Обобщая эту теорему на случай бесконечномерного пространства, можно получить основную теорему существования для задач управления обобщенную теорему Вейерштрасса. Согласно этой теореме, решение общей задачи управления существует, если целевой функционал Jut является непрерывным функционалом от функций управления и если подмножество


U бесконечномерного пространства, которому принадлежат управления, является компактным. Важным частным случаем, когда решения существуют, является задача, в которой функция J и f линейно зависят от u. Задачи оптимального управления. Допустим, что математическая модель некоторого процесса характеризуется зависящими от времени t фазовыми координатами x1t xnt, поведение которых описывается системой обыкновенных дифференциальных уравнений 9


где u1t umt параметры управления, определяющие ход процесса. Будем считать, что допустимые управления uu1 um, содержатся в некотором множестве U и в этом множестве существует управление uou10t um0t, переводящее управляемый объект из начального состояния S0t0,x10 xn0 в конечное состояние S1t1,x11 xn1. Пусть начальное и конечное состояния удовлетворяют краевым условиям 10 а фазовые координаты xx1 xn и


управление uu1 um подчинены изопериметрическим ограничениям 11 Предположим также, что функционал 12 выражает некоторую характеристику процесса, которую условно рассматривают как цель, цену или качество процесса. Задача оптимального управления заключается в отыскании в множестве U такого управления uu1t umt, которое осуществляет переход управляемого объекта, поведение которого описывается системой 9, из состояния S0 в состояние


S1 при выполнении краевых условий 10 и изопериметрических ограничений 11 таким образом, чтобы функционал 12 достигал экстремального значения. Для определенности в дальнейшем будем говорить только о минимуме функционала 12. Четверку xt, ut, t0, t1 называют управляемым процессом в задаче оптимального управления 9-12, если а управление ut кусочно-непрерывная функция на отрезке t0, t1, содержащаяся в множестве U б фазовая траектория xt непрерывна на отрезке t0, t1 в для всех tt0, t1, кроме, быть может, точек


разрыва управления ut, функции x1t xnt удовлетворяют системе управлений 9. Управляемый процесс называется допустимым, если удовлетворяется условия 10 и 11. Допустимый управляемый процесс xt, ut, t0, t1 называются оптимальным, если найдется такое 0, что для всякого допустимого управляемого процесса xt, ut, t0, t1 такого, что при выполняется неравенство Необходимые условия экстремума задачи оптимального управления, позволяющие определять оптимальный управляемый


процесс, если он существует, были получены Л.С. Понтрягиным и носят название принципа максимума Понтрягина. Для формулировки этого принципа предположим, что 0, 1 l и 0, 1 k, 000 некоторые постоянные векторы, а t1t nt кусочно-гладкая на t0, t1 вектор-функция. Введем функции Лагранжа 13 Пусть существует оптимальный управляемый процесс xt, ut, t0, t1. Для произвольной функции Hx, u, t0, t1 обозначим HtHxt, ut, t0, t1.


Имеет место Принцип максимума Понтрягина. Если xt, ut, t0, t1 - оптимальный процесс для задачи 9-12, то найдутся множители Лагранжа, и t, не равны одновременно нулю и такие , что для функционала 13 выполняется 1 Уравнения Эйлера 14 2 Условия трансверсальности по x 15 3 Условия трансверсальности по t 16 4 Принцип максимума по u 17 5 Условия согласованности знаков с соотношениями 10 и 11 если при некотором j в соотношении 11 или при


некотором s в 11 стоит знак , то соответствующееj0 s0 при тех j и s, у которых в соотношениях 10 и 11 стоят знаки равенства, знаки j и s могут быть произвольными 6 Условия дополняющей нежесткости 18 Нужно отметить, что при соответствующем выборе фазовых координат и управления принцип максимума Понтрягина может быть использован для решения всех задач классического вариационного исчисления, однако область его применения гораздо шире.


Рассмотрим пример на применение принципа максимума. Пример 1. Найти оптимальный управляемый процесс в задаче Составим функции Лагранжа Отсюда находим уравнения Эйлера Пусть л00. Тогда щ1С1, а из условия щ110 см. 15 следует, что С10 и щ1t0. Поэтому щ2tС2, а так как согласно условию 17 , то


Поэтому из уравнения связи x 2u, x200, находим Однако по условиям задачи x21-1, что противоречит полученному выражению для x2t. Поэтому л00. Возьмем л01. Тогда щ1t tС3. Учитывая, что щ1t0, находим щ1t t-1. Из уравнения Эйлера щ 2-щ1 получаем щ2t-t22tC4. Пусть C40. Так как щ2t 12-12t-12С4, то при 0t1 будет щ2t0 и, учитывая 17, имеем u1, x2tt, что противоречит условию x21-1. Следовательно C4 0. Если взять C4-12, то щ2t0 при всех t и, следовательно, u-2, x2t-2t,


что противоречит условию x21-1. Итак 12 C4 0. Тогда щ20 C4 0, щ21 С40 и согласно принципу максимума 17 получаем где б достаточно малое число. Теперь из уравнения связи x 2u находим Функция непрерывна на отрезке 0, 1, поэтому существует такая точка t2, в которой оба полученных выражения для x2tравны между собой, т.е. 2t2t2-2, откуда t223. Итак, При рассмотрении многих задач полезно применять функцию


Понтрягина . 19 С ее помощью системы уравнений 9 и 14 могут быть записаны в виде i1, ,n. 20 а принцип максимума по u условие 17 принимает вид 21 В качестве примера на применение функции Понтрягина рассмотрим простейшую задачу о быстродействии. Пример 2. Пусть материальная точка единичной массы движется под действием внешней силы uu1. Считая, что в начальный момент времени точка находится в положении x0 и имеет начальную скорость н0,


требуется остановить ее в кратчайшее время в начале координат. Формализованно эта задача может быть записана в виде Функция Понтрягина H в рассматриваемом случае будет иметь вид а вторая группа уравнений 20 вид Из условий трансверсальности 15 находим а из принципа максимума 21, опустив не зависящее от u слагаемое, получаем т.е. 22 Далее, Функция щ2t не может тождественно равняться нулю, так как отсюда следовало


бы м1м2м3м40, и все множители Лагранжа оказываются нулями. Поэтому функция щ2t может обращаться на 0, Т в нуль не более одного раза и возможны только следующие случаи а щ2t 0 при 0tТ, u1. Из уравнений связи и условий на правом конце находим Тогда на левом конце отрезка 0, T справедливы равенства н0-Т, x0Т22. Следовательно, этот случай возможен лишь тогда, когда начальная точка x10, x20 лежит на параболе x1


x222, причем x10 0, x20 0. Имеем также Т-н0. б щ2t0 при 0tТ, u-1. Аналогично получаем x2tT-t, x1t-T-t22, н0Т, x0-Т22. Этот случай возможен тогда, когда начальная точка лежит на кривой x1 -x222, причем x10 0, x20 0, Тн0. в щ 2t 0 при 0tф, щ2t 0 при фt Т. Тогда Для определения ф и T воспользуемся непрерывностью функций и . Это дает фн0T- ф, ф22 н0фx0-T- ф 22.


Исключая из последнего равенства T, получим уравнение ф22н0фx0н0220, откуда Так как T ф 0, то фн0 0 , и мы имеем Если н0 0, то это возможно лишь при x0 -н 022. Если н0 0, то x0н 022. Таким образом, если н0 0, то начальная точка x10, x20 должна лежать левее параболы x1 -x222, а если н0 0, то начальная точка x10, x20 лежит левее параболы x1 x222. В этом случае г щ2t 0 при при 0tф, щ 2t 0 при фt Т.


Тогда Аналогично предыдущему, получаем ф-н0T-ф ф22 н0фx0T- ф 22. Исключая из последнего равенства T, получим уравнение откуда Так как T ф 0, то ф н0. Поэтому Следовательно, если н0 0, то из условия ф 0 получаем x0 н 022 , а если н0 0, то x0-н 022, так как стоящее под знаком корня выражение не может быть отрицательным. Таким образом, если н0 0, то начальная точка x10, x20 лежит правее параболы x1 x222, если н0 0, то


начальная точка x10, x20 лежит правее параболы x1 -x222. В этом случае Разобранными случаями исчерпываются все возможные расположения начальной точки на фазовой плоскости. Литература М. Интрилигатор Математические методы оптимизации и экономическая теория. Сборник задач по математике для ВТУЗов. Специальные курсы. Под редакцией А.В. Ефимова



Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Сейчас смотрят :

Реферат Неспецифический язвенный коллит
Реферат Норма беременности основные изменения в организме женщины при беременности
Реферат Влияние христианства на развитие права и государства в Киевской Руси
Реферат Маркетинговые исследования рынка и оценка конкурентоспособности товара 3
Реферат Жидкофазное каталитическое окисление фенольных соединений
Реферат Харассмент и российские женщины
Реферат История развития операционной системы Windows
Реферат Концепции "Lean production" в управлении офисом
Реферат Телевидение и журналистика
Реферат The Nature Of Truth Essay Research Paper
Реферат Формування мовленнєвої комунікації молодших школярів на уроках розвитку зв язного мовлення
Реферат Правовые аспекты применения сети Интернет в России
Реферат Внешняя среда организации
Реферат Компенсационная функция и ее проявления в некоторых понятиях и институтах гражданского права
Реферат Чехов А П