НЕОБХІДНІУМОВИ ОПТИМАЛЬНОСТІ. ПРИНЦИП МАКСИМУМУ ПОНТРЯГІНА
1 Загальна задача керованості
Розглянемо керований об'єкт, що описуєтьсясистемою рівнянь
/>,(1)
де /> – вектор фазового стану об'єкта; /> – векторкерування.
Припустимо, задані початкова й кінцевамножини /> та/>. Задачакерованості полягає у встановленні наступного факту: чи існує на деякомувідрізку часу /> хоча б одне таке припустимекерування />,що відповідний йому розв’язок /> рівняння (1) задовольняєграничним умовам
/>, />.(2)
Визначення. Об'єкт є керованим на відрізкучасу /> ізмножини /> намножину />,якщо існує хоча б одне припустиме керування /> таке, що відповідний йомурозв’язок /> задовольняєграничним умовам (2), тобто здійснює перехід з початкової множини /> на кінцевумножину /> навідрізку часу />.
Якщо питання про існування оптимальногокерування вирішено, далі необхідно його знайти (для цього використовуютьсянеобхідні умови оптимальності), а потім вибирати оптимальне керування намножині всіх керувань, що задовольняють цим необхідним умовам. Необхідні умовиоптимальності, які дозволяють виділити із множини припустимих процесів деякупідмножину процесів, підозрілих на оптимальність, дає принцип максимумуПонтрягіна.
2 Властивості оптимальних керувань
Розглянемо керовану систему із законом (1)за заданих крайових умов
/>, />,(3)
у якій фазовий вектор /> набуває будь-якихзначень із простору />, тобто фазові обмеження відсутні.Вважатимемо також, що на вектор керування /> накладаються обмеження:
/>, />, />,(4)
де /> – вектор-функція, неперервна повсіх змінних і неперервно-диференційована по змінних />;
/> – лінійний простіркусково-неперервних на /> функцій.
Необхідно знайти таке припустиме керування />, що переводитьсистему з фазового стану /> у фазовий стан />, причому відповіднийприпустимий процес /> надає мінімального значенняфункціоналу
/>,(5)
де функція /> неперервна за сукупністю усіхзмінних і неперервно-диференційована по змінних />.
Вважатимемо, що час керування /> – довільний,тобто кожному припустимому процесу, на якому система переходить зі стану /> у стан />, відповідаютьсвої моменти часу /> й />.
Мають місце наступні властивостіоптимальних керувань і траєкторій задачі (1), (3)–(5).
1. Властивості керувань не змінюються призміщенні уздовж осі />. Отже, якщо керування />, />, переводитьсистему зі стану /> у стан />, а цільовий функціонал навідповідному припустимому процесі приймає значення />, то для кожного /> керування />, /> такожпереводить систему зі стану /> в стан /> і цільовий функціонал при цьомунабуває значення /> (рис. 1).
/>
Рисунок 1
Позначимо />, …, /> – скінченний набір точок фазовогопростору, для яких існує набір таких керувань />, …, />, що керування /> переводить систему зістану /> устан /> іпри цьому цільовий функціонал дорівнює />, /> (рис. 2).
/>
Рисунок 2
Тоді існує кусково-неперервне керування />, якепереводить систему зі стану /> у стан /> і значення цільового функціоналупри цьому дорівнює
/>.
Зауважимо, що подібна операція неможлива вкласі неперервних керувань, тому що в точках стику /> побудоване узагальнене керуванняможе мати точки розриву першого роду.
3. Якщо функція />, /> – оптимальне керування, тофрагмент цієї функції на будь-якому інтервалі />, />, також є оптимальним керуванням.
4. Припустимо, /> – оптимальна траєкторія, щовідповідає керуванню />, />, />. Розглянемо довільний відрізок />, і позначимо />, />. За таких умовінтеграл /> накеруванні /> набуваєнайменшого значення серед всіх припустимих керувань />, що переводять систему зі стану /> в стан />.
3 Принцип максимуму Понтрягіна
Розглянемо задачу оптимального керування(1), (3)–(5):
/>, />, />,
/>,
/>, />, />, />,
де />, /> – функції, неперервні засукупністю всіх змінних і неперервно-диференційовані по змінних />.
Перейдемо до />-вимірного простору, елементамиякого є вектори
/>,
де /> – фазовий вектор задачі, а /> – деякафункція, що задовольняє співвідношенню
/>.(6)
З останньої формули випливає, що функція /> є розв’язкомрівняння
/>.
Приєднавши останнє рівняння до системи (1),дістанемо нову систему
/>,(7)
де />;
/>.
Підкреслимо, що праві частини рівняньсистеми (7) не залежать від />. З формули (6) випливає, що
/>, />.
Таким чином, початкову задачу зведено дозадачі вибору припустимого керування />, яке здійснює перехід точки /> в />-вимірномупросторі зі стану /> у найближчу точку /> на прямій, щопаралельна осі />, і проходить через точку /> (рис. 3).Пошук оптимального керування тепер полягає в мінімізації величини />. Дійсно,
/>.
/>
Рисунок 3
Складемо допоміжну систему
/>, />,(8)
відносно невідомих функцій />. Ця система називаєтьсяспряженою системою до системи (7), а змінні /> – спряженими змінними.
Якщо /> – припустимий процес, товідповідна цьому процесу система (8) є лінійною однорідною системоюдиференціальних рівнянь із відомими кусково-неперервними коефіцієнтами. Відомо,що за будь-яких початкових умов ця система має єдиний розв’язок.
Оскільки />, />, не залежать від />, то
/>,
і перше рівняння системи (8) можнаспростити: />,звідки випливає, що />.
Розглянемо функцію
/>,(9)
що називається функцією Понтрягіна, де /> – векторспряжених змінних. Точну верхню грань значень цієї функції по змінній /> при фіксованих/> і /> позначимочерез
/>.
Має місце наступна теорема.
Теорема 1 (принцип максимуму). Якщокерування />,/> івідповідна йому фазова траєкторія /> оптимальні, то існує таканенульова вектор-функція />, що відповідає функціям /> і /> (тобтозадовольняє спряженій системі (8) з функціями /> й />), що:
1. Функція /> від змінної /> набуває максимуму вточці /> длябудь-якого />:
/>: />.
У кінцевий момент часу /> має місцеспіввідношення />, />.
Умови теореми 1 дозволяють серед усіхтраєкторій, що проходять через дві задані точки /> й />, виділити окремі траєкторії,серед яких перебуває і оптимальна траєкторія, якщо вона існує. Ці умови єнеобхідними, але не достатніми. Потрібна подальша перевірка знайденихтраєкторій на оптимальність. Тільки в найпростішому випадку, коли знайдено лишеодну траєкторію, а з деяких міркувань відомо, що оптимальний розв’язок існує,можна стверджувати, що знайдена траєкторія і є оптимальною.
Якщо принципу максимуму задовольняютькілька траєкторій, то для виявлення серед них оптимальної треба застосовуватидодаткові умови. Іноді вдається відокремити сторонні траєкторії, порівнюючизначення цільового функціонала. Але оптимальна траєкторія може бути не єдиною,а відкинуті траєкторії, не будучи оптимальними, можуть виявитися локальнооптимальними.
Продиференціюємо функцію Понтрягіна (9) зазмінними /> і/>:
/>, />,
/>, />.
Тепер співвідношення (7) і (8) можнапереписати у вигляді гамільтонової системи:
/>.(10)
Якщо />, />, /> задовольняють системі (10) і умові1 теореми 1, то функції /> і /> змінного /> є сталими. Умова 2 теореми 1,таким чином, має місце в будь-який момент часу />.
4 Принцип максимуму для задачі оптимальноїшвидкодії
Окремим випадком критерію (5) є критерій
/>,(11)
який називається критерієм оптимальноїшвидкодії, а відповідна йому задача – задачею оптимальної швидкодії. Оскільки уформулі (11) />, то функція Понтрягіна /> для задачіоптимальної швидкодії матиме вигляд:
/>,
де />.
Оскільки перший доданок не залежить від />, то максимумфункції /> по/> реалізуєтьсяодночасно з максимумом функції
/>,
де />. Тому далі розглядатимемо новугамільтонову систему, відкинувши перші рівняння системи (10), що відповідають />:
/>.(12)
Позначимо
/>.
Можна довести, що
/>.
З теореми 1 відповідно до умов /> і />, випливає, що:
1) />;
2) вектор-функції /> і /> не обертаються в нуль у жоднійточці відрізка />.
На основі теореми 1 можна сформулюватинеобхідні умови оптимальності в задачі швидкодії.
Теорема 2. Якщо />, /> – оптимальний процес, то існуєненульовий частинний розв’язок /> спряженої системи
/>, />,
такий, що:
1. при кожному значенні /> функція /> змінної /> набуває при /> максимальногозначення:
/>;
у кінцевий момент часу /> має місцеспіввідношення />.
Як і у випадку теореми 1, перевірку умови 2теореми 2 можна проводити в будь-який момент часу />.