3. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений. Уже то обстоятельство, что в этой фразе встретилось несколько латинских слов (maximum наибольшее, minimum - наименьшее, extremum - крайнее, optimus - оптимальное), указывает, что теория экстремальных задач была предметом исследования с древних времен. О некоторых таких задачах писали еще Аристотель (384-322 годы до н.э.), Евклид (III в. до н.э.) и Архимед (287-212 годы до н.э.). Основание города Карфагена (825 год до н.э.) легенда ассоциирует с древнейшей задачей определения замкнутой плоской кривой, охватывающей фигуру максимально возможной площади. Подобные задачи именуются изопериметрическими. Характерной особенностью экстре-мальных задач является то, что их постановка была порождена актуальными запросами развития общества. Более того, начиная с XVII века доминирующим становится представление о том, что законы окружающего нас мира являются следствием некоторых вариационных принципов. Первым из них был принцип П. Ферма. Ферма сформулировал метод исследования на экстремум для полиномов, состоящий в том, что в точке экстремума производная равняется нулю. Для общего случая этот метод получен И. Ньютоном (1671) и Г.В.Лейбницем (1684), работы которых знаменуют зарождение математического анализа.
Начало развития классического вариационного исчисления датируется появлением в 1696 году статьи И. Бернулли (ученика Лейбница), в которой сформулирована постановка задачи о кривой, соединяющей две точки А и В, двигаясь по которой из точки А в В под действием силы тяжести материальная точка достигнет В за минимально возможное время. В рамках классического вариационного исчисления в XVIII-XIX веках установлены необходимые условие экстремума первого порядка (Л. Эйлер, Ж.Л. Лагранж), позднее развиты необходимые и достаточные условия второго порядка (К.Т.В. Вейерштрасс. A.M. Лежандр, К.Г.Я. Якоби), построены теория Гамильтона—Якоби и теория поля (Д. Гильберт, Л. Кнезер).
Дальнейшее развитее теории экстремальных задач привело в XX веке к созданию линейного программирования, выпуклого анализа, математического программирования, теории минимакса и некоторых иных разделов, одним из которых является теория оптимального управления. Эта теория подобно другим направлениям теории экстремальных задач, возникла в связи с актуальными задачами автоматического регулирования в конце 40-х годов (управление лифтом в шахте с целью наискорейшей остановки его, управление движением ракет, стабилизация мощности гидроэлектростанций и др.).
Заметим, что постановки отдельных задач, которые могут быть интерпретированы как задачи оптимального управления, встречались и ранее, например в «Математических началах натуральной философии» И. Ньютона (1687). Сюда же относятся и задача Р. Годдарда (1919) о подъеме ракеты на заданную высоту с минимальными затратами топлива и двойственная ей задача о подъеме ракеты на максимальную высоту при заданном количестве топлива.
За прошедшее время были установлены фундаментальные принципы теории оптимального управления: принцип максимума и метод динамического программирования. Указанные принципы представляют собой развитие классического вариационного исчисления для исследования задач, содержащих сложные ограничения на управление. Сейчас теория оптимального управления переживает период бурного развития как в связи с наличием трудных и интересных математических проблем, так и в связи с обилием приложений, в том числе и в таких областях, как экономика, биология, медицина, ядерная энергетика и др.
1. ПОСТАНОВКА ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Постановка любой конкретной задачи оптимального управления включает в себя ряд факторов: математическую модель управляемого объекта, цель управления (именуемую иногда критерием качества), различного рода ограничения на траекторию системы, управляющее воздействие, длительность процесса управления, класс допустимых управлений и т.д. Остановимся на этих факторах подробнее.
1.1. Модели объекта
В зависимости от вида рассматриваемого явления и желаемой степени детализации его изучения могут быть использованы различные типы уравнений: обыкновенные дифференциальные уравнения, уравнения с последействием, стохастические уравнения, уравнения в частных производных и т.д. Предположим ради определенности, что эволюция объекта описывается системой обыкновенных дифференциальных уравнений
(3.1)
Здесь - управление, фазовый вектор системы, - заданная функция, - евклидово пространство размерности n. Придавая управлению u различные возможные значения, получаем различные состояния объекта, среди которых и выбирается оптимальное (то есть наилучшее) в том или ином смысле.
Пример 1. Рассмотрим прямолинейное движение тела постоянной массы m под действием управляющего воздействия u, создаваемого установленным на теле двигателем. Обозначим через х координату центра масс тела и предположим, что никакие другие силы на тело не действуют. Тогда в соответствии со вторым законом Ньютона уравнение движения тела имеет вид . Последнее уравнение эквивалентно системе двух уравнений первого порядка , .
Пример 2. Охота, рыбная ловля, вырубка леса и т.д. представляют собой способы управления окружающей средой. Рассмотрим популяцию, численность которой x(t) в момент t регулируется с помощью управляющего воздействия u. Тогда для моделирования изменения х(t) может быть использовано уравнение П.Ф.Ферхюльста (1836)
(3.2)
где и К - положительные параметры. Уравнение (3.2) возникает при моделировании рака костного мозга (миеломы), в этом случае x(t) - количество клеток миеломы, а член ux(t) отражает предположение, что больные клетки погибают прямо пропорционально концентрации введенного лекарства и размеру опухоли. Иногда более удовлетворительного соответствия можно достичь, если использовать уравнение (3.2) с запаздыванием n > 0
которое именуется уравнением Г.Е. Хатчинсона (1948).
Иные модели управления численностью популяций описываются уравнениями в частных производных, уравнениями В. Вольтерра, стохастическими уравнениями и др. и учитывают такие факторы, как миграцию, неоднородность плотности расселения, неоднородность по возрастам и т.д.
1.2. Критерий качества (минимизируемый функционал)
Управление системой (3.1) осуществляется для достижения некоторых целей, которые формально записываются в терминах минимизации по u функционалов J, определяемых управлением u и траекторией х, где
(3.3)
Здесь F и заданные скалярные функции. Задача (3.1). (3.3) именуется задачей О.Больца; если , то задачей А.Майера и, наконец, задачей Лагранжа при .
1.3. Ограничения на траекторию
В некоторых реальных ситуациях траектория системы не может принадлежать тем или иным частям пространства . Указанное обстоятельство находит отражение в ограничении вида ), где G(t) -заданная область в . В зависимости от конкретного типа этих ограничений выделяют различные классы задач управления. В задачах с фиксированными концами начальное состояние и конечное состояние х(Т) заданы. Если же x(t0) (или х(Т)) не задано, то получаем задачу со свободным левым (правым) концом. Задача с подвижными концами - это задача, в которой моменты t0 и T фиксированы, а векторы х(t0) и х(Т) принадлежат соответственно областям G(t0) и G(T). В ряде случаев ограничения носят интегральный характер и имеют вид
Если в задаче (3.1), (3.3) начальное положение x(t0) и конечное х(Т) заданы, моменты начала движения t0 и окончания T свободны, функция и , то получаем задачу о переводе системы (3.1) из положения x(t0) в положение х(Т) за минимально возможное время. Подобного рода задачи именуются задачами оптимальными по быстродействию.
1.4. Ограничения на управление
Информационные ограничения на управление зависят от того, какая именно информация о системе (3.1) доступна при выработке управляющего воздействия. Если вектор x(t) недоступен измерению, то оптимальное управление ищется в классе функций u(t), зависящих только от t. В этом случае оптимальное управление именуется программным. Если же вектор х(t) известен точно при , то оптимальное управление ищется в классе функционалов и называется синтезом оптимального управления (или управлением по принципу обратной связи). Здесь означает всю траекторию движения на отрезке . Отметим, что принцип обратной связи является одним из центральных принципов кибернетики. Техническим примером реализации принципа обратной связи являются центробежные регуляторы И.И. Ползунова (1766) и Дж. Уатта (1784), авиационный автопилот Д. Ольховского (1912) и братьев Сперри (1914), гидравлический усилитель Л. Фарко (1873).
Кроме информационных ограничений возможен и другой тип ограничений, обусловленный ограниченностью ресурсов управления, имеющих вид , где - заданное множество.
Подчеркнем, что для детерминированных задач (то есть задач, в которых уравнения движения, критерий качества и ограничения известны точно) оптимальное значение критерия качества (3.3), реализуемое в классе программных управлений и управлений по принципу обратной связи, одно и то же.
2. УСЛОВИЯ ОПТИМАЛЬНОСТИ
2.1. Принцип максимума
Принцип максимума соответствует принципу Вейерштрасса и методу канонических уравнений Гамильтона в классическом вариационном исчислении. Сформулируем необходимые условия оптимальности в форме принципа максимума для задач Майера
(3.4)
Здесь - заданное множество, х0 - заданное начальное положение системы. Введем в рассмотрение скалярную функцию Н и вектор сопряженных переменных с помощью соотношений
(3.5)
где штрих - знак транспонирования.
Предположим, что u(t) - оптиматьное управление, а х(t) и - соответствующие траектория и вектор сопряженных переменных, удовлетворяющие уравнениям (3.4), (3.5). Тогда функция достигает своего максимума по точке u(t)
(3.6)
Найдем из соотношения (3.6) зависимость u от то есть то есть
(3.7)
Далее подставим (3.7) в (3.4), (3.5). В результате получим краевую задачу для системы обыкновенных дифференциальных уравнений относительно функций x(t) и , среди решений которой только и может находиться оптимальная траектория. Если оптимальная траектория x(t) и вектор найдены, то оптимальное управление дается выражением (3.7). Отметим, однако, что поскольку соотношения (3.4) - (3.6) суть лишь необходимые условия оптимальности, то необходимо дополнительное обоснование оптимальности траектории и управления, найденных из соотношений (3.4)-(3.6).
2.2. Метод динамического программирования
Метод динамического программирования является аналогом метода Гамильтона-Якоби, в котором изучается все поле оптимальных траекторий. Опишем применение метода динамического программирования для задачи (3.4). Выберем и зафиксируем произвольный момент времени и рассмотрим вспомогательную задачу управления (3.4) на отрезке [t, T]. Обозначим через минимальное значение критерия качества во вспомогательной задаче при начальном условии , где х - произвольный вектор из . При некоторых предположениях функция V(t, x) удовлетворяет соотношениям
(3.8)
Решив задачу (3.8) и определив функцию V(t,х), можно затем найти синтез оптимального управления u(t,x) из соотношения
. (3.9)
Возможность определять именно синтез оптимального управления является характерной чертой метода динамического программирования, особенно существенной в задачах управления при неполной информации. Использование метода динамического программирования при решении конкретных задач сопряжено с необходимостью решать нелинейное уравнение в частных производных (3.8), а также с необходимостью дополнительного исследования оптимальности управления, полученного из (3.9).
2.3. Линейно-квадратичная задача
Выше была описана универсальная техника решения задач оптимального управления, основанная на применении принципа максимума или метода динамического программирования. Наряду с этими методами при исследовании специальных классов задач оптимального управления могут быть использованы специальные приемы, эффективные именно для данного класса задач. Преимущество этих специальных приемов состоит в том, что с их помощью иногда можно проще осуществить аналогичное исследование рассматриваемой конкретной задачи.
Один из таких подходов, опирающийся на теорию двойственности выпуклых функций, эффективен для задач, линейных по фазовым координатам. При этом вычисление минимума критерия качества в исходной задаче сводится к вычислению максимума некоторого вспомогательного функционала. Это, в частности, дает возможность изучать задачи, в которых оптимального управления не существует. Другой подход, эффективный для линейных задач (то есть задач линейных и по фазовым координатам, и по управлениям), основан на использовании классической проблемы моментов.
Отмеченные выше трудности использования общих необходимых условий оптимальности также приводят к необходимости выделения конкретных классов задач, для которых оказывается возможным эффективное построение решения. Линейная квадратичная задача представляет собой один из таких классов. Проиллюстрируем применение к ней принципа максимума и метода динамического программирования на следующем скалярном примере:
(3.10)
(3.11)
Здесь a, b, g, h, T - заданные постоянные, причем , h > 0, начальное положение системы х0 также задано, ограничения на управление отсутствуют. Требуется определить оптимальное управление системой (3.10) и соответствующее этому оптимальному управлению минимальное значение критерия качества (3.11). Применим вначале принцип максимума. Функция . Поэтому уравнение (3.5) для сопряженной переменной имеет вид
. (3.12)
Условие максимума функции Н по u приводит к равенству . Следовательно, , то есть
(3.13)
Подставим выражение (3.13) для оптимального управления в уравнение (3.10). В результате получим краевую задачу относительно переменных x и .
(3.14)
Будем искать функцию в виде , где функция P(t) подлежит определению. С учетом (3.13) оптимальное управление тогда равняется
. (3.15)
Кроме того, подставляя выражение для в (3.14), получаем, что функция P(t) есть решение дифференциального уравнения Рикатти
(3.16)
Уравнение (3.16) интегрируется в явном виде методом разделения переменных. После того как функция Р(t) найдена, оптимальное управление дается выражением (3.15), причем дальнейшие вычисления констант показывают, что минимальное значение критерия качества
(3.17)
Исследуем теперь ту же задачу (3.10), (3.11), используя метод динамического программирования. Уравнения (3.8) с учетом (3.10), (3.11) принимают вид
(3.18)
Из (3.18) вытекает, что оптимальное управление дается выражением
(3.19)
Соотношения (3.18), (3.19) означают, что функция V есть решение нелинейного уравнения в частных производных первого порядка
(3.20)
Решение задачи (3.20) будем искать в виде . Подставляя это выражение в соотношения (3.20) и приравнивая к нулю коэффициенты при х2, заключаем, что функция P(t) удовлетворяет уравнению (3.16). Из уравнения (3.19) далее следует, что оптимальное управление имеет вид (3.15), а минимальное значение критерия качества дается формулой (3.17). Таким образом, для линейно-квадратической задачи принцип максимума и метод динамического программирования позволяют построить оптимальное управление (3.15) (причем в виде синтеза) и определить минимальное значение критерия качества (3.17). Последнее зависит только от начального положения системы х0 и величины P(0), то есть может быть определено заранее, до фактической реализации процесса управления. Аналогично и оптимальное управление может быть найдено в зависимости только от времени t. Для этого надлежит определить P(t) как решение задачи Коши (3.16), затем подставить управление (3.15) с найденным Р(t) в уравнение (3.10) и решить его, определив х(t), наконец, подставить x(t) в (3.15) и получить программное оптимальное управление.
2.4. Задача об успокоении твердого тела
Одним из хорошо изученных классов задач оптимального управления являются задачи линейного оптимального быстродействия, а также некоторые задачи успокоения движения твердого тела (возникающие, например, в теории управления летательными аппаратами). Рассмотрим в качестве примера одну из них, именно задачу об успокоении твердого тела, вращающегося относительно центра масс О. Обозначим: , i = 1, 2, 3, - главные центральные оси инерции тела, xi - проекция вектора кинетического момента х на ось Охi, и А, В, С - главные центральные моменты инерции твердого тела. Управление и движением твердого тела осуществляется парой поворотных двигателей, которые можно расположить под любым углом относительно тела. Движение тела относительно центра масс описывается уравнениями Эйлера
Тело считается успокоенным, если величина модуля кинетического момента не превосходит заданной величины . Предположим, что в начальный момент времени t0 = 0 значение кинетического момента x(0) задано, причем
Пусть далее - первый момент времени, когда |х(Т)| = R. Управляющий момент u, подчиненный ограничению , требуется выбрать так, чтобы минимизировать время Т успокоения твердого тела. Используем для решения этой задачи метод динамического программирования. Соответствующее уравнение в частных производных относительно функции V(х) имеет вид
(3.21)
Вычисляя управление u, доставляющее минимум выражения в квадратных скобках (3.21), получим
(3.22)
Подставляя (3.22) в (3.21), получим нелинейное уравнение в частных производных относительно функции V
(3.23)
Будем искать решение задачи (3.23) в виде
,
где - скалярная функция скалярного аргумента , подлежащая определению. Подставляя это выражение для V в (3.23), получим соотношения, определяющие функцию :
Отсюда вытекает, что . Значит, оптимальное управление u, успокаивающее тело и минимальное время успокоения V(x) равны
Эти выражения показывают, что , то есть вектор оптимального управления всегда максимален по величине и направлен против вектора кинетического момента.
3. НЕКОТОРЫЕ ЗАМЕЧАНИЯ О ВЫЧИСЛИТЕЛЬНЫХ И ПРИБЛИЖЕННЫХ МЕТОДАХ
В связи со значительными трудностями построения аналитического решения задач оптимального управления исключительное значение приобрели различные приближенные и численные методы их исследования. В зависимости от алгоритмической основы метода он может быть отнесен к той или иной группе. Охарактеризуем некоторые из них. В основе первой группы методов лежит возможность сведения задачи оптимального управления к краевой задаче для системы дифференциальных уравнений с помощью принципа максимума с последующим использованием различных алгоритмов задания недостающих начальных условий. Ко второй группе численных методов относятся те, в которых ищется оптимальное управление с помощью итерационных процедур в пространстве управлений. При этом используются формулы для приращений критерия качества при вариации управления, приводящие либо к методам градиентного типа в пространстве управлений, либо к процедурам последовательных приближений. Третью группу составляют численные процедуры, основанные на переборе в пространстве траекторий или методе динамического программирования. Кроме того, имеются методы, эффективные для конкретных классов систем, например для линейных, а также методы, основанные на сведении исходной задачи оптимального управления к задаче математического программирования.
Опишем подробнее метод последовательных приближений, основанный на использовании метода динамического программирования для задачи (3.4). Зададимся произвольным допустимым управлением (нулевым приближением к оптимальному), то есть управлением, при котором существует решение уравнения (3.4) и выполнено ограничение . Решим далее линейное уравнение частных производных
Функция V0(t,х) представляет собой значение критерия качества при управлении u0 и начальном условии х(t) = х. После того как функция V0 определена, найдем следующее приближение к оптимальному управлению из соотношения
Продолжая указанный процесс, можно построить последовательность управлений и функций , которые в некоторых случаях (например, в линейно-квадратическом) сходятся к решению исходной задачи. Описанная процедура естественным образом может быть использована и при применении принципа максимума к задаче (3.4). В этом случае необходимые условия оптимальности имеют вид краевой задачи (3.4)-(3.6). Зададимся опять некоторым допустимым управлением . Далее найдем при этом управлении соответствующую ему траекторию , решая уравнение (3.4) при . Наконец, подставим u0 и х0 в (3.5) и определим . Зная функции и , определим управление u1(t) из соотношения
.
Продолжая итерации, построим последовательности xi(t), ui(t), которые в некоторых ситуациях сходятся к решению исходной задачи оптимального управления (3.4). Так, например, в применении к линейно-квадратичной задаче (3.10). (3.11) этот процесс приводит к следующей аппроксимации решения Р(t) нелинейного уравнения Рикатти (3.16) последовательностью Pi(t) решений линейных уравнений ()
При этом последовательность равномерно сходится к Р(t), причем .
4. ОПТИКО-МЕХАНИЧЕСКАЯ АНАЛОГИЯ В ИЗЛОЖЕНИИ ДЛЯ ШКОЛЬНИКОВ
Оптико-механическая аналогия - это сходство траектории движения частицы в потенциальном силовом поле с траекторией лучей в оптически неоднородной среде. Траектория материальной точки и траектория светового луча совпадают при определенном соответствии потенциальной энергии и переменного в пространстве показателя преломления среды. Этот факт был теоретически открыт выдающимся ирландским математиком и физиком У.Р. Гамильтоном (1805-1865) в 1834 году и уже в нашем столетии оказал влияние на установление связи между волновой оптикой и волновой (квантовой) механикой.
Практическое значение оптико-механической аналогии связано с использованием ее в электронной оптике, которая занимается формированием и фокусировкой пучков электронов (или ионов) для получения с их помощью изображений и созданием на этой основе электронных и ионных микроскопов и проекторов.
ЗАКОН ПРЕЛОМЛЕНИЯ В ОПТИКЕ
Закон преломления является одним из основных законов еометрической оптики:
Луч падающий и луч преломленный лежат в одной плоскости с нормалью к границе раздела двух сред. При прохождении света из среды с показателем преломления n1, в среду с показателем преломления n2, отношение синуса угла падения к синусу угла преломления равно обратному отношению показателей преломления:
(4.1)
или
(4.1 a)
Первая попытка установить количественно закон преломления принадлежала, по-видимому, греческому астроному К. Птолемею (II в. н.э.). Птолемей объяснял изменение видимого относительного углового положения небесных светил преломлением световых лучей в атмосфере, то есть атмосферной рефракцией. Составленные им таблицы оказались достаточно точными, но так как его измерения относились к сравнительно небольшим углам наблюдения, то он пришел к неправильному заключению о пропорциональности углов (а не синусов) падения и преломления. Эта ошибка была замечена только через тысячу лет (!) арабским ученым Альгазеном (965-1039), но правильного выражения закона он дать не смог.
Около 1270 года итальянский монах Вителиус написал десятитомную (!) оптическую энциклопедию. В ней, в частности, содержались таблицы углов падения и преломления при переходе световых лучей из воздуха в стекло, из воздуха в воду и из воды в стекло. Однако приведенные там данные были неточными. Они ввели в заблуждение И. Кеплера (1571-1630), пытавшегося найти форму поверхности, которая преломляет параллельный пучок так, чтобы он сходился в одной точке. Кеплер был близок к правильному результату — гиперболической поверхности вращения, но отказался от него, так как он не согласовывался с данными Вителиуса.
Честь открытия закона преломления принадлежит голландскому физику В. Снеллиусу (1580-1626) и французскому математику, физику и философу Р. Декарту (1596-1650). К сожалению, книга Снеллиуса, которая содержала этот закон, была вскоре утрачена, так что «Диоптрика» Декарта является первым сохранившимся изданием, содержащим закон преломления. После смерти Декарта была поставлена под сомнение независимость его открытия. Утверждали, что Декарт видел книгу Снеллиуса. Возможно, что это было и так, однако сравнительно недавние исследования показали, что Декарт знал закон преломления еще до своей поездки в Голландию, где он познакомился со Снеллиусом.
Закон преломления в форме (4.1) для двух сред, разделенных плоской поверхностью, легко обобщается на случай неоднородной среды с изменяющимся в пространстве показателем преломления. Именно такую среду представляет собой атмосфера. Неоднородность показателя преломления в атмосфере связана с неоднородностью плотности воздуха. Будем считать ради простоты, что слой воздуха плоский и что показатель преломления зависит только от высоты. Тогда мы можем мысленно разбить этот слой воздуха на тонкие параллельные слои, в каждом из которых показатель преломления будем приближенно считать постоянным и изменяющимся скачком от слоя к слою (рис. 1). С уменьшением толщины этих вспомогательных слоев и увеличением их числа мы будем приближаться к реальной ситуации. При переходе из одного слоя в другой луч света будет испытывать преломление в соответствии с законом (4.1):
(4.2)
На каком-то k-м шаге луч может испытать и полное внутреннее отражение, если окажется, что . Если же полного внутреннего отражения не происходит, то читатель может без труда доказать, используя (4.2), что угол преломления в i-м слое полностью определяется углом падения в нулевом слое и наоборот:
(4.3)
Поэтому истинное угловое положение светила , которое исследовал Птолемей, может быть определено по наблюдаемому положению с помощью уравнения
(4.4)
Напомним, что у поверхности Земли показатель преломления , а полагается равным точно 1. Конечно, простая формула (4.4) справедлива только для светил, высоко стоящих над горизонтом, когда луч света проходит плоский слой атмосферы и можно пренебречь шарообразностью Земли (рис. 2).
Изменение плотности воздуха (и вместе с ней показателя преломления) с высотой оказывается выраженным гораздо сильнее, если имеет место сильный перепад температуры с высотой. Например, в холодных странах плотность воздуха понижается с высотой более резко, чем в странах с умеренным климатом. Наоборот, в жарких странах сильное нагревание воздуха у поверхности Земли приводит к тому, что воздух внизу оказывается более разреженным, чем при несколько больших высотах. Поэтому в первом случае имеется область, в которой показатель преломления уменьшается с высотой, а во втором увеличивается. При достаточно резком изменении показателя преломления может возникнуть мираж, обусловленный полным внутренним отражением лучей. Чтобы объяснить это явление, предположим для определенности, что показатель преломления убывает с высотой. Тогда луч, исходящий от какого-то предмета на поверхности Земли, испытает полное внутреннее отражение на высоте h, которую можно найти, согласно (4.3), из уравнения
(4.5)
где n(0) — показатель преломления воздуха на нулевой высоте; - угол, определяющий начальное направление луча относительно вертикали; n(h) — показатель преломления на высоте h. Наблюдателю тогда будет казаться, что предмет находится наверху - это так называемый верхний мираж. Если же показатель преломления возрастает с высотой, то может возникнуть нижний мираж: наряду с истинным изображением предмета появится изображение внизу и в перевернутом виде. Даже в наших не слишком жарких условиях мы часто наблюдаем нижний мираж: блестящие пятна на нагретом шоссе — отражение неба.
Оптически неоднородные среды представляют и большой практический интерес. Их используют для конструирования так называемых абсолютных оптических приборов, то есть оптических систем, дающих резкое (без аберрации) изображение трехмерного предмета. Они имеют широкое применение для создания безоболочечных световодов - так называемых сельфоков. В частности, имеются сельфоки, созданные на основе кварцевого стекла с параболической зависимостью показателя преломления от радиуса (показатель преломления максимален на оси световода). Интересно, что при диаметре такого световода 0,1 мм и длине 1 км по нему можно передать изображение с разрешающей способностью 500 линий/мм.
ЗАКОН ПРЕЛОМЛЕНИЯ В МЕХАНИКЕ ДЛЯ ДВИЖЕНИЯ ЧАСТИЦЫ В ПОТЕНЦИАЛЬНОМ ПОЛЕ
Мы рассмотрели пока лишь вопрос о траектории луча в оптически неоднородной среде и сформулировали алгоритм расчета этой траектории. Теперь рассмотрим, как определяется траектория материальной точки массы m, движущейся в потенциальном поле U(х,у,z). Ее полная энергия складывается из кинетической и потенциальной и сохраняется (в силу закона сохранения энергии) в процессе движения
(4.6)
где V — абсолютная величина мгновенной скорости.
Напомним, что потенциальная энергия определяется как работа по перемещению тела из данного положения в некоторую другую точку, в которой потенциальная энергия принимается за нуль. В простейшем, известном из школьного курса случае для потенциальной энергии в однородном поле тяжести имеем
(4.7)
Здесь координата z определяет высоту подъема над поверхностью Земли, принимаемую за уровень, для которого потенциальная энергия полагается равной нулю. Более точное выражение для потенциальной энергии тела над поверхностью Земли следует из закона всемирного тяготения
; (4.8)
где — постоянная всемирного тяготения, m - масса тела, М — масса Земли, R - радиус Земли, r - расстояние от поверхности Земли. В данном случае нуль потенциальной энергии выбирается в бесконечно удаленной точке.
Для нас будет важно в дальнейшем, что при движении в потенциальном поле при заданном начальном значении энергии абсолютная величина скорости однозначно определяется, согласно (4.6), положением материальной точки в пространстве:
(4.9)
Для простоты дальнейшего изложения рассмотрим случай, когда сила, действующая на материальную точку, всюду имеет одинаковое направление, как в первом примере, но может изменяться по величине, как во втором примере. В этом случае потенциальная энергия будет зависеть только от одной координаты, которая отсчитывается вдоль направления, по которому направлена сила.
Аналогично тому, как мы делали при рассмотрении траектории луча, разобьем пространство на слои в направлении, перпендикулярном направлению силы. В каждом слое скорость материальной точки будем считать приближенно постоянной.
Пусть материальная точка массы m, имеющая скорость V1 пересекает границу первого и второго слоев. Во втором слое скорость частицы V2. Согласно второму закону Ньютона,
, (4.10)
где — время прохождения первого слоя.
Заметим, что, согласно (4.10), составляющая скорости, перпендикулярная силе, не изменяется. Поэтому движение частицы будет происходить в одной плоскости, проходящей через направление начальной скорости и направление силы. Это утверждение представляет собой аналог первой части закона преломления.
Выберем в плоскости движения декартову систему координат (х,у), причем ось Оу выберем вдоль направления силы. Тогда из (4.10) следует
(4.11)
где V1x, V1y, V2x, V2y - проекции скорости в первом и втором слоях на выбранные оси координат, F — составляющая силы вдоль оси Оу. Первое уравнение (4.11) можно заменить на
(4.12)
где и - углы, которые образуют скорости в первом и втором слоях с направлением силы. А это как раз аналог второй части закона преломления, выражаемой формулой (4.1 а).
Напомним еще раз, что в каждом слое абсолютная величина скорости однозначно определена. Поэтому угол , под которым скорость направлена к действующей силе в каждом слое, может быть найден с помощью закона преломления (4.12) по углу . Таким образом, для определения траектории материальной точки получается тот же алгоритм, что и для определения траектории луча (рис. 3).
Отметим, что роль показателя преломления в рассматриваемом случае играет величина скорости. Очевидно, что траектория луча и траектория частицы будут в точности совпадать, если показатель преломления пропорционален скорости и направление луча в начальной точке совпадает с направлением скорости. Согласно (4.9), первое условие может быть выражено равенством
, (4.13)
где - произвольный положительный коэффициент пропорциональности.
Если мы хотим найти одно из возможных потенциальных полей, в котором частица движется по такой же траектории, что и луч в заданной неоднородной среде, то это проще сделать для случая Е = 0. Тогда
. (4.14)
При этом потенциальная энергия U(y) должна быть отрицательной. Величина произвольна. Из сказанного выше следует, что она не должна влиять на траекторию. На что же она влияет? Так как показатель преломления является безразмерной величиной, то очевидно, что зависит от выбираемой единицы энергии. Если масштаб координаты фиксирован, то изменение единиц энергии можно достичь изменяя единицы массы и времени. Таким образом, изменение можно интерпретировать как переход к случаям движения частиц с другими массами или при фиксированной массе в другом масштабе времени (быстрее или медленнее). При определенном выборе единиц величину можно положить равной 1.
Таким образом, сформулированная выше оптико-механическая аналогия доказана. Правда, она доказана для случая силы, имеющей постоянное направление в пространстве. Но это не умаляет общности результата, поскольку в достаточно малой окрестности направление силы можно считать фиксированным, а оптическую среду – слоисто-однородной.