ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ
§ 1. Понятие неявной функции
В математике и в ее приложениях приходитсясталкиваться с такими задачами, когда переменная u, являющаяся по смыслу задачи функцией аргументов х, у,…, задается посредством функционального уравнения
F(u, х, у, ...)= 0. (1)
Вэтом случае говорят, что uкак функция аргументов х, у,… задана неявно. Так,например, функция u= -, рассматриваемая вкруге x2 + y2 ≤ 1, может быть неявно задана посредством функционального уравнения
F(u, х, у)= u2+ x2 + y2– 1 =0. (2)
Естественно, возникает вопрос, при каких условияхфункциональное уравнение (1) однозначноразрешимо относительно u, т.е. однозначноопределяет явную функцию u= φ( х,у, ...)и более тонкий вопрос, при каких условиях эта явнаяфункция является непрерывной и дифференцируемой. Эти вопросы не являютсяпростыми. Так функциональное уравнение (2), вообще говоря, определяет в круге x2 + y2 ≤ 1, кроме указанной выше явной функции u= -, бесконечно многодругих функций. Таковыми являются функция u= +, а также любаяфункция u, равная + для некоторых точек (х, у) из круга x2 + y2 ≤ 1иравная -для остальных точекэтого круга. Для выяснения вопроса об условиях, обеспечивающих однозначнуюразрешимость уравнения (2) относительно u, обратимся кгеометрической иллюстрации. Уравнение (2) определяет в пространстве (u, х, у)сферу Sрадиуса 1 с центром в начале координат (рис.1).Возьмем на сфере Sточку M0(u0, х0, у0), не лежащую в плоскости Оху, т.е. такую, для которой u0≠ 0. Очевидно, часть сферы S, лежащая в достаточно малой окрестности точки M0,однозначнопроектируется на плоскость Оху.Аналитически это означает, что если рассматривать функцию F(u, х, у) = u2+ x2 + y2– 1тольков указанной окрестности точки M0, то уравнение (2) однозначно разрешимо относительно uиопределяет единственную явную функцию u= + при u0>0 и u= -при u0
Еслиже на сфере Sвзять точку M1(0, х1,у1), лежащую в плоскости Оху (см. рис. 1), то очевидно, что частьсферы S, лежащая в любойокрестности M1неоднозначнопроектируется на плоскость Оху. Аналитически это означает, что еслирассматривать функцию F(u, х, у) = u2+ x2 + y2– 1 в любой окрестности точки M1, то уравнение (2) не является однозначно разрешимымотносительно u.
Обратимвнимание на то, что частая производная функции F(u, х, у) = u2+ x2 + y2– 1не обращается в нуль в точке М0и обращается в нуль в точке М1. Ниже мы установим, что для однозначной разрешимости в окрестности точки М0общего функциональногоуравнении (1) относительно uпринципиальную роль играет необращение в нуль в точке М0частной производной Попутно мы установим условия, при которых явнаяфункция, представляющая собой единственное решение уравнения (1), является непрерывной и дифференцируемой.
В дальнейшем мы будем обозначать пространствопеременных (u, х, у, ...)символом R, а пространство переменных ( х, у, ...) символом R'. Радисокращения записи и для удобства геометрической иллюстрации будем рассматриватьдве переменные х, у.
§ 2. Теорема о существовании идифференцируемости
неявной функции и некоторые ееприменения
1. Теорема осуществовании и дифференцируемости неявной функции.
Теорема 1.Пусть функция F(u, х, у) дифференцируема в некоторой, окрестности точкиM0(u0, х0, у0) пространства R, причемчастная производная непрерывна в точке M0. Тогда, если в точке M0функция Fобращается в нуль, а частная производная не обращается в нуль,то для любого достаточно малого положительного числа ε, найдется такаяокрестность точки M0’(х0,у0) пространства R', что в пределах этой окрестности существуетединственная функция u= φ(х,у), которая удовлетворяет условию | u — u0 |
F(u, х, у) = 0 (3)
причем эта функция u= φ(х, у) непрерывна и дифференцируема в указаннойокрестности точки M0’.
З а м е ч а н и е 1. В условиях теоремы 1 можно опуститьтребование непрерывности частной производной в точке M0, нотогда придется дополнительно потребовать, чтобы эта производная не обращалась внуль не только в самой точке M0, но и в некоторой окрестности этой точки и сохранялаопределенный знак в этой окрестности.
Д о к а з а т е л ь с т в о теоремы 1.
1.Прежде всего докажем, что для достаточно малого ε>0 в окрестности точки M0’(х0, у0) существуетединственная функция u= φ(х,у), которая удовлетворяет условию | u — u0 |
Ради определенности будем считать, что частнаяпроизводная положительнав точке M0. Тогда из непрерывности указанной производной в M0и изтеоремы об устойчивости знака непрерывной функции вытекает, что найдется такая окрестность точки M0, всюду в пределах которой положительна. Эту окрестность мы можем взять в виде шара Ωдостаточно малого радиуса с центром в точке M0. Фиксируем далее положительное число ε настолько малым, чтобы каждая източек M1(u0 — ε, х0, у0)и M2(u0 + ε, х0, у0)лежала внутри шара Ω (для этого достаточно взятьε меньшим радиуса шара Ω).Подчеркнем, что при этом снизу εограничено лишь нулем, и мы можем брать его как угодно малым — это будет использованонами ниже.
Рассмотримфункцию F(u, х0,у0)одной переменной насегменте u0 – ε ≤u≤ u0 + ε. Сгеометрической точки зрения это означает, что мы рассматриваем функцию трехпеременных F(u, х, у)вдоль отрезка М1М2(рис. 2). Так как производная u, х0,у0)положительна насегменте u0 – ε ≤u≤ u0 + εтофункция F(u, х0,у0)возрастает на этом сегменте. Но тогда, поскольку этафункция равна нулю в середине указанного сегмента (т. е. при u= u0), тоF(u, х0,у0) имеет отрицательное значение на левом конце и положительноезначение на правом конце указанного сегмента, т. е.
F(M1) 0
Далеерассмотрим функции F(u — ε, х, у)и F(u+ ε, х, у)двух переменных хи у, т. е., выражаясь геометрическимязыком, рассмотрим функцию F(u, х, у)надвух плоскостях, параллельных координатной плоскости Оху, первая из которых проходит через точку M1авторая — через точку M2. Поскольку F(M1) 0 ифункция F(u, х, у)непрерывна всюду в шаре Ω, то по теореме обустойчивости знака непрерывной функции на указанных плоскостях найдутся такие окрестности точек M1и M2, впределах которых функция F сохраняетте же знаки, что и в точках M1и M2. Эти окрестности мы можем взять в виде открытыхквадратов с центрами в точках M1и M2и с достаточно малой стороной 2δ (на рис. 2указанные квадраты заштрихованы). Аналитически тот факт, что функция F(u, х, у)сохраняет постоянный знак на указанных квадратах,выражается неравенствами
F(u0 – ε, х,у)
При | x– x0|
F(u0 + ε, х,у) > 0
Выборстороны указанных квадратов мы подчиним и еще одному условию: возьмем δ столь малым, чтобы обауказанных квадрата лежали внутри шара Ω (это заведомо можносделать, ибо центры квадратов M1и M2являются внутренними точками шара Ω). При такомвыборе δ любая точка пространства (u, х, у),координаты которой удовлетворяют неравенствам
| x – x0|
будетлежать внутри шара Ω. С геометрической точкизрения неравенства (5) определяют открытый прямоугольный параллелепипед сцентром в точке M0и со сторонами, параллельными осям координат u, х, уи соответственно равными 2ε, 2δ и 2δ.Этот параллелепипед мы будем обозначать символом П. Так как параллелепипед Плежит внутри шара Ω, то всюду впараллелепипеде П (включая открытые квадраты, лежащие в его основаниях)производная положительна.Кроме того, в силу неравенств (4),функция F(u, х, у) отрицательна на нижнем основании и положительна на верхнемосновании П.
Докажем теперь, что уравнение (3) однозначно разрешимоотносительно u, если функцию F(u, х, у)рассматривать лишь для значений u, х, у, лежащих внутри параллелепипеда П. Уясним, чтотребуется доказать. Пусть M’(х, у) — любая точка пространства R', координаты которой удовлетворяют неравенствам
| x– x0|
Иначеговоря, пусть M’(х, у) — любая точка плоскости Оху, лежащая внутри квадрата с центром в точке M0’(х0, у0)и со сторонами, равными 2δ. Требуется доказать,что для координат х, у точки М' найдется, и притом единственное, число uизинтервала u0 – ε
Зафиксировав значения х и у, удовлетворяющиенеравенствам (6), рассмотрим функцию F(u,х, у) аргумента uна сегменте u0 – ε ≤u≤ u0 + ε, т.е. рассмотрим функцию F(u, х, у) наотрезке M1’M2’где M1’и M2’ — точкипересечения прямой, проходящей через точку M’(х, у)и параллельной оси Ou, с основаниями параллелепипеда П(см. рис. 2). Так какпроизводная u, х, у)положительна на сегменте u0 – ε ≤u≤ u0 + ε, тофункция F(u, х, у) возрастает на этомсегменте (или, что тоже самое, возрастает на отрезке M1’M2’). Но тогда из условий F(M1’) 0 вытекает,что внутри сегмента u0 – ε ≤u≤ u0 + εнайдется одно единственное значение uтакое, что F(u,х, у) = 0 (или, выражаясь геометрически, внутри отрезка M1’M2’найдется единственная точка М, лежащая на поверхности S).
Пусть теперь функция u= φ( х,у)символизирует то правило, посредствомкоторого каждой точке M’(х, у)из окрестности (6) ставится в соответствиеединственное число uиз интервала u0 – ε
2.Докажемтеперь, что функция u= φ( х, у) непрерывна в любой точке M’(х, у) окрестности (6). Так как для любой точки M’(х, у)из окрестности (6) выполнены те же условия (а именнолюбой точке M’(х, у)из окрестности (6) соответствует точка M(u, х, у)пространства R такая, что функция F(u, х, у) обращается в нуль в точке М, дифференцируема в некоторойокрестности точки М и имеет в этойокрестности отличную от нуля частную производную ), что и для точки M0’(х0,у0), то достаточнодоказать непрерывность функции u= φ( х,у)лишь в точке M0’(х0, у0). Требуется доказать, что для любого достаточно малогоположительного ε существуетположительное число δтакое, что для любых х и у, удовлетворяющихнеравенствам | x– x0|
Темсамым непрерывность функции u= φ( х,у)установлена. Запишем условие непрерывности функции u= φ( х, у)в точке M0’(х0,у0)в разностной форме. Обозначая через Δuполное приращение функции u= φ( х, у)в точке M0’(х0,у0), соответствующееприращениям Δxи Δy, мыполучим, что Δu→0 при
3.Остается доказать дифференцируемость функции u= φ( х,у)в любой точке M’(х, у)окрестности (6). В силу замечания, сделанного в пункте 2, достаточно доказатьдифференцируемость функции u= φ( х,у)в самой точке M0’(х0, у0). Чтобы это сделать, вычислим полное приращение Δuфункции u= φ( х,у)в точке M0’(х0, у0), соответствующее приращениям аргументов Δxи Δy. ПосколькуF(u0, х0,у0) = 0и F(u0+ Δu, х0+ Δx, у0+ Δy) = 0, то полное приращение ΔFфункции F(u, х, у)в точке M0’(х0,у0), соответствующееприращениям аргументов Δu, Δxи Δy, равно нулю. Но в силу условиядифференцируемости функции F(u, х, у)в точке M0(u0, х0, у0)это полное приращение имеет вид
Здесь всечастные производные , и берутся в точке M0(u0, х0, у0); α, β иγ→0 при
Итак, мы получаем
(7)
Согласноразностной форме условия непрерывности функции u= φ( х,у)в точке M0’(х0, у0)Δu→0 при образом, можноутверждать, что α, β иγ→0 лишь при условии
По условию теоремы частная производная отлична от нуля в точке M0. Поскольку γ→0при при достаточномалых Δxи Δyвыражение не обращается в нуль. В таком случае формулу (7) можно поделить на в результате чего мы получим
(8)
По теореме о предельном значении частного двух функцийможем утверждать, что
(9)
гдеμ и υ→0 при
Сопоставляяформулы (8) и (9), окончательно получим
(10)
Формула(10) доказывает дифференцируемость функции u= φ( х,у)в точке M0’(х0, у0). Тем самым теорема 1 полностью доказана.
З а м е ч а н и е 2. Приведенное доказательство безвсяких затруднений переносится на случай неявной функции, зависящей не отдвух, а от любого конечного числа аргументов x1, х2,…, xm(и, в частности, от одного аргумента). Случай двух аргументов х и у имеет лишь то преимущество,что допускает наглядную геометрическую иллюстрацию в пространстве (u, х, у).
2.Вычислениечастных производных неявно заданной функции. Остановимся на вычислении частных производных функции, неявно заданнойпосредством уравнения (3). Пусть выполнены условия теоремы 1. Тогда для полногоприращения функции u= φ(х,у)справедливо представление (10).Это представление позволяет утверждать, что частные производные функции u= φ(х, у)определяются формулами
(11)
Аналогичныеформулы справедливы и для случая, когда неявно заданная функция зависит не отдвух, а от любого конечного числа аргументов x1, х2,…, xm. В этом случае (k= 1, 2, …, m)
Еслимы хотим обеспечить существование у неявно заданной функции u= φ( х, у) частных производных второгопорядка, то, естественно, приходится усилить требования, наложенные на функциюF(u, х, у) в теореме 1, именноприходится дополнительно требовать, чтобы функция F(u, х, у) была два раза дифференцируема в рассматриваемой точке. Вэтих предположениях остановимся на вычислении частных производных второго порядка.
Введемполезное в дальнейшем понятие полной частной производной функции. Предположим,что нам дана дифференцируемая функция трех аргументов Ф(u, х, у), причем один из этих аргументов uсамявляется дифференцируемой функцией двух других аргументов х и у. Тогда функцию Ф(u, х, у)можно рассматривать как сложную функцию двухаргументов х, у. Частные производныеэтой сложной функции по х и у будем называть полными частными производными функции Ф(u, х, у) по х и уи обозначать символами и
Поправилу дифференцирования сложной функции мы получим следующие формулы дляуказанных полных частных производных:
Переходимк вычислению частных производных второго порядка неявно заданной функции. Радиопределенности вычислим производную у и принимая во внимание, что каждая из частных производных и зависит от трехаргументов u, х, у, первый из которых сам является функцией хи у, будем иметь
Вставляяв полученную формулу выражение , определяемое второй изформул (11), окончательно будем иметь
(12)
Совершенноаналогично вычисляются частные производные и быть вычислены и частные производные третьего ипоследующих порядков (при условии, что функция F(u, х, у) дифференцируема в данной точке соответствующее числораз).
П ри м е р ы. 1) Вычислить частнуюпроизводную функции u= φ( х,у), заданной посредством уравнения x+ y+ u– e — ( x+ y+ u) = 0.
Преждевсего, пользуясь формулами (11), вычислим частные производные первого порядка = 0.
2)Тот же вопрос для функции, заданной уравнением u2+ x2+ y2 — a2= 0. Используяформулы (11), получим , . Далее, будем иметь
3.Особыеточки поверхности и плоской кривой.Рассмотрим некоторую поверхность S(плоскую кривую L),определяемую в заданной декартовой прямоугольной системе координат уравнением F(х, у, z)=0(F(х, у,)=0).Относительно функции F(х, у, z)(F(х, у,)) предположим, что она имеетнепрерывные частные производные первого порядка по всем аргументам всюду внекоторой окрестности любой точки поверхности S(кривой L).Будем называть данную точку поверхности S(кривой L)особой, если в этой точке обращаются в нуль все частные производные первогопорядка функции F(х, у, z)(F(х, у,)). В окрестности особой точкинельзя применить к уравнению F(х, у, z)=0(F(х, у,)=0) теорему 1, т. е. нельзяутверждать, что это уравнение разрешимо хотя бы относительно одной изпеременных х, у, z (х, у). Такимобразом, участок поверхности S(кривой L), прилегающей к особой точке, может не допускатьоднозначного проектирования ни на одну из координатных плоскостей (ни на одну изосей координат). Структура поверхности S(кривой L)в окрестности особой точки может быть очень сложной и требует дополнительногоисследования.
Точки поверхности S(кривой L),не являющиеся особыми, принято называть обыкновенными.В окрестности обыкновенной точки действует теорема 1, так что прилегающий кобыкновенной точке участок поверхности S(кривой L) допускает однозначное проектирование хотя бы наодну из координатных плоскостей (хотя бы на одну из осей координат), чтосущественно облегчает исследование этого участка.
П ри м е р ы. 1) Найти особые точки кругового конуса x2+ y2– z2= 0.
ПосколькуF(х, у, z) = x2+ y2– z2, то , , . Единственной особойточкой является начало координат. Хорошо известно, что в окрестности этой точкиповерхность конуса не может быть однозначно спроектирована ни на одну из координатных плоскостей (рис. 15.3).
2)Тот же вопрос в отношении плоской кривой x2 — y2+ x3= 0.
Частныепроизводные имеют вид , . Обе частныепроизводные обращаются в нуль в двух точках плоскости (0, 0) и (-. Из этих двух точек только первая принадлежитрассматриваемой кривой, т. е. является особой. Построив кривую x2 — y2+ x3= 0в окрестности точки (0, 0), мы убедимся в том, что эта точка является точкойсамопересечения графика (рис. 15.4). Ясно, что в окрестности этой точки кривуюнельзя однозначно спроектировать ни на ось Ох,ни на ось Оу.
4.Условия,обеспечивающие существование для функции y=f(x)обратной функции.Применим теорему 1для выяснения условий, при выполнении которых функция y=f(x) имеет в некоторой окрестности точки x0обратную функцию x=f-1(y), определенную в некоторой окрестности точки y0, гдеy0= f(x0). Будем рассматривать функцию y=f(x)как функцию, определяемую функциональным уравнением вида F(х, y) = f(x) – у = 0.
Тогдавопрос о существовании обратной функции совпадает с вопросом о разрешимостиотносительно х указанного функциональногоуравнения. Как следствие теоремы 1 и замечания 1 перед доказательством этойтеоремы, мы получим следующее утверждение: еслифункция y=f(x) имеет отличную от нуля производную в некоторой окрестности точких0, то для этой функции в окрестности х0существуетобратная функция x=f-1(y), определенная и дифференцируемая внекоторой окрестности точки у0, где y0= f(x0). Производнаяуказанной обратной функции в точке y0 в силу второй из формул (11) равна