Карпова Наталия Анатольевна
Санкт-Петербургский государственный университет
Санкт Петербург 2003
Введение.
Математическая статистика является наукой, которая изучает соотношения, столь глубоко проникающие в суть вещей, что их можно встретить при самых различных обстоятельствах. Результаты исследований, полученные с помощью аппарата математической статистики, используются в самых различных областях науки и техники, таких как биология, медицина, анатомия, геология, экология, экономика, и т.д.
Данная дипломная работа посвящена рассмотрению двух основных задач математической статистики:
получению кривой распределения вероятностей по имеющейся выборке;
нахождению зависимости между двумя случайными величинами, заданными своими выборками.
Для решения первой задачи используются различные методы. В данной работе рассмотрен метод Карла Пирсона, представителя английской школы статистики. Им было получено дифференциальное уравнение
а так же введен критерий æ (каппа Пирсона), с помощью которого Пирсон классифицировал решения этого дифференциального уравнения и представил их в виде двенадцати типов.
Позже в своих теоретических исследованиях Колмогоров А. Н. и Марков А. А. доказали, что любой закон распределения может быть записан в виде одного из двенадцати типов кривых Пирсона, поэтому для решения данной задачи используется метод Пирсона нахождения кривой распределения.
Для решения второй задачи используется метод П.Л. Чебышева, создателя Санкт – Петербургской математической школы. В статистике имя знаменитого русского математика П. Л. Чебышева (1821-1894) известно главным образом по так называемому неравенству Чебышева, которое он предложил для распределения вероятностей, и которое имеет силу для любого статистического распределения численностей.
Однако за последнее время в статистике всё большее значение приобретают ортогональные полиномы Чебышева, которые имеют особое значение при определении множественной и криволинейной регрессии и при вычислении коэффициентов обобщённой функции нормального распределения вероятностей.
Чебышев предложил общую интерполяционную формулу, при которой возможно интерполирование в самых разнообразных случаях. Эта интерполяционная формула удовлетворяет условиям метода наименьших квадратов и выражена при помощи его ортогональных полиномов. Общая интерполяционная формула, или, иначе ряд Чебышева, предложен Чебышевым в 1855 году. Она имеет вид
Таким образом в дипломной работе рассматриваются два метода:
метод Пирсона нахождения кривых распределения вероятностей,
метод Чебышева получения ортогональных полиномов,
которые были положены в основу обобщенного метода Грамма – Шарлье нахождения кривой распределения вероятностей.
Глава 1. Система кривых Пирсона.
В данной главе ставится задача нахождения закона распределения случайной величины в удобном для практического использования виде. Для ее решения рассматривается подход К. Пирсона, который является выдающимся представителем английской статистической школы.
§ 1. Дифференциальное уравнение Пирсона.
Рассмотрим
случайную величину, заданную своей выборкой
Метод Пирсона заключается в том, что мы рассматриваем дифференциальное уравнение Пирсона:
и исследуем, какие решения можно получить при различных значениях параметров уравнения (1).
Общий интеграл этого уравнения представим в виде:
где
Значение этого неопределенного интеграла зависит от корней уравнения
следовательно, от его дискриминанта
который можно написать в виде
вводя параметр
æ
Или иначе, величину æ можно представить в виде:
æ
где
величины
где
Тогда
Через
величины
Величина æ называется критерием Пирсона (каппа Пирсона) и различные значения ее дают нам следующие выводы о корнях уравнения:
А.
Если æ
В.
Если 0< æ<1, то
С.
Если æ>1, то
Соответственно
этим случаям Пирсон различает три главных типа своих кривых, которые он назвал
соответственно типами I, IV и VI. Затем æ может равняться
В своих разработках Колмогоров А. Н. и Марков А. А. доказали, что любой закон распределения может быть записан в виде одного из двенадцати типов кривых Пирсона, поэтому для решения задачи идентификации используется метод Пирсона.
§ 2. Основные типы кривых Пирсона.
В этом параграфе будут рассмотрены основные типы кривых распределения вероятностей, предложенные и классифицированные Пирсоном.
Тип I.
Пусть æ<0. Тогда
и
уравнение (2) имеет вещественные корни различных знаков:
Тогда правая часть уравнения (1) может быть представлена в виде:
где
Пусть еще
Тогда уравнение (1) перепишется в виде
и общий интеграл его можно представим в виде
где
Тип
I получается, если
или, как обычно пишут
Так
как
Тогда простое преобразование дает следующие формулы:
Эти формулы используются вообще при вычислении параметров и других кривых Пирсона.
Далее, пользуясь этими же формулами,
следовательно,
Затем
или, после простых подсчетов,
где
Таким
образом,
Когда
найдены
в которых
Здесь использовано равенство
которое получается, так мы имеем
и
следовательно,
откуда
(так
как
Таким
образам,
и
в которых
где
Остается
найти
При помощи подстановки
мы находим:
Следовательно,
Тип IV.
Второй главный тип кривых Пирсона, соответствующий значениям
0< æ<1, когда уравнение (1) имеет комплексные корни.
Пусть эти корни равны
где
Тогда уравнение (1) будет
откуда
и
или
причем
Параметры
кривой (3), выражаются следующим образом через моменты
(здесь
где
Интеграл в правой части можно привести к другому виду:
подстановка
приводит его к виду
Обычно, полагая
пишут
где
Тип VI.
Третий главный тип кривых Пирсона, соответствующий значениям критерия æ>1 . В этом случае уравнение (2) имеет вещественные корни одного знака. Не приводя вывода уравнения кривой типа VI, аналогичного выводу уравнения кривой типа I [5], прямо приведем уравнение, отнесенное к средней выравниваемого распределения, как началу координат:
(в
нем
причем
берется
причем
должно быть
и
Уравнение кривой типа VI пишут также в виде:
беря за начало координат точку
Параметры
Кривая
простирается от
§ 3. Переходные типы кривых Пирсона.
Переходные
типы кривых Пирсона получаются при специальных значениях критерия æ и при
некоторых условиях, налагаемых на
Тип II.
Получается
при æ=0,
отнесенное к моде, которая теперь равна средней (кривая симметрична относительно начала). Ее параметры вычисляются по формулам
Кривая
простирается от -а до а. На концах распределения
Тип VII.
Имеет уравнение
получается
при æ=0,
Нчало координат в средней (средняя равна моде).
Тип III.
Имеет уравнение
с началом координат в моде и с параметрами
Получается
при æ
Тип V.
Имеет уравнение
с параметрами
кривая получается при æ=1 и бесконечна в одном направлении.
Тип VIII.
Имеет уравнение
простирается от –а до 0, получается при
æ
причем
и он не должен быть больше 1 или меньше 0.
Тогда
а начало в точке
Тип IX.
Имеет уравнение
простирается от –а до 0, получается при
æ
Параметр т определяется как решение уравнения
Тогда
а начало будет в точке
Тип X.
Имеет уравнение
с
началом координат в точке
Тип XI
Имеет уравнение
получается при
æ
и
простирается от
и b зависит от m.
Тогда
а начало координат в точке
Тип XII.
Имеет уравнение
получается при
æ
Кривая
простирается от
Тип N.
Тринадцатый тип кривых распределения Пирсона – нормальная кривая с уравнением
которая получается при условиях
æ
Типы II, VI, VII, VIII, IX представляют специальные случаи кривой типа I, тип X – специальный случай типа III, а тип XI - типа VI. [5] (См. приложение 1.)
Глава 2. Применение ортогональных полиномов Чебышева при нахождении кривых распределения вероятностей.
В этой главе рассмотрено получение ортогональных полиномов способом, который разработал П. Л. Чебышев. А именно, через разложение в непрерывную дробь суммы
и рассмотрение знаменателей подходящих дробей полученной непрерывной дроби. Причем показано, что полученные таким образом ортогональные полиномы отвечают условиям метода наименьших квадратов, а так же показано их применение для нахождения кривых распределения вероятностей.
§ 1. Получение ортогональных полиномов по способу Чебышева.
Пусть
даны значения интерполируемой функции
соответствующие
значения аргумента
Требуется найти такую целую функцию
где
В
данной задаче в качестве веса
где n есть
или
иначе говоря n - сумма всех испытаний.
Для
решения нашей задачи находим коэффициенты
……………………
После
преобразований получаем следующую систему уравнений для нахождения
коэффициентов
……………………
……………………
……………………
где
Такой подход к нахождению коэффициентов имеет существенный недостаток – при повышении степени полинома хотя бы на единицу приходится переписывать все уравнения и решать систему заново.
Есть другой вариант построения искомого полинома [8].
Пусть
будет
где
Пусть
теперь сумма
равняется
т.е.
Каковы
в этом случае условия относительно
имеет наименьшее значение?
Обозначим
эту сумму через
и, подставляя в нее
составляем обычным способом дифференцирования следующие уравнения:
Отсюда следует:
Так
как
В
результате преобразований получим выражения для коэффициентов
………………
………………
Теперь можно представить функцию
в таком виде
Легко
убедиться, что для перехода от найденного выражения интерполируемой функции к
целой функции степени
Для
дальнейшего перехода к целой функции степени
достаточно
прибавить к найденному выражению функции степени
Таким образом, решение задачи параболического интерполирования по способу наименьших квадратов приводится к нахождению ряда
Этот
ряд, обладающий свойством давать посредством суммы своих
Теперь
для полного решения задачи остается еще узнать, что представляют собой функции
Далее, с помощью разложения дроби
по
нисходящим степеням
где
дает приближенное представление функции [7]
с точностью до членов степени
включительно.
Здесь
Что
касается
Разлагая
в непрерывную дробь вида
где
Выражения
для
Выражения
для коэффициентов
Вводя для сокращения обозначение
через
Для
Что
касается величин
Теперь
перейдем к определению коэффициентов
Для
Это
выражение весьма упростится, если
Также упростятся выражения для
Функция
При помощи этих формул можно вычислить какой угодно член ряда Чебышева
Оценка результатов интерполирования производится при помощи среднего квадратического отклонения данных значений интерполируемой функции от вычисленных по найденному уравнению параболы.
Обозначим
сумму квадратов отклонений через
а
Итак,
Мы
видим, что в зависимости от нашей весовой функции
§ 2. Обобщение Грамма - Шарлье.
Пусть
по методу Пирсона найден вид кривой распределения вероятностей
где
Таким
образом, мы получаем кривую распределения вероятностей теперь уже в виде
Производные
функции
тогда можем записать
где
функции
А
коэффициенты
=
Отсюда следует, что
На практике в этом разложении мы используем только четыре первых члена, и коэффициенты перед ними есть:
Коэффициенты
Свойство
(5) есть свойство ортогональности полиномов, т. е.
§ 3. Весовые функции и системы ортогональных полиномов.
В общей теории ортогональных полиномов известно, что система ортогональных полиномов называется классической, если она ортогональна относительно весовой функции, которая является решением дифференциального уравнения Пирсона [2], [6]. То есть, здесь прослеживается связь между теорией классических ортогональных полиномов и задачами математической статистики (нахождением закона распределения вероятностей).
Полиномы Чебышева - Эрмита.
Пусть многочлен (2) не имеет корней, тогда уравнение Пирсона (1) после переноса начала координат запишется в виде
тогда решение этого уравнения запишется в виде
Линейным преобразованием независимого переменного
эта
функция приводится с точностью до постоянного множителя
Поскольку
умножение весовой функции на постоянную практически не изменяет ортогональные
многочлены, то в формуле (6), как и в аналогичных нижеследующих формулах, не
нарушая общности, можно полагать
В этом случае условие ортогональности запишется в виде:
Полиномы Чебышева - Лагерра.
Пусть теперь многочлен (2) имеет один корень. Тогда уравнение (1) представимо в виде
Тогда его решение запишется в виде
Многочлены, ортогональные с таким весом, можно рассматривать как обобщение многочленов Чебышева – Лагерра, ортогональных с весом
Причем
и здесь можно выразить эти многочлены через многочлены Чебышева – Лагерра
Полиномы Якоби.
Предположим,
что многочлен (2) имеет два различных действительных нуля. Тогда
где
представимо в виде
и
определяет некоторую систему ортогональных многочленов, которая линейным
преобразованием независимого переменного и умножением на постоянную сводится к
системе многочленов Якоби
И соответственно условие ортогональности будет иметь вид:
Многочлены Чебышева I рода являются частным случаем многочленов Якоби, так как весовая функция, относительно которой ортогональны эти многочлены, имеет вид:
и
получается при подстановке в весовую функцию многочленов Якоби параметров
Многочлены Чебышева II рода так же являются частным случаем многочленов Якоби, так как весовая функция многочленов Чебышева II рода имеет вид
и
получается при подстановке в весовую функцию многочленов Якоби параметров
Следует так же отметить, что многочлены Лежандра являются частным случаем многочленов Якоби, так как весовая функция многочленов Лежандра
и
есть частный случай весовой функции многочленов Якоби при
Глава 3. Примеры нахождения кривых распределения вероятностей и программное обеспечение.
В этой главе рассматриваются примеры нахождения кривых распределения по методу кривых Пирсона с использованием теоретических исследований, рассмотренных в первой и второй главах дипломной работы. Было написано программное обеспечение, с помощью которого были получены и проинтерпретированы численные результаты.
§ 1. Примеры нахождения кривых распределения вероятностей.
Рассмотрение примеров заключалось в том, что было рассмотрено пятьдесят случайных выборок, а далее были рассмотрены примеры выборок с заданным законом распределения. Согласно рассмотренному ниже алгоритму были произведены соответствующие вычисления, и по каждой выборке была построена кривая распределения вероятностей. При проведении испытаний было получено, что кривая распределения сорока семи из пятидесяти рассмотренных выборок есть кривая Пирсона первого типа, которая определяется следующей формулой:
Здесь
нужно отметить разнообразие кривых Пирсона, делающее их применение очень
гибким. Это означает, что кривые распределения вероятностей первого типа при
различных значениях параметров
Ниже рассмотрено несколько примеров наиболее часто встретившихся форм кривой распределения I типа.
Пример 1.
Рассмотрим выборку:
|
|
|
|
1 |
10,55233622 |
2 |
Кривая распределения вероятностей первого типа. |
2 |
13,44763172 |
2 |
|
3 |
17,80800986 |
1 |
|
4 |
4,963081479 |
2 |
Параметры кривой: |
5 |
14,66424847 |
2 |
|
6 |
12,436602 |
1 |
|
7 |
9,36697793 |
2 |
|
8 |
15,20854056 |
1 |
|
9 |
15,66078138 |
2 |
|
10 |
8,748272777 |
2 |
|
11 |
9,028156996 |
1 |
|
12 |
18,93642914 |
2 |
|
13 |
18,84283829 |
1 |
|
14 |
14,6049341 |
1 |
Следовательно,
кривая распределения вероятностей будет определена на промежутке
Рис.1
Из
чего следует, что если параметры кривой распределения первого типа будут
находиться в пределах
Из пятидесяти рассмотренных выборок двадцать четыре имеют такую форму кривой распределения вероятностей.
Пример 2.
Рассмотрим другую выборку:
|
|
|
|
1 |
8,460199654 |
2 |
Кривая распределения вероятностей первого типа. |
2 |
45,34087276 |
8 |
|
3 |
18,07745451 |
5 |
|
4 |
5,419406056 |
8 |
Параметры кривой: |
5 |
18,67596108 |
6 |
|
6 |
23,24656701 |
9 |
|
7 |
18,95143622 |
1 |
|
8 |
53,27426755 |
3 |
|
9 |
54,93095666 |
1 |
|
10 |
24,27284002 |
2 |
|
11 |
17,74883789 |
4 |
Кривая распределения вероятностей имеет в этом случае форму, показанную на рис. 2.
Рис.2
В
этом случае параметры кривой распределения будут:
Этот случай встретился нам семь раз из пятидесяти.
Пример 3
|
|
|
|
1 |
3,881268442 |
7 |
Кривая распределения вероятностей первого типа. |
2 |
1,343869925 |
17 |
|
3 |
3,770335495 |
11 |
|
4 |
2,860628724 |
9 |
Параметры кривой: |
5 |
2,043179214 |
4 |
|
6 |
1,447737217 |
10 |
|
7 |
2,43993476 |
13 |
|
8 |
1,658227324 |
8 |
|
9 |
3,98119396 |
16 |
|
10 |
1,391261339 |
5 |
|
Кривая распределения вероятностей имеет вид:
1
Рис. 3
Такой
будет форма кривой распределения вероятностей, если параметры
§2. Алгоритм вычислений.
Тип кривой распределения вероятностей Проверка условий для æ
Пирсона i
Исходные данные
Метод Пирсона.
Заключение.
В дипломной работе были рассмотрены вопросы нахождения распределения вероятностей по заданным выборочным значениям случайной величины. В первой главе было рассмотрено решение дифференциального уравнения Пирсона, проклассифицированы с помощью æ критерия Пирсона, найдены типы кривых распределения вероятностей и параметры, соответствующие каждому типу.
Во второй главе был рассмотрен подход Чебышева к получению систем ортогональных полиномов, которые обладают свойством метода наименьших квадратов. Было рассмотрено применение способа Чебышева для нахождения кривой распределения вероятностей по обобщенному методу Грамма – Шарлье.
В третьей главе описывается алгоритмическое обеспечение нахождения кривых распределения вероятностей по методу Пирсона.
Результаты дипломной работы могут представлять большое значение для решения многих практических задач, так как часто возникает необходимость по экспериментальным данным оценить распределение вероятностей измеренной случайной величины.
Список литературы
Гмурман В.Е. Теория вероятности и математическая статистика. Учебное пособие для вузов. М.: Высшая школа, 1999
Джексон Д. Ряды Фурье и ортогональные полиномы. М.: Государственное издательство иностранной литературы, 1948
Митропольский А.К. Техника статистических распределений. М.: издательство “Наука”, 1971
Немчинов В.С. Полиномы Чебышева и математическая статистика. М.: издание Московской ордена Ленина сельскохозяйственной академии имени К.А. Тимирязева, 1946
Романовский В. И. Математическая статистика. Издательство Академии Наук УзССР, 1961
Суетин П.К. Классические ортогональные многочлены. М.: издательство “Наука”, 1976
Хинчин А. Я. Цепные дроби. М.: Государственное издательство физико-математической литературы, 1961
Хотимский В. И. Выравнивание статистических рядов по методу наименьших квадратов (способ Чебышева). М.: Государственное статистическое издательство, 1959
Для подготовки данной работы были использованы материалы с сайта http://ref.com.ua
Дата добавления: 05.03.2007
! |
Как писать рефераты Практические рекомендации по написанию студенческих рефератов. |
! | План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом. |
! | Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач. |
! | Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты. |
! | Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ. |
→ | Виды рефератов Какими бывают рефераты по своему назначению и структуре. |