Содержание
Введение
1. Выборочный метод
2. Статистическая оценка законов распределения
3. Основные свойства точечных оценок
4. Оценка математического ожидания и дисперсии по выборке
5. Доверительные интервалы
6. Методы получения оценок
7. Метод максимального правдоподобия
8. Распределение хи-квадрат
Литература
Введение
Когда приходится изучать не единичные, а массовые случайные явления, необходимо прибегать к статистическим методам исследования. Эти методы предназначены для выявления закономерностей там, где на первый взгляд нет ничего, кроме совокупности отдельных фактов, наблюдений, измерений. Теория вероятностей и математическая статистика являются науками о методах количественного анализа массовых случайных явлений.
В теории вероятностей по заданным вероятностям некоторых событий и функциям распределения случайных величин определяются вероятности и функции распределения других событий и случайных величин.
Естественно спросить: откуда известны исходные вероятности и распределения, как их найти? Одних априорных рассуждений для этого, как правило, недостаточно, необходимы опыт, специальные испытания. Математическая статистика и разрабатывает методы, позволяющие по результатам испытаний делать определённые выводы о вероятностях и распределённых случайных величин и событий.
Целью каждой науки является обнаружение некоторых общих закономерностей, позволяющих предвидеть течение явлений природы и выбирать рациональные пути поведения в исходных ситуациях. Во многих случаях для обнаружения общих закономерностей необходимо провести большое число наблюдений и измерений; как следствие нужны методы обработки совокупности таких наблюдений. Эти методы также разрабатывает математическая статистика.
Первые работы по математической статистике появились в 18ом веке и были связаны со статистикой народонаселения, изучением продолжительности жизни и вопросами страховании. Позже в конце 18ого начало 19ого века в связи с астрономическими задачами начались серьёзные исследования по теории ошибок измерений. Биологические изыскания послужили толчком для постановки многочисленных вопросов, которые привели в начале 20го века к выделению математической статистки в отдельную науку. Сейчас в связи с общим бурным развитием науки и проникновением количественных методов буквально во все отрасли знаний интерес к математической статистике возрос, возникли новые задачи и методы. Математическая статистика находится в стадии дальнейшего развития и её прогресс продолжается.
Известно, что каждое распределение определяется тем или иным числом параметров: закон Пуассона зависит только от одного параметра - математического ожидания; нормальный закон - от двух - математического ожидания и дисперсии исследуемой случайной величины.
Если мы хотим использовать эти законы, например распределения Пуассона, в инженерных задачах, нам нужно оценить параметр, то есть найти его численное значение, в данном случае - численное значение математического ожидания.
Традиционный естественный способ нахождения параметра заключается в обследовании некоторого множества значений соответствующей случайной величины. Это множество обычно называется выборкой; элементы множества - выборочными значениями случайной величины; количество элементов - объёмом выборки. На основании изучения выборки мы делаем некоторые выводы о всей совокупности возможных значений случайной величины. Эта совокупность называется генеральной. В результате обследования выборки и использования соответствующих статистических правил можно получить численную оценку значения параметра. Оценка параметра - это некоторая функция от выборочных значений случайной величины. В нашем случае в качестве оценки параметра - математического ожидания можно использовать среднее арифметическое выборочных значений. Отметим, что оценка является случайной величиной. Таким образом, параметр - постоянная величина заменяется значением случайной величины, полученной по результатам выборки на основании некоторого правила.
Если мы рассмотрим ещё одну выборку такого же объёма, то численное значение оценки будет несколько иным, так как состав нашей выборки случаен. Это ещё раз иллюстрирует тот факт, что с помощью оценки величина параметра определяется с некоторой ошибкой. Узловым для математической статистики является вопрос, как далеко могут отклонятся величины оценок, вычисление по выборке, от соответствующих истинных значений параметров.
В рассмотренном случае нужно по выборке оценить математическое ожидание случайной величины, распределённой по закону Пуассона. Как это сделать? Можно использовать: 1) среднее арифметическое 2) наиболее часто встречающееся выборочное значение случайной величины; 3) средний член вариационного ряда.
Какая из этих оценок лучше? И что значит лучшая оценка? Каким требованиям она должна удовлетворять? Ответы на эти вопросы даёт математическая статистика.
Вторая задача - проверка статистических гипотез. Это могут быть гипотезы о законе распределения, о равенстве двух математических ожиданий или дисперсий различных распределений. Проверка статистических гипотез также производится на основе анализа выборки ограниченного объёма.
Можно предположить что некоторая случайная величина распределена по закону Пуассона. Эта гипотеза нуждается в проверке. Частоты (оценки вероятностей), полученные в результате обработки выборки, могут несколько отличаться от вероятностей, определённых на основании распределения Пуассона. Причина расхождения может заключаться в том, что неправильна гипотеза о законе распределения. Однако не исключение и другая причина: объём выборки весьма мал, а при таком объёме выборки полученные различия между частотами и вероятностями могут наблюдать и при истинности предположения о законе распределения. Принять наилучшее решение в данном случае помогают методы математической статистики.
Существуют и другие не менее важные задачи математической статистики, такие, например как планирование эксперимента, установление статистических зависимостей между случайными событиями.
1. Выборочный метод
Генеральная и выборочная совокупность
Одним из фундаментальных понятий математической статистики является неопределяемое понятие генеральной совокупности. Под генеральной совокупностью понимают множество качественно однородных элементов (объектов, изделий) самой различной природы. Рассмотрим возможные типы этих совокупностей.
1. Конечная и реально существующая, например генеральная совокупность всех людей Украины в фиксированный момент времени.
2. Бесконечная и реально существующая, например множество действительных чисел, лежащих между нулем и единицей.
3. Воображаемая (гипотетическая) конечная или бесконечная: Например, повторные непрекращающиеся бросания игральной кости дают последовательность элементов из бесконечной несуществующей генеральной совокупности.
Вторым основным понятием математической статистики является понятие выборочной совокупности (выборки).
Пусть требуется изучить элементы некоторой генеральной совокупности относительно какого-либо количественного признака, характеризующего эти элементы. Это можно сделать, производя сплошное обследование всех элементов совокупности относительно интересующего нас признака. Однако на практике сплошное обследование применяется сравнительно редко. Для генеральной совокупности, содержащей большое число элементов, сплошное обследование будет экономически невыгодно или вообще физически невозможно. Если обследование объекта связано с его уничтожением (например при проверке качества минных взрывателей) или потребует больших материальных затрат (например запуск современной ракеты), то проводить сплошное обследование практически не имеет смысла. В такой ситуации случайно отбирают из генеральной совокупности ограниченое число объектов и изучают их.
Таким образом, выборочной совокупностью или просто выборкой объёма n будем называть совокупность n объектов, отобранных из интересующей нас генеральной совокупности.
2. Статистическая оценка законов распределения
Если выборка объёма n из генеральной совокупности представительна, то элементы с одинаковыми значениями варианты будут приблизительно одинаково часто встречаться как в выборке, так и в генеральной совокупности. В этом случае естественно принять распределение X в выборке за приближенное распределение ее в генеральной совокупности, тоесть считать дискретное распределение выборки Fn(x) приближением к теоретической функции распределения F(x). Пример приближения показан на рисунке
Основанием для такого приближения является так называемая основная теорема математической статистики, доказанная В.И. Гливенко
Из этой теоремы следует, что при n>? с вероятностью, равной единице, верхняя граница отклонения |F(x)?F(x)| на всей оси x стремится к нулю. Тем самым гарантируется равномерное приближение Fn (x) к F(x) на всей оси x. Таким образом, исследуя функцию Fn (x), мы можем по ней приближено оценить теоретическую функцию распределения случайной величины.
в случае, когда математическое ожидание известно
.
Определение 24.1. Пусть генеральная совокупность описывается случайной величиной , распределение которой зависит от скалярного параметра . Пусть, далее, и две функции выборки такие, что всегда и
.
() со случайными границами называют доверительным интервалом для неизвестного параметра с доверительной вероятностью .
Число называют уровнем значимости интервала.
Стараясь иметь как можно более достоверные выводы, границы доверительного интервала выбирают таким образом, чтобы доверительная вероятность была как можно ближе к 1.
Схематически процесс построения доверительного интервала можно описать следующим образом.
Пусть - несмещенная оценка параметра .
Выберем доверительную вероятность . Значение выражения « как можно ближе к 1» относительно, оно находится вне границ математики и определяется лицом, производящим статистические исследования. Обычно выбирают равным 0,9; 0,95; 0,99.
Пусть, далее, можно найти такое число > 0, что
.(24.1)
Записав (24.1) в виде
,
видим, что интервал () является доверительным интервалом для параметра с уровнем значимости .
Практически вопрос о построении доверительного интервала связан с возможностью нахождения распределения оценки , а это, в свою очередь, зависит от распределения генеральной совокупности.
Пример 24.1. Построение доверительного интервала для математического ожидания нормальной генеральной совокупности при известной дисперсии.
Пусть генеральная совокупность распределена по нормальному закону с параметрами (2), где 2 (дисперсия) известно. Мы уже знаем, что наилучшей в смысле несмещенности, состоятельности и эффективности оценкой неизвестного математического ожидания нормального закона является выборочное среднее
.
В продвинутом курсе теории вероятностей доказывается, что нормальное распределение обладает свойством устойчивости : если независимые случайные величины распределены нормально с параметрами () и () соответственно, то их сумма + распределена нормально с параметрами ().
Используя это утверждение в нашем случае, заключаем, чтораспределена нормально с параметрами (), а нормированное выборочное среднее подчинено нормальному закону с параметрами (0,1).
Это означает, что
, где .
Функция Ф(z) нам уже встречалась, её значения табулированы.
Выберем теперь доверительную вероятность и обозначим корень уравнения Ф() = /2.
После этого рассмотрим равенства
, которые свидетельствуют о том, что интервал
является доверительным для параметра с доверительной вероятностью ( и уровнем значимости ).
Приведем часть из таблицы значений (прил. 2) для некоторых наиболее употребительных значений .
Таблица 24.1 (Зависимость от доверительной вероятности)
|
0,9
0,925
0,95
0,99
1,65
1,78
1,96
2,89
Обозначим половину ширины доверительного интервала.
Замечаем, что:
при фиксированной доверительной вероятности ширина доверительного интервала уменьшается с ростом числа наблюдений n как величина порядка ( при увеличении, например, числа наблюдений в 100 раз ширина интервала уменьшится в 10 раз);
поскольку Ф(z) возрастает с ростом z, то увеличение доверительной вероятности, при всех прочих постоянных параметрах, приводит к расширению доверительного интервала.
Пример 24.2. Желая узнать, сколько часов в неделю дети проводят у телевизора, социологическая служба обследовала 100 учеников некого города, в результате чего оказалось, что в среднем это число равно . Из прошлой практики известно, что стандартное отклонение () генеральной совокупности равно 6 (часов). Найдем доверительный интервал с доверительной вероятностью 0,95 для числа часов в неделю, проводимых ребенком у телевизора.
Поскольку = 0,95, из табл. 24.1 находим , и границы интервала доверия будут такими:
,
интервал доверия имеет вид (26.32; 28.68).
Теперь поставим вопрос иначе: сколько детей надо обследовать с тем, чтобы среднее число часов в неделю, проводимых ребенком у телевизора, отклонилось от его оценки не более чем на 0,5 ч. с вероятностью 0,95?
В такой постановке речь идет о нахождении числа n таким, чтобы выполнялось равенство
,
откуда или n = (2Z0.475)2.
В условиях примера n = (261,96)2 553.
Разумеется, при больших значениях n ширина доверительного интервала уменьшится.
Заметим, что по сравнению с первоначальной задачей ширина интервала уменьшилась в 1,18/0,5 = 2,36 раз, количество необходимых испытаний увеличилось в (2,36)2 = 5,57 раз ( 553 отличается в третьем знаке от 100 5,57).
Пример 24.3. Построение доверительного интервала для математического ожидания нормальной генеральной совокупности при неизвестной дисперсии.
Снова рассмотрим генеральную совокупность , распределенную нормально с параметрами (2), однако теперь считаем дисперсию 2 неизвестной.
Обозначим стандартное выборочное квадратичное отклонение
.
В курсах теории вероятностей доказывается, что случайная величина
подчиняется так называемому закону распределения Стьюдента с n - 1 степенью свободы и её плотность имеет вид
,
где Кn некоторая нормирующая константа.
Созданы таблицы , дающие возможность вычислять вероятности вида
(см. прил. 4).
Ввиду вышесказанного, получаем равенства:
,
из которых видно, что выбрав Z как корень уравнения
( обозначим этот корень ), приходим к доверительному интервалу для вида
.
Пример 24.4. Рассмотрим вопрос о построении доверительного интервала для неизвестного количества времени в течение недели, проводимого ребенком у экрана телевизора, сохранив все данные примера 24.2, считая теперь, что 6ч. есть оценка выборочного среднеквадратического отклонения, .
По таблице распределения Стьюдента (см. приложение 4) находим , границы интервала будут
,
а сам интервал (25,92; 29,08).
Замечаем, что интервал стал шире, что объясняется уменьшением объема имеющейся информации из-за незнания ещё одного параметра генеральной совокупности.
А | Б | В | Г | Д | Е | Ж | З |
И | Й | К | Л | М | Н | О | П |
Р | С | Т | У | Ф | Х | Ц | Ч |
Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ключевые слова страницы: Статистическое моделирование | реферат |
СтудентБанк.ру © 2014 - Банк рефератов, база студенческих работ, курсовых и дипломных работ, шпаргалок и докладов по различным дисциплинам, а также отчеты по практике и многое другое - бесплатно. |
! |
Как писать рефераты Практические рекомендации по написанию студенческих рефератов. |
! | План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом. |
! | Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач. |
! | Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты. |
! | Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ. |
→ | Виды рефератов Какими бывают рефераты по своему назначению и структуре. |