Государственноеобщеобразовательное учреждение высшего
профессиональногообразования
Московской области
«Международныйуниверситет природы общества и человека «Дубна»
Филиал «Котельники»
Кафедра естественных игуманитарных наук
Курсовая работа
По дисциплине«Теория вероятности, математическая статистика и случайные процессы»
Тема работы:«Статистическое изучение выборочных данных экономических показателей »
Выполнила:студентка 2-го курса
очнойформы обучения гр. ПОВТ-21
___________________И.И.Власова
Проверил:доцент
___________________Е.Ю.Орлова
Котельники-2010
Оглавление
Введение
1. Распределениевероятностей
1) Распределение Вейбулла
2) Задача
2. Исследованиеметодами математической статистики
1) Общие методыматематической статистики
2) Исследованиевыборочных статистических данных
3. Корреляция величин
1) Корреляция величин
2) Задача
Заключение
Список использованнойлитературы
Введение
Математическаястатистика, раздел математики, посвященный математическимметодам систематизации, обработки и использования статистических данных длянаучных и практических выводов. При этом статистическими данными называютсясведения о числе объектов в какой-либо более или менее обширной совокупности,обладающих теми или иными признаками.
Предмети метод математической статистики. Статистическое описание совокупностиобъектов занимает промежуточное положение между индивидуальным описаниемкаждого из объектов совокупности, с одной стороны, и описанием совокупности поеё общим свойствам, совсем не требующим её расчленения на отдельные объекты, —с другой. По сравнению с первым способом статистические данные всегда в большейили меньшей степени обезличены и имеют лишь ограниченную ценность в случаях,когда существенны именно индивидуальные данные (например, учитель, знакомясь склассом, получит лишь весьма предварительную ориентировку о положении дела изодной статистики числа выставленных его предшественником отличных, хороших,удовлетворительных и неудовлетворительных оценок). С другой стороны, посравнению с данными о наблюдаемых извне суммарных свойствах совокупностистатистические данные позволяют глубже проникнуть в существо дела. Например,данные гранулометрического анализа породы (то есть данные о распределенииобразующих породу частиц по размерам) дают ценную дополнительную информацию посравнению с испытанием нерасчленённых образцов породы, позволяя в некотороймере объяснить свойства породы, условия её образования и прочее.
Методисследования, опирающийся на рассмотрение статистических данных о тех или иныхсовокупностях объектов, называется статистическим. Статистический метод применяетсяв самых различных областях знания. Однако черты статистического метода вприменении к объектам различной природы столь своеобразны, что было быбессмысленно объединять, например, социально-экономическую статистику,физическую статистику.
Цельработы: исследование эмпирических данных методами теориивероятности и математической статистики.
Поставленныезадачи:
1. Подробноеизучение распределения непрерывной случайной величины с точки зрения теориивероятности на примере логарифмически-нормального распределения
2. Исследованиестатистических данных методом математической статистики
3. Изучениекорреляции величин и нахождение с помощью коэффициента корреляции линейнойзависимости случайных величин
1.Распределение вероятностей
1) Распределение Вейбулла
РаспределениеВе́йбулла в теории вероятностей — двухпараметрическое семейство абсолютнонепрерывных распределений.
Пустьраспределение случайной величины Х задаётся плотностью />, имеющей вид:
/>,
гдеλ и kпараметры распределения
Тогдаговорят, что X имеет распределениеВейбулла.
Функцияраспределения
F(x)=1-/>
Математическоеожидание
M(x)=λГ/>
Дисперсия
D(x)=/>
2) Задача
Пассажирможет уехать на любом из двух маршрутов автобусов.Закон времени ожиданияприхода этих автобусов задается графикомплотности распределения вероятностислучайной величины X.
/>
Требуетсянайти:
1) параметрА,
2) плотностьраспределения f(x),
3) функциюраспределения F(x)(найти аналитическую формулу и построить график),
4) числовыехарактеристики: математическое ожидание M(x),дисперсию D(x) и среднееквадратическое отклонение />(х),
5) вероятностьтого, что во время ожидания пассажиром автобуса составит от 3,5 до 6(вероятность попадания величины в интервал (3,5;6))
Решение
1)
f(x)=/>
НайдемА по условию нормировки:
/>
/>+A/>
6А=1
А/>
2)
f(x)/>
3)Используем формулу:
F(x)=/>
1.x/>
F(x)=/>
2. x/>
/>
3. x/>
F(x)=/>+/>=/>+/>
-/>
4.х/>
F(x)=/>+/>+/>=/>+/>
F(x)=/>
Графикфункции распределения
/>
4)Найдем математическое ожидание по формуле
M(x)=/>
M(x)=/>
Спомощью формулы D(x)=/> найдемдисперсию: D(x)=(/>=/>46.09
/> =6.78
5)P(3.5
2.Исследование методами математической статистики
1) Общие методы математической статистики
Вомногих своих разделах математическая статистика опирается на теориювероятностей, позволяющую оценить надёжность и точность выводов, делаемых наосновании ограниченного статистического материала (напр., оценить необходимыйобъём выборки для получения результатов требуемой точности при выборочномобследовании).
Математическаястатистика — раздел математики, разрабатывающий методы регистрации, описания ианализа данных наблюдений и экспериментов с целью построения вероятностныхмоделей массовых случайных явлений[1]. В зависимости от математической природыконкретных результатов наблюдений статистика математическая делится настатистику чисел, многомерный статистический анализ, анализ функций (процессов)и временных рядов, статистику объектов нечисловой природы.
Выделяютописательную статистику, теорию оценивания и теорию проверки гипотез.Описательная статистика есть совокупность эмпирических методов, используемыхдля визуализации и интерпретации данных (расчет выборочных характеристик,таблицы, диаграммы, графики и т. д.), как правило, не требующих предположений овероятностной природе данных. Некоторые методы описательной статистики предполагаютиспользование возможностей современных компьютеров. К ним относятся, вчастности, кластерный анализ, нацеленный на выделение групп объектов, похожихдруг на друга, и многомерное шкалирование, позволяющее наглядно представитьобъекты на плоскости.
Методыоценивания и проверки гипотез опираются на вероятностные модели происхожденияданных. Эти модели делятся на параметрические и непараметрические. Впараметрических моделях предполагается, что характеристики изучаемых объектовописываются посредством распределений, зависящих от (одного или нескольких)числовых параметров. Непараметрические модели не связаны со спецификациейпараметрического семейства для распределения изучаемых характеристик. Вматематической статистике оценивают параметры и функции от них, представляющиеважные характеристики распределений (например, математическое ожидание,медиана, стандартное отклонение, квантили и др.), плотности и функциираспределения и пр. Используют точечные и интервальные оценки.
Большойраздел современной математической статистики — статистический последовательныйанализ, фундаментальный вклад в создание и развитие которого внес А. Вальд вовремя Второй мировой войны. В отличие от традиционных (непоследовательных)методов статистического анализа, основанных на случайной выборке фиксированногообъема, в последовательном анализе допускается формирование массива наблюденийпо одному (или, более общим образом, группами), при этом решение об проведенииследующего наблюдения (группы наблюдений) принимается на основе уженакопленного массива наблюдений. Ввиду этого, теория последовательногостатистического анализа тесно связана с теорией оптимальной остановки.
Вматематической статистике есть общая теория проверки гипотез и большое числометодов, посвящённых проверке конкретных гипотез. Рассматривают гипотезы означениях параметров и характеристик, о проверке однородности (то есть осовпадении характеристик или функций распределения в двух выборках), о согласииэмпирической функции распределения с заданной функцией распределения или спараметрическим семейством таких функций, о симметрии распределения и др.
Большоезначение имеет раздел математической статистики, связанный с проведениемвыборочных обследований, со свойствами различных схем организации выборок ипостроением адекватных методов оценивания и проверки гипотез.
Задачивосстановления зависимостей активно изучаются более 200 лет, с моментаразработки К. Гауссом в 1794 г. метода наименьших квадратов.
Разработкаметодов аппроксимации данных и сокращения размерности описания была начатаболее 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднеебыли разработаны факторный анализ[2] и многочисленные нелинейные обобщения[3].
Различныеметоды построения (кластер-анализ), анализа и использования (дискриминантныйанализ) классификаций (типологий) именуют также методами распознавания образов(с учителем и без), автоматической классификации и др.
Внастоящее время компьютеры играют большую роль в математической статистике. Онииспользуются как для расчётов, так и для имитационного моделирования (вчастности, в методах размножения выборок и при изучении пригодностиасимптотических результатов).
2) Исследование выборочных статистических данных
Объемпродаж компьютерной техники в магазине «Горбушкин двор» изменяется взависимости от времени года, ассортимента товаров, цен производителя и т.д.Известны статистические данные этого показателя в течение некоторого времени.
1) Необходимосгруппировать данные, образовав 8-10 интервалов. Найти распределение частот и относительныхчастот .
2) Найтии построить эмпирическую функцию распределения
Найдемэмпирическую функцию распределения по формуле:
3) Построитьполигон распределения. Построить гистограмму частот и относительных частотраспределения. Объяснить основное свойство гистограммы
4) Выдвинутьгипотезу о вероятном распределении показателя. Найти точечные оценки числовыххарактеристик распределения
5) Методоммоментов найти оценку параметров распределения, считая его равномерным назаданном интервале значений
6) Оценитьистинные значения параметров выборочного распределения с помощью доверительногоинтервала с надежностью 0.95, считаяраспределение нормальным
7) Использоватькритерий Пирсона, при уровне значимости 0.05 проверить согласуется ли гипотезао
а)нормальном распределении выборки
б)показательном распределении выборки
в)равномерном распределении выборки
1. Сгруппировавданные получим 8 интервалов:
/> [3;5) [5;7) [7;9) [9;11) [11;13) [13;15) [15;17) [17;19]
/> 1 1 4 9 17 12 4 1
Найдемраспределение частот:
/> 4 6 8 10 12 14 16 18
/> 1 1 4 9 17 12 4 1
Найдемраспределение относительных частот
n= 1+1+4+9+17+12+4+1=49
/> 4 6 8 10 12 14 16 18
/> 0.02 0.02 0.08 0.18 0.35 0.24 0.082 0.02
2.
/>
1. x/>(-/>
/>0
2. x/>
/>=0.02
3. x/>
/>=0.02+0.02=0.04
4. x/>
/>=0.04+0.08=0.12
5. x/>
/>=0.12+0.18=0.3
6. x/>
/>=0.3+0.35=0.65
7. x/>
/>=0.65+0.24=0.89
8. x/>
/>0.89+0.082=0.972
9. x/>
/>0.97+0.02=1
Итак, эмпирическая функцияраспределения будет выглядеть так
/>
Построимэмпирическую функцию распределения
/>
3.
Полигонраспределения
/>
Гистограммой– называется фигура состоящая из прямоугольника. Основания прямоугольников –интервальные задания случайной величины, высота прямоугольников
- длягистограммы частот находится по формуле:
/>=/>
/>=0.5
/>=0.5
/>
/>
/>
/>
/>
/>
/>
- длягистограммы относительных частот находится по формуле:
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
4. /> />.
5. Методмоментов применяется для оценки неизвестных параметров распределения, сутьметодов заключается в том, что приравниваются теоретические и эмпирическиемоменты. Если закон распределения содержит 1 параметр, то для оценки этогопараметра составляется одно уравнение, в котором теоретический моментприравнивают к эмпирическому моменту. Если распределение случайной величинысодержит 2 параметра, то составляют два уравнения и т.д.
Считаяраспределение равномерным на заданном интервале значений запишем дифференциальныйзакон:
/> 2 параметрараспределения a и b/>
M(x)=/>
D(x)=/>
D(x)/> />
/>(4+6+32+90+204+168+64+18)=/>=11.959
/>=/>
/>
/>
/>
/>
/>/>
6.Доверительным называют интервал который с заданной надежностью /> показываетзаданный параметр.
Истинноезначение измеряемой величины равно ее математическому ожиданию a.Поэтому задача сводится к оценке математического ожидания (при известном />) при помощидоверительного интервала
/>
/> = 2.009
Всевеличины кроме S(среднеквадратическогоотклонения) известны. Для нахождения Sсначала найдем />(исправленнуюдисперсию).
/>
/>*175.4=3.58
/>=1.89
/>
/>
7.а) 1./>
2.Вычислим теоретические частоты, учитывая, что n=49,h=1, />=2.6, поформуле:
/>i
/>
/>
/>
/> 1 4 -3,06 0.0037 0,07 2 6 -2,29 0.0290 0,55 3 8 -1,52 0.1257 2,37 4 10 -0,75 0.3011 5,67 5 12 0,015 0.3989 7,52 6 14 0,78 0.2943 5,55 7 16 1,55 0.1200 2,26 8 18 2,32 0.0270 0,51
3.Сравним эмпирические и теоретические частоты
I) составим расчетную таблицу, изкоторой найдем наблюдаемое значение критерия
/>
/>
/>
/>
/>
/> 1 1 0,07 0,93 0,86 12,2 2 1 0,55 0,45 0,2 0,36 3 4 2,37 1,63 2,66 1,12 4 9 5,67 3,33 11,09 1,95 5 17 7,52 9,48 89,87 11,95 6 12 5.55 6,45 61,15 11,02 7 4 2,26 1,74 3,03 1,1 8 1 0,51 0,49 0,24 0,47
Изтаблицы найдем />
II) по таблице критических точекраспределения />, по уровнюзначимости />k=s-3=8-3=5
/>
Т.к./> - гипотезу онормальном распределении генеральной совокупности отвергаем. Другими словами,эмпирические и теоретические частоты различаются значимо.
б)
/>
/> 3-5 1 5-7 1 7-9 4 9-11 9 11-13 17 13-15 12 15-17 4 17-19 1
1./>
2.Найдем оценку параметра предполагаемого показательного распределения
/>
Т.о.плотность предполагаемого показательного распределения имеет вид:
/>(x>0)
3.Найдем вероятности попадания Xв каждый из интервалов по формуле:
/>
Например,для первого интервала:
/>
/>
/>
/>
/>
/>
/>
/>
⅀=0.89
4./> , где />-й интервал
Например,для первого интервала
/>
/>
/>
/>
/>
/>
/>
/>
5.Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Дляэтого составим расчетную таблицу, причем объединим малочисленные частоты (4+6=10),(16+18=34) и соответствующие им теоретические частоты (16,17+5,88=22,05), (1,96+1,96=3,92)
/>
/>
/>
/>
/>
/> 1 2 21,07 -19,07 363,6 17,2 2 4 3,92 -0,08 0,0064 0,0016 3 9 3,43 5,57 31,02 9,04 4 17 3,136 13,864 192,2 61,3 5 12 2,744 9,26 85,74 31,25 6 5 3,92 1,08 1,166 0,3
/> 49
Потаблице найдем />
/>
Т.к./>гипотеза ораспределении X по показательному законуотвергается.
в)
/>
/> 3-7 2 7-9 4 9-11 9 11-13 17 13-15 12 15-19 5
1. />
/>
/>
/>
2. />
3. Найдемтеоретические частоты:
/>
/>
/>
/>
4. Сравнимэмпирические и теоретические частоты, используя критерий Пирсона приняв числостепеней свободы k=s-3=8-3=5для этого
Составим расчетную таблицу
/>
/>
/>
/>
/>
/> 1 2 2,91 -0,91 0,83 0,28 2 4 10,78 -6,78 45,96 4,27 3 9 10,78 -1,78 3,17 0,294 4 17 10,78 6,22 38,7 3,6 5 12 10,78 1,22 1,49 0,14 6 5 7,87 -2,87 8,24 1,04 ⅀ 50 9,62
Израсчетной таблицы получаем />
Найдемпо таблице критических точек распределения /> по уровнюзначимости /> критическуюточку правосторонней критической области />
Т.к./> гипотеза оравномерном распределении отвергается.
3.Корреляция величин
3.1Корреляция величин
Корреляция— зависимость между случайными величинами, не имеющая, вообще говоря, строгофункционального характера. В отличие от функциональной зависимости корреляции,как правило, рассматривается тогда, когда одна из величин зависит не только отданной другой, но и от ряда случайных факторов. Зависимость между двумяслучайными событиями проявляется в том, что условная вероятность одного из нихпри наступлении другого отличается от безусловной вероятности. Аналогично,влияние одной случайной величины на другую характеризуется условнымираспределениями одной из них при фиксированных значениях другой.
Некоторыевиды коэффициентов корреляции могут быть положительными или отрицательными(возможна также ситуация отсутствия статистической взаимосвязи — например, длянезависимых случайных величин). Если предполагается, что на значенияхпеременных задано отношение строгого порядка, то отрицательная корреляция —корреляция, при которой увеличение одной переменной связано с уменьшениемдругой переменной, при этом коэффициент корреляции может быть отрицательным;положительная корреляция в таких условиях — корреляция, при которой увеличениеодной переменной связано с увеличением другой переменной, при этом коэффициенткорреляции может быть положительным.
3.2Задача
Совместныйзакон распределения суммы дивидендов, выплачиваемых по привилегированной иобыкновенной акциям некоторой компании, задается следующей таблицей
/>
/> 0 1 2 2
/>
/>
/> 4
/>
/>
/>
/>
1) Построитьмаргинальные законы распределения случайных величин Xи Y.
/>)=/>
/>)=/>
/>
Проверка:/> Y 0 1 2 p
/>
/>
/>
X:/>)=/>
/>)=/>
Проверка:/> X 2 4 p
/>
/>
2) Вычислитьчисловые характеристики: математические ожидания /> и />, дисперсии /> и />,среднеквадратические отклонения /> и />
/>
/>
/>
/>
/>
/>
3) Условныевероятности составляющих Xи Y соответственно вычисляются посоответствующим формулам:
P(/>
/>
/> X 2 4
/> 0,75 0.44
/>
/>
/> X 1 2
/> 0.3 0.325 0.375