Реферат по предмету "Экономика"


Комплексная статистическая обработка экспериментальных данных

Министерствообразования и науки Украины
Пояснительнаязаписка
к курсовойработе
по дисциплинеСтатистика
Комплекснаястатистическая обработка экспериментальных данных

Реферат
 
Объектом исследованияданной работы является комплексный анализ сгенерированных выборок случайных величин и подбор их закона распределения.
Целью работы является изучение методов и приемов анализастатистической информации, получение навыков и опыта работы в пакете STATISTICA.
В данной работе применялись широко используемыестатистические методы обработки и анализа данных.
Результатом работыявляется освоение методов обработки данных статистического наблюдения, иханализа с помощью обобщающих показателей, установление теоретических законовраспределения случайных величин и доказательство адекватности этих законов.
Данную курсовую работуможно использовать в качестве наглядного пособияпо обработке статистических данных для различных учебных целей и задач.

Задание на курсовой проект
 
По специальносгенерированному имитатору получить последовательности случайных чисел двухтипов:
а) />,
где /> – номер варианта,
/> - номер измерения случайной величины,
/> – случайное число, возвращаемое при обращении кстандартной функции выбранного языка программирования – датчику случайныхчисел.
б) />.
Для исследованийпредусмотреть следующие объёмы измерений для каждой из случайных величин: 100,200, …, 1000 (объёмы выборок).
Произвести статистическийанализ каждой из полученных выборок для двух случайных величин в следующейпоследовательности:
а) найти размахварьирования;
б) определитьцелесообразное количество групп по формуле Стерджесса, построить группировку иинтервальный ряд;
в) привести графическоеизображение полигона частот, гистограммы, кумуляты и эмпирической функциираспределения;
г) вычислить ипроанализировать точечные оценки /> и /> для простого и интервального рядов; построить ипроанализировать зависимость величины точечной оценки от объема выборки и отномера эксперимента (10 выборок для объема выборки 1000);
д) построитьдоверительные интервалы для /> и />, используя различные значения доверительнойвероятности (0,9; 0,95; 0,975; 0,995; 0,999) и проанализировать зависимостьдлины доверительного интервала от объёма выборки и от величины доверительнойвероятности;
е) вычислить ипроанализировать медиану, коэффициент вариации, коэффициент асимметрии иэксцесс, моду; проанализировать зависимости числовых характеристик от объемавыборки;
ж) оценить однородностькаждой из выборок, используя:
1) коэффициент вариации;
2) метод />-статистик Ирвина.
з) определить, близки лик нормальному распределению полученные эмпирические распределения на основе:
1) анализа числовыххарактеристик положения и вариации;
2) на основе критериясогласия Пирсона;
и) по виду гистограммвыдвинуть гипотезу о предполагаемых законах распределений исследуемых случайныхвеличин, определить оценки параметров предполагаемых распределений (методмоментов и максимального правдоподобия) и проверить гипотезу о законераспределения по критерию Пирсона.

Введение
Сдавних пор человечество осуществляло учет многих сопутствующих егожизнедеятельности явлений и предметов, а также связанных с ними вычислений.Люди получали разносторонние, хотя и различающиеся полнотой сведения наразличных этапах общественного развития. Данные учитывались повседневно впроцессе принятия хозяйственных решений, а в обобщенном виде и нагосударственном уровне – при определении направления экономической и социальнойполитики, характера внешнеполитической деятельности.
Выполняя самыеразнообразные функции сбора, систематизации и анализа сведений, характеризующихэкономическое и социальное развитие общества, статистика всегда играла рольглавного поставщика факторов для управленческих, научно-исследовательских иприкладных практических нужд различного рода структур, организаций и населения.Роль статистики в нашей жизни настолько значительна, что люди, часто незадумываясь и не осознавая, постоянно используют элементы статистическойметодологии в повседневной практике.
Применяя статистические методы в экономических исследованиях,можно осуществлять стратегическое планирование, а также анализировать ипрогнозировать рыночную конъюнктуру, уменьшая степень неопределенности вотношении внешнего окружения.
С увеличением объемовинформации, становится актуальным вопрос ее компьютерной обработки. Получениенавыков обработки и анализа экспериментальных данных с помощью компьютера,например, в пакете STATISTICA даетвозможность получить полную информацию об исследуемом объекте и найтиоптимальное решение конкретной поставленной задачи.

1. Генерация исходных данных
В данной курсовой работе вместо статистического наблюденияиспользуются случайные величины, сгенерированные по следующим формулам:
1) непрерывная случайная величина X, определяемая по формуле 1.1;
/> (1.1)
2) непрерывная случайная величина У, определяемая по формуле1.2.
/> (1.2)
где />, /> - значения случайной величины X и У в различных опытах;
/> - случайное число, равномерно распределенное наотрезке [0, 1], возвращаемое при обращении к стандартной функции на выбранномязыке программирования к датчику случайных чисел;  Для генерации исходныхданных были использованы следующие методы:
1) Для случайной величины /> в окне Variable в поле Long Name была введена формула 1.3:
/> (1.3)
2) Для случайной величины /> был создан программный имитатор в модуле STATISTICA BASIC. Реализация алгоритма генерации данных в модуле STATISTICA BASIC приведена в приложении А.
В результате былиполучены выборки, объемом 100, 200…1000 значений для каждой из случайныхвеличин.

2. Первичная обработка результатов наблюдения
 
2.1 Построение вариационного ряда
Вариационный ряд — упорядоченные по возрастанию значенияпризнака.
Построение вариационного ряда в пакете STATISTICA производилось следующим образом:
в модуле Basic Statistics and Tables: Analysis → Frequencytables → кнопка Variables для выбора переменной → отметили All distinct values → ОК.
Размах варьирования /> – абсолютная величина разности между максимальным /> и минимальным /> значениями (вариантами) изучаемого признака:
/> (2.1)
Построение размахаварьирования в пакете STATISTICA производилось следующим образом:
в модуле Basic Statistics and Tables:Analysis → Descriptive statistics → Variables (выбрать переменную) → нажали Box & whisker plotfor all variables → выбралиMedian / Quart. / Range → ОК.
Значения размахаварьирования для заданных выборок в таблице 2.1.
Таблица 2.1 – Размахварьирования для заданных выборок
/>
/> Выборка
/>
/>
/>
/>
/>
/> 100 25,201 6,993 18,209 28,805 2,429 26,376 500 25,110 6,984 18,126 33,695 0,196 33,499 1000 25,237 6,711 18,466 33,962 -1,574 35,536

Случайная величина /> имеет меньший размах, чем случайная величина />.
2.2 Группировкастатистических данных
Число групп определяется по формуле Стерджесса (2.2):
/>, (2.2)
где /> – количество групп;
/> – объем выборки.
После определения числа групп следует определить интервалыгруппировки — значения варьирующего признака, лежащие в определенных границах.Величина равного интервала определяется по формуле (2.3):
(2.3)   />,
где /> – число групп интервалов,
/> – размах выборки .
Ниже приведены значениячисла групп интервалов для всех выборок:
При />: />.
При />: />.
При />:/>.
При />:/>.
При />: />.
При />:/>.
При />:/>.
При />:/>.
При />: />.
При />: />.
Построение интервальногоряда в пакете STATISTICA производилось следующим образом:
а) Analysis→Frequency tables→Variables(выбрали переменную);
б) установили количествоинтервалов в “No. of exact intervals”, посчитанных по формуле Стерджесса;
в) установили флажки вDisplay options:
- Cumulativefrequencies – накопленные частоты;
- Percentages — частости;
- Cumulativepercentages – накопленные частости.
Интервальные ряды покаждой выборке для случайных величин X и Y приведены в таблицах 2.2-2.7 иД.1-Д.14.
Таблица 2.2 — Интервальный ряд СВ /> при /> Частота Кумул. частота Процент Кумул. процент 5,475289Таблица 2.3 — Интервальный ряд СВ /> при /> Частота Кумул. частота Процент Кумул. процент 5,850935Таблица 2.4 — Интервальный ряд СВ /> при /> Частота Кумул. частота Процент Кумул. процент 5,745344Таблица 2.5 — Интервальный ряд СВ /> при /> Частота Кумул. Процент Кумул. 0,231076Таблица 2.6 — Интервальный ряд СВ /> при /> Частота Кумул. Процент Кумул. -1,89766

Таблица 2.7 — Интервальный ряд СВ /> при /> Частота Кумул. Процент Кумул. -3,547942.3 Графическоеизображение рядов распределения
Графическое изображениеинтервальных рядов включает построения полигона частот, гистограммы и кумуляты.
В пакете STATISTICAпостроение полигона происходит следующим образом:
а) Analysis → Frequency tables →Variables (выбрать переменную);
б) установить количествоинтервалов в “No. of exact intervals”;
в) Frequency tables →Count;
г) нажать правую кнопкумыши и из выпадающего списка выбрать “Custom Graphs”;
д) 2D Graphs → Graph Type →Line Plot. [1]
Построение кумуляты:
а)Analysis→ Frequency tables → Variables (выбрать переменную);
б) установить количествоинтервалов в “No. of exact intervals”;
в) Frequency tables → Cumul.Count;
г) нажать правую кнопкумыши и выбрать “Custom Graphs”;
д) 2D Graphs → Graph Type →Line Plot (Bar />).
Построение гистограммыпроисходит следующим образом:
а) Analysis → Frequency tables →Variables (выбрать переменную);
б) установить количествоинтервалов в “No. of exact intervals”;
в) Frequency tables → Percent;
г) нажать правую кнопкумыши и из выпадающего списка выбрать “Custom Graphs”;
д) 2D Graphs → Graph Type →Bar />
2.4 Точечные оценкисредних показателей
Точечная оценка математического ожидания по вариационномуряду вычисляется по формуле (2.4):
(2.4)   />
где /> – значения элементов выборки.
Оценка дисперсии по вариационному ряду вычисляется по формуле(2.5).
/>
(2.5)  
Вычисление оценки математического ожидания по интервальномувариационному ряду осуществляется по формуле (2.6):
(2.6)   />
где />– середина />-го интервала;
/> – статистическая вероятность(частость) попадания в />-тый интервал.
Оценка дисперсии для интервального ряда вычисляется поформуле (2.7):
(2.7)   />
Вычисление точечных оценок по вариационному ряду в пакете STATISTICA:
Analysis → Descriptive statistics →Categorization → Number of intervals (установить количество интервалов) → More statistics → Mean, Variance. [2]
Значения точечных оценокматематического ожидания и дисперсии для простого и интервального рядовприведены в таблице 2.8.
Таблица 2.8 – Оценкиматематического ожидания и дисперсииВыборка Математическое ожидание Дисперсия Простой ряд Интервальный ряд Простой ряд Интервальный ряд
/>(/>) 16,254 16,279 27,849 28,517
/>(/>) 16,189 16,174 26,259 26,598
/>(/>) 15,950 16,006 27,608 28,330
/>(/>) 16,668 16,936 31,125 31,113
/>(/>) 15,989 16,007 30,406 31,242
/>(/>) 15,792 15,740 27,059 28,636
Из приведенных данныхвидно, что полученные оценки математического ожидания и дисперсии повариационному (простому) и интервальному рядам имеют близкие значения. Причем,чем больше объем выборки, тем более точный результат. От номера эксперимента,то есть от количества испытаний величины точечной оценки не зависят. Это виднона рисунках 2.25 – 2.32.
/>
Рисунок 2.25 — Зависимость /> от объема выборки для />
/>
Рисунок 2.26 — Зависимость /> от объема выборки для />

/>
Рисунок 2.27 — Зависимость /> от объема выборки для />
/>
Рисунок 2.28 — Зависимость /> от объема выборки для />
/>
Рисунок 2.29 — Зависимость /> от номера эксперимента по />

/>
Рисунок 2.30 — Зависимость /> от номера эксперимента по />
/>
Рисунок 2.31 — Зависимость /> от номера эксперимента по />
/>
Рисунок 2.32 — Зависимость /> от номера эксперимента по />

В таблице 2.9 приведеныоценки математического ожидания и дисперсии, вычисленные для 10 выборок по 1000элементов в каждой для случайной величины /> и случайной величины />.
Таблица 2.9 – Точечныеоценки выборок из 1000 элементов для /> и />
/>
/> Выборка
/>
/>
/>
/> 1 15,792 27,832 15,754 27,421 2 16,193 29,501 16,283 29,650 3 16,076 29,006 15,900 28,716 4 16,052 28,884 16,096 26,124 5 15,968 28,508 15,947 30,983 6 16,212 28,710 16,163 29,956 7 16,215 28,747 16,030 30,011 8 15,945 27,243 16,428 29,069 9 16,080 28,103 16,054 28,265 10 15,853 28,369 15,980 28,913
2.5 Доверительныеинтервалы
Для того чтобы оценить достоверность оценок, вводят понятиедоверительный интервал и доверительная вероятность.
(2.7)   Доверительный интервалдля математического ожидания определяется по формуле (2.7):
/>
где /> – математическоеожидание генеральной совокупности;
/> - доверительная вероятность;
/> - оценка математическогоожидания;
 (2.8)   /> - величина доверительногоинтервала, вычисляется по формуле (2.8):

/>
где /> - квантиль нормальногораспределения, получается обратным интерполированием из таблицы для функциираспределения стандартного нормального закона. Вычисляется по формуле (2.9).
 (2.10)  
 (2.9)   />
/> - оценка дисперсии, вычисляетсяпо формуле (2.10).
/>
Доверительный интервалдля дисперсии определяется по формуле (2.11).
 (2.12)   />,
/>
где /> – дисперсия генеральнойсовокупности;
/> – оценка дисперсии.
/> – квантиль нормальногораспределения.
Оценка стандартногоотклонения в зависимости от закона распределения случайной величины имеетразличное значение.
Для нормального законараспределения эта величина будет равна:
/>

Для равномерного:
/>
Ниже в таблицах 2.10-2.21приведены доверительные интервалы математического ожидания исследуемых выборок.
-точный метод
Таблица 2.10 — Доверительные интервалы для СВ />, />
/> 15,378 17,130
/> 15,207 17,301
/> 15,053 17,455
/> 14,739 17,769
/> 14,481 18,027
-грубый метод
Таблица 2.11 –Доверительные интервалы для СВ />, />
/> 15,376 17,132
/> 15,207 17,301
/> 15,058 17,450
/> 14,753 17,755
/> 14,508 18,000
-точный метод
Таблица 2.12 — Доверительные интервалы для СВ />, />
/> 15,811 16,566
/> 15,738 16,639
/> 15,673 16,704
/> 15,542 16,835
/> 15,408 16,940
-грубый метод
Таблица 2.13 –Доверительные интервалы для СВ />, />
/> 15,795 16,553
/> 15,722 16,626
/> 15,657 16,691
/> 15,526 16,822
/> 15,420 16,928
-точный метод
Таблица 2.14 — Доверительные интервалы для СВ />, />
/> 15,677 16,224
/> 15,624 16,276
/> 15,577 16,323
/> 15,483 16,418
/> 15,447 16,565
-грубый метод
Таблица 2.15 –Доверительные интервалы для СВ />, />
/> 15,729 16,283
/> 15,676 16,336
/> 15,629 16,383
/> 15,533 16,479
/> 15,456 16,556

-точный метод
Таблица 2.16 –Доверительные интервалы для СВ />, />
/> 15,742 17,595
/> 15,561 17,775
/> 15,399 17,938
/> 15,066 18,270
/> 15,084 18,788
-грубый метод
Таблица 2.17 –Доверительные интервалы для СВ />, />
/> 16,018 17,854
/> 15,843 18,029
/> 15,687 18,185
/> 15,369 18,503
/> 15,112 18,760
-точный метод
Таблица 2.18 – Доверительныеинтервалы для СВ />, />
/> 15,583 16,396
/> 15,505 16,474
/> 15,435 16,544
/> 15,294 16,685
/> 15,177 16,837
-грубый метод

Таблица 2.19 –Доверительные интервалы для СВ />, />
/> 15,596 16,418
/> 15,517 16,497
/> 15,447 16,567
/> 15,305 16,709
/> 15,190 16,824
-точный метод
Таблица 2.20 –Доверительные интервалы для СВ />, />
/> 15,521 16,063
/> 15,469 16,115
/> 15,423 16,161
/> 15,329 16,255
/> 15,178 16,302
-грубый метод
Таблица 2.21 –Доверительные интервалы для СВ />, />
/> 15,462 16,018
/> 15,408 16,072
/> 15,361 16,119
/> 15,264 16,216
/> 15,187 16,293
Длины доверительныхинтервалов для математического ожидания при различных уровнях доверительнойвероятности приведены в таблице 2.22.
Таблица 2.22 – Длиныдоверительных интервалов Длина интервала
/>
/>
/>
/>
/>
/>(/>) 1,752 2,094 2,402 3,03 3,546
/>(/>) 0,755 0,901 1,031 1,293 1,532
/>(/>) 0,547 0,652 0,746 0,935 1,118
/>(/>) 1,853 2,214 2,539 3,204 3,704
/>(/>) 0,813 0,969 1,109 1,391 1,66
/>(/>) 0,542 0,646 0,738 0,926 1,124
В таблицах 2.23 – 2.34 указаныдоверительные интервалы дисперсии исследуемых выборок.
-точный метод
Таблица 2.23 –Доверительные интервалы для СВ />, />
/> 25,059 32,793
/> 24,452 33,693
/> 23,926 34,524
/> 22,914 36,280
/> 22,095 37,873
-грубый метод
Таблица 2.24 –Доверительные интервалы для СВ />, />
/> 26,084 30,950
/> 25,619 31,415
/> 25,205 31,829
/> 24,362 32,672
/> 23,681 33,353
-точный метод

Таблица 2.25 – Доверительныеинтервалы для СВ />, />
/> 23,373 30,586
/> 22,807 31,426
/> 22,316 32,201
/> 21,372 33,838
/> 20,608 35,324
-грубый метод
Таблица 2.26 –Доверительные интервалы для СВ />, />
/> 24,329 28,867
/> 23,895 29,301
/> 23,508 29,688
/> 22,722 30,474
/> 22,088 31,108
-точный метод
Таблица 2.27 –Доверительные интервалы для СВ />, />
/> 22,258 29,128
/> 21,719 29,928
/> 21,252 30,666
/> 20,354 32,225
/> 19,626 33,640
-грубый метод
Таблица 2.28 –Доверительные интервалы для СВ />, />
/> 23,169 27,491
/> 22,756 27,904
/> 22,388 28,272
/> 21,639 29,021
/> 21,035 29,625
-точный метод
Таблица 2.29 –Доверительные интервалы для СВ />, />
/> 27,340 35,779
/> 26,678 36,761
/> 26,104 37,667
/> 25,000 39,582
/> 24,106 41,321
-грубый метод
Таблица 2.30 –Доверительные интервалы для СВ />, />
/> 28,459 33,767
/> 27,951 34,275
/> 27,499 34,727
/> 26,579 35,647
/> 25,837 36,389
-точный метод
Таблица 2.31 –Доверительные интервалы для СВ />, />
/> 26,575 34,777
/> 25,931 35,732
/> 25,374 36,613
/> 24,301 38,474
/> 23,431 40,164

-грубый метод
Таблица 2.32 –Доверительные интервалы для СВ />, />
/> 27,662 32,822
/> 27,168 33,316
/> 26,729 33,755
/> 25,835 34,649
/> 25,114 35,370
-точный метод
Таблица 2.33 –Доверительные интервалы для СВ />, />
/> 25,163 32,930
/> 24,554 33,834
/> 24,026 34,668
/> 23,010 36,431
/> 22,187 38,031
-грубый метод
Таблица 2.34 –Доверительные интервалы для СВ />, />
/> 26,193 31,079
/> 25,726 31,546
/> 25,310 31,962
/> 24,463 32,809
/> 23,780 33,492
В таблице 2.35 показаноизменение длины доверительного интервала для дисперсии в зависимости от объемавыборки и величины доверительной вероятности.

Таблица 2.35 – Длиныдоверительных интервалов Величина интервала
/>
/>
/>
/>
/>
/>(/>) 7,734 9,241 10,598 13,366 15,778
/>(/>) 7,213 8,619 9,885 12,466 14,716
/>(/>) 4,322 5,148 5,884 7,382 8,590
/>(/>) 8,439 10,083 11,563 14,582 17,215
/>(/>) 8,202 9,801 11,239 14,173 16,733
/>(/>) 7,767 9,280 10,642 13,421 15,844
Анализируя полученныеданные можно заметить, что при увеличении уровня доверительной вероятностиувеличивается величина доверительного интервала, а при увеличении объемавыборки она уменьшается. Это справедливо как для доверительных интерваловматематического ожидания, так и для дисперсии. [3]
2.6 Другие точечныеоценки интервального ряда (мода, медиана, коэффициент вариации, коэффициентасимметрии, эксцесс)
Модой в вариационном рядуявляется наиболее часто встречающееся значение признака.
Мода по интервальномуряду вычисляется по формуле (2.13):
/> (2.13)
где /> – левая граница модального интервала (модальнымназывается интервал, имеющий наибольшую частость);
/> – величина интервала группировки;
/> – частота модального интервала;
/> – частота интервала,предшествующего модальному;
/> – частота интервала, следующегоза модальным.
Медиана – серединноенаблюдение в выборке длиной n.
При нечетном n медиана в вариационном ряду естьзначение ряда с номером />.
При четном n медиана есть полусумма значений сномерами /> и/>. Винтервальном ряду для нахождения медианы применяется формула (2.14):
(2.14)   />
где /> – нижняя граница медианного интервала (медианнымназывается интервал, накопленная частота которого превышает половину общейсуммы частот);
/> – величина интервала группировки;
/> – частота медианного интервала;
/>– накопленная частота интервала, предшествующегомедианному.
Коэффициент вариациивычисляется по формуле (2.15):
(2.15)   />
На основе моментатретьего порядка (смотри формулу 2.16) выборочный коэффициент асимметрии находитсяпо формуле (2.17):

(2.16)   />
(2.17)   />
С помощью момента четвертого порядкахарактеризуют свойство рядов распределения, называемое эксцессом. Показательэксцесса для ранжированного ряда находится по формуле (2.18).
(2.18)   />
Вычисление точечныхоценок по вариационному ряду в пакете STATISTICA происходит следующим образом:
Analysis →Descriptive statistics:
а) Categorization → Number ofintervals (установить количество интервалов);
б) нажать кнопку More statistics → откроется окно Statistics, где можно выбрать следующиепоказатели:
-  Mean – выборочное среднее;
-  Median – медиана;
-  Standard Deviation – стандартное отклонение среднегозначения;
-  Variance – выборочнаядисперсия;
-  Skewness – выборочный коэффициент асимметрии;
-  Kurtosis – выборочныйкоэффициент эксцесса;
в) выбрать необходимыепараметры и нажать ОК.
Значения медианы,коэффициента вариации, коэффициента ассиметрии и эксцесса приведены в таблице2.36.

Таблица 2.36 — Медиана,коэффициент вариации, коэффициент ассиметрии и эксцессВыборка Медиана Коэф. ассиметрии Эксцесс Коэф. вариации
/>(/>) 16,587 -0,009 -1,017 0,326
/>(/>) 16,501 -0,058 -1,160 0,317
/>(/>) 16,119 0,007 -1,192 0,329
/>(/>) 16,531 -0,086 -0,449 0,335
/>(/>) 16,013 -0,022 -0,138 0,345
/>(/>) 15,795 -0,080 0,170 0,329
Анализируя полученные данные, можно сказать, что обеслучайные величины имеют практически симметричное распределение, т. к.коэффициенты асимметрии всех выборок близки к нулю,
Случайная величина /> имеет более пологое распределение (эксцесс для всехее выборок имеет отрицательное значение). А эксцесс выборок случайной величины /> практически равен нулю, т.е. «крутизна»распределения случайной величины Yблизка к нормальному распределению.
2.7 Оценкаоднородности выборки
Любая исследуемая совокупность содержит как значенияпризнаков, сложившихся под влиянием факторов, непосредственно характерных дляанализируемой совокупности, так и значения признаков, полученных подвоздействием иных факторов, не характерных для основной совокупности.
Совокупность считается однородной, если коэффициент вариациине превышает 33% (для распределений, близких к нормальному). [4]
Из таблицы 2.36 видно, что однородными можно считать выборкислучайной величины /> при /> равном 100, 500, 1000 и /> при n равном 1000.
Однородность выборкиможно проверить, также используя метод Ирвина, основанный на определении />-статистики. При его использовании выявлениеаномальных наблюдений производится по формуле (2.19).
(2.19)   />
где /> – упорядоченная (по возрастанию или по убыванию)исследуемая совокупность;
/> – значение ряда;
/>– предыдущее значение ряда;
/> – среднеквадратическое отклонение.
Если расчетное значениепревысит уровень критического, то оно признается аномальным.
Произведя соответствующиерасчёты в Microsoft Excel мы убедились, что ни одно из расчётных значений непревышает уровень критического значения. Это значит, что все выборки случайныхвеличин /> и /> – однородны.
2.8 Проверка нормальности эмпирического распределения
 
2.8.1 Проверка нормальности эмпирического распределения наоснове анализа точечных оценок числовых характеристик
Если среднее арифметическое,медиана и мода имеют близкие значения, это указывает на вероятное соответствиеизучаемого распределения нормальному закону. Для нормального распределениякоэффициент асимметрии и эксцесса равны нулю, а для равномерного эксцесс равен-1,2.
В таблице 2.37 приведеныданные для проверки вышеуказанных утверждений.
Таблица 2.37 – Анализчисловых характеристик положения и вариации
равномерный закон (СВ />)
нормальный закон (СВ />) выборка
/>
/>
/> выборка
/>
/> 100 16,254 16,587 -0,009 -1,017 100 16,668 16,531 -0,449 200 16,369 15,840 0,034 -1,264 200 15,688 15,703 0,712 300 16,355 16,335 -0,092 -1,270 300 15,696 15,655 0,472 400 15,658 15,581 0,056 -1,254 400 16,770 16,954 -0,196 500 16,189 16,501 -0,058 -1,160 500 15,989 16,013 -0,138 600 16,048 15,897 -0,022 -1,158 600 16,049 16,008 -0,077 700 15,964 15,956 -0,017 -1,159 700 16,319 16,576 -0,128 800 15,867 15,649 0,072 -1,218 800 15,990 16,082 0,172 900 16,132 16,028 -0,022 -1,243 900 15,885 15,749 -0,092 1000 15,950 16,119 0,007 -1,192 1000 15,792 15,795 0,170
Анализируя полученныеданные, можно сделать вывод о том что значения медианы и среднегоарифметического для выборок случайной величины /> и /> имеют практически равное значение.Для выборки /> значение коэффициента ассиметрии, адля выборки случайной величины /> значение эксцесса практически равно0. Для случайной величины /> значение эксцесса практически -1,2.Таким образом, все это свидетельствует о близости распределения случайнойвеличины /> нормальному распределению, аслучайной величины /> равномерному.
2.9 Определение закона распределения случайных величин
 
2.9.1 Определение закона распределения случайной величины повиду гистограммы
По виду гистограмм, приведенных на рисунках 2.19-2.21 делаемпредположение о том, что случайная величина /> подчиняется равномерному закону распределения, аслучайная величина /> соответствует нормальному законураспределения, что можно увидеть на рисунках 2.22-2.24.
2.9.2 Определение оценок параметров распределений
Метод моментов
Метод моментовзаключается в том, что определенное количество статистических начальных и (или)центральных моментов приравнивается к соответствующим теоретическим моментамраспределения случайной величины. Уравнения метода показано в формуле (2.23).
(2.23)   />
(2.24)   где /> – теоретическийначальный момент />-того порядка для непрерывнойслучайной величины, вычисляется по формуле (2.24):
/>.
/> – статистическая оценкасоответствующего теоретического момента />-того порядка, вычисляется по формуле (2.25):
(2.25)   />.
/> – теоретический центральный момент s-того порядка, вычисляется по формуле(2.26):

(2.26)   />.
/> – статистическая оценкатеоретического центрального момента />-того порядка, вычисляется по формуле (2.27):
(2.27)   />.
Из системы (2.23)находятся параметры распределения. Число уравнений в системе зависит отколичества неизвестных параметров. Для нормального и равномерного законов,система должна содержать два уравнения, для экспоненциального – одно.
Для равномерного законараспределения система (2.23) принимает вид (2.28):
/>
(2.28)   />/>
Из системы 2.28 нужнонайти параметры /> и />.
В таблице 2.38 приведенызначения этих параметров, найденные методом моментов и методом максимальногоправдоподобия.
Таблица 2.38 – Значенияпараметров /> и />
/>(метод
моментов)
/>(метод максимального
правдоподобия)
∆/>
/>(метод
моментов)
/>(метод максимального
правдоподобия)
∆/>
/> 6,993 6,996 0,003 25,201 25,542 0,341
/> 6,984 7,313 0,329 25,110 25,065 0,045
/> 6,711 6,849 0,138 25,237 25,051 0,186

Из таблицы видно, чтозначения параметров, найденные разными методами, практически совпадают. Этоподтверждает, что случайная величина /> распределена по равномерному закону.
Метод максимальногоправдоподобия
По методу максимальногоправдоподобия, строится так называемая функция правдоподобия (2.29):
(2.29)   />
где    /> – выборка,
/> – вектор параметров.
Необходимо найти такиезначения вектора />, чтобы функция /> достигала максимума. Для этого строят системуправдоподобия (2.30), содержащую частные производные от функции правдоподобияпо всем переменным, приравненные к нулю. Для упрощения вычислений переходят кфункции />, равной логарифму натуральному от />:
(2.30)   /> .
Оценки параметров, получаемыеиз этой системы, называют оценками максимального правдоподобия.
Для равномерного законафункция правдоподобия будет иметь вид (2.31)

(2.31)   />
где /> и /> – параметры распределения.
Данная функция будетдостигать максимума при условии (2.32):
/>
Судя по полученнымоценкам параметров распределения, можно сделать вывод, что наше предположениебыло верно изначально и случайная величина /> действительно распределена равномерно.
2.10 Проверка нормальности эмпирического распределения наоснове критериев согласия Пирсона
Для проверки гипотезы осоответствии эмпирического распределения нормальному закону распределениянеобходимо ввести нулевую гипотезу, которая будет проверяться по критериюПирсона.
/>: генеральная совокупность распределена по нормальномузакону.
В качестве мерырасхождения для критерия /> выбирается величина, равнаявзвешенной сумме квадратов отклонений статистической вероятности отсоответствующей теоретической вероятности, рассчитанных по нормальному законутеоретического распределения /> вычисляется по формуле (2.20)
(2.20)   />

где />– частота попадания вi-тый интервал;
/> – объем выборки;
/> – теоретическая вероятность попадания i-тый интервал:
/>
(2.21)   .
Общая схема применениякритерия />:
1. Определение мерырасхождения по формуле 2.20;
2. Задание уровнязначимости />;
3. Определение числастепеней свободы /> по формуле 2.22.
/>, (2.22)
где /> – количество интервалов в интервальном ряду;
/> – число налагаемых связей, равное числу параметров
предполагаемого законараспределения
4. Область принятия основнойгипотезы:
/>.
Выполнение в пакетеSTATISTICA.
В модуле Nonparametric Statistics (непараметрическая статистика), Distribution Fitting. В поле Continuous Distributions представлены непрерывные распределения, а в поле Discrete Distributions — дискретные распределения (законраспределения выбираем дважды щелкнув на его название мышью) ® Variable (выбрать переменную) ® в поле Plot distribution выбираем Frequency distribution (частоты распределения) ® в поле Kolmogorov-Smirnov test ставим No → установимнеобходимые параметры числа интервалов, верхней и нижней границ, среднего идисперсии → Graph. Результатыпроверки соответствия гипотезы приведены в таблице 2.39 и показаны на рисунках2.41-2.46
Таблица 2.39 – Значения /> и χ2крит для случайныхвеличин /> и/>Выборка
/>
/>
/>
Гипотеза />
/>(/>) 4 9,49 7,53 Принимается
/>(/>) 4 9,49 11,815 Отвергается
/>(/>) 5 11,1 11,95 Отвергается
/>(/>) 5 11,1 25,54 Отвергается
/>(/>) 6 12,59 45,51 Отвергается
/>(/>) 6 12,59 39,83 Отвергается
/>(/>) 6 12,59 48,77 Отвергается
/>(/>) 7 14,1 40,81 Отвергается
/>(/>) 7 14,1 49,97 Отвергается
/>(/>) 7 14,1 76,75 Отвергается
/>(/>) 4 9,49 2,04 Принимается
/>(/>) 4 9,49 2,12 Принимается
/>(/>) 5 11,1 2,78 Принимается
/>(/>) 5 11,1 2,99 Принимается.
/>(/>) 6 12,59 3,15 Принимается
/>(/>) 6 12,59 4,61 Принимается
/>(/>) 6 12,59 5,07 Принимается
/>(/>) 7 14,1 5,86 Принимается
/>(/>) 7 14,1 6,32 Принимается
/>(/>) 7 14,1 7,16 Принимается

На основе полученныхданных можно сделать вывод, что случайная величина /> распределена по нормальномузакону, а случайная величина /> не распределена по нормальномузакону.
Анализируя получившиесяграфики, делаем вывод, что случайная величина /> распределена по равномерному закону, а случайная величина/> – по нормальному.

Заключение
В ходе курсовой работыбыли освоены методы обработки данных статистического наблюдения, их анализа спомощью обобщающих показателей, установление теоретических законовраспределения случайных величин и доказательство адекватности этих законов.Также в результатевыполнения данной работы мы приобрели навыки и опыт работы в пакете STATISTICА.
В ходе анализа данных,были сделаны выводы, что основной частью статистического анализа являетсявыявление закона распределения случайной величины, а также, выявление основныхфакторов, оказывающих влияние на качество оцениваемых параметров законараспределения (длина выборки, её однородность, величина доверительнойвероятности). Был произведен статистический анализ каждой из полученных в ходегенерации выборок данных двух случайных величин, был найден закон ихраспределения. Рассмотрены основные числовые характеристики положения и вариациинормального и равномерного закона.
Полученный опыт работы состатистическими данными и методами их обработки на компьютере позволит гораздобыстрее и эффективнее применять эти методы обработки информации в повседневнойжизни, в частности, для экономических исследований и разработок.

Перечень ссылок
случайный величина интервальный выборка
1. Теориястатистики: Учебник / Под ред. проф. Р. А. Шмойловой. — 3-е изд., перераб. -М.:Финансы и статистика, 2000. — 560 с.
2. Елисеева И. И.,Юзбашев М. М. Общая теория статистики: Учебник / Под ред. чл.-корр. РАН И. И.Елисеевой. – М.: Финансы и статистика, 1998. – 365 с.: ил.
3.  Смирнов Н.В., Дунин-Барковский И.В.Курс теории вероятностей и математической статистики для техническихприложений. – М.: Наука, 1969. – 509 с.
4.  Гурман В.Е. Теория вероятностей и математическаястатистика. Учеб. пособие для втузов. Изд. 5-е перераб. и доп. – М.: Высш.школа, 1977. – 397 с.
5.  Кремер Н.Ш. Теория вероятностей иматематическая статистика. – М.: Unity,2000. – 544 с.
6.  Вентцель Е.С. Теория вероятностей. –М.: Наука, 1969. – 576 с.
7. Боровиков В. STATISTICA: искусство анализа данных накомпьютере. Для профессионалов. — СПб.: Питер, 2001. — 656 с.

Приложение А
Генерация исходных данныхСВ /> в пакете STATISTICA
Dim ADS AsSpreadsheet
Dim STBReportAs Report
Dim SUM AsDouble
Dim LOOP_CASEAs Double
Dim I AsDouble
Sub Main
Set ADS =ActiveDataSet
Set STBReport= Reports.New
For LOOP_CASE= 1 To NCASES(ADS)
For I = 1 To n
SUM = 0
For L = 1 To300
SUM = SUM +Uniform(1)
Next L
ADS.Value(LOOP_CASE, 1) = N * ((1 / 15) * SUM — 9)
Next I
NEXT_CASE:
Next LOOP_CASE
End Sub

Приложение Б
Интервальные ряды для СВ /> и />
Таблица Д.1 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,289175Таблица Д.2 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,502861Таблица Д.3 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,555859

Таблица Д.4 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,616825Таблица Д.5 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,638499Таблица Д.6 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,746050

Таблица Д.7 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 5,747041Таблица Д.8 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -3,85839Таблица Д.9 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -3,50252Таблица Д.10 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. 1,299935Таблица Д.11 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -1,98797Таблица Д.12 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -2,68355Таблица Д.13 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -1,52038Таблица Д.14 — Интервальный ряд СВ />, /> Частота Кумул. Процент Кумул. -1,06170


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.