Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
«Санкт-Петербургский государственный политехнический университет»
Факультет экономики и менеджмента
Кафедра «Предпринимательство и коммерция»
ЛАБОРАТОРНАЯ РАБОТА №1
По дисциплине «Статистика»
На тему «Анализ эмпирического распределения»
Санкт-Петербург 2008
Введение
Ряд распределения - это распределение единиц совокупности по значению того или иного признака. Комплексный анализ ряда распределения включает:
- Табличное и графическое представление ряда распределения;
- Расчёт и анализ показателей центра и структуры распределения;
- Расчёт и анализ показателей вариации;
- Характеристику формы распределения;
- Выбор теоретического распределения, которому соответствует изучаемое эмпирическое [1].
Ряды распределения могут быть:
1) Вариационными;
2) Атрибутивными.
Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений (т.н. закон больших чисел).
Исходными данными для анализа служит информация, полученная из сборника Росстата Регионы России [2], а именно статистическая информация о числе собственных легковых автомобилей на 1000 человек населения в различных регионах России в 1990 году. Объём исходной совокупности - 87 единиц.
Таблица 1.1. Распределение регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 году. k=8
Таблица 1.2. Распределение регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 году. k=6
При k=8 получено много малонаполненных групп, что является нежелательным для анализа ряда распределения. Выбирая окончательный вариант табличного представления вариационного ряда в работе, следует остановиться на группировке с использованием 6 групп. Тогда величина группировочного интервала составит 14,6.
Необходимо подвести предварительные итоги (на примере третьей строки): только в тридцати регионах России, что составляет 35,71% от общего числа регионов, количество автомобилей на 1000 человек населения в 1990 году составляло от 46,3 до 60,9 штук. В пятидесяти пяти регионах России (65,47% от всех регионов) количество автомобилей на 1000 человек населения в 1990 году составляло менее 60,9 штук.
Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.
На основе таблиц строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. Графическое представление может быть осуществлено как использованием абсолютных, так и относительных частот [3].
Рис. 1.1. Полигон распределения регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 году
Рис. 1.2. Кумулята распределения регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 году
Рис. 1.3 Гистограмма распределения регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 году
2. Характеристика центральной тенденции распределения
Таблица 2.1. Показатели центра и структуры распределения
Показатель центра |
||
Среднее значение |
55,70595 |
|
Медиана |
56,15000 |
|
Мода |
52,87000 |
В среднем в регионах России количество автомобилей на 1000 человек населения в 1990 году составляло 55,71 штуку. В 50% регионов России количество автомобилей на 1000 человек населения в 1990 году было меньше 56,15 штук, а в другой половине - больше.
- Абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);
- Относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации) [1].
Формулы расчёта. Размах вариации:
,
где и - максимальное и минимальное значение признака совокупности.
Дисперсия:
,
где - значение признака у i_ой единицы совокупности, - средняя арифметическая, - частота у i_ой единицы совокупности, - сумма частот ().
Среднее квадратическое (стандартное) отклонение:
.
Коэффициент вариации:
Таблица 3.1. Показатели вариации
Показатель вариации |
||
Размах вариации R |
73 |
|
Дисперсия 2 |
227,8647 |
|
Среднее квадратическое отклонение |
15,0952 |
|
Коэффициент вариации V |
27,0980% |
Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 73 единицы. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 27,0980%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать однородной, т.к. коэффициент вариации меньше 33%.
В 1990 году в регионах России число автомобилей на 1000 человек населения отличалось от среднего по стране на 15,0952 штук.
Таблица 4.1. Показатели структуры
Показатель структуры |
||
Нижний квартиль |
44,80 |
|
Медиана |
56,15 |
|
Верхний квартиль |
65,80 |
В 50% регионов России количество автомобилей на 1000 человек населения в 1990 году составляло от 44,80 до 65,80 штук.
- Асимметрия;
- Эксцесс (куртозис).
Соответственно существуют коэффициенты асимметрии и эксцесса и стандартные ошибки для этих коэффициентов. Коэффициент асимметрии оценивает, насколько распределение симметрично относительно центра. Коэффициент эксцесса оценивает крутизну распределения, т.е. степень выпада вершины распределения относительно кривой нормального распределения. Эксцесс имеет смысл оценивать только тогда, когда в эмпирическом распределении присутствует несущественная асимметрия.
Формулы расчёта. Коэффициент асимметрии:
.
Стандартная ошибка:
.
Коэффициент эксцесса:
.
Стандартная ошибка:
.
Таблица 5.1. Показатели формы
Показатель формы |
||
Коэффициент асимметрии As |
0,032687 |
|
Стандартная ошибка As |
0,262651 |
|
Коэффициент эксцесса Es |
-0,377168 |
|
Стандартная ошибка Es |
0,519660 |
По результатам подсчётов делаются следующие выводы: распределение имеет очень незначительную правостороннюю асимметрию, кроме того есть незначительный отрицательный эксцесс, это значит, что в совокупности не сформировалось «ядро» распределения.
Таблица 6.1. Проверка гипотезы о нормальном распределении регионов России по числу автомобилей на душу населения в 1990 году
Формулы, по которым рассчитывается плотность модельного распределения, а также формулы для расчета теоретических частот распределения могут быть легко найдены в общедоступной справочной и учебной литературе. В данной лабораторной работе используются формулы для нормального распределения.
Функция нормального распределения: , плотность нормального распределения:
,
где - значение изучаемого признака, - средняя арифметическая величина, - среднее квадратическое отклонение изучаемого признака, e, ? - математические константы, - нормированное отклонение.
Теоретические частоты нормального отклонения рассчитываются по следующей формуле:
,
где N - объём совокупности, hk - величина интервала. В моём случае вариационный ряд построен с использованием равных интервалов, следовательно: .
Рис. 6.1. Гистограмма и расчётная кривая распределения регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 г.
В шапке таблицы находятся следующие показатели: , (уточнённое значение числа степеней свободы,
,
где k - число интервалов вариационного ряда, n - число параметров теоретического распределения, определяемых по опытным данным, для нормального закона n=2, p - расчётный уровень значимости).
Принятие решения о справедливости гипотезы о законе распределения можно осуществить, ориентируясь на эмпирическое значение критерия , который сравнивается с табличным значением . Окончательные выводы по проверке гипотезы о законе распределения: так как , то гипотеза о нормальном распределении регионов России по числу собственных легковых автомобилей на 1000 человек населения в 1990 г. не противоречит истине.
1. Лекции по дисциплине статистика. Лектор - доц. О.А. Пономарёва, 2008.
2. Сборник Росстата Регионы России. Социально-экономические показатели. 2006.
3. Учебное пособие. Статистика. Методы анализа распределений. Выборочное наблюдение. Н.В. Куприенко, О.А. Пономарёва, Д.В. Тихонов. 132 с. - 2008.
Контрольная работа | Концепция информатизации Российской Федерации |
Контрольная работа | Причины агрессивного поведения. Методы работы с агрессивными детьми |
Контрольная работа | Алгоритм выбора и реализации предпринимательской идеи |
Контрольная работа | Современные методы арт-терапии |
Контрольная работа | Системы управления взаимоотношения с клиентами |
Контрольная работа | Учет материальных затрат в бухгалтерском учете |
Контрольная работа | Геополитическое положение России |
Контрольная работа | Особенности вознаграждения работников в организации |
Контрольная работа | Виды запасов |
Контрольная работа | Психоанализ |
Контрольная работа | Управление дебиторской задолженностью |
Контрольная работа | Дифференцированный подход в обучении и воспитании |
Контрольная работа | Закономерности воспитания детей дошкольного возраста |
Контрольная работа | Крещение Руси. Роль православия в развитии древнерусского государства |
Контрольная работа | Профессиональная этика специалиста юриспруденции (с учетом профессиональной деятельности) |