--PAGE_BREAK--X`j
Интервал
t
4,5
0
9
5
-1,63
0,1057
6
0,1667
13,5
9
18
16
-0,98
0,2468
14
0,2857
22,5
18
27
32
-0,33
0,3778
22
4,5455
31,5
27
36
18
0,33
0,3778
22
0,7273
40,5
36
45
8
0,98
0,2468
14
2,5714
58,5
45
72
9
2,28
0,0297
5
3,2
Итого
Х
Х
Х
Х
Х
Х
11,4965
Таблица SEQ Таблица \* ARABIC 5 – моделирование ряда распределения после объединения интервалов
В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению χ2. Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5. Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.
Оценка параметров генеральной совокупности на основе выборочных данных В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют выборочное наблюдение, то есть статистическому обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.
Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.
Выборка 54 регионов Из 88 регионов выберем 54. Выбранные единицы представлены в Приложении В.
Рассчитаем выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%. Вычислим предельную ошибку средней с помощью коэффициента доверия для вероятностей 0,760, 0,860, 0,880 и 0,960.
Таблица SEQ Таблица \* ARABIC 6 – Предельные ошибки
Необходимо отметить, что используемая для расчета предельной ошибки средней дисперсия генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.
В результате получаем следующие доверительные интервалы генеральной средней:
Таблица SEQ Таблица \* ARABIC 7 – Доверительные интервалы генеральной средней
Выборка 24 региона Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.
Так как количество единиц в выборке меньше 30, то она относится к малым. Следовательно, расчет предельной средней необходимо проводить по правилам малой выборки.
Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:
Таблица SEQ Таблица \* ARABIC 8 – предельные ошибки малой выборки
Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента выбирается по соответствующей таблице.
Доверительные интервалы в малой выборке имеют вид:
Значение генеральной средней равно 27,1%. Для всех предложенных вероятностей оно попадает в доверительный интервал, рассчитанный как для малой, так и для большой выборки. Однако, на мой взгляд, к таким результатам привели большие значения предельных ошибок, которые в свою очередь зависят от дисперсии. Но формально можно считать обе выборки достаточно результативными.
Анализ динамики Проанализируем динамику показателя «Среднедушевой доход в месяц, руб.», по Центральному федеральному округу за 2000-2004 годы. Построим ряд динамики:
Таблица SEQ Таблица \* ARABIC 9 – Среднедушевые доходы населения по Центральному федеральному округу в месяц, руб.
Необходимо отметить, что ряд является интервальным и равномерным. Показатели в каждом интервале полностью сопоставимы по единицам измерения и территории.
Показатели ряда динамики и тенденции динамики Наименование показателя
-2
-1
0
1
2
Средние характеристики
Уровень ряда, руб.
3230,60
4299,60
5435,60
7211,30
8999,50
5835,32
Абсолютный прирост (цепной), руб.
…
1069,00
1136,00
1775,70
1788,20
1442,23
Абсолютный прирост (базисный), руб.
0
1069,00
2205,00
3980,70
5768,90
…
Абсолютное ускорение (цепное)
…
…
67,00
639,70
12,50
239,73
Темп роста (цепной),%
…
133,09
126,42
132,67
124,80
129,19
Темп роста (базисный),%
100,00
133,09
168,25
223,22
278,57
…
Темп прироста (цепной),%
…
33,09
26,42
32,67
24,80
29,19
Темп прироста (базисный),%
0
33,09
68,25
123,22
178,57
…
Абсолютное значение 1% прироста (цепного)
…
32,31
43,00
54,36
72,11
…
Таблица SEQ Таблица \* ARABIC 10 – Показатели ряда динамики
Абсолютный цепной прирост показывает изменение значения показателя по отношению к предыдущему периоду, а абсолютный базисный прирост – по отношению к начальному периоду. Цепной темп роста – это соотношение значения показателя в текущем и предыдущем периоде. Видно, что во всех интервалах цепной темп роста больше 100%, следовательно, значение показателя увеличивается. Средний уровень ряда рассчитывается как простая арифметическая, так длина интервалов одинаковая, а показатель выражен в абсолютных величинах. Средний прирост уровня ряда составляет 1442,23 руб. в год. Средний темп прироста равен 29,19%, именно на эту величину в среднем увеличиваются среднедушевые доходы каждый год.
Выбор вида тренда Так как количество уровней в ряду мало, то для выбора вида уравнения динамики можно использовать графический метод или метод наименьших квадратов.
Применим графический метод. Нанесем на поле координат точки, соответствующие значениям признака в каждом периоде. Проведем прямую линию, наиболее точно отражающую тенденцию распределения точек.
На проведенной прямой выберем 2 произвольные точки. Используя их координаты, решим следующую систему уравнений:
a+b* = ;
a+b* = ;
a=, b= .
Уравнение динамики имеет вид: y= + .
Метод наименьших квадратов дает оценку параметров, отвечающую принципам максимального правдоподобия, лишь в том случае, когда распределение в совокупности подчиняется нормальному закону. В нашем случае гипотеза о нормальном характере распределения была отвергнута. Поэтому методу МНК нельзя полностью доверять.
Рассчитаем параметры уравнения прямой линейной зависимости:
5*a+0*b=29176,60
0*a+10*b=14449,5
a=5835,32; b=1444,95; Сумма квадратов отклонений фактических значений признака от теоретических равна 329329,28.
Рассчитаем параметры уравнения параболы:
5*a+0*b+10*c=29176,60
0*a+10*b+0*c=14449,5
10*a+0*b+34*c=60431,3
a=5538,45; b=1444,95; c=148,44. Сумма квадратов отклонений фактических значений признака от теоретических равна 20865,03.
Рассчитаем параметры уравнения третьей степени:
5*a+0*b+10*c+0*d=29176,60
0*a+10*b+0*c+34*d=14449,5
10*a+0*b+34*c+0*d=60431,3
0*a+34*b+0*c+130*d=49062,9
a=5538,45; b=1460,392; c=148,44; d=-4,54. Сумма квадратов отклонений фактических значений признака от теоретических равна 20568,00.
Минимальное значение суммы квадратов отклонений фактических значений признака от теоретических соответствует последнему уравнению. Таким образом, уравнение динамики имеет вид:
y = -4,5417x3 + 148,44x2 + 1460,4x + 5538,4.
Рассчитаем показатели колеблемости, для чего сначала вычислим показатели отклонения от тренда:
Наименование показателя
-2
-1
0
1
2
Уровень ряда (фактический), ед.
3230,60
4299,60
5435,60
7211,30
8999,50
Уровень ряда (теоретический), ед.
3247,74
4231,03
5538,45
7142,73
9016,64
Отклонение фактического уровня ряда от теоретического, ед.
-17,14
68,57
-102,85
68,57
-17,14
Таблица SEQ Таблица \* ARABIC 11 – показатели отклонения от тренда
Таблица 12 – показатели колеблемости
Анализ полученных результатов позволяет сделать вывод о том, что полученная зависимость наилучшим образом аппроксимирует исходные данные. Очень низкие коэффициент аппроксимации, показывающий очень слабую колеблемость тенденции, и относительное линейное отклонение от тренда позволяют использовать тренд для прогнозирования изменения значений показателя среднедушевых денежных доходов в месяц на срок приблизительно 1,5 года.
Заключение В результате проделанной работы по многостороннему исследованию совокупности, состоящей из 88 регионов РФ, по показателю «Доля денежных доходов, расходуемых на прирост финансовых активов, % в 2004г.» можно сделать следующие выводы:
Выяснилось, что лишь 34% регионов имеет показатель ниже среднего, оставшиеся 66 субъектов РФ имеют показатель выше среднего, что свидетельствует о достаточно высоких размерах финансовых активов.
Гипотеза о нормальном характере распределения не подтвердилась вследствие выраженной правосторонней асимметрии
В результате построения ряда динамики по показателю «Среднедушевой денежный доход в месяц, руб. по Центральному федеральному округу за 2000-2004гг.» и его последующего анализа было получено уравнение третьей степени, наилучшим образом описывающее тенденцию динамики:
y = -4,5417x3 + 148,44x2 + 1460,4x + 5538,4. Данное уравнение с большой долей вероятности можно использовать для прогнозирования.
При проведении выборки и анализе выборочных совокупностей установлено, что генеральная средняя попадает во все доверительные интервалы, рассчитанные для вероятностей 0,76; 0,86; 0,88; 0,96 как в малой, так и в большой выборке. Но значительной степени это объясняется не столько высокой репрезентативностью выборок, сколько большим значением предельной ошибки, на которую, в свою очередь, повлияла большая величина дисперсий.
В заключении необходимо отметить, что выполнение данного курсового проекта позволило приобрести навыки по обработке больших массивов статистических данных и их.
Приложение А продолжение
--PAGE_BREAK--