По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1998 г.
Район
Потребительские расходы в расчете на душу населения тыс. руб. у
Средняя заработная плата и выплаты социального характера, тыс. руб., х
Волго-Вятский район
Респ. Марий Эл
302
554
Респ. Мордовия
360
560
Чувашская респ.
310
545
Кировская обл.
415
672
Нижегородская обл.
452
496
Центрально-Черноземный
Белгородская обл.
502
777
Воронежская обл.
355
632
Курская обл.
416
688
Липецкая обл.
501
833
Тамбовская обл.
403
577
Поволжский
Респ. Калмыкия
208
584
Респ. Татарстан
462
949
Астраханскаяобл.
368
888
Волгоградская обл.
399
831
Пензенская обл.
342
562
Саратовская обл.
354
665
Ульяновская обл.
558
705
Задание
1. Постройте поле корреляции и сформируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Рассчитайте коэффициент эластичности.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости =0,05.
8. Оцените полученные результаты.
Построим поле корреляции:
/>
В данном случае можно сформулировать гипотезу о наличии связи между расходами и заработной платы, носящей скорее всего гиперболический характер.
1.1 Построить линейную модель.
О/>
пределим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1 приложения.
Можно сказать, что связь между размером потребительских расходов и средней заработной платы и выплат социального характера.
У/>
равнение линейной регрессии имеет вид:
Значения параметров линейной модели определим, используя данные таблицы 1.
/>, />.
У/>
равнение регрессии имеет вид:
Рассчитаем коэффициент детерминации:
/>
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера.
F/>
> Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15, то уравнение регрессии с вероятностью 0,95 в целом статистически значимое.
Определим среднюю ошибку:
/>
В среднем расчетные значения ý для линейной модели отличаются от фактических значений на 4,04%.
1.2 Построение степенной модели парной регрессии
Уравнение степенной регрессии имеет вид:
Д/>
ля построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Д/>
анные приведены в таблице 2 приложения.
Обозначим Y=lgŷ, X=lg x, A=lga.
Тогда уравнение примет вид: Y=A+bX-линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
/>
A=0,001
Уравнение регрессии будет иметь вид: Y=0,001+0,915X
Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=10-0,001*х0,915
Получим уравнение степенной модели регрессии: Ŷ=0,998*х0,915
Определим индекс корреляции:
С/>
вязь между показателем у и фактором х можно считать достаточно сильной. Коэффицент детерминации равен R2=r2XY=0,728
Рассчитаем критерий Фишера.
F/>
> Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15
Средняя относительная ошибка
В/>
среднем расчетные значения ý для степенной модели отличаются от фактических значений на 1,28%.
1.3 Построение экспоненциальной функции
Ŷ=аbx
Для построения этой модели необходимо провести линериаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения.
Lgŷ=lga+xlgb
Обозначим Y=lgŷ, B=lgb, A=lga
Получим линейное уравнение регрессии:
Y=A+Bx
Рассчитаем его параметры, используя данные таблицы 4 приложения.
/>, />.
Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=100,026*(100,004)x=1,06*1,01x
О/>
пределим индекс корреляции:
Связь между показателем у и фактором х можно считать недостаточно сильной. Коэффицент детерминации равен R2=r2XY=0,404
Р/>
ассчитаем критерий Фишера.
F Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15
У/>
равнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F> Fтабл.
Средняя относительная ошибка
В среднем расчетные значения ý для экпоненциальной модели отличаются от фактических значений на 5,16%.
1.4 Построение гиперболической функции
Уравнение гиперболической функции:
Ŷ=a+b/x
Проведем линеаризацию модели путем замены Х=1/х. В результате получим линейное уравнение ŷ=a+bX
Рассчитаем его параметры по данным таблицы 5.
/>, />.
Получим следующее уравнение гиперболической модели:
Ŷ=31,001+215709,49/х
/>
Определим индекс детерминации:r2=0,951
Вариация результата Y на 95,1% объясняется вариацией фактора Х.
Р/>
ассчитаем критерий Фишера.
F Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15
Средняя относительная ошибка: 0,067*44,106=2,955%
В среднем расчетные значения ý для гиперболической модели отличаются от фактических значений на 2,955%.
1.5 Выбор лучшей модели
Для выбора лучшей модели построим сводную таблицу результатов
Коэффициент детерминации
F-критерий Фишера
Индекс корреляции
Средняя относительная ошибка
Линейная
0,346
7,9
0,588
4,04
Степенная
0,728
40,2
0,924
1,28
Экспоненциальная
0,636
0,404
10,17
5,16
Гиперболическая
0,951
291,1
0,975
2,955
Наибольшее значение коэффициента детерминации и критерия Фишера имеет гиперболическая модель. Она же имеет практически наименьшую среднюю относительную ошибку, значит, ее можно взять в качестве лучшей для построения прогноза.
1.6 Расчет прогнозного значения результативного показателя.
/>.
Подставим значение xр в уравнение гиперболической регрессии:
Ŷ=31,001+215709,49/х
/>
Доверительный интервал прогноза для уровня значимости определяется в виде:
/>
где
/>
Рассчитаем необходимые величины:
/>;
/>
/>;
/>; />;
/>.
В результате доверительный интервал прогноза для уровня значимости 0,05 равен:
505,8-0,275*145,8 />.
465,7/>
8. Полученные результаты, в целом удовлетворительные. Модель гиперболической парной регрессии описывает реальную зависимость рассматриваемыми показателями.