Всероссийскийзаочный финансово-экономический институт
Лабораторнаяработа
по дисциплине«Эконометрика»
Брянск 2010
Задание
В таблице 1 представленыданные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь1996г.).
Таблица 1 – Исходныеданные№ п/п Х1 Х2 Х3 Х4 Х5 Х6 Х7 Х8 У 1 1 1 39 20 8,2 1 15,9 2 3 1 68,4 40,5 10,7 1 27 3 1 1 34,8 16 10,7 1 12 13,5 4 1 1 39 20 8,5 1 12 15,1 5 2 1 54,7 28 10,7 1 12 21,1 6 3 1 74,7 46,3 10,7 1 12 28,7 7 3 1 71,7 45,9 10,7 27,2 8 3 1 74,5 47,5 10,4 28,3 9 4 1 137,7 87,2 14,6 1 52,3 10 1 1 40 17,7 11 1 1 8 22 11 2 1 53 31,1 10 1 1 8 28 12 3 1 86 48,7 14 1 1 8 45 13 4 1 98 65,8 13 1 1 8 51 14 2 1 62,6 21,4 11 1 1 34,4 15 1 1 45,3 20,6 10,4 1 1 8 24,7 16 2 1 56,4 29,7 9,4 1 1 8 30,8 17 1 1 37 17,8 8,3 1 15,9 18 3 1 67,5 43,5 8,3 1 29 19 1 1 37 17,8 8,3 1 3 15,4 20 3 1 69 42,4 8,3 1 3 28,6 21 1 1 40 20 8,3 15,6 22 3 1 69,1 41,3 8,3 1 27,7 23 2 1 38,1 35,4 13 1 1 20 34,1 24 2 1 75,3 41,4 12,1 1 1 20 37,7 25 3 1 83,7 48,5 12,1 1 1 20 41,9 26 1 1 48,7 22,3 12,4 1 1 20 24,4 27 1 1 39,9 18 8,1 1 21,3 28 2 1 68,6 35,5 17 1 1 12 36,7 29 1 1 39 20 9,2 1 21,5 30 2 1 48,6 31 8 1 26,4 31 3 1 98 56 22 1 53,9 32 2 1 68,5 30,7 8,3 1 1 6 34,2 33 2 1 71,1 36,2 13,3 1 1 6 35,6 34 3 1 68 41 8 1 1 12 34 35 1 1 38 19 7,4 1 1 12 19 36 2 1 93,2 49,5 14 1 1 12 46,6 37 3 1 117 55,2 25 1 1 12 58,5 38 1 2 42 21 10,2 1 12 24,2 39 2 2 62 35 11 1 12 35,7 40 3 2 89 52,3 11,5 1 1 12 51,2 41 4 2 132 89,6 11 1 1 12 75,9 42 1 2 40,8 19,2 10,1 1 1 6 21,2 43 2 2 59,2 31,9 11,2 1 1 6 30,8 44 3 2 65,4 38,9 9,3 1 1 6 34 45 2 2 60,2 36,3 10,9 1 1 12 31,9 46 3 2 82,2 49,7 13,8 1 1 12 43,6 47 3 2 98,4 52,3 15,3 1 1 12 52,2 48 3 3 76,7 44,7 8 1 1 43,1 49 1 3 38,7 20 10,2 1 1 6 25 50 2 3 56,4 32,7 10,1 1 1 6 35,2 51 3 3 76,7 44,7 8 1 1 6 40,8 52 1 3 38,7 20 10,2 1 18,2 53 1 3 41,5 20 10,2 1 1 20,1 54 2 3 48,8 28,5 8 1 22,7 55 2 3 57,4 33,5 10,1 1 1 27,6 56 3 3 76,7 44,7 8 1 1 36 57 1 4 37 17,5 8,3 1 7 17,8 58 2 4 54 30,5 8,3 1 7 25,9 59 3 4 68 42,5 8,3 1 7 32,6 60 1 4 40,5 16 11 1 3 19,8 61 2 4 61 31 11 1 3 29,9 62 3 4 80 45,6 11 1 3 39,2 63 1 3 52 21,2 11,2 1 1 18 22,4 64 2 3 78,1 40 11,6 1 1 18 35,2 65 3 3 91,6 53,8 16 1 18 41,2 66 1 4 39,9 19,3 8,4 1 6 17,8 67 2 4 56,2 31,4 11,1 1 6 25 68 3 4 79,1 42,4 15,5 1 6 35,2 69 4 4 91,6 55,2 9,4 1 6 40,8
Принятые в таблицеобозначения:
Y – цена квартиры, тыс.долл.;
Х1 – число комнат вквартире;
Х2 – район города (1 –Приморский, Шувалово-Озерки, 2 – Гражданка, 3 – Юго-запад, 4 — Красносельский);
Х3 – общая площадьквартиры (м2);
Х4 – жилая площадьквартиры (м2);
Х5 – площадь кухни (м2);
Х6 – тип дома (1 –кирпичный, 0 — другой);
Х7 – наличие балкона (1 –есть, 0 — нет);
Х8 – число месяцев доокончания срока строительства.
1) Введите фиктивнуюпеременную z, отражающую местоположение квартирыи позволяющую разделить всю совокупность квартир на две группы: квартиры насевере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города(Юго-запад, Красносельский район).
2) Составьте матрицупарных коэффициентов корреляции исходных переменных. Вместо переменной х2используйте фиктивную переменную z.
3) Постройте уравнениерегрессии, характеризующее зависимость цены от всех факторов в линейной форме.Установите, какие факторы мультиколлинеарны.
4) Постройте модель у = f(х3, х6, х7,х8, z) в линейнойформе. Какие факторы значимо воздействуют на формирование цены квартиры в этоймодели?
5) Существует ли разницав ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
6) Оцените статистическуюзначимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнениярегрессии проверьте с помощью F-критерияФишера; оцените качество уравнения регрессии с помощью коэффициентадетерминации R2.
Решение
1) Введем фиктивнуюпеременную Z вместо Х2, отражающую местоположениеквартиры и позволяющую разделить всю совокупность квартир на две группы. Первые47 квартир относятся к северной части города (Приморский район,Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной частигорода (Юго-запад, Красносельский район). Составим матрицу парных коэффициентовкорреляции исходных переменных.Х1 Z Х3 Х4 Х5 Х6 Х7 Х8 У 1 1 39 20 8,2 1 15,9 3 1 68,4 40,5 10,7 1 27 1 1 34,8 16 10,7 1 12 13,5 1 1 39 20 8,5 1 12 15,1 2 1 54,7 28 10,7 1 12 21,1 3 1 74,7 46,3 10,7 1 12 28,7 3 1 71,7 45,9 10,7 27,2 3 1 74,5 47,5 10,4 28,3 4 1 137,7 87,2 14,6 1 52,3 1 1 40 17,7 11 1 1 8 22 2 1 53 31,1 10 1 1 8 28 3 1 86 48,7 14 1 1 8 45 4 1 98 65,8 13 1 1 8 51 2 1 62,6 21,4 11 1 1 34,4 1 1 45,3 20,6 10,4 1 1 8 24,7 2 1 56,4 29,7 9,4 1 1 8 30,8 1 1 37 17,8 8,3 1 15,9 3 1 67,5 43,5 8,3 1 29 1 1 37 17,8 8,3 1 3 15,4 3 1 69 42,4 8,3 1 3 28,6 1 1 40 20 8,3 15,6 3 1 69,1 41,3 8,3 1 27,7 2 1 38,1 35,4 13 1 1 20 34,1 2 1 75,3 41,4 12,1 1 1 20 37,7 3 1 83,7 48,5 12,1 1 1 20 41,9 1 1 48,7 22,3 12,4 1 1 20 24,4 1 1 39,9 18 8,1 1 21,3 2 1 68,6 35,5 17 1 1 12 36,7 1 1 39 20 9,2 1 21,5 2 1 48,6 31 8 1 26,4 3 1 98 56 22 1 53,9 2 1 68,5 30,7 8,3 1 1 6 34,2 2 1 71,1 36,2 13,3 1 1 6 35,6 3 1 68 41 8 1 1 12 34 1 1 38 19 7,4 1 1 12 19 2 1 93,2 49,5 14 1 1 12 46,6 3 1 117 55,2 25 1 1 12 58,5 1 1 42 21 10,2 1 12 24,2 2 1 62 35 11 1 12 35,7 3 1 89 52,3 11,5 1 1 12 51,2 4 1 132 89,6 11 1 1 12 75,9 1 1 40,8 19,2 10,1 1 1 6 21,2 2 1 59,2 31,9 11,2 1 1 6 30,8 3 1 65,4 38,9 9,3 1 1 6 34 2 1 60,2 36,3 10,9 1 1 12 31,9 3 1 82,2 49,7 13,8 1 1 12 43,6 3 1 98,4 52,3 15,3 1 1 12 52,2 3 76,7 44,7 8 1 1 43,1 1 38,7 20 10,2 1 1 6 25 2 56,4 32,7 10,1 1 1 6 35,2 3 76,7 44,7 8 1 1 6 40,8 1 38,7 20 10,2 1 18,2 1 41,5 20 10,2 1 1 20,1 2 48,8 28,5 8 1 22,7 2 57,4 33,5 10,1 1 1 27,6 3 76,7 44,7 8 1 1 36 1 37 17,5 8,3 1 7 17,8 2 54 30,5 8,3 1 7 25,9 3 68 42,5 8,3 1 7 32,6 1 40,5 16 11 1 3 19,8 2 61 31 11 1 3 29,9 3 80 45,6 11 1 3 39,2 1 52 21,2 11,2 1 1 18 22,4 2 78,1 40 11,6 1 1 18 35,2 3 91,6 53,8 16 1 18 41,2 1 39,9 19,3 8,4 1 6 17,8 2 56,2 31,4 11,1 1 6 25 3 79,1 42,4 15,5 1 6 35,2 4 91,6 55,2 9,4 1 6 40,8
2) Проведемкорреляционный анализ на выявление зависимости Y от представленных факторов в среде «СтатЭксперт».
Протокол корреляционногоанализа
/>
Главная цель анализаданных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимыхпеременных, имеющих высокий уровень корреляции между собой.
Критическое значениекоэффициента корреляции rкр = 0,2002. Это означает, что всекоэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрамисчитается незначимой.
Влияние независимойпеременной Х3, Х4, включенной в исследование, имеетвысокий уровень (r > 0,7),причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).
Х5 оказываетумеренное положительное влияние на величину Y (rух5 = 0,303).
Х1, Х2,Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6= = -0,104, rух7 = 0,119, rух8 = -0,005).
3) Построим уравнениерегрессии, характеризующее зависимость цены от всех факторов, в линейной форме.
Линейная регрессия
/>
Уравнение будет иметьвид:
у(х) = -0,505 – 0,966х1+ 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5+ 5,835х6 + 1,244х7 – 0,011х8
Линейная или близкая кней связь между факторами называется мультиколлинеарностью. Считают явлениемультиколлинеарности в исходных данных установленным, если коэффициент парнойкорреляции между двумя переменными больше 0,7.
Рассмотрим матрицу парныхкоэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.
Матрица парных корреляций
/>
Явление сильнойколлинеарности наблюдается между факторами:
Х1 и Х3,т.к. rх1х3 = 0,872 > 0,7
Х1 и Х4,т.к. rх1х4 = 0,917 > 0,7
Х3 и Х4,т.к. rх3х4 = 0,966 > 0,7
4) Построим модель у = f (х3, х6, х7,х8, z) в линейнойформе.
/>
Результаты регрессионногоанализа
/>
Модель в линейной формебудет иметь вид:
у(х) = -5,64 + 0,715х2+ 0,475х3 + 6,786х6 + 1,284х7 – 0,037х8
Х6 (тип дома),значимо воздействует на формирование цены квартиры в модели.
5) Оценим статистическуюзначимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессиипроверим с помощью F-критерия; оценимкачество уравнения регрессии с помощью коэффициента детерминации R2.
Характеристика остатковлинейной регрессииХарактеристика Значение Среднее значение 0,000 Дисперсия 10,579 Приведенная дисперсия 12,220 Средний модуль остатков 2,237 Относительная ошибка 7,144 Критерий Дарбина-Уотсона 1,154 Коэффициент детерминации 0,991 F — значение ( n1 = 8, n2 = 58) 764,697 Критерий адекватности 36,993 Критерий точности 47,492 Критерий качества 44,867 Уравнение значимо с вероятностью 0.95
Коэффициент детерминациипоказывает долю вариации результативного признака под воздействием изучаемыхфакторов. Следовательно, около 99,1% вариации зависимой переменной учтено вмодели и обусловлено влиянием включенных факторов.
Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверкагипотезы о значимости уравнения регрессии проводится на основании:
если Fфакт > Fкрит, то модель статистически значима;
если Fфакт
Fфакт > Fкрит, значит модель статистически значима, т.е. пригодна киспользованию.
Оценим с помощью t-критерия Стьюдента статистическуюзначимость коэффициентов уравнения регрессии.
Табличное значение t-критерия при 5% уровне значимости истепени свободы k = 69-8-1 = 60 составляет2,0003.
Если tрасч > tтабл, то коэффициент статистически значим.
Характеристика модели Коэффициенты Стандартная ошибка t-статистика Y-пересечение -6,10491 1,867676003 -3,268720937 Переменная Х 1 -0,16426 1,096321271 -0,149825399 Переменная Х 2 0,744173 0,335026167 2,221237839 Переменная Х 3 0,36827 0,092869614 3,965447278 Переменная Х 4 0,147869 0,132602783 1,115126788 Переменная Х 5 0,177213 0,195399452 0,906925347 Переменная Х 6 6,93635 0,869661345 7,975921084 Переменная Х 7 1,777648 1,124095736 1,581402513 Переменная Х 8 -0,04802 0,072432334 -0,662966567
tb0= 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb1 = 0,1498 коэффициент регрессии b0 статистически незначим;
tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb4 = 1,1151 коэффициент регрессии b0 статистически незначим;
tb5 = 0,9069 коэффициент регрессии b0 статистически незначим;
tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;
tb7 = 1,5814 коэффициент регрессии b0 статистически незначим;
tb7 = 0,6630 коэффициент регрессии b0 статистически незначим;
6) существует ли разницав ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?
tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003,
значит факторы Х2 (районгорода), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют наформирование цен на квартиры.
Анализ показал, чторазница в ценах на квартиры, расположенные в северной и южной частяхСанкт-Петербурга существенна, т.к. tb2= 2,2212 > 2,0003.