--PAGE_BREAK--
Рис. 2
3. Проверить выполнение предпосылок МНК.
1. Случайный характер остатков (критерий поворотных точек, критерий пиков):
,
где n— количество наблюдений;
m– количество поворотных точек (пиков).
Точка считается поворотной, если она больше предшествующей и последующей (или меньше).
является поворотной точкой
является поворотной точкой
не является поворотной точкой
не является поворотной точкой
не является поворотной точкой
является поворотной точкой
не является поворотной точкой
является поворотной точкой.
m=4
m=4>2, следовательно неравенство выполняется, свойство выполняется.
2. Независимость значений остатков (отсутствие автокорреляции). Критерий Дарбина-Уотсона.
x
y
17
26
24,718
1,282
1,6435
*
22
27
28,523
-1,523
2,3195
7,8680
10
22
19,391
2,609
6,8069
17,0734
7
19
17,108
1,892
3,5797
0,5141
12
21
20,913
0,087
0,0076
3,2580
21
26
27,762
-1,762
3,1046
3,4188
14
20
22,435
-2,435
5,9292
0,4529
7
15
17,108
-2,108
4,4437
0,1069
20
30
27,001
2,999
8,9940
26,0814
3
13
14,064
-1,064
1,1321
16,5080
133
219
*
-0,023
37,9608
75,2816
сравниваем с двумя табличными:
, следовательно, свойство выполняется, остатки независимы.
3. Подчинение остатков нормальному закону (
R/S
критерий).
Расчётный критерий сравниваем с двумя табличными, если расчётный критерий попадает внутрь табличного интервала, то свойство выполняется.
(2,67;3,57)
1,216
4. Проверка равенства М(Е)=0, средняя величина остатков равна 0 (критерий Стьюдента).
Если , то свойство выполняется.
2,2281
, следовательно, свойство выполняется.
5. Гомоскедастичность остатков, то есть дисперсия остатков () одинаково для каждого значения (остатки имеют постоянную дисперсию).
Если дисперсия остатков неодинакова, то имеет место гетероскедастичность.
Если предпосылки не выполняются, то модель нужно уточнять. Применяем тест Голдфельд-Квандта:
1) упорядочить (ранжировать) наблюдения по мере возрастания фактора «Х».
2) исключить d-средних наблюдений.
,
где n– количество наблюдений.
2) разделить совокупность на две группы: с малыми и большими значениями «Х» и для каждой из частей найти уравнение регрессии.
3) найти остаточную сумму квадратов отклонений () для каждого уравнения регрессии.
4) применяют критерий Фишера:
Если , то гетероскедастичность имеет место, то есть пятая предпосылка не выполняется.
Упорядочим наблюдениям по мере возрастания переменной Х:
X
Y
3
13
7
19
7
15
10
22
12
21
14
20
17
22
20
30
21
26
22
27
X5=12; Y5=21 и Х6=14; Y6=20 исключаем.
; n=10
x
y
3
13
9
12,517
0,483
0,2333
7
19
49
17,569
1,431
2,0478
7
15
49
17,569
-2,569
6,5998
10
22
100
21,358
0,642
0,4122
27
69
207
*
-0,013
9,2930
n=4
x
y
17
22
289
23,25
-1,25
1,5625
20
30
400
26,25
3,75
14,0625
21
26
441
27,25
-1,25
1,5625
22
27
484
28,25
-1,25
4,5625
80
105
1614
*
18,75
n=4
, так как
, значит, пятая предпосылка выполняется, следовательно, модель нужно адекватна.
продолжение
--PAGE_BREAK--4. Осуществить проверку значимости параметров уравнения регрессии с помощью
t
-критерия Стьюдента (α=0,05).
;
x
y
17
26
289
24,718
1,282
1,6435
13,69
22
27
484
28,523
-1,523
2,3195
75,69
10
22
100
19,391
2,609
6,8069
1,89
7
19
49
17,108
1,892
3,5797
39,9
12
21
144
20,913
0,087
0,0076
1,69
21
26
441
27,762
-1,762
3,1046
59,29
14
20
196
22,435
-2,435
5,9292
0,49
7
15
49
17,108
-2,108
4,4437
39,69
20
30
400
27,001
2,999
8,9940
44,89
3
13
9
14,064
-1,064
1,1321
106,09
133
219
2161
*
-0,023
37,9608
392,1
, следовательно, параметр значим.
, следовательно, коэффициент регрессии значим.
Интервальная оценка:
а0: 11,781 2,31*1,617
а0: 11,781 3,735
Нижняя граница: 11,781-3,735=8,046
Верхняя граница: 11,781+3,735=15,516
а0: (8,04615,516), следовательно, параметр а0 значим, так как в эти границы не попадает 0.
а1: 0,761 2,31*0,11
а1: 0,7610,2541
Нижняя граница: 0,761-0,254=0,507
Верхняя граница: 0,761+0,254=1,015
а1: (0,5071,015), следовательно, коэффициент регрессии а1 значим, так как в эти границы не попадает 0.
5. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью
F
-критерия Фишера (α=0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Для нахождения коэффициента детерминации найдём коэффициент парной корреляции:
Проверяем значимость по критерию Стьюдента:
, следовательно, значим.
=0,926, то есть связь между переменными yи xочень тесная (то есть близко к 1) и прямая (так как больше 0).
Находим коэффициент детерминации:
, то есть 85,8% — изменение объёма выпуска продукции (зависимой переменной «y») происходит под влиянием объёма капиталовложений (фактора «х», включённого в модель).
Значимость уравнения регрессии по критерию Фишера:
, следовательно, уравнение регрессии значимо, модель адекватна.
Средняя относительная ошибка аппроксимации:
x
y
17
26
24,718
1,282
0,0493
22
27
28,523
-1,523
0,0564
10
22
19,391
2,609
0,1186
7
19
17,108
1,892
0,0996
12
21
20,913
0,087
0,0041
21
26
27,762
-1,762
0,0678
14
20
22,435
-2,435
0,1218
7
15
17,108
-2,108
0,1405
20
30
27,001
2,999
0,1000
3
13
14,064
-1,064
0,0818
133
219
*
-0,023
0,7332
Так как , значит модель не достаточно точная.
F-критерий намного больше табличного значения, коэффициент детерминации очень близок к 1, а относительная ошибка аппроксимации составляет 7,33%. На основании рассчитанных критериев можно сделать вывод о хорошем качестве модели.
6. Осуществить прогнозирование среднего значения показателя
Y при уровне значимости α=0,1, если прогнозное значение фактора
X составляет 80% от его максимального значения.
— прогноз факторного признака (объема капиталовложений).
— точечный прогноз.
(17,6; 25,2) – точка должна лежать на графике модели.
Интервальный прогноз:
25,21,861,81
25,23,37
Нижняя граница: 25,2-3,37=21,83
Верхняя граница: 25,2+3,37=28,57
То есть при уровне значимости =0,1, если прогнозное значение фактора «Х» составит 80% от его максимального значения или 17,6, точечный прогноз среднего значения «Y» по линейной модели составит 25,2. Доверительный интервал: 21,8328,57.
7. Представить графически фактические и модельные значения
Y
точки прогноза рис. 3.
Рис. 3
8. Составить уравнения нелинейной регрессии:
· Гиперболической;
· Степенной;
· Показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации, коэффициенты эластичности и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Уравнение степенной модели парной регрессии:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведём логарифмирование обеих частей уравнения:
Обозначим , , . Тогда уравнение примет вид продолжение
--PAGE_BREAK--