ВАРИАНТ 5
Изучается зависимость средней ожидаемойпродолжительности жизни от нескольких факторов по данным за 1995 г., представленным в табл. 5.
Таблица 5
Страна
Y
X1
X2
X3
X4 Мозамбик 47 3,0 2,6 2,4 113 Бурунди 49 2,3 2,6 2,7 98 …………………………………………………………………………………….. Швейцария 78 95,9 1,0 0,8 6
Принятые в таблице обозначения:
· Y— средняя ожидаемая продолжительностьжизни при рождении, лет;
· X1— ВВП в паритетах покупательной способности;
· X2— цепныетемпы прироста населения, %;
· X3— цепныетемпы прироста рабочей силы, %;
· Х4 — коэффициент младенческой смертности, %.
Требуется:
1. Составить матрицупарных коэффициентов корреляции между всеми исследуемыми переменными и выявитьколлинеарные факторы.
2. Построитьуравнение регрессии, не содержащее коллинеарных факторов. Проверитьстатистическую значимость уравнения и его коэффициентов.
3. Построитьуравнение регрессии, содержащее только статистически значимые и информативныефакторы. Проверить статистическую значимость уравнения и его коэффициентов.
Пункты 4 — 6 относятся к уравнению регрессии,построенному при выполнении пункта 3.
4. Оценить качествои точность уравнения регрессии.
5. Датьэкономическую интерпретацию коэффициентов уравнения регрессии и сравнительнуюоценку силы влияния факторов на результативную переменную Y.
6. Рассчитатьпрогнозное значение результативной переменной Y, если прогнозныезначения факторов составят 75 % от своих максимальных значений. Построитьдоверительный интервал прогноза фактического значения Y c надежностью 80%.
Решение. Для решения задачи используется табличный процессор EXCEL.
1.С помощью надстройки «Анализ данных… Корреляция» строимматрицу парных коэффициентов корреляции между всеми исследуемыми переменными(меню «Сервис» ® «Анализданных…» ® «Корреляция»).На рис. 1изображена панель корреляционного анализа сзаполненными полями[1]. Результаты корреляционногоанализа приведены в прил. 2 и перенесены в табл. 1.
/>
рис.1. Панелькорреляционного анализа
Таблица 1
Матрица парных коэффициентов корреляции
Y
X1
X2
X3
X4 Y 1 X1 0,780235 1 X2 -0,72516 -0,62251 1 X3 -0,53397 -0,65771
0,874008 1 X4 -0,96876 -0,74333 0,736073 0,55373 1
Анализ межфакторных коэффициентов корреляции показывает,что значение 0,8 превышает по абсолютной величине коэффициент корреляциимежду парой факторов Х2–Х3 (выделен жирнымшрифтом). Факторы Х2–Х3 таким образом, признаютсяколлинеарными.
2. Как было показано в пункте 1, факторы Х2–Х3являются коллинеарными, а это означает, что они фактически дублируют другдруга, и их одновременное включение в модель приведет к неправильнойинтерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х2имеет больший по модулю коэффициент корреляции с результатом Y, чем фактор Х3: ry,x2=0,72516; ry,x3=0,53397; |ry,x2|>|ry,x3| (см. табл.1). Это свидетельствует о более сильном влиянии фактора Х2 наизменение Y. Фактор Х3, такимобразом, исключается из рассмотрения.
Для построения уравнения регрессии значения используемых переменных (Y,X1, X2, X4) скопируем на чистый рабочий лист (прил. 3).Уравнение регрессии строим с помощью надстройки «Анализ данных… Регрессия»(меню «Сервис» ® «Анализданных…» ® «Регрессия»).Панель регрессионного анализа с заполненными полями изображена на рис. 2.
Результаты регрессионного анализа приведены в прил. 4 и перенесеныв табл. 2. Уравнение регрессии имеет вид (см. «Коэффициенты» втабл. 2):
ŷ = 75.44 + 0.0447 · x1 — 0.0453 · x2 — 0.24 · x4
Уравнение регрессии признается статистически значимым, так как вероятностьего случайного формирования в том виде, в котором оно получено, составляет 1.04571·10-45 (см. «ЗначимостьF» втабл. 2), что существенно ниже принятого уровнязначимости a=0,05.
Вероятность случайного формирования коэффициентов при факторе Х1ниже принятого уровня значимости a=0,05 (см. «P-Значение» втабл. 2), чтосвидетельствует о статистической значимости коэффициентов и существенном влиянииэтих факторов на изменение годовой прибыли Y.
Вероятность случайного формирования коэффициентов при факторахХ2и Х4 превышает принятый уровень значимости a=0,05 (см. «P-Значение» втабл. 2), и эти коэффициенты не признаются статистически значимыми.
/>
рис. 2. Панель регрессионного анализамодели Y(X1,X2,X4)
Таблица 2
Результаты регрессионного анализа модели Y(X1, X2, X4)Регрессионная статистика Множественный R 0,97292594 R-квадрат 0,946584884 Нормированный R-квадрат 0,944359254 Стандартная ошибка 2,267611945 Наблюдения 76