--PAGE_BREAK--1.4. Типичный пример анализа экономических процессов
с использованием пространственных данных
По 28 предприятиям концерна изучается зависимость дневной выработки (ед.) у от уровня механизации труда (%) х по следующим данным (табл. 2).
Таблица 2
продолжение
--PAGE_BREAK--
При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excelдля этого можно использовать средство Мастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы – Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.
Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:
1) щелкнуть правой кнопкой мыши по ряду данных;
2) в динамическом меню выбрать команду Добавить линию тренда. На экране появится окно Линия тренда (рис. 2);
3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;
4) перейти на вкладку Параметры. В поле Показать уравнение на диаграмме установить подтверждение;
5) в случае необходимости можно задать остальные параметры.
Рис. 2. Диалоговое окно для выбора типа тренда
Изобразим полученную зависимость графически точками координатной плоскости (рис. 3). Такое изображение статистической зависимости называется полем корреляции.
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными х и у.
По данным табл. 2 найдем уравнение регрессии у по х. Расчеты произведем в Excel по формулам (7)–(13), промежуточные вычисления представим в табл. 3.
Рис. 3. Поле корреляции
Таблица 3
--PAGE_BREAK--
Итак, уравнение регрессии у по х:
= -19,37 + 0,74x.
Из полученного уравнения регрессии следует, что при увеличении уровня механизации х на 1% выработка у увеличивается в среднем на 0,74 ед.
По исходным данным вычислим коэффициент корреляции.
Расчеты произведем в Excel, промежуточные вычисления см. табл. 3 и формулы (15), (16).
= 0,954,
т.е. связь между переменными тесная.
Оценим на уровне значимости a= 0,05 значимость уравнения регрессии у по х.
1-й способ. Используя данные табл. 4 вычислим необходимые суммы по формулам табл. 1:
= 6715,71 (см. столбец 6);
QR= = 6108,09 (см. столбец 7);
Qe= Q-QR= 6715,71 – 6108,09 = 607,63
Таблица 4
--PAGE_BREAK--
F= = 261,36.
По статистическим таблицам F-распределения F0,05;1;26= 4,22. Так как
F> F0,05;1;26, то уравнение регрессии значимо.
2-й способ. Учитывая, что b1= 0,739, = 11170,43
(табл. 4), = =23,37 (табл. 4), по формуле (26)
t= = 16,17.
По таблице t-распределения t0,95;26= 2,06. Так как t> t0,95;26, то коэффициент регрессии b1, а значит, и уравнение парной линейной регрессии значимо.
Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR= 6108,09, Q= 6715,71. По формуле (28) = 0,9095 (или R2= r2 = 0,9542 = 0,9095). Это означает, что изменения зависимой переменной у – дневная выработка – на 90% объясняется вариацией объясняющей переменной х – уровнем механизации.
Найдем 95%-ные доверительные интервалы для индивидуального значения прибыли при уровне механизации равной 65%.
Ранее было получено уравнение регрессии
= -19,37 + 0,74x.
Чтобы построить доверительный интервал для индивидуального значения , найдем точечное значение признака = -19,37 + 0,74∙65 = 28,718.
Затем найдем дисперсию оценки:
=23,370= 0,839
и = 0,916.
Далее искомый доверительный интервал получим по (29):
28,718 – 2,06∙0,916 £ £28,718 + 2,06∙0,916
26,832 £ £30,604
Таким образом, дневная выработка при уровне механизации равной 65% с надежностью 0,95 находится в пределах от 26,832 ед. до
30,604 ед.
Найдем 95%-ный доверительный интервал для параметра b1.
По формуле (30)
0,74 – 2,06£b1£0,74 + 2,06,
0,645 £b1£0,834,
т.е. с надежностью 0,95 при изменении уровня механизации xна 1% дневная выработка yбудет изменяться на величину, заключенную в интервале от 0,645 до 0,834 (ед.).
Исследуем полученную модель на наличие гетероскедастичности.
Тест Голфреда
-
Квандта.
Упорядочим п наблюдений по мере возрастания переменной х. Исключим из рассмотрения С= 6 центральных наблюдений (условие
(п -С)/2 = (28 – 6)/2 = 11 > р = 1 выполняется). Разделим совокупность из (п -С) = (28 – 6) = 22 наблюдений на две группы (соответственно с малыми и большими значениями фактора хпо 11 наблюдений) и определим по каждой из групп уравнения регрессии. Для первой группы оно составит = -3,70 + 0,39x. Для второй группы: = 1,16 + 53,11x. Определим остаточные суммы квадратов для первой (S1) и второй (S2) групп. Промежуточные расчеты занесем в табл. 5.
--PAGE_BREAK--