1
Санкт-Петербургский институт машиностроения
Курсовая работа
по дисциплине Статистика
на тему
Автокорреляционная функция. Примеры расчётов
Выполнил
Студент курса
группы
отделения
Руководитель
Санкт-Петербург
2007
Коэффициент автокорреляции и его оценка
Для полной характеристики случайного процесса недостаточно его математического ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых наблюдений понятие «связанного ряда»: вероятность возникновения на определенном месте тех или иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации -
g (k) = E[(x(t) - m)(x(t + k) - m)] -
и автокорреляции
r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,
где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t1),x(t2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t1, t2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как [5, 312]
r (k) = g (k) /g (0),
откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t. Коэффициент автокорреляции может быть оценен и для нестационарного ряда, но в этом случае его вероятностная интерпретация теряется.
В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):
Наиболее важным из различных коэффициентов автокорреляции является первый - r1, измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).
Распределение коэффициентов автокорреляции неизвестно, позтому для оценки их достоверности иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику [4, 112]
t = r1 (n -1)0.5 ,
которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).
Автокорреляционные функции
Последовательность коэффициентов корреляции rk, где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).
Вид выборочной автокорреляционной функции тесно связан со структурой ряда.
· Автокорреляционная функция rk для «белого шума», при k >0, также образует стационарный временной ряд со средним значением 0.
· Для стационарного ряда АКФ быстро убывает с ростом k. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой [3, 268].
· В случае выраженной сезонности в графике АКФ также присутствуют выбросы для запаздываний, кратных периоду сезонности, но эти выбросы могут быть завуалированы присутствием тренда или большой дисперсией случайной компоненты.
Рассмотрим примеры автокорреляционной функции:
· на рис. 1 представлен график АКФ, характеризующегося умеренным трендом и неясно выраженной сезонностью;
· рис. 2 демонстрирует АКФ ряда, характеризующегося феноменальной сезонной детерминантой;
· практически незатухающий график АКФ ряда (рис. 3) свидетельствует о наличии отчетливого тренда.
Рис 1.
Рис 2.
Рис 3.
В общем случае можно предполагать, что в рядах, состоящих из отклонений от тренда, автокорреляции нет. Например, на рис. 4 представлен график АКФ для остатков, полученных от сглаживания ряда, очень напоминающий процесс «белого шума». Однако нередки случаи, когда остатки (случайная компонента h ) могут оказаться автокоррелированными, например, по следующим причинам [1, 172]:
· в детерминированных или стохастических моделях динамики не учтен существенный фактор фактически, нарушен принцип омнипотентности
· в модели не учтено несколько несущественных факторов, взаимное влияние которых оказывается существенным вследствие совпадения фаз и направлений их изменения;
· выбран неправильный тип модели (нарушен принцип контринтуитивности);
· случайная компонента имеет специфическую структуру.
Рис 4.
Критерий Дарбина-Уотсона
Критерий Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.
Численное значение коэффициента равно
d = [(e(2)-e(1))2 + ... + (e(n)-e(n -1))2]/[e(1)2 + ... + e(n)2],
где e(t) - остатки.
Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).
Значение d близко к величине 2*(1 - r1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие - отрицательной [2, 193].
Например, после сглаживания ряда ряд остатков имеет критерий d = 1.912. Аналогичная статистика после сглаживания ряда - d = 1.638 - свидетельствует о некоторой автокоррелированности остатков.
Пример 1. ВВП РФ
Приведем данные о ВВП РФ
Год |
квартал |
ВВП |
первая разность |
|
2001 |
I |
1900,9 |
|
|
II |
2105,0 |
204,1 |
||
III |
2487,9 |
382,9 |
||
IV |
2449,8 |
-38,1 |
||
2002 |
I |
2259,5 |
-190,3 |
|
II |
2525,7 |
266,2 |
||
III |
3009,2 |
483,5 |
||
IV |
3023,1 |
13,9 |
||
2003 |
I |
2850,7 |
-172,4 |
|
II |
3107,8 |
257,1 |
||
III |
3629,8 |
522,0 |
||
IV |
3655,0 |
25,2 |
||
2004 |
I |
3516,8 |
-138,2 |
|
II |
3969,8 |
453,0 |
||
III |
4615,2 |
645,4 |
||
IV |
4946,4 |
331,2 |
||
2005 |
I |
4479,2 |
-467,2 |
|
II |
5172,9 |
693,7 |
||
III |
5871,7 |
698,8 |
||
IV |
6096,2 |
224,5 |
||
2006 |
I |
5661,8 |
-434,4 |
|
II |
6325,8 |
664,0 |
||
III |
7248,1 |
922,3 |
||
IV |
7545,4 |
297,3 |
||
2007 |
I |
6566,2 |
-979,2 |
|
II |
7647,5 |
1081,3 |
Исследуем ряд
На диаграммах показаны: исходный ряд (сверху) и автокорреляционная функция до лага 9 (снизу). На нижней диаграмме штриховой линией обозначен уровень «белого шума» - граница статистической значимости коэффициентов корреляции. Видно, что имеется сильная корреляция 1 и 2 порядка, соседних членов ряда, но и удаленных на 1 единицу времени друг от друга. Корреляционные коэффициенты значительно превышают уровень «белого шума». По графику автокорреляции видим наличие четкого тренда.
Ниже даны значения автокорреляционной функции и уровня белого шума
|
АКФ(...) |
Ошибка АКФ |
||
1 |
0,856 |
0,203 |
-0,203 |
|
2 |
0,762 |
0,616 |
-0,616 |
|
3 |
0,658 |
0,747 |
-0,747 |
|
4 |
0,550 |
0,831 |
-0,831 |
|
5 |
0,418 |
0,885 |
-0,885 |
|
6 |
0,315 |
0,915 |
-0,915 |
|
7 |
0,224 |
0,932 |
-0,932 |
|
8 |
0,131 |
0,940 |
-0,940 |
Если нас интересует внутренняя динамика ряда необходимо найти первую разность его членов, т.е. для каждого квартала найти изменение значения по сравнению с предыдущим кварталом. Для первой разности построим автокорреляционную функцию.
Статистика Дарбина-Ватсона (DW) =1,813 |
|
DW Up= 1,450 |
|
DW Low=1,290 |
Статистика Дарбина-Уотсона показывает, что автокорреляции 1-го порядка нет. По графику можно видеть, что первые разности возрастают, т.к. тренд восходящий. Видна автокорреляция 2 и 4-го порядков, что говорит о полугодовой и годовой сезонности. Значения функции и границы для «белого шума» представлены ниже
|
АКФ(...) |
Ошибка АКФ |
||
1 |
-0,203 |
0,392 |
-0,392 |
|
2 |
-0,530 |
0,416 |
-0,416 |
|
3 |
-0,003 |
0,513 |
-0,513 |
|
4 |
0,637 |
0,513 |
-0,513 |
|
5 |
-0,087 |
0,627 |
-0,627 |
|
6 |
-0,423 |
0,629 |
-0,629 |
|
7 |
-0,028 |
0,673 |
-0,673 |
Пример 2. Импорт
Дано
год |
квартал |
номер |
значение |
разность |
|
1999 |
I |
1 |
3,10 |
|
|
II |
2 |
3,40 |
0,30 |
||
III |
3 |
3,33 |
-0,07 |
||
IV |
4 |
3,80 |
0,47 |
||
2000 |
I |
5 |
3,20 |
-0,60 |
|
II |
6 |
3,60 |
0,40 |
||
III |
7 |
3,70 |
0,10 |
||
IV |
8 |
4,33 |
0,63 |
||
2001 |
I |
9 |
3,60 |
-0,73 |
|
II |
10 |
4,43 |
0,83 |
||
III |
11 |
4,30 |
-0,13 |
||
IV |
12 |
5,17 |
0,87 |
||
2002 |
I |
13 |
4,13 |
-1,03 |
|
II |
14 |
4,77 |
0,63 |
||
III |
15 |
5,20 |
0,43 |
||
IV |
16 |
5,97 |
0,77 |
||
2003 |
I |
17 |
5,10 |
-0,87 |
|
II |
18 |
5,90 |
0,80 |
||
III |
19 |
6,33 |
0,43 |
||
IV |
20 |
7,23 |
0,90 |
||
2004 |
I |
21 |
6,43 |
-0,80 |
|
II |
22 |
7,70 |
1,27 |
||
III |
23 |
8,17 |
0,47 |
||
IV |
24 |
9,08 |
0,92 |
||
2005 |
I |
25 |
8,17 |
-0,92 |
|
II |
26 |
9,80 |
1,63 |
||
III |
27 |
10,50 |
0,70 |
||
IV |
28 |
12,47 |
1,97 |
||
2006 |
I |
29 |
10,40 |
-2,07 |
|
II |
30 |
12,67 |
2,27 |
||
III |
31 |
14,20 |
1,53 |
||
IV |
32 |
17,10 |
2,90 |
Построим автокорреляционную функцию
|
АКФ(...) |
Ошибка АКФ |
||
1 |
0,802 |
0,211 |
-0,211 |
|
2 |
0,693 |
0,535 |
-0,535 |
|
3 |
0,585 |
0,637 |
-0,637 |
|
4 |
0,566 |
0,701 |
-0,701 |
|
5 |
0,423 |
0,756 |
-0,756 |
|
6 |
0,343 |
0,785 |
-0,785 |
|
7 |
0,255 |
0,803 |
-0,803 |
|
8 |
0,231 |
0,813 |
-0,813 |
|
9 |
0,131 |
0,822 |
-0,822 |
|
10 |
0,072 |
0,824 |
-0,824 |
Видим, что есть автокорреляция 1-го и 2-го порядков. График показывает наличие тренда. Положительная автокорреляция объясняется неправильно выбранной спецификацией, т.к. линейный тренд тут непригоден, он скорее экспоненциальный. Поэтому сделаем ряд стационарным, взяв первую разность.
|
АКФ(...) |
Ошибка АКФ |
||
1 |
-0,297 |
0,343 |
-0,343 |
|
2 |
0,309 |
0,390 |
-0,390 |
|
3 |
-0,420 |
0,420 |
-0,420 |
|
4 |
0,636 |
0,471 |
-0,471 |
|
5 |
-0,226 |
0,571 |
-0,571 |
|
6 |
0,214 |
0,583 |
-0,583 |
|
7 |
-0,311 |
0,593 |
-0,593 |
|
8 |
0,444 |
0,613 |
-0,613 |
|
9 |
-0,229 |
0,653 |
-0,653 |
Видим наличие автокорреляции 4-го порядка, что соответствует корреляции данных, отдаленных на год. Автокорреляцию первого порядка не имеем.
Статистика Дарбина-Ватсона (DW) =2,023 |
|
DW Up=1,500 |
|
DW Low=1,360 |
Пример 3. Экспорт
Приведем данные
год |
квартал |
номер |
значение |
разность |
|
2000 |
I |
1 |
22,30 |
|
|
II |
2 |
22,80 |
0,50 |
||
III |
3 |
24,80 |
2,00 |
||
IV |
4 |
24,80 |
0,00 |
||
2001 |
I |
5 |
25,50 |
0,70 |
|
II |
6 |
25,50 |
0,00 |
||
III |
7 |
25,90 |
0,40 |
||
IV |
8 |
26,20 |
0,30 |
||
2002 |
I |
9 |
26,30 |
0,10 |
|
II |
10 |
28,60 |
2,30 |
||
III |
11 |
28,70 |
0,10 |
||
IV |
12 |
30,30 |
1,60 |
||
2003 |
I |
13 |
30,50 |
0,20 |
|
II |
14 |
31,00 |
0,50 |
||
III |
15 |
33,80 |
2,80 |
||
IV |
16 |
36,40 |
2,60 |
||
2004 |
I |
17 |
38,00 |
1,60 |
|
II |
18 |
41,40 |
3,40 |
||
III |
19 |
47,20 |
5,80 |
||
IV |
20 |
52,36 |
5,16 |
||
2005 |
I |
21 |
52,50 |
0,14 |
|
II |
22 |
60,40 |
7,90 |
||
III |
23 |
65,70 |
5,30 |
||
IV |
24 |
67,40 |
1,70 |
||
2006 |
I |
25 |
69,00 |
1,60 |
|
II |
26 |
76,60 |
7,60 |
||
III |
27 |
79,80 |
3,20 |
||
IV |
28 |
71,00 |
-8,80 |
||
2007 |
I |
29 |
80,50 |
9,50 |
|
|
|
|
|
||
|
|
|
|
||
|
|
|
|
Для исходного ряда имеем:
|
АКФ(...) |
Ошибка АКФ |
||
1 |
0,896 |
0,165 |
-0,165 |
|
2 |
0,822 |
0,600 |
-0,600 |
|
3 |
0,712 |
0,739 |
-0,739 |
|
4 |
0,592 |
0,828 |
-0,828 |
|
5 |
0,483 |
0,884 |
-0,884 |
|
6 |
0,372 |
0,920 |
-0,920 |
|
7 |
0,261 |
0,941 |
-0,941 |
|
8 |
0,150 |
0,950 |
-0,950 |
|
9 |
0,062 |
0,954 |
-0,954 |
Очевидно наличие четкого тренда, значимыми являются коэффициенты автокорреляции 1-го и 2-го порядков. Для первой разности
|
АКФ(...) |
Ошибка АКФ |
||
1 |
-0,173 |
0,372 |
-0,372 |
|
2 |
-0,090 |
0,389 |
-0,389 |
|
3 |
0,353 |
0,392 |
-0,392 |
|
4 |
0,240 |
0,435 |
-0,435 |
|
5 |
-0,106 |
0,454 |
-0,454 |
|
6 |
-0,088 |
0,457 |
-0,457 |
|
7 |
0,315 |
0,460 |
-0,460 |
|
8 |
-0,136 |
0,490 |
-0,490 |
Автокорреляции уже не видим, остатки распределены как «белый шум».
! | Как писать курсовую работу Практические советы по написанию семестровых и курсовых работ. |
! | Схема написания курсовой Из каких частей состоит курсовик. С чего начать и как правильно закончить работу. |
! | Формулировка проблемы Описываем цель курсовой, что анализируем, разрабатываем, какого результата хотим добиться. |
! | План курсовой работы Нумерованным списком описывается порядок и структура будующей работы. |
! | Введение курсовой работы Что пишется в введении, какой объем вводной части? |
! | Задачи курсовой работы Правильно начинать любую работу с постановки задач, описания того что необходимо сделать. |
! | Источники информации Какими источниками следует пользоваться. Почему не стоит доверять бесплатно скачанным работа. |
! | Заключение курсовой работы Подведение итогов проведенных мероприятий, достигнута ли цель, решена ли проблема. |
! | Оригинальность текстов Каким образом можно повысить оригинальность текстов чтобы пройти проверку антиплагиатом. |
! | Оформление курсовика Требования и методические рекомендации по оформлению работы по ГОСТ. |
→ | Разновидности курсовых Какие курсовые бывают в чем их особенности и принципиальные отличия. |
→ | Отличие курсового проекта от работы Чем принципиально отличается по структуре и подходу разработка курсового проекта. |
→ | Типичные недостатки На что чаще всего обращают внимание преподаватели и какие ошибки допускают студенты. |
→ | Защита курсовой работы Как подготовиться к защите курсовой работы и как ее провести. |
→ | Доклад на защиту Как подготовить доклад чтобы он был не скучным, интересным и информативным для преподавателя. |
→ | Оценка курсовой работы Каким образом преподаватели оценивают качества подготовленного курсовика. |
Курсовая работа | Деятельность Движения Харе Кришна в свете трансформационных процессов современности |
Курсовая работа | Маркетинговая деятельность предприятия (на примере ООО СФ "Контакт Плюс") |
Курсовая работа | Политический маркетинг |
Курсовая работа | Создание и внедрение мембранного аппарата |
Курсовая работа | Социальные услуги |
Курсовая работа | Педагогические условия нравственного воспитания младших школьников |
Курсовая работа | Деятельность социального педагога по решению проблемы злоупотребления алкоголем среди школьников |
Курсовая работа | Карибский кризис |
Курсовая работа | Сахарный диабет |
Курсовая работа | Разработка оптимизированных систем аспирации процессов переработки и дробления руд в цехе среднего и мелкого дробления Стойленского ГОКа |