Реферат по предмету "Математика"


Построение моделей временных рядов

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра теории рынка


Курсовая работа

по дисциплине: Эконометрика

на тему «Построение моделей временных рядов»

Вариант 16


Выполнил: Атаманчук Я.П.

Группа: ФБЭ — 81

Проверил: Тимофеев В.С.

Новосибирск 2011



Ситуация 9: “Загон для коз”. Робинзон живет на необитаемом острове и организует свой быт. Вот что пишет по этому поводу Д.Дефо: “Я задумал развести целое стадо коз, рассудив, что это единственный способ обеспечить себя мясом и молоком к тому времени, когда у меня выйдут порох и дробь. Единственным средством для этого было держать коз в загоне, огороженном прочным частоколом или плетнем так, чтобы козы не могли сломать его ни изнутри, на снаружи”. Сказано – сделано. И далее: “Я решил огородить кусок луга ярдов в полтораста длиной и сто шириной и на первый раз ограничиться этим… Этот участок я огораживал около трех месяцев, а затем перевел в этот загон всех своих коз”.

Однако через некоторое время он заметил, что молока, которое он получал со своего стада, стало не хватать для всех нужд – ведь он потреблял не только само молоко, но и получал из него сыр, масло и т.д. Проведя ревизию своего хозяйства, он выяснил, что объемы удоев стали уменьшаться из-за ухудшения качества и особенно количества кормов, т.е. травы, которая росла на участке, стало не хватать для всего стада, которое поедало ее, а времени вырасти для новой травы не хватало. Он огородил новый участок и перевел стадо туда, оставив старый участок для восстановления травяного покрова.

В нашем распоряжении есть два временных ряда: X1 – месячный уровень осадков (в миллиметрах) и X2 – среднемесячные удои молока (в галлонах), которые Робинзон составил за это время.

Цель: проведение эконометрического анализа заданных временных рядов для прогнозирования их значений.

Построить графики временных рядов. Для каждого временного ряда провести первичный статистический анализ, включая:

Вычисление среднего значения, дисперсии, меры разброса;

Вычисление автоковариационной и автокорреляционной функций;

Построение коррелограммы.

Сделать выводы.


На графике временного ряда X1(t) прослеживаются периодически повторяющиеся изменения признака. Период составляет 12 месяцев. В среднем не наблюдается долгосрочных тенденций ни к увеличению, ни к уменьшению. Влияние всех компонент временного ряда на значения элементов ряда носит аддитивный характер.


На графике наблюдается долгосрочная тенденция к уменьшению. Вместе с тем, происходят периодически повторяющиеся изменения признака. Временной ряд имеет сезонную и/или циклическую компоненту.

В момент времени (t=40), удои молока достигают наивысшего уровня. Это может объясняться наличием структурных изменений в этой точке. Очевидно, именно в этот момент Робинзон перевел свое стадо на новый участок.

Первичный статистический анализ:

а = 1N Σ x(t);

σ2 = 1N-1 Σ (xt-а) 2;

γτ= 1N-τ t=1N-τ (xt — а)(xt + τ — а));

Для временного ряда х1(t):

E[X1(t)] = а= 30,3236;

D[X1(t)] = σ2= 17,6307;

γ(τ)=5,10348;

Средний месячный уровень осадков составляет около 30 мм. Отклонение от среднего составляет 4,1989 мм.

Для временного ряда х2(t):

E[X1(t)] = а= 7,0982;

D[X1(t)] = σ2= 2,32944;

γτ=1,12624;

Среднемесячные удои молока в среднем составляют около 7 галлонов. Отклонение от среднего равно 1,52625 галлона молока.


Найдем значения оценок автокорреляционной функции:

Рекомендуемое количество элементов автокорреляционной функции не должно превышать N/3 18,3.

Для временного ряда х1(t):

r1

0,300274

r2

-0,243352

r3

-0,361304

r4

-0,400067

r5

0,0144388

r6

0,5417388

r7

0,0207405

r8

-0,433738

r9

-0,415498

r10

-0,284967

r11

0,245709

r12

0,9827882

r13

0,2988384

r14

-0,259614

r15

-0,370474

r16

-0,402023

r17

0,0166211

r18

0,5434392


Коррелограмма для временного ряда X1(t)

Коррелограмма показывает степень статистической взаимозависимости между элементами временного ряда.

Для стационарного ряда, чем больше разнесены во времени элементы временного ряда, тем слабее их взаимосвязь.

Исходя из полученной коррелограммы можно сделать вывод о том, что временной ряд «Месячное количество осадков» не является стационарным.

Элементы временного ряда являются взаимосвязанными, что говорит о наличии сезонной компоненты.Анализ автокорреляционной функции позволяет предположить, что наиболее тесным образом связаны элементы ряда, разнесенные на 6, 12, 18 и т.д. месяцев.

Наиболее высоким для временного ряда осадков оказался коэффициент корреляции 12-го порядка, это значит, что временной ряд содержит циклические колебания в 12 месяцев.

Для временного ряда х2(t):

r1

0,529201

r2

0,13054468

r3

0,00722151

r4

-0,0266268

r5

0,164693

r6

0,4670576

r7

0,1645495

r8

-0,1266122

r9

-0,1870788

r10

-0,2207901

r11

-0,095556

r12

0,2221958

r13

-0,097639

r14

-0,3676262

r15

-0,4155157

r16

-0,4258159

r17

-0,206055

r18

0,2386529


Коррелограмма для временного ряда X2(t)


Исходя из полученной коррелограммы можно сделать вывод о том, что временной ряд «Среднемесячные удои молока» не является стационарным.

Элементы временного ряда являются взаимосвязанными, что говорит о наличии сезонной компоненты. Ряд среднемесячных удоев молока имеет тенденцию к снижению, т.к. максимальное значение принимает коэффициент автокорреляции 1-ого порядка.

Построить модель временного ряда. Для этого:

Записать основное разложение временного ряда и проверить гипотезу о наличии неслучайных компонент в этом разложении;

Построить модели для неслучайных компонент, присутствие которых в разложении было доказано. При построении модели в качестве возможных регрессоров рассмотреть следующие функции:

t2, t, 1t, 1t2, 1t, 13t, 14t

Привести несколько вариантов функции тренда, и обосновать выбор наилучшей;

С помощью критерия Дарбина – Уотсона проверить остатки на автокорреляцию;

Если на графике временного ряда продолжительно наблюдаются структурные изменения, то выдвинуть соответствующую гипотезу и проверить с помощью теста Чоу и подхода Гуйарати.

Сделать выводы.

По графикам временных рядов видно, что амплитуда колебаний примерно одинакова, следовательно, в качестве моделей выберем аддитивные.

Тогда получим разложение следующего вида:

X(t) = T(t) + S(t) + C(t) + ε (t)

T (t) – неслучайная, монотонная функция тренда

S (t) – неслуяайная периодическая функция с периодом, кратным «сезону»

С (t) – неслучайная периодическая функция

ε (t) – случайная составляющая

Для выявления факта наличия/отсутствия неслучайной составляющей проверим гипотезу:

Н0: E[X(t)] = const – ряд стационарный

Н1: E[X(t)] ≠ const.

Временной ряд X1(t)

Критерий серий
.

Xmed=xN+12, если N нечетно;(xN2+ xN2+1)2, иначе.

“+”: х(t) > x med“-”: x(t)

Хmed = 31; V(N) = 27; τ(N) = 4

Условия: τ(N) ≥ 1,43Ln(N+1); V(N) ≤ 0,5(N+2-1,96N-1),

Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.

τ(N) V(N) > 21,298, следовательно гипотеза не отвергается, а значит, неслучайные компоненты могут не присутствовать.

Критерий «восходящих» и «нисходящих» серий

“+”: x(t+1) – x(t) >0
“-”: x(t+1) – x(t)

V(N) = 36; τ(N) = 3

Условия: V(N) τ(N) ≥ τ0 (N),

Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.

τ0(N) =5, N ≤ 266, 26 Nτ0(55)=6

V(N) > 30,306; τ(N) гипотеза не отвергается, следовательно неслучайные компоненты могут и не присутствовать.

Критерий Фостера-Стьюарта

mt= 1, xt>xk, k=1, …(t-1)0, иначе

lt = 1, xt

dt= mt– lt, rt= mt+ lt;

D = t=2Ndt= -2

R = t=2Nrt= 10

tD= DσD, tR= R- µσR,

σD= 2lnN- 0.8456= 2,6775

σR= 2lnN- 3.4253= 2,1423

µ= 2t=2N1t= 3.6227

tD = -0.747; tR = 1.32146

| tD |


| tR|
Временной ряд X2(t)

Критерий серий
.

Xmed=xN+12, если N нечетно;(xN2+ xN2+1)2, иначе.

“+”: х(t) > x med“-”: x(t)

Хmed = 6,8; V(N) = 20; τ(N) = 7

Условия: τ(N) ≥ 1,43Ln(N+1); V(N) ≤ 0,5(N+2-1,96N-1),

Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.

τ(N) > 5,756; V(N)
Критерий «восходящих» и «нисходящих» серий

“+”: x(t+1) – x(t) >0
“-”: x(t+1) – x(t)
V(N) = 35; τ(N) = 3

Условия: V(N) τ(N) ≥ τ0 (N),

Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.

τ0(N) = 5, N ≤ 266, 26 N τ0(55)=6

V(N) > 30,306; τ(N) гипотеза не отвергается, следовательно неслучайные компоненты могут и не присутствовать.

Критерий Фостера-Стьюарта

mt= 1, xt>xk, k=1, …(t-1)0, иначе

lt = 1, xt

dt= mt– lt, rt= mt+ lt;



D = t=2Ndt= -8

R = t=2Nrt= 12

tD= DσD, tR= R- µσR,

σD= 2lnN- 0.8456= 2,6775

σR= 2lnN- 3.4253= 2,1423

µ= 2t=2N1t= 7,169

tD = -2,98785; tR = 2,25504

| tD | > 2,0057

| tR| > 2.0057, следовательно, гипотеза отвергается, а значит в структуре временного ряда присутствуют трендовые компоненты.

В силу того, что критерий «восходящих» и «нисходящих» серий говорит о возможном отсутствии неслучайных компонент во временном ряде Х2, проведем еще одну проверку ряда на наличие неслучайной компоненты при помощи критерия Аббе.

Критерий Аббе

Данный критерий служит для выявления систематического смещения значений временного ряда. Для проверки гипотезы Н0необходимо вычислить статистику вида

A=q2σ2,

где q2=12(N-1)t=1N-1xt+1-x(t)2

Гипотеза Н0отвергается с вероятностью ошибки 0,05, если выполняется условие

A≤1+uγN+121+uγ2,

Где uγ- квантиль стандартного нормального распределения для доверительной вероятности γ=0,95.

Для модели времянного ряда X2:

q2=1,013

σ2= 2,32944;

A=1,0132,32944=0,435

uγ=0,8289,

0,435≤1+0,828955+121+(0,8289)2,

0,435≤1,111 – неравенство выполняется, следовательно гипотеза Н0отвергается, а значит делаем вывод о наличии в структуре временного ряда Х2 неслучайных, зависящих от времени компонент.




Проверив данные временные ряды на наличие неслучайной компоненты можно сделать следующие выводы:

При проверке гипотезы о наличии неслучайных компонент во временном ряду месячного уровня осадков получились, что по критерию серий и критерию восходящих и нисходящих серий, критерию Фостера-Cтьюарта неслучайная компонента в модели отсутствует.

При проверке гипотезы о наличии неслучайных компонент во временном ряду среднемесячного удоя молока получились, что по критерию серий и по критерию Аббе неслучайная компонента в модели присутствует. По критерию восходящих и нисходящих серий неслучайная компонента может и не присутствовать. Критерий Фостера-Стьюарта показывает наличие трендовой компоненты. В целом мы можем сделать вывод о присутствии неслучайной компоненты во временном ряду среднемесячного удоя молока.


Временной ряд X1(t)

Шаг 1. Произведем выравнивание исходного временного ряда методом скользящей средней. Найдем годовую добычу дичи Робинзоном, после чего найдем скользящие средние. Для приведения в соответствие с фактическими моментами времени, найдем центрированные скользящие средние.

месяц

кол-во

скользящие средние за год

центрированные скользящие средние

оценка сезонной компоненты

1

27,50










2

31,90










3

29,80










4

31,70










5

29,60










6

25,00

30,45







7

24,10

30,46667

30,45833

-6,36

,,,

,,,

,,,

,,,

,,,

49

27,30

30,61667

30,68333

-3,38333

50

33,20










51

30,30










52

32,10










53

30,80










54

24,60










55

22,50











Шаг 2. Оценим сезонные компоненты как разность между фактическими элементами ряда и центрированными скользящими средними.

Скорректированные оценки сезонной компоненты определяются путем вычитания из средней оценки сезонной компоненты для месяца корректирующего коэффициента.

k = Siсредн12= 0,010475

год\мес.

1

2

3

4

5

6

7

8

9

10

11

12

1



















-6,35833

2,583333

1,2

8,070833

4,258333

-3,32917

2

-2,87083

2,5625

0,066667

1,0625

-0,57083

-6,29583

-7,2375

2,333333

1,129167

8,1125

4,904167

-3,5625

3

-1,98333

1,9625

0,379167

0,804167

-0,34583

-4,925

-7,77917

2,375

1,4

8,016667

4,579167

-5,33333

4

-2,87917

2,191667

-0,0875

1,091667

0,345833

-5,53333

-6,66667

3,520833

1,208333

7,7

4,991667

-4,775

5

-3,38333


































Siсредн

-2,77917

2,238889

0,119444

0,986111

-0,19028

-5,58472

-7,01042

2,703125

1,234375

7,975

4,683333

-4,25

Si

-2,78964

2,228414

0,10897

0,975637

-0,20075

-5,5952

-7,02089

2,69265

1,2239

7,964525

4,672859

-4,26047


Шаг 3. Устраним сезонную компоненту S из исходных уравнений ряда и получим выровненные данные T+=X(t)-S

Месяц

Х(t)

Si

X(t) — Si

1

27,50

-2,78964

30,29

2

31,90

2,228414

29,67159

3

29,80

0,10897

29,69103









53

30,80

-0,20075

31,00075

54

24,60

-5,5952

30,1952

55

22,50

-7,02089

29,52089
--PAGE_BREAK--


T=X(t) -S
После исключения сезонной компоненты из временного ряда можно говорить об отсутствии трендовой компоненты в разложении временного ряда.

Временной ряд X2(t)

Шаг 1. Произведем выравнивание исходного временного ряда методом скользящей средней. Найдем годовую добычу дичи Робинзоном, после чего найдем скользящие средние. Для приведения в соответствие с фактическими моментами времени, найдем центрированные скользящие средние.

Месяц

Кол-во

Скользящие средние за год

Центрированные скользящие средние

Оценка сезонной компоненты

1

11,00










2

9,70










3

8,50










4

8,70










5

7,60










6

6,70

8,066667







7

6,10

7,65

7,858333

-1,76

,,,

,,,

,,,

,,,

,,,

49

6,50

7,166667

7,25

-0,75

50

7,50










51

6,90










52

7,60










53

6,60










54

5,30










55

4,80











Шаг 2. Оценим сезонные компоненты как разность между фактическими элементами ряда и центрированными скользящими средними.

Используем полученные оценки сезонной компоненты для расчета сезонности S. Для этого найдем средние месячные оценки сезонной компоненты.

Скорректированные оценки сезонной компоненты определяются путем вычитания из средней оценки сезонной компоненты для месяца корректирующего коэффициента.

k = Siсредн12= 0,012471

 Год/месяц

1

2

3

4

5

6

7

8

9

10

11

12

1



















-1,75833

0,145833

-0,07917

1,9625

1,158333

-1,04167

2

-0,92917

0,55

-0,1875

0,4625

0,120833

-1,52083

-1,58333

0,358333

0,104167

2,258333

1,016667

-0,85

3

-0,71667

0,508333

-0,1875

0,1625

0,0125

-1,275

-1,7625

0,754167

0,354167

1,2125

0,529167

-1,72917

4

-1,73333

-0,90417

-1,14167

4,225

2,108333

-0,4875

-1,175

0,541667

-0,02083

1,2375

0,854167

-1,02083

5

-0,75


































Si ср

-1,03229

0,051389

-0,50556

1,616667

0,747222

-1,09444

-1,56979

0,45

0,089583

1,667708

0,889583

-1,16042

Si ск

-1,04476

0,038918

-0,51803

1,604196

0,734751

-1,10692

-1,58226

0,437529

0,077112

1,655237

0,877112

-1,17289

Шаг 3. Устраним сезонную компоненту S из исходных уравнений ряда и получим выровненные данные T+=X(t)-S

Месяц

Х(t)

Si

X(t) — Si

1

11,00

-1,04476

12,04

2

9,70

0,038918

9,661082

3

8,50

-0,51803

9,018027









53

6,60

0,734751

5,87

54

5,30

-1,10692

6,406916

55

4,80

-1,58226

6,382263


Шаг 4.Используя регрессионный анализ, проведем аналитическое выравнивание ряда T=X-S

Несколько вариантов функции тренда:

T=θ+θ1t

θ1= NtiTi –(ti)(Ti)Nti2- (ti)2

θ0 = T- t* θ1
θ1= -0,0132

θ0= 7,5023

T = 7,5023 -0,0132t

ESS = (Ti-Ti)2= 78,90959

RSS = (Ti-Ti)2= 2,420453

TSS = (Ti-Ti)2= 81,33005

R2= RSS/TSS = 0,029761

Данная модель тренда объясняет всего 2,97% вариации среднемесячных удоев молока за последние 5 лет, поэтому данную модель лучше не использовать.



Θ= (XTX)-1XTY, где

Y=T, X = 1 t11 t21… … …1 t1n t2n , t1= 1 t, t2= 14t

θ0= 8,182

θ1= 7,887

θ2= -3,574

ESS = (Ti-Ti)2= 45,47

RSS = (Ti-Ti)2= 35,78

TSS = (Ti-Ti)2= 81,27

R2 = RSS/TSS = 0,4402, следовательно, данная модель тренда объясняет 44,02% вариации среднемесячных удоев молока за последние 5 лет.

Проверим на значимость параметры модели.

H0: θi= 0 – параметр не значим;

H1: θi ≠ 0.

t= θiSθi — статистика Стьюдента;

S2 = 1N-m*1Nei2 — оценка дисперсии ошибок, где ei= Тi — Тi;

Sθi2=S2*qii – оценка дисперсии оценки, где — элемент главной диагонали матрицы (XTX)-1.

S2= 45,5/52 = 0,8749

Sθ02 = 0,8749*1,075 = 0,941

Sθ0=0,941 =0,97

t = 8,182 / 0,97 = 8,435

tкр(0,05;52)=2,00

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0в данном уравнении регрессии является значимым.

Sθ12 = 0,8749*4,237 = 3,7069

Sθ1=3,7069 =1,925

t = 7,887 /1,925=4,096



|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.

Sθ22 = 0,8749*6,09289 = 5,3308

Sθ2=5,3308 =2,3089

t = -3,574 / 2,3089= -1,548

|t| tкр(0,05;52) следовательно, гипотеза не отвергается, то есть параметр 2 в данном уравнении регрессии не является значимым.

Проверим значимость модели по критерию Фишера.

— уравнение не значимое

Статистика Фишера:

F = (0,44/ 1 – 0,44) * (52/2) = 20,45

Fкр(2, 52) = 3,2

F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.



Θ= (XTX)-1XTY, где

Y=T, X = 1 t11 t21 t31 … … … …1 t1n t2n t3n , t1= 1 t, t2= 1t, t3= 14t

θ0= 18,29

θ1= -13,465

θ2= 57,471

θ3= -50,353

ESS = (Ti-Ti)2= 42,52

RSS = (Ti-Ti)2= 38,75

TSS = (Ti-Ti)2= 81,27

R2 = RSS/TSS = 0,4768, следовательно, данная модель тренда объясняет 47,68% вариации среднемесячных удоев молока за последние 5 лет.



Проверим на значимость параметры модели.

H0: θi= 0 – параметр не значим;

H1: θi ≠ 0.

t= θiSθi — статистика Стьюдента;

S2 = 1N-m*1Nei2 — оценка дисперсии ошибок, где ei= Тi — Тi;

Sθi2=S2*qii – оценка дисперсии оценки, где — элемент главной диагонали матрицы (XTX)-1.

S2= 42,52/51 = 0,8338

Sθ02 = 0,8338*35,45 = 29,56

Sθ0=29,56 =5,4367

t = 18,29 / 5,4367= 3,3642

tкр(0,05;51)=2,00

|t| > tкр(0,05;51) следовательно, гипотеза отвергается, то есть параметр 0в данном уравнении регрессии является значимым.

Sθ12 =0,8338*157,63 = 131,433

Sθ1=131,433 =11,4644

t = -13,465 /11,4644=-1,17

|t| tкр(0,05;51) следовательно, гипотеза не отвергается, то есть параметр 1 в данном уравнении регрессии не является значимым.

Sθ22 = 0,8338*1111,24 = 926,5588

Sθ2=926,5588 =30,4394

t = 57,471 / 30,4394= 1,888

|t| tкр(0,05;51) следовательно, гипотеза не отвергается, то есть параметр 2 в данном уравнении регрессии не является значимым.

Sθ32 = 0,8338*742,32 = 618,95

Sθ3=618,95 =24,8787

t = -50,353 / 24,8787= -2,0239

|t| > tкр(0,05;51) следовательно, гипотеза отвергается, то есть параметр 3 в данном уравнении регрессии является значимым.

Проверим значимость модели по критерию Фишера.

— уравнение не значимое

Статистика Фишера:

F = (0,4768/ 1 – 0,4768) * (51/3) = 15,49

Fкр(3, 51) = 2,8

F > Fкр(2, 51), то гипотеза отвергается, и уравнение является значимым.

    продолжение
--PAGE_BREAK--T=4

Преобразуем данную модель к модели вида Т4=

Θ= (XTX)-1XTY, где

Y=Т4, X = 1 t11 t21… … …1 t1n t2n , t1= 1 t, t2= 13t

θ0= 7029,97

θ1= 31151,31

θ2= -17141,69





ESS = (Ti-Ti)2= 145623360,70

RSS = (Ti-Ti)2= 381033397,01

TSS = (Ti-Ti)2= 526656757,72





R2 = RSS/TSS = 0,7235, следовательно, данная модель тренда объясняет 72,34% вариации среднемесячных удоев молока за последние 5 лет.



Проверим на значимость параметры модели.

H0: θi= 0 – параметр не значим;

H1: θi ≠ 0.

t= θiSθi — статистика Стьюдента;

S2 = 1N-m*1Nei2 — оценка дисперсии ошибок, где ei= Тi — Тi;

Sθi2=S2*qii – оценка дисперсии оценки, где — элемент главной диагонали матрицы (XTX)-1.





S2= 145623360,70/52 = 2800449,244

Sθ02 = 2800449,244*0,5967 = 1671061,15

Sθ0=1671061,15 =1292,69

t = 7029,97 / 1292,69 = 5,438

tкр(0,05;52)=2,00

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0в данном уравнении регрессии является значимым.



Sθ12 = 2800449,244*5,33 = 14927190,66

Sθ1=14927190,66 =3863,57

t = 31151,32/3863,57=8,063

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.



Sθ22 = 2800449,244*6,077 = 17018504

Sθ2=17018504 =4125,35

t = -17141,69/ 4123,35= -4,155

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 2 в данном уравнении регрессии является значимым.



Проверим значимость модели по критерию Фишера.

— уравнение не значимое



Статистика Фишера:

F = (0,7235/ 1 – 0,7235) * (52/2) = 68,03

Fкр(2, 52) = 3,2

F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.



T=4

Преобразуем данную модель к модели вида Т4=



Θ= (XTX)-1XTY, где



Y=Т4, X = 1 t11 t21… … …1 t1n t2n , t1= 13t, t2= 14t

θ0= 35714,47

θ1= 251132,01

θ2= -267257,62





ESS = (Ti-Ti)2= 152050307,12

RSS = (Ti-Ti)2= 374606450,59

TSS = (Ti-Ti)2= 526656757,72





R2 = RSS/TSS = 0,7113, следовательно, данная модель тренда объясняет 71,13% вариации среднемесячных удоев молока за последние 5 лет.



Проверим на значимость параметры модели.

H0: θi= 0 – параметр не значим;

H1: θi ≠ 0.

t= θiSθi — статистика Стьюдента;

S2 = 1N-m*1Nei2 — оценка дисперсии ошибок, где ei= Тi — Тi;

Sθi2=S2*qii – оценка дисперсии оценки, где — элемент главной диагонали матрицы (XTX)-1.



S2= 152050307,12/52 = 2924044,36

Sθ02 = 2924044,36*8,244 = 24105156,03

Sθ0=24105156,03 =4909,7

t = 35714,47 / 4909,7 = 7,2743

tкр(0,05;52)=2,00

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0в данном уравнении регрессии является значимым.



Sθ12 = 2924044,36*322,42 = 942773721,9

Sθ1=942773721,9 =30704,62

t = 251132,01/30704,62=8,179

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.



Sθ22 = 2924044,36*406,69= 1189187744

Sθ2=1189187744 =34484,60

t = -267257,62/ 34484,60= -7,75

|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 2 в данном уравнении регрессии является значимым.



Проверим значимость модели по критерию Фишера.

— уравнение не значимое



Статистика Фишера:

F = (0,7113/ 1 – 0,7113) * (52/2) = 64,056

Fкр(2, 52) = 3,2

F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.





По результатам проведенного анализа в качестве наилучших моделей были выбраны: Модель 3: При проверке уравнения модели по критерию Стьюдента, значимым оказались параметры — θ0 и θ3, θ1 и θ2 — незначимы, уравнение по статистике Фишера значимо, R2=0,4768

Модель 4: Все неизвестные параметры уравнения при проверке по критерию Стьюдента оказались значимыми, уравнение по статистике Фишера значимо, R2=0,7235

Модель 5: Все неизвестные параметры уравнения при проверке по критерию Стьюдента оказались значимыми, уравнение по статистике Фишера значимо; R2=0,7113.



















Из трех представленных моделей наилучшей является модель вида т.к. все ее параметры являются значимыми, сама

модель значима и объясняет 72,35% (наибольший процент) вариации среднемесячных удоев молока.



Проверим остатки на автокорреляцию.



Выдвигаем гипотезу об отсутствии автокорреляции в остатках и две альтернативные ей.

: r (1) = 0
: r (1) > 0
H2: r (1)
Рассчитываем статистику Дарбина-Уотсона:



= 126110735,12145623360,70 = 0,866

dL=1,49dU=1,64 — кр. значения Дарбина-Уотсона (0,05; 2; 55)



А+? А0? А-





0 dLdU 4-dU4-dL 4



Значение статистики d (= 0,866) попадает в критическую область “А+”, следовательно, гипотеза отвергается в пользу альтернативы H1, а значит r(1)>0.

По графику временного ряда X2(t) можно предположить наличие структурных изменений. Проверим эту гипотезу с помощью теста Чоу и подхода Гуйарати.





Критерий Чоу.



В ходе своих наблюдений Робинзон заметил, что удои резко сократились в некоторый момент времени. Он пришел к выводу, что необходимо построить новое пастбище для своих коз, и поэтому огородил новую местность. Это изменение привело к резкому скачку в удоях, что отразилось на временном ряде и вызвало структурные изменения.

По графику временного ряда было сделано предположение о наличии структурных изменений в момент t*=40 (40-ой месяц, 4-ый год). Проверим это предположение с помощью теста Чоу.



t*=40, тогда:

T (t) – единая модель временного ряда
T1 (t) – модель временного ряда, построенная на промежутке до t*
T2 (t) – модель временного ряда, построенная на промежутке после t*

N, N1, N2 – количество наблюдений, использованное для построения моделей T (t), T1 (t), T2 (t).

Кусочная модель может быть записана в виде:

T1+2(t) = T1t, t







Модель

Число наблюдений

Число степеней свободы

Остаточная сумма квадратов



55

52

145623360,70



39

36

17637380,26



16

13

12411431,02







Выдвигаем гипотезу о структурной стабильности временного ряда:

H: ΔESS = 0
H1: ΔESS ≠ 0

ESS1+2= ESS1+ ESS2= 17637380,26+12411431,02=30048811,29



ΔESS = 145623360,70 – 30048811,29= 115574549,4



F = ΔESSkESS1+2N-2k= (115574549,4/3)/( 30048811,29/(55-6))=62,82Fкр(0,05; 2; 52)= 3,186

F > Fкр, следовательно, гипотеза отвергается и для моделирования следует использовать кусочную модель.







Критерий Гуйарати.



T1(t) = θ0(1) + θ1(1)f1(t) + … + θk(1)fk(t)

T2(t) = θ0(2) + θ1(2)f1(t) + … + θk(2)fk(t)



Выдвигаем гипотезу о структурной стабильности:

H0: {временной ряд x(t) структурно стабилен}
H1: {структурные изменения оказывают влияние на временной ряд x(t)}



Построим вспомогательное регрессионное уравнение Гуйарати:

x(t) = θ0(1) + θ0(z)Z(t) + θ1(1)f1(t) + θ1(z)f1(t)Z(t) + … + θk(1)fk(t) + θk(z)fk(t)Z(t) + e(t)



В нашем случае, уравнение будет иметь следующий вид:

x(t) = 4θ(1) + θ(z) Z(t) + θ1(1) f1(t) + θ1(z) f1(t)Z(t) + … + θk(1) fk(t) + θk(z) fk(t)Z(t) + e(t)



Z (t) = 0, t



Оценка вектора неизвестных параметров вспомогательного уравнения:

Θ = (XTX)-1XTY, где

Y – матрица значений временного ряда X2(t)

X = 1 Z11t f11t f11t*Z11t f21t f21t*Z11(t)… … … … … …1 Z1nt f1nt f1nt*Z1nt f2nt f2nt*Z1n(t)

t* = 40

1,083435

-1,08344

2,429773

-2,42977

-3,14102

3,14101711

-1,08344

30987,27

-2,42977

724881

3,141017

-167664,07

2,429773

-2,42977

6,947653

-6,94765

-7,56885

7,56884673

-2,42977

724881

-6,94765

16989764

7,568847

-3924682,2

-3,14102

3,141017

-7,56885

7,568847

9,418588

-9,4185884

3,141017

-167664

7,568847

-3924682

-9,41859

907385,732

Получаем:

(XTX)-1=











Θ=3872,33480225,6525821,3812753370,7-9174,5567-2707877,9

X(t)=43872,33+480225,65 Zt+25821,38 13t+12753370,7 13t Zt-9174,5567 14t-2707877,914t Zt+ e(t)



Н0: θ0(z), θ1(z),θ2(z), =0- незначимые параметры

Н1: θ0(z), θ1(z),θ2(z), ≠0



Преобразуем уравнение к виду:

X(t)4=3872,33+480225,65 Zt+25821,38 13t+12753370,7 13t Zt-9174,5567 14t-2707877,914t Zt+ e(t)



S2=3004881155-6=613241





Sθ0(z)2=613241*30987,27=19002664985 Sθ0(z)=137850,1541

Sθ1(z)2=613241*16989763,63=10418820434195,50 Sθ1(z)=3227819,765

Sθ2(z)2=613241*907385,732=556446176055,15 Sθ2(z)=745953,1996

t(θ0(z)) =480225,646/137850,1541= 3,483679

t(θ1(z)) = 12753370,7/3227819,765=3,951079

t(θ1(z)) = -2707877,9/745953,1996= -3,63009





tкр(95%;49) = 2.0076

|t(θ0(z))| > tкр => данный параметр значим;

|t(θ1(z))| >tкр => данный параметр значим.

|t(θ2(z))| >tкр => данный параметр значим.



Все параметры значимы, что говорит о том, что различие соответствующих параметров кусочных моделей также являются значимыми. Гипотеза о структурной стабильности отвергается и ряд X2(t) (среднемесячные удои молока) является структурно нестабильным. Следовательно, отдаем предпочтение кусочной модели.







Выводы:

После проведение первичного статистического анализа были получены следующие результаты:

Для временного ряда X1(t) (месячный уровень осадков): в среднем в месяц на острове выпадало 30,3236 мм осадков. Отклонение от среднего составляет 4,1989 мм.

Для временного ряда X2(t) (среднемесячные удои молока): в среднем в месяц на острове выпадало 7,169 галлонов. Отклонение от среднего составляет 1,534галлона.

В качестве моделей временных рядов были выбраны аддитивные.

Проверив временные ряды на наличие неслучайных компонент с помощью критериев, мы выявили:

временной ряд осадков не содержит неслучайных компонент

временной ряд удоев содержит неслучайные компоненты – трендовую и сезонную.



Наилучшей трендовой моделью, описывающей временной ряд удоев является:



Применение критерия Дарбина-Уотсона показало, что в остатках рядов удоев наблюдается положительная автокорреляция.

Было доказано наличие автокорреляции в остатках, причем r(1) > 0.

В ходе своих наблюдений Робинзон заметил, что удои резко сократились в некоторый момент времени. Он пришел к выводу, что необходимо построить новое пастбище для своих коз, и поэтому огородил новую местность. Это изменение привело к резкому скачку в удоях, что отразилось на временном ряде и вызвало структурные изменения.

С помощью теста Чоу мы выявили, что во временном ряде удоев присутствуют структурные изменения в точке t*=40, поэтому необходимо применять кусочную модель:





С помощью подхода Гуйарати определили, что параметры значимы, а, следовательно, ряд среднемесячных удоев молока структурно нестабилен, поэтому предпочтение отдается кусочной модели.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.