--PAGE_BREAK--
3). Случ откл-ие εiи εji≠jне зависят др от др. Это означает, что отсут-т систем-я связь м/у 2 любыми парами откл-ий, т.е.
Если это усл-ие вып-ся, то гов-т об отсут-ии а/коррел м/у случ откл-ми.
Это соотн-ие еще перепис-т в форме M(εi,εj)=0 (i≠j).
4). Случ откл-ие д.б. незав-мо от объясняющ-х переем-х. Обычно это усл-ие вып-ся автомат-ки, если объяснящие перем-ые – известные вел-ны.
Но м показать, что в принципе это выпол-ся в любых мделях данного типа.
Пояснение
5). Модель яв-ся линейной отн-но ее парам-ов βо β1.
Теорема Гаусса-Маркова.
Основ-ся на предпосылках МНК.
Если все 5 предпос-к вып-ся, то оценки коэф-в, получ-е с помощью МНК облад-т след сво-вами:
А). Оценки яв-ся несмещенными, т.е.
Б). Оценки яв-ся состоятельными, т.к. дисп-ии их с ростом объема выборки стрем-ся к 0.
Т.е. ↑ объема выборки приводит к устойчивости оценок коэф-в ур-ия. Сч-ся, что объем выборки д удовл-ть соот-ию n>3m-1, где m-кол-во объясняющих переем-х.
В). Оценки эфф-ны, т.е. они имеют наименьшую дисп-ию разброса отн-но теорет-х вел-н по срав-ию с такими же оценками полученных с примен-м и люб др методов расчета.
В англоязыч науч лит-ре эти оценки получ-ли название BLUE
(голубые оценки) по первыем буквам (наилуч лин состоят эффект). Если наруш-ся предпосылки 2 и 3, то дисп-ии откл-ий не пост-ны, случ откл-ия связаны др с др и коэф-ты теряют св-ва несмещен-ти и эффек-ти.
При этос б сделаны след предположения:
1). Объясняющ перем-ые не яв-ся случ.
2). Случ вел-ны εiимеют норм распр-ие с пар-ми 0 и ε²
εi²~N(0;σ²)
Число набл-ий n>3m-1 сущ-но > числа объясняющ перем-х. Отсут-т ошибки специф-ии. М/у объясняющ перем-ми в случае m≥2 отсут-т зав-т (мультикол-ть).
Анализ точности определения оценок коэффициентов регрессии.
Изв-но, что мат ожидания расчет коэф-в совпадают с их теоретич вел-ми
При этом чем
Покажем, что дисп-ии оценок D(b1) и D(bo) непоср-но связаны с дисп-ей случ откл-ий в теоретич модели D(εi)=D(εj)=σ²=consti≠j.
Для этого запишем вел-ну b
Обозначим за
=∑Сiyi
Аналог-но преобр-м знач-е для bo.
Обозначим
=∑diyi
Причем Ciи di–нек-ые constрассчит-е по выборке, что очевидно из их обозначений.
Оценим теперь вел-ну дисп-ий для коэф-та b1
D(b1)=D(∑Ciyi)=
И т.к. мы знаем значение для дисп-ии разброса случ откл-ий, то м записать
=σ²∑Сi²=
Т.о. мы нали знач-ие дисп-ии на основе дисп-ии теоретич откл-ия ε.
Аналог-но для bo.
Мы м получить, что она равна
D(bo)=D(b1)x²
Т.о. дисп-ия разброса коэф-та прямопропорц-на дисп-ии случ откл-ий => чем > фак-р случ-ти, тем менее точными б оценки и чем > число набл-ий в выборке, тем меньше б эти вел-ны разбросаны.
Кроме того дисп-ии обратнопропорц-ны выбороч дисп-ии объясняющ перем-й S²x, т.е. чем шире область изм-ий объясняющ перем-й, тем точнее б оценки. Но в силу того, что дисп-ии случ теоретич откл-ий σ² нам неиз-ны, мы б их заменять несмещен-й дисп-ей расчет случ откл-ий.
,
где m— число объясняющ переем-х. Для парной регр-ии .
Тогда стандарт откл-ия
Наз-ся стандартной ошибкой в случ откл-ии. И для того, чтобы рассч-ть дисп-ию разброса коэф-в эмпир-го ур-ия регр-ии, мы б исп-ть формулы
Проверка гипотез относ-но коэф-ов лин ур-ия регр-и.
Эмпир ур-ия регр-ии строятся на основе конеч выборки, извлеч-й из генер сов-ти случ образом, поэтому как б показано коэф-ты ур-ия яв-ся случ вел-нами.
При проведении эк анализа перед иссл-лями оч часто возн-т необ-ть сравнить расчет коэф-ты boи b1 с нек-ми теоретич коэф-ми βо и β1.
Это срав-ие осущ-ся по схеме проверки гипотез. Предпол-м, провер-ся гипотеза Но:, состоящая в том, что эти вел-ны совпадают.
Но:=b1=β1. Тогда с ней конкурир-ая гипотеза Н1: не совпадает. Как изв-но из тер.вера для проверки таких гипотез рассч-ся tстат-ка Стьюдента, кот-ая при справед-ти гипотезы но имеет распред-ие Стьюдента с числом степеней свободы с парной регр-ей
tb1= (b1-β1)/Sb1
ν=n-2 (n-m-1)
n– объем выборки
m– кол-во объясняющ перем-х
Гипоеза Но б отклонена, если расчет знач-ие по модулю, т.к. нам безрал-но в какую сто-ну произошло откл-ие, окаж-ся > или = вел-ной, найденной из табл Стьюдента.
α-ур-нь знач-ти.
Сч-ся, что в эк задачах α м принимать знач-я 0,05 или 0,01, т.е. мы поверяем гипотезу с вер-тью 95 или 99%.
α/2 берется в связи с тем, что откл-ие м.б. как отриц, так и положит.
При невып-ии этого усл-ия сч-ся, что нет осн-ий для откл-ия гипотезы Но. Однако вел-ны теорет коэф-в как правило неиз-ны, поэтому на начал этапе анализа рассм-ся задача о наличие зав-ти м/у фак-ми х и у. Эта проблема провер-ся на основе гипотезы Но:b1=0 связи нет. С ней конкур-т H1:b1≠0 связь присут-т.
В такой пост-ке гов-т, что провер-ся гипотеза о стат знач-ти коэф-та ур-ия регр-ии.
Если приход-ся принять гипотезу Но, то мы гов-м коэф-т незначим (слишком близок к 0) и соответ-ю объясняющ перем-ую скорее всего из ур-ия следует искл-ть. В против случае коэф-т стат-ки значим. Н указ-т на наличие опр-й лин зав-ти м/у фак-ми.
Тогда расч-ся стат-ка Стьюдента по соотн-ю и по таблицам Стьюдента находят соответ-но вел-ну .
Если она ≤ расчет вел-ны, то мы м сказать, что есть осн-ия отклонить гипотезу Но и принять Н1.
Коэф-т отличен от 0. Для парной регр-ии мы не б проверять стат знач-ть bo, т.к. он только гаран-т прохождение линии регр-ии ч/з ср точку выборки.
Сущ-т грубое правило, позвол-ее делать первонач выводы о поведении коэф-в ур-ия при отсут-ии таблиц Стьюдента.
По нему срав-ся вел-на ошибки Sb1, допущенной при нахождении коэф-та с вел-ной этого коэф-та.
А). Если станд ошибка > чем коэф-т, то 0
Б). Если ошибка не превосх-т половины вел-ны коэф-та, то 1
В). Если они соот-ся в диапозоне 2
Г). Если ошибка
Безусл-но на tb1 сущест влияние оказ-т объем выборки n.
Чем >n, тем
Но при n>10 выписанное грубое правило оценки раб-т практически всегда.
Интервальные оценки коэффициента линейного уравнения регрессии.
Если для эмпир ур-ия выпол-ся предпос-ки Гауса-Маркова, то мы м утвер-ть, что найденные оценки коэф-в б подчин-ся норм закону распред-ия, в соот-ии с кот-м теоретич откл-ие εiраспр-ны нормально с пар-ми 0 и σ².
εi~N(0;σ²)
Это усл-ие соглас-ся с усл-ми центр предел теоремы тер.вера, в соот-ии с кот-ой если случ вел-на испыт-т влияние оч большого числа независ-х случ вел-н, влияние каждой из кот-ых на эту случ вел-ну мало, то рассматр-ая случ вел-на имеет распред-ие близкое к нормальному (асимптотически нормальное).
А мы пок-ли, что εiкак раз отражают влияние, оказываемое на завис перем-ую фак-ми не включ-ми в модель, кот-ых в эк-ке как правило оч много. Но их влияние на у мало, иначе мы д.б. бы их вкл-ть в модель.
=> если n≥3-1, то у нас вып-ся усл-ия центр пред теоремы. Мы м гов-ть, что εiраспр-ны нормально, а это позв-т не только найти наилучшее BLUEоценки для коэф-та, но и построить для них интервальные оценки, что дает опред-ые гарантии проверки точности нахождения коэф-в при смене исход-й выборки.
Причем к-т b1=∑Ciyi также как и у объясн-я перем-я, являясь лин комб-ей его выбороч вел-н yiпри Ci=const, также б иметь норм распред-ие. Причем мы пок-ли уже, что его мат ожидание совп-т с вел-ной теорет к-та, а дисп-ия
=> к-т b1 имеет норм распр-ие с пар-ми β1, D(d1).
Поэтому tстат-ка для коэф-та подчинена распр-ию Стьюдента с доверит-й вер-тью γ=1-α, что соот-т утвер-ию
Тогда мы м записать, что вер-ть
Преобр-м выраж-ие, стоящее в скобках
-tкрSb1≤b1-β1≤tкрSb1
-b1-tкрSb1≤-β1≤tкрSb1-b1
-b1-tкрSb1≤β1≤b1+tкрSb1
Получ соот-ие дает доверит-й инт-л, кот-ый с надеж-тью 1-α покрывает теорет коэф-т β1.
Доверительные интервалы для зависимой переменной.
Одной из осн-х задач эконометр анализа яв-ся прогнозир-ие знач-ий завис перем-ой при опр-ых знач-ях Хпр объясн-й перем-ой.
Здесь возм-н двоякий подход. Либо предсказ-ся усл-ое мат ожидание объясн-й перем-ой при нек-ой объясн-й перем-ой Хпр. М(У/х=Хпр). Либо прогноз-ся нек-ое конкр значение завис перем-ой при извест-м значении объясн-й перем-ой. Тогда гов-т о предсказании конкр вел-ны
1). Предсказание ср значения.
Предпол-м, что мы построили нек эмпир значение парной регр-ии ỹi=b0+b1xi, на основе кот-го хотим предсказать ср вел-ну завис перем-й у при х=Хпр. В данном случае рассчит-ое по урав-ию вел-на ỹпр=b0+b1xпр яв-ся только оценкой для искомого мат ожидания.
Встает вопрос насколько м эта оценка откл-ся от ср мат ожидания для того, чтобы ей м.б. доверять с надеж-тью γ=1-α.
Чтобы построить доверит инт-л, покажем, что случ вел-на ỹпр имеет норм распр-ие с нек-ми конкр переем-ми.
Мы знаем, что ỹпр=b0+b1xпр. Подставим в это ур-ие знач-ие для boи b1, найденное в виде лин комбинаций выборочных вел-н объясн-й перем-й yi.
Т.е. мы пок-ли, что расчет вел-на яв-ся лин комб-ей нормально распред-й случ вел-ны yi=> она дейст-но имеет норм распред-ие и мы м рассч-ть пар-ры этого распред-ия М(Ỹпр) и D(Ỹпр).
М(Ỹпр)=M(bo+b1Xпр)= М(bo)+XпрM(b1) = βo+Xпрβ1
D(Ỹпр)=D(bo+b1Xпр) =
Т.к. boвычисл-ся ч/з значение для b1, то они м/у собой зависят и поэтому
= D(bo)+X²прM(b1)=2cov(bo,b1Xпр)***=
Рас-м вел-ну ковариации.
Заменим вел-ну boч/з правило ее вычисления из эмпир ур-ия регр-ии, аналог-но поступим со знач-ем βо, записав его знач-ие ч/з теорет ур-ие регр-ии.
Тогда получаем
-
это дисп-ия для значения b1
Мы знаем вел-ну дисп boи b1. Подставим сюда их значения:
Преобразуем данное выр-ие прибавив и отняв к скобке
В этом выр-ии заменяем σ² несмещенной оценкой по эмпир ур-ию регр-ии σ²=∑ei²/n-2 и тогда мы м рассчитать Т стат-ку
, получаемого из значения теорет дисп-ии заменой дисп теорет откл-ия σ² на So², вычис-ое по выборке ∑ei²/n-2. А тогда мы м, используя табл Стьюдента, выч-ть вер-ть того, что |T|≤tрасч
Тогда ν=n-2.
И м посчитать, сделав такие же преобр-ия как для коэф-в ур-ия, что мат ожидание нах-ся в инт-ле:
2). Предсказание индив знач-ий завис перем-й.
Предположим, что нас интер-т нек-ое конкр-е знач-ие вел-ны завис-й перем-й yo. При ее сопост-ии со знач-м, кот-ое м.б. рассч-но по ур-ию регре-ии.
Мы знаем, что yoб норм распр-но с пар-ми ỹ~N(βo+β1xпр;σ²). Одновр-но с этим
с таким же ср и дисп-ей, рассч-й для ỹпр.
Построим нов перем-ую U= ỹo— ỹпр и нас б интер-ть поведение такой случ вел-ны.
М(ỹо- ỹпр)= М(ỹо)-М(ỹпр)=0
D(ỹо- ỹпр)= D(ỹо)+D(ỹпр)=>
Каждую из кот-ых мы м оценить, используя выбор значения.
=>S²(ỹj-ỹпр)= S²(ỹо)+S²(ỹпр)
Каждая из них нам изв-на. Первая вел-на оцен-ся
Т.о. мы м расч-ть стандарт ее откл-ия в рез-те чего получили Трасч данной случ вел-ны. продолжение
--PAGE_BREAK--
Проверка общего кач-ва ур-ия регрессии. Коэф-т детерминации
R
².
Расчет ур-ие регр-ии всегда проходит так, что не все точки выборки принадлежат этой прямой. Обычно оно лишь частично объясняет поведение точек выборки. Сущ-т диаграмма Венна, позволяющая интерпретир-ть ур-нь этой оценки.
5 графиков:
На счеме 1 х никак не влияет на поведение У. 2;3;4 пок-т все усиливающееся влияние объясняющей перем-й на объясняемую. На 5 ф-р х полностью объясняет поведение У.
Суммарной мерой общего кач-ва ур-ия регр-ии яв-ся коэф-т детерминации R².
Поясним его смысл и покажем методику вычисления.
Предпол-м, что мы рассч-ли эмпир ур-ие рер-ии ỹ=bo+b1x. Тогда yi=ỹ+ei.
Рассм-м вел-ну откл-ия точек выборки завис-й перем-й от их ср вел-ны.
Преобразуем эту разность прибавив и отняв от нее соответ-е знач-ие, рассчит-е по ур-ию регр-ии.
Тогда 2 слогаемое – та часть, кот-ая не объяснена в этом откл-ие ур-ем регр-ии, а 1 это часть объясненная ур-ем регр-ии. Получ выр-ие возведем в квадрат.
и просуммир-м по всем знач-м i.
Рассм-м сред слогаемое
Мы получили знач-ие для мат ожидания вел-ны
Разделим это рав-во на лев часть.
В лев сто-не записана доля разброса точек выборки отн-но ур-ия регр-ии и доля разброса не объясненная этим ур-ем.
Т.е. объясненная доля разброса, если ее принять за коэф-т детер-ии ур-ия б опр-ся как
Очевидно, что 0≤R²≤1, т.е. когда ∑ei²=0, все точки выборки лежат а прямой линии регр-ии, то R²=1 идеальный вар-т.
А если совпадает с дисп-ей разброса объясняемой перем-й, т.е. ур-ие регр-ии ничего не объяснило в поведении завис перем-й R²=0.
Возм-ны усл-ия наруш-ия этого соотн-ия, при кот-ых R²≤0. Они связаны с тем, что неправ-но выбрана специф-ия модели, т.е. вид зав-ти м/у х и У.
Если модель строится на основе данных врем-х рядов, то R² как правило нах-ся в диапазоне 0,6≤R²≤0,7.
Покажем как в случае парной регр-ии коэф-т детер-ии связан с вел-ной выбороч-й коррел-ии м/у перем-ми х и У.
Для этого выпишем долю разброса, объясненную ур-ем регр-ии.
Запишем вместо b1 его вел-ну:
Числ-ль и знам-ль преоб-м для чего умножим их на ∑ квадратов откл-ий по объясняющ перем-й
Заметим, что
Тогда мы в нашем выраж-ии
Множественная линейная регрессия.
Общеиз-но, что на люб эк пок-ль чаще всего оказ-т влияние не 1, а какие-то мно-во ф-ров. Тогда мы д исп-ть ур-ие множест регр-ии y=βo+β1x1+β2x2…+βmxm+ε, те.е знач-ие у зависит от mф-ров.
При m≥2, регр-ия сч-ся множест-й. Если мы составим нек-ый вектор
mх 1, то мы м рассм-ть как ур-ие заданное в векторно-матричной форме, сформировав из значений объясняющ-х перем-ых некую матрицу, строками кот-ый яв-ся значения объясн-й перем-й, входящие в 1 выборочную компоненту.
Столбцы представлены наборами значений каждого из фак-ров, входящих в модель.
Тогда сов-ые знач-ия завис перем-й м.б. предст-ны в виде в-ра столбца.
Случ откл-ия также м рассм-ся как нек-ый столбец
Но исходя из того, что в модели при βо всегда коэф-т =1, то матрицу значений объясн-их перем-ых пополняют 1-м столбцом, состоящим из 1 и обознач-т за Х.
Эта матрица имеет размерность nx(m+1).
Ур-ие регр-ии в матрично-вей форме мы м представить как У=Хβ+ε
При этом д вып-ся усл-ие n≥3m-1 и все усл-ия Гауса-Маркова, кот-ые кратко запишем в форме
1).М(εi)=0 для люб i.
2).D(εi)=D(εi)=σ² для люб iи j
3).Отсут-т связь м/у откл-ми
4).Случ откл-ия не зависят от объясняющ перем-ых cov(εi;xi)=0.
5).Модель линейна отн-но расчет пар-ов, но в ур-ях множест регр-ии возн-т необ-ть выпол-ия еще одного усл-ия.
6). В модели отсут-т соверш мульт-ть м/у объясняющ перем-ми. Нап-р: в модель нельзя одновр-но включать данные годовые и квартальные в этом же году, т.к. годовые склад-ся из поквартальных.
7). Как уже б показано для исп-ия tстат-ки и расчета стандартов откл-ий д вып-ся требование о том, что случ откл-ия εiимеют норм распр-ие εi~N(0;σ²). Выполнимость этой предпосылки дает возм-ть при соотв-ии модели осн требованиям модели Гауса-Маркова утвер-ть, что мы нашли наилучшие оценки коэф-в ур-ия, чем м бы их получить, используя люб др метод нахождения.
Предпол-м, что мы вычислили оценки коэф-та, тогда ур-ие множест регр-ии, построенное на основе выборки, б запис-ть в форме аналогич записи в парной регр-ии.
ỹ=bo+b1x1+b2x2+…+bmxm
y=bo+b1x1+b2x2+…+bmxm+e, где е – вектор расчетных откл-ий
И для любого набора значений ф-ров в выборке б вып-ся
ỹi=bo+b1xi1+b2xi2+…+bmxim
yi— ỹi=ei
А тогда по методу МНК мы м опр-ть ф-ию Q=∑ei²= ∑(yi-bo-b1xi1-b2xi2-…-bmxim)²
И найти от этой ф-ии част производные по ее парам-м (коэф-там ур-ия).
Получаем сис-му из m+1 ур-ия с m+1 неизв-м. Если ее приравнят к 0, то получим сис-му лин ур-ий отн-но коэф-в ур-ия регр-ии, кот-ая всегда б иметь единств решение, т.к. мы м добиться того, чтобы опр-ль сис-мы был ≠0.
Но в тех случаях, когда кол-во объясняющ перем-х m>2, решение таких сис-м нач-т вызывать трудности, поэтому расчет коэф-в делают в матрчно-вект-й форме.
Расчет коэффициентов множественной линейной регрессии.
Предпол-м, что исход выборка предст-на как
Век-р искомых коэф-в и вектор откл-ий
Тогда вел-на Qм.б. запис-на в виде произв-ия 2-х век-ров как
А Ỹб опр-ся как
=>е=У-Ỹ
, т.к. транспонирование озн-т, что строки стан-ся столбцами и наоборот.
Но т.к. Q–нек-ое число, то каждое из выраж-й здесь также из себя предс-т число.
При трансп-ии матрица сост-ая из 1 эл-та переходит сама в себя.
Воспол-ся этим св-вом и докажем, что 2 и 3 слогаемое в выр-ии совп-т. Для этого транспон-ем любое из них.
2).
Найдем производную от этого выр-ия по любой из компонент в-ра В.
Распишем в явном виде значение для 2 и 3 выраж-ий, т.кк производ от 1-го слог-го по люб bj=0.
Тогда производ-я по люб из значений bj м.б. предст-на как эл-ты произведения из соответ строки этой матрицы (век-ра-столбца), т.е.
Рассм-м теперь последнее из слогаемых, но сначала распишем матрицу
Размер-ть 1-й (m+1)n, 2-й n(m+1)
Размер-ть итоговой (m+1)(m+1)
Полученная матрица всегда симметр-на отн-но глав диагонали, т.к. под знаком суммир-я множители м поменять местами.
Б считать, что эл-ми матрицы Zяв-ся Zij, причем, чтобы не запис-ть нулевые строку и столбец, добавленные в выборку.
Z=(Zij) i=1, m+1
j=1, m+1
Б считать, что эл-ты Zимеют индексы:
,
где индекс 0 соотнес с этой добавленной строкой и столбцом.
Тогда все выраж-ие б равно
Тогда при вычил-ии производ-й от такого выраж-ия каждая производ-я по bjб встреч-ся дважды: 1-й раз во внеш суммир-ии, 2-й во внутр.
Поэтому производ-й от 3-го слогаемого б рав-на:
И чтобы найти значи-я для век-ра В, мы д эту производ-ю приравнять к 0.
Общее выражение для нахождения коэф-в в ур-ях множест регрессии.
Значения для эл-тов век-ра Bпри m=1 и m=2получить на практике в общем матричном виде, что позволит понять принцип нахож-ия коэф-в ур-ий с люб кол-вом объясняющ перем-ых.
Но при решении задач с 2 объясняющ перем-ми (m=2) мы б польз-ся преобразован-ми знач-ми, получ-ми из общего вида m=2 в форме:
Для b2 получаем симметрично
bo– усл-ие прохождения ч/з среднюю точку выборки.
1-3 (дисп-ии откл-ий) не м.б. отрицат. 4-6 (ковариации) м.б. люб
Дисперсии и стандартные ошибки коэффициентов.
Их знание позвол-т анализ-ть точность найденных оценок коэф-в, строить их доверит интер-лы и проверять соответ-ие гипотезы.
Наиболее удобным для такой проверки знач-я дисп-ий и станд откл-ий, запис-й в матр-но-векторной форме.
Если мы запишем вектор теорет откл-ий
,
введем вспомогат век-р I, состоящий из ед-ц
,
то мы сможем, используя единич матрицу, записать матрицу ковариаций случ откл-ий в форме:
D(εi)=D(εj)=σ²
Исходя из этого К(ε)=σ²Е, где Е- единич матрица.
Усл-ия Гауса-Маркова б выглядеть:
1). Мε)=0
2). D(ε)=σ²I(век-р единич)
3). К(ε)=σ²Е
Рассм-м, когда знач-я для коэф-в с учетом их соотн-ия с теоретич коэф-ми из ур-ия регр-ии.
Откл-ие теорет век-ра от расчет
Построим ковариационную матрицу для теорет коэф-в, использую получ-е соот-ие.
Т.к. матрица симметр-на относ-но глав диагонали, то обрат к ней матрица тоже симмет-на=>
Кроме ε все значения яв-ся constиз выборки. Поэтому множ-ли можно вынести из мат ожидания, сохранив порядок умножения.
=> для люб знач-ия коэф-та bjмы можем представить единич дисп-ию его вел-ны ч/з выбороч знач-я, зная что оценкой для σ² яв-ся
σ²→So²=∑ei²/n-m-1, а из матрицы обратной мы возьмем соответ-й эл-т с глав диаг-ли матрицы Z.
А тогда мы получ-ем возм-ть рассч-ть t-стат-ку.
При проверке гипотез отн-но коэф-в ур-ие множ регр-ии также как и для ур-ия парной регр-ии. Отличие состоит в том, что при построении доверит инт-ла отн-но завис-й перем-й у.
. Для мат ожидания →
В остальном, выраж-е для доверит интер-в полностью соот-т значению доверит инт-в в ур-ях парной регр-ии. продолжение
--PAGE_BREAK--
Анализ качества эмпирических уравнений и множества линейных регрессий.
Построение эмпир ур-ия яв-ся начальным этапом эмпир анализа. 1-ое построенное Ур-ие по имеющейся выборке оч редко яв-ся удовл-м по всем хар-м. Поэтому след важнейшая задача – проверка кач-ва ур-ия.
В экономет-ке принята устоявшаяся схема такого анализа. Она провод-ся по след напр-ям:
1).Проверка стат знач-ти коэф-в рассматр-го ур-ия регр-ии.
2). Проверка общего кач-ва ур-ия.
3). Проверка св-в данных, выполнимость кот-ых предназначалась при оценивании ур-ий, т.е. это проверка усл-ий Гауса-Маркова.
1). Проверка стат знач-ти коэф-в рассматр-го ур-ия регр-ии.
Как и в парных ур-иях, эта проверка дел-ся на основе t-статистик.
Т.е. рассч-сяtbj=|bj/Sbj|.
И если |tbj|>tкр, то коэф-т сч-ся значимым.
Если |tbj|
Его присут-ие в ур-ии неоправданно со стат т.зр., и он м лишь искажать реальн картину взаимосвязей. Поэтому рекоменд-ся такие ф=ры из ур-ия исключать.
Зачастую, строгую проверку м не делать. Достаточно и грубой оценки.
|tbj|≤1 – не значим
1
2
3
Коэф-т искл-т, если |tbj|≤1
2). Проверка общего кач-ва ур-ия.
Для этого, как и в парной регр-ии, исп-ся Fстат-ки.
Fкр=Fα1,υ1,υ
υ1=mυ2=n-m-1
И также, как в tстат-ке, если Fрасч>Fкр, то ур-ие сч-ся значимым.
Как б показано, 0
Но для того, чтобы соотнести ур-нь детермин-ии с каждым из объясн-их ф-ров, его коррет-т на число степеней свободы в исходной выборке. Вводят скоррек-й коэф-т
Т.е. в знаменателе записана несмещенная оценка общей дисп-ии независ-й перемен-й. А в числ-ле мы расс-м вел-ну, соответ-ую So²=∑ei²/(n-m-1).
В этом случае соот-ие м.б. предст-но ч/з исходное значение коэф-та детерминации:
Обычно привод-ся данные как для одного, так и для др коэф-та детерм-ии. Но абсолютизировать эти пок-ли нельзя.
Сущ-т мно-во вар-тов, когда при высоком знач-ии R² (R²→1), не б вып-ся усл-ий Гаусса-Маркова, и ур-ие окаж-ся низкого кач-ва.
Анализ статистической значимости коэффициента детерминации.
Он провер-ся по Fтат-ке. Проверка соот-т гипотезе Ho:β1=β2-…βm=0.
Если Fрасч≤Fкр, то десается вывод, что совокуп влияние всех объясн-х переем-х, исп-х в модели, не зависимую пере-ю стат-ки не значит. У ур-ия низкое кач-во.
Если же гипотеза откл-ся (Fр>Fкр), то объясненная дисп-ия разброса завис-ой переем-й соизмерима с дисп-ей, вызванной случ откл-ми. Очевидно, что Rи R²=0 или ≠0 одновр-но. А это значит, что по МНК наилуч-я линяя регр-ии ỹ=yср, а => у лин не зависит от объясн-их переем-х.
В случаях парной регр-ии, проверка нулевой гипотезы для R² равносильна проверке на стат значимость tстат-к из соотношения
т.к. m=1, ar²=(rxy)²
Проверка равенства 2-х коэффициентов детерминации.
Основана на исп-ии стат-ки Фишера для проверки необх-ти включения или искл-ия в ур-ии множест регр-ии доп объян-их переем-х.
Предположим, что изнач-но построено ур-ие, содерж-ее mобъясн-их переем-х:
и для него вычислим коэф-т детерм-ии R²I. Исключим из исх-ой выборки все объясняющ переем-ые, имеющие номер > чем к. Тогда, по ост выборке мы м построить др ур-ие регр-ии:
ŷ и для него опр-м R²II. Всегда R²II≤R²I, т.к. включ в модель кажд доп пере-й объясн-т еще какую-то долю ее разброса отн-но ур-ия регр-ии. Тогда нас интер-т на сколько кач-во одного ур-ия отлич-ся от кач-ва др ур-ия.
Поэтому гипотеза Но состоит в том, что коэф-ты детер-ии совпадают (кач-во одинаковое), а с ней конкур-т Н1.
R²I= R²II– кач различно.
В соответ-ии с ними рассч-ся R²стат:
, где m-k– кол-во исключ объясн-х переем-х.
Если Fрасч≤Fкр, то кач-во ур-ий приблизит одинаково, значит переем-ые исключ-ны правильно.
Если Fрасч>Fкр, кач-во ур-ий сущ-но разл-но, и мы не д.б.исключать эти переем-ые.
Замечание:обычно на практике не искл-ся одновр-но несколько объясн-х переем-ых. Их берут по одному и каждый раз сч-т Fстат по соотн-ю:
, где k– кол-во исключ объясн-х переем-х. Как правило k=1.
При этом м искл-ть не последующие объясн переем-е, а любую, начиная с тех, у кот-ых mintстат.
Таким же образом м идти проверка целесообр-ти включения доп объясн-х переем-х в исход модель.
Допустим, что это б модель I, и мы к ней добавили Р объясн-х переем-х.
Расч-ли 3-ю модель:
и у него коэф-т детерм-ии R²III.
Тогда сч-т Fстат= (R²III-R²I)/(1-R²III) * [n-(m+p)]/pи ее проверяют по Fкр Фишера.
Проверка гипотезы о совпадении уравнений 2-х различных выборок.
Это еще одно напр-ие исп-ия F-стат Фишера. Такая проверка дел-ся тестом Чоу, кот-ый сост-т в:
Пусть имеется 2 выборки объема n1 и n2. У каждой постоено свое ур-ие регр-ии
для n1
для т2.
И мы хотим проверить отл-ие и
Тогда:
Предположим, что мы рассч-ли ∑ квадратов откл-ий для этих ур-ий
Потом по объед-й выборке (n1+n2) построим ур-ие регр-ии.
и для него также вычислим
и затем считаем Fстат, сравнивающую эти суммы квадратов откл-ий.
. Тогда Fкр=Fα. υ1=m+1 υ2=(n1+n2)-2m-2. Потому что для Sмы имеем (n1+n2)-m-1 степеней свободы.
Для + степеней свободы
= (n1+n2-2m-2).
Тогда, если Fрасч
И мы м исп-ть любое из ур-ий, рассч-х по этим выборкам, т.е. выборки м.б. объединять.
Такую проверку приход-ся делать при построении дин рядов. Предположим, мы строим ур-ие парной регр-ии объмов продаж. minавто с toдо t2. При этом знаем, что в t1 изменены пошлины, те.е. изм-сь институц среда.
За (toдо t1) есть выборка n1 и ур-ие .
За (t1; t2) выборка n2 и ур-ие
А потом по объед выборке строим обязат ур-ие ỹ
График.
Если Но не откл-ся, то мы реально м строить ỹпо сов-й выборке без учета институц изм-ий и исп-ть его для прогноза на ((t2-to)/3)
Проверка выполнимости предпосылок МНК.
Проверка на отсут-ие а/коррел остатков (ста-ка DW)
Стат знач-ть коэф-в ур-ия регр-ии и близость ед-цы к-та детерм-ии еще не гаран-т выс кач-во построенного ур-ия, т.к. м не вып-ся какие-то из предпосылок Гауса-Маркова.
Одной из таких предпос-к яв-ся незав-ть случ откл-ий др от др, что гаран-ся усл-ем
Послед-ая коррел-я откл-ий наз-ся а/коррел и показ-т, что если построена упорядоч-я по вр-ни (или номерами выборки) послед-ть откл-ий, то это озн-т, что или в выборке испол-ны перекрест знач-я или задан времен-й ряд, в кот-м послед-ие вел-ны генерир-ся предыд-ми. Поэтому в выкладках м исп-ся обозначеия
, т.е. откл-ия соседние по вр-ни.
В эк задачах как правило встреч-ся положит а/коррел и очень редко возм-на отрицат.
В больш-ве случаев это связано с тем, что в модели отсут-т нек-ый ф-р, кот-ый возд-т на объясн-ую переем-ую в постоян напр-ии.
Сущность а/коррелм объяснить на след примере.
Предпол-м иссл-ся спрос У на прохлад напитки в зав-ти от дохода Х для домохоз-ва по среднемес данным. Предпол-м, что трендовая зав-ть, построен-я по этой выборке в виде ур-ия парной регр-ии.
б опис-ся нек-ой линией
График.
Но реал потреб-ие прохлад напитков безусл-но зависит от вр-ни года. Т.е. фактич-е т выборки в зав-ти от сезона года б нах-ся или все выше или все ниже линии.
Аналог картина набл-ся в макре по циклам деловой акт-ти.
Положит а/коррел озн-т, что в бол-ве случаев за положит откл-ми след-т полож, а за отриц отриц-ые, что и озн-т однонапр-ую связь м/у откл-ми – ковариация полож-на.
Среди осн-ых причин, вызыв-х наличие а/коррел обычно выд-т:
1). Ошибки специф-ии модели, т.е. не учет в модели какой-то важной объясн-й переем-й или неправ-й выбор формы зав-ти.
2).Инерция в изм-ие эк пок-лей. Многие эк пок-ли (инф-ия, безр-ца, объем ВНП) облад-т опр-й циклич-тью, связ-й с волнообр-тью.
Нап-р эк подъем приводит к росту занят-ти, сокр инф-ии, ↑ ВНП. Он продол-ся до тех пор, пока изм-ия конъюнктуры рынка и ряда др эк хар-к рынка не приведут к замедл-ию роста, затем его ост-ке и дальней-му снижению пок-лей. Но в люб случае эта трансфо-ия осущ-ся замедл-но и облад-т опр-й инерцией.
3). Эффект паутины. Во многих эк процессах и в пр-ве пок-ли реаг-т на изм-ие эк усл-ий с временным лабом.
Нап-р: предл-ие с/х прод-ии реаг-т на изм-ие цены на нее с запазд-ем = периоду до получения нов урожая.
Большая цена в прошлом году вызовет рост про-ва в этом году. Скорее всего произ-т ее перепро-во => цена ↓, в след году б исп-ны под зерновые цена ↑ и т.д. пока не уст-ся равновесие.
4). Сглаживание данных. Общеизв-но, что врем тренды стр-ся на основе сглаж-ия данных по врем рядам.
=> каждая след-ая средняя в нашем вар-те входить 2 предидущ знач-ия, т.е. ср зав=т др от др. И это служит причиной наличия положит а/коррел у врем рядов.
Последствия и способы обнаружения автокорреляции. Графический метод.
Если регресс-я модель рассч-сь по МНК, то
1). Оценки пар-ров ур-ия оставаясь несмещ-ми отн-но среднего перестают быть эф-ми, т.е. наилучшими из всех возм-х.
2). Дисп-ии этих оценок вычисл-ые по станд формулам б смещенными в сто-ну убывания, что повлечет за собой увелич-е t-статистик.
что м привести к признанию стат-ки знач-ми (tbj>tкр) тех переем-х в ур-ии, кот-ые такими не яв-ся.
3). Вел-на So²=∑ei²/(n-m-1) также окаж-ся смещенной отн-но теоретич дисп-ии откл-ий σ², а поэтому применение tи Fстатистик окаж-ся необоснов-м, б получены неправ-е выводы по модели и ухуд-ся ее прогозные кач-ва.
Чтобы обнаружить а/коррел исп-т неск0ко методов.
Графический метод.
В этом случае стр-ся графики, связыв-ие номер выбора выборочной компоненты или время, для кот-го взята переем-я и соответ-ие знач-ия для откл-ий, получ-х исходя из рассчит-го ур-ия регр-ии.
4 графика.
На первых 3-х графиках изобр-на нек-ая зав-ть вел-ны откл-ия от № выборочной пары. М предпол-ть, что в модели присут-т а/коррел остатков. На 4 графке такой зав-ти нет, поэтому мы м предпол-ть отсут-ие а/коррк. Причем сч-ся, что ≈ 10% точек м.б. неподчинены осн зав-ти и а/коррел отсут-т.
Метод Дарбина-Уотсона.
По нему рассч-ся к-т а/коррел остатков первого пор-ка, кот-ый совп-т со знач-м коэф-та выбороч-й коррел
Но мы знаем, что мат ожидания (ср знач) откл-ий =0 в методе МНК => получили
Но на практике для такого анализа исп-т стат-ку DW, для кот-й сущ-т расчет-е таблицы
Покажем, что эти вел-ны дейст-но совп-т. Для этого преобр-м числ-ть
Последняя ∑ отл-ся от первой на 1 слогаемое. А т.к. знач-е eiневелики, то мы м предпол-ть, что они м/у собой совп-т. Тогда
≈2∑ei² -2∑eiei-1
Тогда
А т.к. мы предпол-ли, что ∑ei² ≈∑ei-1², то
=> ста-ка DWб вести аналог-но поведению выбор коэф-та коррел м/у откл-ми.
Еслиr eiei-1 =1, DW=0
r eiei-1 =0, DW=2
r eiei-1 =-1, DW=4
Т.е. все знач-я этой стат-ки нах-ся в инт-ле (0;4) при 2 а/коррел остатков отсут-т. И вопрос закл-ся в том, насколько м эта стат-ка откл-ся от 2, чтобы мы м утвер-ть, что а/коррел отсут-т.
Таблицы DWпостроены с.о., что в соот-ии с заданным nвыбир-ся опр-ая таблица, входами в кот-ую яв-ся m-число объясняющих переем-х и n— объем выборки
Таблица
Предпол-м n=kи в модели исп-ны m=2. Тогда из таблицы б найдены 2 числа dlи du, dl
В зав-ти от того, куда попадет значение DW, мы м делать выводы о наличие или отсут-ии а/коррел остатков в модели. Но т.к. по этому методу мы ничего не м сказать окончат-но при попадании в зоны неопр-ти.
Метод рядов.
Основан на учете чередования знаков у отклонений ei. Для этого поступают с.о. Нап-р для нашей задачи, рассч-й для парной регр-ии, выставим посл-ть знаков по откл-ию.
(--)(++)(--)(+++)(-)(++) n=12
Затем объед-ся инт-лы совпадающих знаков. Каждая из образ-ых послед-тей наз-ся рядов (ряд одинак знаков). В нашей задаче к=6. Кол-во одинак знакв в отдел-м ряду наз-ся длиной ряда. Если рядов сущ-но мало по отн-ию к объему выборки n, то вер-на положит а/коррел, а если их много, то возм-на отрицат а/коррел.
Для более детального анализа поступ-т с.о. Пусть n– объем выборки. n1 – кол-во положит знаков. n2 – отрицат. В нашем случае n1=7 n2=5.
При достаточно большом кол-ве наблюдений n>20, мы м посчитать мат ожидание кол-ва рядов знаков.
и дис-ию разброса этого кол-ва рядов
Тогда, если принять, что мат ожидание м оценить ч/з таблицы распред-ия кол-ва рядов, кот-ое д нах-ся в инт-ле , то при попадании в этот инт-л а/коррел остатков б отсут-ть. В противном случае, если , то у нас положит а/коррел, а если k≥ — отрицат. Для такого распред-я б построены таблицы Экхарда, в соот-ии с кот-ми м опр-ть нижнюю и верхнюю гр-цу числа К. К1
Таблицы имеют стр-ру
Нижняя граница К1
Таблица имеет своб поля. Если попадаем в своб поле, то к1 выбираем наименьший в этой строке.
Верхняя гр-ца К2.
Выбор осущ-ся также как для К1 и знач-я берутся для своб полей также как и в 1 случае.
В отл-ии от критерия DWэтот метод дает однознач ответ, причем н помнить, что метод DWне применим для регресс моделей, содерж-х в кач-ве объясн-х переем-х нек-ые лаговые объясн вел-ны. Даже если этот лаг имеет 1 пер-д. Нап-р в модели . Для таких моделей исп-ся спец n-стат-ка Дарбина, по кот-й , где — вычис-ся из стат-ки DW. Обычно ее принимают =1-1/2DW, т.к. .
обычно при-т равной квадрату станд-й ошибки коэф-та при лаговой переменной. В нашем примере . продолжение
--PAGE_BREAK--