Реферат по предмету "Математика"


Парная линейная регрессия, парная нелинейная регрессия, множественная регрессия, временные ряды

--PAGE_BREAK--
F-отношение определяется как:

                                          (1.21)

Нулевая гипотеза (об отсутствии связи между y и x) принимается если:

, где                                         (1.22)

Ftable(1,n-2,α) — табличное значение F-критерия для степеней свободы 1 (числитель), n-2 (знаменатель),α — уровень значимости.

Гипотеза о наличии связи между y и x принимается если

                                               (1.23)

1.4.2. Порядок выполнения проверки нулевой гипотезы:

1.4.2.1. Сделаем копию листа и озаглавим его «Существенность параметров».

1.4.2.2. Сформируем заголовки таблицы модели (Рисунок 1.12).

1.4.2.3. Выделим ячейки для расчета:

— средних квадратов отклонений на одну степень свободы (Dcom, Dfact, Drem),

— коэффициента детерминации D через суммы квадратов отклонений,

— средних квадратов отклонений,

— F-отношения, через средние квадратов отклонений на одну степень свободы,

— F-отношения, через коэффициент детерминации,

— табличного значения F-критерия,

1.4.2.4. Сформируем заголовки строк для расчета сумм квадратов отклонений.



Рисунок 1.12

1.4.2.5. Рассчитаем суммы квадратов отклонений (Sfact, Srem, Scom).

1.4.2.6. Рассчитаем средние квадраты отклонений на одну степень свободы (1.20, 1.21, 1.22).

1.4.2.7. Рассчитаем коэффициент детерминации D через суммы квадратов отклонений:

                                                 (1.24)

1.4.2.8. Вычислим F-отношение через средние квадратов отклонений на одну степень свободы (1.23),

1.4.2.9. Вычислим F-отношения, через коэффициент детерминации:



1.4.2.10. Вычислим табличное значение F-критерия,

Введем табличное значение F-критерия для уровня значимости а = 0,05, воспользовавшись стандартной функцией из статистической категории Fобр (FINV) с тремя аргументами: (уровень значимости; степень свободы числителя F-отношения; степень свободы знаменателя F-отношения). Для нашего случая в ячейку табличного значения F-критерия заносится формула «=FINV(0,05;1;98)»

1.4.2.11. Из данных вычислений получили:

Так как Ftable , то гипотеза Но о наличии связи между x и y принимается.

1.4.2.12. При увеличении ошибки регрессионной модели е, F-отношение уменьшается, что говорит об ослаблении связи между x и y, что, в конце концов, приводит к разрыву этой связи. Тогда гипотеза Но о наличии связи между x и y отвергается. (Рисунок 1.12а, Рисунок 1.12б)



Рисунок 1.12а



Рисунок 1.12б

1.4.2.13. При ошибке регрессионной модели, при которой нулевая гипотеза отвергается идентифицированная линия регрессии намного отклоняется от заданной.

1.5. Оценка доверительных интервалов линии регрессии и прогноза зависимой переменной.

1.5.1. Основные положения:

Стандартная ошибка в оценках параметров а и b определяется как:

                              (1.25)

                                                (1.26)

Соответственно, доверительные интервалы для фактических коэффициентов bf и af будут:

                                            (1.27)

Стандартное отклонение для линии регрессии определяется как:

                                    (1.28)

Соответственно, доверительные интервалы для линии регрессии определяются как:

                                     (1.29)

Стандартная ошибка прогноза определяется формулой по полученной линии регрессии определяется как:

                                 (1.30)

Доверительные границы прогноза определяются как:

                                     (1.31)

1.5.2. Последовательность выполнения процедуры оценки доверительных интервалов:

1.5.2.1. Скопируем лист и озаглавим его «Доверительные интервалы».

1.5.2.2. Сформируем заголовки таблицы модели:



Рисунок 1.13

1.5.2.3. Выделим ячейки (Рисунок 1.13) для расчета:

— стандартных ошибок оценки коэффициента b и a (CKOb, CKOa),

— значения t-критерия Стьюдента для коэффициентов b и a (tb, ta),

— табличного значения t-критерия (tinv),

— верхних и нижних доверительных интервалов (Дов.инт. НГ, ВГ).

1.5.2.4. Рассчитаем стандартные ошибки в оценке коэффициентов линии регрессии mb, ma (1.27, 1.28).

1.5.2.5. Рассчитаем фактические значения t-критерия Стьюдента по формулам:

                                                      (1.32)

1.5.2.6. Введем функцию расчета табличного значения t-критерия.

Аргументы функции: доверительная вероятность (α) и число степеней свободы (n-2).

1.5.2.7. Сопоставляя фактические и табличные значения t-критерия Стьюдента модели b и a и выдвинув гипотезу Но (о статистической незначимости параметров, т.е. a=b=rxy=0), делаем вывод:

т.к. ta>tтабл, tb, то b-незначим, а не случайно отличается от нуля, а сформировалось под влиянием систематически действующей произвольной.

1.5.2.8. Рассчитаем верхние и нижние значения коэффициентов b и a для уровня значимости α=0,05 (1.29).

1.5.2.9. Добавим колонки с расчетом нижней и верхней границы линии регрессии (Рисунок 1.14).

Расчет производится по формулам (1.30, 1.31).

(При вводе формул обращаем особое внимание, на то, какие ссылки должны быть абсолютными, а какие — относительными).



Рисунок 1.14

1.5.2.10. Построим точечные графики зависимости полученной линии регрессии и доверительных интервалов для различных значений ошибки σе (Рисунок 1.15).



Рисунок 1.15

1.5.2.11. Как видно на графике, при увеличении значений ошибки σе границы доверительных интервалов увеличиваются и наоборот, что говорит об ослаблении связи между x и y.

1.5.2.12. Добавим колонки с расчетом нижней и верхней границы линии прогноза зависимой переменной для уровня значимости α=0,05 (Рисунок 1.16). Доверительные границы прогноза зависимой переменной вычисляются по формулам (1.32, 1.33).

Вначале получим столбец значений СКО (1.32). После этого получить значения нижней и верхней границ (1.33). Данные интервалы учитывают статистический характер оценок коэффициентов b и a. Однако для больших объемов наблюдений значение в формуле (1.30).



относительно малы по сравнению с единицей. В этой связи оценка стандартной ошибка прогноза может быть определена как:

                     (1.33)



Рисунок 1.16

Доверительные интервалы в этом случае будут строиться аналогично. Однако следует учесть, что они справедливы лишь для конкретного набора зависимой и независимой переменных, т.е. для конкретных идентифицированных значений коэффициентов b и a.

1.5.2.13. Изменяя ошибку модели получим несколько доверительных границ прогноза.



Рисунок 1.17

1.5.2.14. Из рисунка видно, что с увеличением границ прогноза связь между x и y ослабевает под влиянием ошибки σе. на линии регрессии.

1.6. Идентификация с помощью функции «Линейн» («LINEST») ППП Excel. Для идентификации с помощью функции «Линейн» («LINEST») ППП Excel необходимо:

-выделим массив ячеек 2х5 (Рисунок 1.18).

-вызовем функцию «линейн».

-введем 4 аргумента:

-массив y

-массив x

-константа а – ИСТИНА

-статистические характеристики – ИСТИНА

Введем данную формулу, как формулу массива для этого нажмем на клавишу F2 или активизируем строку формул. После ввода формулы массива удерживая клавиши и жмем на клавишу.



Рисунок 1.18

Таблица 1.1 представляет возвращаемые переменные в ячейках формулы массива (Рисунок 1.18).

Таблица 1.1

Коэффициент регрессии, b

Свободный член, a

СКОкоэффициент регрессии b, mb

СКОкоэффициента а, ma

Коэффициент детерминации, D

Стандартное отклонение наблюдаемых значений независимой переменной от линии регрессии, σrem (корень из Drem)

F-отношение

Число степеней свободы n-2 в F-критерии (1, n-2, α)

Сумма квадратов отклонений, объясняемой регрессией

Остаточная сумма квадратов

При повторе моделирования (путем нажатия клавиши F9) полученные с данной функцией результаты совпадают с ранее вычисленными «вручную».

1.7. Идентификация с помощью «Пакета анализа — Регрессия» ППП Excel. После вызова команды «Анализ данных» в меню «Сервис» выберем инструмент анализа «Регрессия». В диалоговом окне (Рисунок 1.19) введем интервалы для независимой и зависимой переменных x y.

Введем значение уровень надежности равный (1-α)100%, где α — уровень значимости. Например, для уровня значимости α =0,05, «Уровень значимости» будет составлять 95%.

Установим флажок на «выходном интервале» и в соседнюю ссылку вставим адрес левой верхней ячейки, с которой будут выводиться результаты анализа.



Рисунок 1.19

Рисунок 1.20 представляет результат анализа.

Заголовки таблицы «ВЫВОД ИТОГОВ».

Регрессионная статистика.

Множественный R – коэффициент корреляции, Данный пакет может быть использован для идентификации множественной регрессии (что будет рассмотрено далее), чем и объясняется определение данного коэффициента.

R-квадрат – коэффициент детерминации.

Стандартная ошибка – корень квадратный из среднего квадрата отклонений Drem.

Наблюдения – число наблюдений.

Дисперсионный анализ

Регрессия df – число степеней свободы (degree of freedom) для Sfact (сумма квадратов отклонений, обусловленная регрессией).

Остаток — df – число степеней свободы для Srem (остаточная сумма квадратов отклонений).

Итого — df – число степеней свободы для Scom (общая сумма квадратов отклонений).

Регрессия — SS –сумма квадратов отклонений, обусловленная регрессией (Sfact).

Остаток — SS –остаточная сумма квадратов отклонений (Srem).

Итого SS –общая сумма квадратов отклонений (Scom).

Регрессия — MS – cредний квадрат отклонений на одну степень свободы, обусловленный регрессией (Dfact).

Остаток — MS – cредний квадрат отклонений на одну степень свободы, обусловленный регрессией (Drem).

Итого — MS – cредний квадрат отклонений на одну степень свободы, обусловленный регрессией (Dcom).

F – F-отношение.

Значимость F — вероятность принятия нулевой гипотезы (гипотезы об отсутствии связи).

Y-пересечение – Коэффициенты – оценка коэффициента а.

Переменная х1 — Коэффициенты — оценка коэффициента b.

Y-пересечение (Переменная х1, х2) – Стандартная ошибка – СКО оценки коэффициентов а и b.

Y-пересечение (Переменная х1, х2) – t-статистика – фактические значения t-критерия Стьюдента для коэффициентов а и b.

Y-пересечение (Переменная х1, х2) — Р-значения — вероятность принятия нулевой гипотезы относительно коэффициентов регрессии а и b.

Y-пересечение (Переменная х1, х2) – Нижние (Верхние) 95% — Нижние и верхние доверительные границы для коэффициентов регрессии а и b для доверительной вероятности 0,95 (а=0,05).

(Экспоненциальная форма представления числа 1Е-44 эквивалентна записи 1*10-44).

1.7.1. Сопоставим значения таблицы «ВЫВОД ИТОГОВ» с рассчитанными вручную и с использованием функции «ЛИНЕЙН».



Рисунок 1.20

1.8 Анализ регрессии для реальных экономических показателей

По статистическим данным за n-ый год сформирована таблица. Проведем идентификацию и анализ парной линейной регрессии, используя функцию «Линейн» ППП Excel (Рисунок 1.21).



Рисунок 1.21

На основе данной таблицы и с помощью функции «Линейн» ППП Excel получаем следующие данные (Рисунок 1.22):



Рисунок 1.22

Из полученных данных можем вывести линейное уравнение зависимости y от x. Оно имеет вид: y=74,999214+0,029281x, т.е. с увеличением выручки на 1 руб., зар.плата будет увеличиваться на 0,029281 в среднем.

Судя по значению D=0,443311- связь переменных регрессии умеренная. Причем, 44%- это доля вариации y, объясненная вариацией фактора x, включенного в уравнение, а остальные 56% вариаций приходятся на долю других факторов, не учтенных в уравнении.

Выдвинем гипотезу Но о статистически незначимом отличии показателей от нуля: a=b=rxy
=0. С помощью таблицы Стьюдента определили, что t
таблдля числа степеней свободы df
=n-2=30-2=28 и а=0,05 составляет 2,0484.

t
a=74,999214/7,3521127=10,2> t
табл            t
b=0,029281/0,006201=4,72> t
табл

Исходя из этого, гипотеза Ноотклоняется т.е. aи bнеслучайно отличаются от нуля, а статистически значимы.


2. Моделирование и идентификация парной нелинейной регрессии


2.1. План работы

В процессе выполнения данной работы необходимо:

-синтезировать модель Монте-Карло парной нелинейной регрессии (прямая задача).

-вычислить параметры парной нелинейной регрессии (обратная задача идентификации.

-оценить существенность параметров линейной регрессии и доверительные интервалы линии регрессии.

-оценить доверительные интервалы прогноза.

-составить отчет по работе.

2.2. Модель Монте-Карло нелинейной регрессии

Парная нелинейная регрессия подразделяется на два вида

-нелинейная относительно независимой переменной x,

-нелинейная относительно оцениваемых параметров a и b.

Примером первого вида являются уравнения:

                                                        (2.1)

Примером второго вида являются степенная и экспоненциальная функции:

, где                                                       (2.2)

x— независимая переменная (признак-фактор),

y— зависимая переменная (результативный признак),

a, b — параметры модели.

e— случайное отклонение наблюдаемой зависимой переменной, вызванное влиянием других факторов. Аналогично линейным моделям данная величина распределена по центрированному нормальному закону со средним квадратическим отклонением σе. Задачей идентификации регрессионной модели является по данным реальных наблюдений зависимой (y) и независимой (x) переменной при наличии случайных отклонений (e) оценить параметры регрессионной модели a и b.

Парная нелинейная регрессия относительно независимой переменной x легко приводится к линеному виду путем замены переменной (z=x3 – для первого уравнения и z=1/x2 – для второго).

                                                  (2.3)

Уравнения парной нелинейной регрессия относительно оцениваемых параметров a и b не все приводятся к линейному виду. В данной работе рассматриваются модели, которые могут быть приведены к линейному виду (такие нелинейные модели называются внутренне линейными).

Степенная и экспоненциальная модели внутренне линейны, поскольку они могут быть приведены в линейному виду.

Так, для степенного уравнения логарифмирование позволяет получить линейную модель в виде:

                                                      (2.4)

Аналогично экспоненциальная модель приводится как:

                                        (2.5)

Данные уравнения являются основой статистического моделирования нелинейной регрессии.

Значения параметров для выполнения работы определяется вариантом. Ниже представлена методика выполнения работы для уравнения

                                                       (2.6)

2.2.1. Последовательность выполнения работы по моделированию.

2.2.1.1. Откроем новую книгу и сохраним ее в своей папке под именем ПНР.xls (Парная Нелинейная Регрессия). Озаглавим лист «Модель».

2.2.1.2. Сформируем заголовки для исходных данных модели (Рисунок 2.1)

— коэффициенты модели a, b;

— объем наблюдений n;

— среднее квадратическое отклонение погрешности СКОе;

— математическое ожидание независимой переменной Мх;

— среднее квадратическое отклонение независимой переменной СКОх.

— значение степени k

2.2.1.3. Введем значения а, b, k, CKOe (σе), Mx, CKOx.



Рисунок 2.1

2.2.1.4. Сформируем заголовки таблицы модели (Рисунок 2.2).

2.2.1.5. Выделим ячейки для:

-расчета коэффициента корреляции r;

-индекса корреляции R.

-номера наблюдения i;

-независимой переменной x;

-факторного значения зависимой переменной y, определяемой независимой переменной x;

-ошибки регрессии (отклонение наблюдаемой независимой величины от фактического значения зависимой переменной y, определяемой независимой переменной x) e;

-наблюдаемого значения зависимой переменной (с учетом ошибки регрессии e) y;



Рисунок 2.2

2.2.1.6. Введем первый номер наблюдения (i=1).

2.2.1.7. Смоделируем первое значение независимой переменной.

Случайное значение независимой переменной x моделируется аналогично линейной модели.

2.2.1.8. Рассчитаем теоретическое значение зависимой переменной.

Теоретическое значение зависимой переменной определяется формулой:

                                                   (2.7)

2.2.1.9. Смоделируем ошибку модели.

Ошибка модели моделируется аналогично линейной модели.

2.2.1.10. Рассчитаем фактическое значение зависимой переменной. Фактическое значение зависимой переменной рассчитывается как сумма теоретического значения и ошибки.

2.2.1.11. Смоделируем сто наблюдений.

Пользуясь средствами копирования содержимого ячеек в Excel получим 100 наблюдений независимой и зависимой переменной. В ячейку количества наблюдений n введем 100.

В отчете представить 10 первых значений (Рисунок 2.3) и построить точечные графики теоретической зависимости и смоделированных фактических наблюдений  (Рисунок 2.4).



Рисунок 2.3



Рисунок 2.4

2.3. Идентификация модели парной нелинейной регрессии.

2.3.1. Основные положения:

Рассматриваемая нелинейная регрессионная модель приводится к линейной путем введения новой переменной

.

Процедура идентификации и анализа полученной линейной модели y(z) аналогичена процедуре идентификации и анализа для линейной модели.

2.3.2. Последовательность выполнения.

2.3.2.1. Вводим новую переменную.

2.3.2.2. Получим столбец 100 значений новой переменной (Рисунок 2.5).



Рисунок 2.5

Таким образом, задача свелась к линейной модели



2.3.2.3. Для определения параметров a и b применить функцию «Линейн» («LINEST») ППП Excel, для чего выделить массив ячеек 2х5 (Рисунок 2.6).



Рисунок 2.6

2.3.2.4. Аналогично, как это делалось для линейной модели вводим формулу массива.

В ячейках формулы массива (Рисунок 2.6) возвращаемые переменные расположены в соответствии с таблицей, представленной в разделе парной линейной регрессии.

2.3.2.5. Сопоставим идентифицированные значения коэффициентов модели с заданными.

Посредством нажатия на клавишу F9 (при нажатии которой происходит новая генерация случайных чисел) пронаблюдать за изменением идентифицируемой линий регрессии из-за вариации рассчитанных коэффициентов a и b.

2.3.2.6. Видно, что при увеличении коэффициента a, коэффициент b уменьшается. Идентификационная линия регрессии с уменьшением коэффициента a приближается к теоретической линий данной регрессии.

Заключение о принятии нулевой гипотезы, построение доверительных интервалов линии регрессии y(z) и прогноза строятся аналогично, как это делалось выше для линейной модели (в рамках данной работы это разрешается не проводить).

2.3.2.7. Построим точечные графики зависимости теоретической и идентифицируемой линий регрессии.

Для этого необходимо преобразовать полученные зависимости от z в зависимости от x и получить столбец значений y (Рисунок 2.7).



Рисунок 2.7

В качестве параметров a и b используются идентифицированные с помощью функции «Линейн» значения.

2.3.2.8. С помощью мастера диаграмм построим теоретическую и идентифицированную линии регрессии (Рисунок 2.10).

2.3.2.9. Построим доверительные интервалы прогноза.

Доверительные интервалы прогноза определяются как:

, где

— теоретическое идентифицированная нелинейная линия регрессии (на странице Excel – yт),

- табличное значение коэффициента Стъюдента для доверительной вероятности α=0,05,

- Стандартное отклонение наблюдаемых значений независимой переменной от линии регрессии (2-й столбец,3-я строка возвращаемой таблицы функции «ЛИНЕЙН»).

Табличное значение коэффициента Стъюдента (tinv) для рассматриваемого примера (Рисунок 2.8):



Рисунок 2.8

Получим график с нелинейной регрессией и доверительными интервалами прогноза (Рисунок 2.9).



Рисунок 2.9

2.3.2.10. Генерируя различные случайные последовательности и изменяя СКОe получим различные теоретические и идентифицированные линии регрессии (Рисунок 2.10, Рисунок 2.11).



Рисунок 2.10



Рисунок 2.11

2.3.2.11. Из полученных линий регрессии видим, что в нашем случае (при первоначально заданной CKOe=3) связь параметров a иb была достаточно сильной. Поэтому при генерации различных случайных последовательностей теоретические и идентифицированные линии регрессии практически не отличаются друг от друга. При увеличении CKOe(CKOe=500) появляются значимые различия между линиями, а в некоторых случаях связь близка к разрыву.

2.4. Анализ нелинейной регрессии для реальных экономических показателей.

Исследуем зависимость общих расходов предприятия от объема производства.

Дана таблица наблюдений:



Рисунок 2.12

Исследуем данную зависимость при заданном уравнении y
=
bxk
+
a
+
eи k=0.5.

Получим средние значения по столбцам, а так же значения XYи X
^2.

Вычислим значения a и b:
    продолжение
--PAGE_BREAK--
b
= (ср
XY
-ср
X
*ср
Y
)/(ср
X
^2-(ср
X
)^2))

a
=ср
Y
-
b
*ср
X.

Формула для вычисления Yтеор имеет вид: Yтеор=b*x+a.

Рассчитаем средний квадрат отклонения (Y-Yтеор)^2, а так же для приведения нелинейного уравнения к линейному введем и рассчитаем новую переменную Z=X^k.



Рисунок 2.13

При помощи функции «Линейн» проведем анализ полученных данных:



Рисунок 2.14

Графически данная зависимость имеет вид:



Рисунок 2.15


3. Моделирование и идентификация множественной линейной регрессии

3.1. План работы

-в процессе выполнения данной работы необходимо

-синтезировать модель Монте-Карло множественной линейной регрессии (прямая задача).

-вычислить параметры множественной линейной регрессии (обратная задача идентификации).

-составить отчет по работе.

3.2. Модель Монте-Карло множественной линейной регрессии (прямая задача)

Уравнение множественной линейной регрессии.

Множественная линейная регрессия имеет вид

, где                                 (3.1)

x1, x2, x3, …,x
k, — независимые переменные,

y — зависимая переменная,

a,b1, b2, b3,…, b
k — параметры модели.

В реальности на данную связь оказывает влияние множество других неконтролируемых факторов, в связи с чем данная связь представляется как:

, где                             (3.2)

e — случайное отклонение наблюдаемой зависимой переменной, вызванное влиянием других факторов. Уравнение (3.1) является основой статистического моделирования уравнения регрессии.

В рамках данной работы будет моделироваться и идентифицироваться модель третьего порядка:



3.2.1. Последовательность выполнения работы по моделированию.

Откроем новую книгу. Cохраним книгу в своей папке под именем МЛР. Xls (Множественная Линейная Регрессия).

Для данной задачи рекомендуется отменить режим автоматического пересчета листа. Для этого необходимо в «Сервис»\ «Параметры»\ «Вычисления» установить режим «вручную».

3.2.1.2. Сформируем заголовки для исходных данных модели (Рисунок 1.1):

— коэффициенты модели, a,b1, b2, b3,…, b
k;

— среднее квадратическое отклонение погрешности СКОе;

— математическое ожидание независимых переменных Мх1, Мх2, Мх3,;

— среднее квадратическое отклонение независимых переменных СКОх1, СКОх2, СКОх3,

Ввести значения а, b1, b2, b3, CKOe(σ
е), Мх1, Мх2, Мх3,СКОх1, СКОх2, СКОх3, согласно варианту контрольной работы.

3.2.1.3. СКОе задать равным нулю.



Рисунок 3.1

3.2.1.4. Сформируем заголовки таблицы модели (Рисунок 3.1).

Выделим ячейки для:

i – номер наблюдения,

1 – единичный вектор (будет рассмотрен ниже),

х1, х2, х3 — значения переменных x1
,x2,x3,

е – значение ошибки в текущем наблюдении e,

y – моделируемое факторное значения зависимой переменной y, определяемое независимыми переменными x1,x2,x3и ошибкой e.

3.2.1.5. Моделирование двадцати наблюдения (Рисунок 3.2 (показаны первые 4 наблюдения))



Рисунок 3.2

Колонка единичного вектора заполняется единицами.

Случайные значения независимых переменных x1, x2, x3– моделируются аналогично предыдущему по формуле

, где                                                  (3.3)

Z — центрированная и нормированная случайная величина, распределенная по нормальному закону (MZ=0, σZ=1),

Mx, σx — математическое ожидание и среднее квадратическое отклонение независимой переменной.

Центрированная и нормированная случайная величина моделируется на основании центральной предельной теоремы путем 12-ти кратного сложения равномерно распределенных случайных чисел R
i в диапазоне (0,1].

                                                        (3.4)

Синтаксис функцией, возвращаемой случайное число, равномерно распределенное в диапазоне (0,1], имеет вид:

R=слчис().

Для моделирования независимой переменной необходимо в ячейку, где моделируется переменная x необходимо ввести формулу:

«=(слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()+слчис()-6)*[ σx]+ [Mx]», где

[Mx] и [σx] — соответственно адреса ячеек, где заданы математическое ожидание и среднее квадратическое отклонение независимой переменной (ссылки на данные ячейки должны быть абсолютными).

Аналогично моделируется ошибка в текущем наблюдении e,

Факторное значения зависимой переменной y, определяемое независимыми переменными x1,x2,x3и ошибкой eвычисляется по формуле (3.2).

3.2.1.6. Задав СКОе=0 (Ме=0) построим точечные графики зависимости у(х1), у(х2), у(х3) (Рисунок 3.3).



Рисунок 3.3

3.2.1.7. При СКОе=0 имеем отсутствие линейной связи y(x). Это объясняется тем, что внутри рассматриваемых случаев случайная природа образования зависимости имеет место существовать.

3.3. Идентификация модели множественной линейной регрессии

3.3.1. Основные положения процедуры идентификации параметров множественной линейной регрессии

Задачей идентификации и является нахождение таких значенийa, b1, b2, b3, при которых сумма квадратов ошибки будет минимальна

                            (3.5)

На основании смоделированных значений наблюдений мы имеем следующую систему уравнений:

                                         (3.6)

Где верхний индекс обозначает номер моделируемого наблюдения.

Если ввести следующие векторы и матрицу как:

,                         (3.7)

то система уравнений может быть записана в векторной форме:

                                                       (3.8)

Условие минимума квадрата ошибки в векторной форме будет иметь вид:

                                              (3.9)

Данный минимум обеспечивается при условии равенства нулю производной:

 где                                    (3.10)
ХТ — транспонированная матрица Х.

Раскрывая скобки получаем:

                                        (3.11)

Откуда вектор параметров модели будет определяться как:

                                          (3.12)

3.3.2. Последовательность выполнения работы:

Для расчета элементов вектора В (состоящего из значений коэффициентов регрессионной модели) необходимо последовательно получим:

— транспонированную матрицу — ХТ,

— произведение — ХХТ,

— обратную матрицу – (ХХТ)-1,

— произведение — (ХХТ)-1 ХТ,

— произведение — (ХХТ)-1 ХТ
Y,

3.3.2.1. Получим транспонированную матрицу ХТ.

Транспонированная матрица получается путем замены срок на столбцы,



Для получения транспонированной матрицы необходимо:

-выделим исходную матрицу

-кликнем по кнопке «Копирование»,

-кликнем на ячейку, в которой необходимо разместить транспонированную матрицу (20 столбов вправо и 5 строк вниз от нее ячейки должны быть свободными),

-выполним команду «Правка>Специальная вставк
a».Поставим флажок «Транспонирование» и нажмем на клавишу ОК.

На рабочем поле появилась транспонированная матрица (Рисунок 3.4 — приводим лишь первые столбцы).



Рисунок 3.4

Убедимся, что процедура транспонирования произведена правильно.

3.3.2.2. Получим произведение матриц ХХТ.

Произведение матрицы Х размерностью (20х4) на матрицу ХТ размерностью (4х20) будет матрица размерностью (4х4).

В этой связи выделим область ячеек 4х4 и введем в них формулу массива умножения матриц «Мунож» (категория «математические»).

В раскрывшемся диалоговом окне (Рисунок 3.5) введем адреса умножаемых массивов.

После чего кликнем по кнопке «ОК», нажмем на клавишу F2 или активизируем строку формул и удерживая клавиши и нажмем на клавишу.

В выделенных ячейках появится результат умножения (Рисунок 3.6).



Рисунок 3.5



Рисунок 3.6.

3.3.2.3. Получим обратную матрицу (ХХТ)-1.

Выделим ячейки (4х4) для обратной матрицы и ввести в них формулу массива вычисления обратной матрицы «Мобр» (в той же категории). В диалоговом окне ввести адреса исходной обращаемой матрицы и аналогично получить значения ее элементов (Рисунок 3.7)



Рисунок 3.7

3.3.2.4. Получим произведение матриц (ХХТ)-1ХТ.

Произведение матрицы (ХХТ)-1ХТразмерностью (4х4) на матрицу размерностью (4х20) будет матрица размерностью (4х20).

Следовательно, для ввода формулы массива необходимо выделить ячейки для матрицы размером (4х20). После чего аналогично получить результат умножения (Рисунок 3.8 – приведены первые столбцы результата умножения).



Рисунок 3.8

3.3.2.5. Получим произведение матриц (ХХТ)-1ХТ
Y, т.е. вектор коэффициентов В.

Произведение матрицы (ХХТ)-1ХТ
Y размерностью (4х20) вектор Y размерностью (20х1) будет вектор размерностью (4х1).

Следовательно, необходимо выделить 4 ячейки на поле и ввести в них аналогично формулу умножения матриц.

Озаглавим слева данные ячейки (a, b1, b2, b3) (Рисунок 3.9)

Значения в этих ячейках должны совпадать с заданными значениями a, b1, b2, b3



Рисунок 3.9

3.4. Идентификация с помощью «Пакета анализа — Регрессия» ППП Excel

Идентификация с помощью «Пакета анализа — Регрессия» ППП Excel аналогична процедуре идентификации линейной парной регерессии. Отличие заключается в задании входного интервала Х. Для идентификации множественной регрессии необходимо задавать адреса ячеек не одного столбца, а нескольких столбцов (для нашего примера 3), в которых размещены значения независимых переменных x1
,x2,x3 (Рисунок 3.10).



Рисунок 3.10



Рисунок 3.11



Рисунок 3.12

Уравнение регрессии имеет вид: y=17-2x1-7x2

Значимость критерия F показывает, что полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается значимость всего уравнения и показателя тесноты связи (индекса множественной детерминации) R-квадрат оценивает долю вариаций результата за счет представленных в уравнении факторов в общей вариации результата. 100% указывает на полную связь между результативными и факторными признаками. Стандартная ошибка определяет тесноту связи с учетом степени свободы общей и остаточной дисперсии. Она дает тесноту связи, которая не зависит от числа факторов.

3.5.Пример анализа экономических показателей на предприятии.

Исследуем зависимость денежной выручки за несколько месяцев (y) от поступления денежных средств за пребывание льготных категорий граждан (x1) и среднего возраста льготных категорий.

Дана таблица наблюдений.

Анализ зависимости выручки (y тыс.руб.) санатория «Огонёк» от средней суммы поступлений денежных средствот льготных путевок (x1 тыс. руб.) и среднего возраста льготной категории (x2 лет).



Рисунок 3.13
Проведем анализ с помощью «Пакета анализа — Регрессия» ППП Excel.



Рисунок 3.14



Рисунок 3.15



Рисунок 3.16

Уравнение регрессии имеет вид y=1,883+0.9626x1+0.0748x2

По множественному R= 0,9699 видим, что связь коэффициентов регрессии тесная.Критерий Fчастн х2 = 2 показывает статическую зависимость включения второго фактора после первого. Прирост факторной дисперсии за счет дополнительного признака х
2незначительный. Вероятность х
2случайного формирования много ниже уровня значимости. Прирост факторной дисперсии за счет признак х1 существенный. Поэтому фактор х2 можно исключить из рассмотрения и ограничиться парной регрессией y=1,883+0,9626х1. Уравнение более простое для анализа и прогноза.


4. Моделирование и идентификация временных рядов

4.1. План работы

В процессе выполнения данной работы необходимо:

-синтезировать модель Монте-Карло временного ряда (прямая задача).

-вычислить параметры временного ряда (обратная задача идентификации) на основе метода наименьших квадратов и получить уравнение прогноза.

-вычислить параметры временного ряда (обратная задача идентификации) на основе процедуры Юла-Уокера и получить уравнение прогноза.

-составить отчет по работе.

4.2. Модель Монте-Карло временного ряда.

В общем виде модель авторегрессии-скользящего среднего АРСС(p,q) имеет вид:

, где    (4.1)

ft–значение временного ряда в момент времени t,

ft – значение временного ряда в момент времениt-1, t-2,…,t-k,

ai bi – коэффициенты модели,

nt, nt-1,…, nt-k– значения случайного центрированного (математическое ожидание равно нулю) и нормированного (среднее квадратическое отклонение равно единице) импульса типа «белый шум» в моменты времени t,
t-1,
t-2,…,
t-
k.

Коэффициент a0 определяет (но не равен ему) среднее значение ряда (но не равен ему).

Анализ временных рядов удобно производить с помощью дискретного преобразования Лапласа или z-преобразования (основанным на гармоническом разложении Фурье и преобразовании Фурье). Таблица 4.1 представляет весьма простые формулы для преобразования временного ряда, представленного во временной области, в ряд в терминах z-преобразования и обратно.

Таблица 4.1.

Преимущество рассмотрения временных рядов в области z-преобразования по сравнению с их анализом во временной области заключается в понижении «сложности» математических действий. Так операции дифференцирования, интегрирования, умножения, деления во временной области в z-пространстве заменяются на операции умножения, деления, сложения, вычитания, соответственно.

Значительным преимуществом представления временных рядов в z-пространстве является то, что это позволяет проводить математические действия над ними (складывать, вычитать, умножать, делить).

Без нарушения общности для простоты положим, что коэффициент a0 равен нулю.

На основании формул в данной таблице временной ряд (4.1) в терминах z-преобразования (с учетом равенства нулю коэффициента a0) будет выглядеть как:

                     (4.2)

Преобразуя данное выражение (вынося за скобки) f(
z) и n(
z) получаем;

,

Откуда:



Полином:

                             (4.3)

определяет «авторегрессионную» составляющую модели.

Полином:

                                      (4.4)

представляет собой составляющую «скользящее среднее».

Уравнение:

                                 (4.5)

называется характеристическим уравнением.

Корни данного уравнения полностью описывают поведение временного ряда. Для стационарных процессов все корни характеристического уравнения должны быть по модулю меньше единицы



Если корни характеристического уравнения комплексно-сопряженными, то во временном ряду имеет место гармоническая составляющая.

В данной контрольной работе рассматривается модель авторегрессии 2-го порядка АРСС(2,0) или АР (2).

Соответственно модель авторегрессии 2-го порядка во временной области будет иметь вид

,                                         (4.6)

а в z-преобразовании:

                                               (4.7)

Характер временного ряда определяется корнями характеристического уравнения:

                                                (4.8)

Домножим левую и правую части на z2 и получим квадратное уравнение:

                                                    (4.9)

Корни характеристического уравнения определяются как:

                                                 (4.10)

По определению корней уравнения имеем:

                                                   (4.11)

или:

                                           (4.12)

Сопоставляя данное уравнение с (4.9) находим коэффициенты модели:

                                                (4.13)

Пусть корни характеристического уравнения комплексно-сопряженные:

, где                                       (4.14)
    продолжение
--PAGE_BREAK--


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.