Курсовая работа
на тему:
«Решение задач прогнозирования с помощьюстатистического пакета SPSS»
/>Введение
Точная исвоевременная информация о том, что может произойти в экономике и обществе вбудущем, всегда имела значение для тех, кто принимал бизнес-решения.Прогнозирование стало важной частью процесса планирования любой компании.Развитие современных экономических теорий, а также сложных компьютерныхпрограмм повлияло на подъем новых методов прогнозирования.
Сегодня рынокстатистического программного обеспечения впечатляет своим многообразием. Существуетболее тысячи разнообразных программ решающих задачи статистического анализаданных. Зарекомендовавшими себя представителями этого класса программ являются SAS, STATISTICA, Statgraphics,а также отечественная разработка пакет STADIA. Однако бесспорным лидеромявляется статистический пакет SPSS.
Целью даннойкурсовой работы является описание функциональных возможностей системы SPSS и решение средствамиэтой системы задачи прогнозирования.
1.Функциональныевозможности системы SPSS
Пакет SPSSдля Windows является в настоящее время одним из лидеров среди универсальныхстатистических пакетов. SPSS предлагает полный набор инструментов, обеспечивающихэффективную работу на всех этапах аналитического процесса – от планирования доуправления данными, анализа данных и представления результатов.
Программноеобеспечение SPSS позволяет:
§ Эффективноосуществлять сбор и ввод данных;
§ Организовыватьпростой доступ к данным;
§ Эффективноуправлять данными;
§ Использоватьразличные статистические процедуры для анализа данных и строить более точныемодели;
§ Нагляднопредставлять результаты тем;
§ Публиковатьрезультаты в Интернете.
Дляпрогнозирования числовых переменных в системе SPSS можно использовать такиепроцедуры как:
§ Линейнаярегрессия – исследованиевзаимосвязей между предикторами и прогнозируемой переменной. Например,прогнозирование продаж на основе данных о ценах и доходе покупателей.
§ Линейнаярегрессия доступна в SPSS Base
§ Регрессияна основе взвешенного метода наименьших квадратов
§ – используется,когда дисперсия независимой переменной в генеральной совокупности непостоянна.
§ Регрессияна основе взвешенного метода наименьших квадратов доступна в SPSS RegressionModels
§ Двухэтапныйметод наименьших квадратов – применяется, когда предиктор и прогнозируемая переменнаяоказывают взаимное влияние друг на друга.
§ Двухэтапныйметод наименьших квадратов доступен в SPSS Regression Models
§ Анализвыживаемости– оценка распределения временных интервалов между двумя событиями, например,временных интервалов от момента привлечения клиента до момента ухода клиента кконкурентам, даже если второе событие не регистрируется (например, клиентыостаются лояльными).
Анализвыживаемости доступен в SPSS Advanced Models
– РегрессияКокса с ковариатами, зависящими от времени
– ПроцедураКаплана-Мейера
– Таблицыдожития
Процедурыдоступны в SPSS Advanced Models.
Мощныминструментом анализа временных рядов и прогнозирования является модуль SPSS Trends. SPSS Trends позволяетанализировать информацию о прошлом и предсказывать будущее.
SPSS Trendsпозволяет воспользоваться следующими процедурами оценивания:
§ АнализБокса-Дженкинса для несезонных и одномерных моделей
§ Процедурыдля обработки сезонных составляющих
§ Оценкадо четырех параметров в 12 различных моделях экспоненциального сглаживания
§ Различныерегрессионные методы: регрессия тренда, регрессионные модели савторегрессионными ошибками первого порядка
§ Разложениевременных рядов на гармонические составляющие
На каждомэтапе построения модели в SPSS Trends можно воспользоваться альтернативнымиметодами. Для оценки степени адекватности модели в SPSS Trends выводятсястатистики и нормальные вероятностные графики. Адекватность моделей можнооценивать при помощи автоматически вычисляемых стандартных ошибок и другихстатистик.
SPSS дляWindows обладает целым рядом графических возможностей позволяющих визуальнооценить полученные числовые результаты анализа и прогноза данных.Многочисленные типы диаграмм позволяют представлять результаты в нагляднойформе.
§ Категориальныедиаграммы(включая несколько типов столбиков, линий, областей, кругов и ящиков).
§ Диаграммыдля контроля качества (включая диаграммы Парето, Х-среднего и Сигма).
§ Гистограммыи диаграммы рассеяния (включая перекрывающиеся, матричные и трехмерные).
§ Диагностическиеи исследовательские графики (включая графики по наблюдениям и графики временных рядов).
§ Вероятностныеграфики(включая графики наблюденных и ожидаемых значений).
§ Графикиавтокорреляционной и частной автокорреляционной функции (включая преобразованиенатурального логарифма и сезонное и несезонное дифференцирование).
§ Графикикросс-корреляционной функции (включая преобразование при помощи натуральногологарифмирования, сезонное и несезонное дифференцирование).
Системапрезентационной графики SPSS для Windows позволяет без лишних усилий создаватьдиаграммы, наилучшим образом описывающие результаты анализа, а такжередактировать созданные диаграммы для их более тонкой настройки. Системойпрезентационной графики также легко пользоваться в случае работы впроизводственном режиме. SPSS создавать диаграммы и применять параметрысозданной диаграммы к новым диаграммам.
Дляпредставления данных в табличном виде в системе SPSS имеется дополнительныймодуль SPSS Tables. Интерактивный интерфейс построения таблиц обновляется в режимереального времени, так что Вы можете видеть, как будет выглядеть таблица, иизменять ее в процессе построения. Такие возможности, как объединение несколькокатегорий в одну, вставка итогов и подитогов сверху, снизу, справа или слева втаблице, добавление подкатегорий, изменение типов переменных и исключениекатегорий позволяют быстро и эффективно управлять внешним видом таблиц. Крометого, вместе с таблицами можно рассчитывать статистические критерии, чтопозволяет устанавливать и подчеркивать достоверность полученных результатов.Например, можно показать значимость связи между временем, уделяемым домашнимживотным, и временем восстановления после сердечного приступа, построив таблицупо переменной времени восстановления после сердечного приступа и переменнымповседневной деятельности.
Скоростьработы и производственные возможности SPSS Tables позволяют создавать большиеотчеты, и обеспечивают быстрое и эффективное представление информации,заложенной в огромных массивах данных, в удобной и понятной форме. SPSS Tablesобладает целым рядом возможностей, обеспечивающих удобную и быструю доставкуполучаемых табличных отчетов. Интерактивные мобильные таблицы, создаваемые вSPSS Tables, можно экспортировать в Word и Excel. Дополнительногоформатирования таблиц не требуется, однако, при необходимости в таблицы можновставлять содержательную и описательную информацию. Результаты также можнораспечатывать и публиковать в Интернете.
2.Основные понятия и методы эконометрического прогнозирования
Прогнозирование– это научное, основанное на системе установленных причинно-следственных связейи закономерностей, выявление состояния и вероятностных путей развития явлений ипроцессов.
Статистическиеметоды прогнозирования опираются на анализ временных рядов.
Временнымрядом называется (рядом динамики) называется последовательность значенийстатистического показателя-признака, упорядоченная в хронологическом порядке, т.е.в порядке возрастания временного параметра. Отдельные наблюдения временногоряда называются уровнями этого ряда.
Каждыйвременной ряд содержит два элемента:
1. значениявремени;
2. соответствующиеим значения уровней ряда.
В качествепоказателей времени во временных рядах могут указываться либо определенныемоменты времени, либо отдельные периоды (сутки, месяцы, кварталы, полугодия,годы и т.д.). в зависимости от характера временного параметра ряды делятся намоментные и интервальные.
В моментныхрядах уровни характеризуют значения показателей по состоянию на определенныемоменты времени. В интервальных рядах уровни характеризуют значения показателяза определенные интервалы времени.
Уровни рядов динамики могут представлять собойабсолютные, относительные и средние величины. Если уровни ряда представляютсобой непосредственно не наблюдаемые значения, а производные величины: средниеили относительные, то такие ряды называются производными. Уровни этих рядовполучаются с помощью некоторых вычислений на основе абсолютных показателей.
Важной особенностью интервальных рядов динамикиабсолютных величин является суммировании я их уровней. В результате получаютсянакопленные итоги, имеющие осмысленное содержание благодаря отсутствиюповторного счета.
Моментные ряды в отличие от интервальных необладают свойством аддитивности. При исследовании моментных рядов смысл имеетрасчет разностей уровней, характеризующих изменение показателя за некоторыйпериод времени.
Успешность статистического анализа развитияпроцесса во времени во многом зависит от правильного построения рядов динамики.
Каждый уровень временного ряда формируется подвоздействием большого числа факторов, которые условно можно разделить на 3группы:
факторы,формирующие тенденции ряда;
факторы,формирующие циклические колебания ряда;
случайныефакторы.
При различных сочетаниях в изучаемом явлении илипроцессе этих факторов зависимость уровней ряда от времени может приниматьразличные формы.
Если во временном ряду проявляется длительнаятенденция изменения экономического показателя, то говорят, что имеет местотренд.
Если модельявляется временным рядом, представленным как сумма трендовой, циклической и случайнойкомпонент, то такая модель называется аддитивной моделью временного ряда.
Если в моделивременный ряд представлен как произведение перечисленных компонент, то такаямодель называется мультипликативной моделью временного ряда.
Длястатического анализа одномерных временных рядов экономических показателей вида:y1, у2,… уnвычисляютряд величин:
- абсолютныйприрост />, который показываетвеличину изменения показателя за определенный интервал времени;
- среднийабсолютный прирост: />, т.е. прирост вединицу времени;
- коэффициентроста для t-гопериода />,
- коэффициентприроста />.
На практике часто применяют показатель темпароста и темпа прироста:
/>, где Т/>-темп роста для t-го периода;
/>, где Т/>-темп прироста для t-го периода.
Предварительныйанализ временных рядов экономических показателей заключается в основном ввыявлении и устранении аномальных значений уровней ряда, а также в определенииналичия тренда в исходном временном ряде. Под аномальным уровнем понимаетсяотдельное значение уровня временного ряда, которое не отвечает потенциальнымвозможностям исследуемой экономической системы и оказывает существенное влияниена значения основных характеристик временного ряда.
Для выявленияаномальных уровней временных рядов используются методы, рассчитанные длястатистических совокупностей, например, метод Ирвина предполагает использованиеследующей формулы:
/>; t = 2,3, …, n.
где />; />.
Расчетныезначения />,/> и т.д. сравниваются стабличными значениями критерия Ирвина />,и если какое-то значение оказывается больше табличного, то соответствующеезначение у/> уровня ряда считаетсяаномальным.
Дляопределения наличия тренда в исходном временном ряду применяют ряд методов, вчастности метод проверки разностей средних уровней.
Чтобы болеечетко выявить тенденцию развития исследуемого процесса производят сглаживание(выравнивание) временных рядов.
Сглаживания временных рядов можно осуществлятьаналитическими или механическими методами.
Сутьаналитических методов заключается в построении кривой, проходящей междуконкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, иодновременно освобождала его от незначительных колебаний.
Суть методов механического сглаживаниязаключается в следующем: берется несколько первых уровней временного ряда,образующих интервал сглаживания, и для них подбирается полином, степенькоторого должна быть меньше числа уровней, входящих в интервал сглаживания; спомощью полинома определяются новые, выровненные значения уровней в серединеинтервала сглаживания. Далее интервал сглаживания сдвигается на один уровеньряда вправо, вычисляется следующее сглаженное значение и т.д.
Простейшим методоммеханического сглаживания является метод простой скользящей средней.
При наличииво временном ряду тенденции и циклических изменений значения последующегоуровня ряда зависят от предыдущих. Зависимость между последовательными уровнямивременного ряда называют автокорреляцией уровней ряда.
Количественноее можно измерить с помощью индекса корреляции между уровнями исходноговременного ряда и уровнями этого ряда, сдвинутыми на несколько шагов вовремени.
Последовательностькоэффициентов автокорреляции уровней первого, второго и т.д. порядков называютавтокорреляционной функцией временного ряда (АКФ).
График зависимости ее значений от величины лаганазывается коррелограмой.
АКФ и коррелограмма позволяют определить лаг, прикотором автокорреляция наиболее высокая, а, следовательно, и лаг, при которомсвязь между текущим и предыдущим уровнями ряда наиболее тесная, т.е. с ихпомощью можно выявить структуру ряда.
Коэффициентавтокорреляции и АКФ целесообразно использовать для выявления во временном ряденаличия или отсутствия трендовой компоненты и циклической компоненты:
если наиболее высокимоказался коэффициент автокорреляции 1-го порядка, то исследуемый ряд содержиттолько тенденцию;
если наиболее высокимоказался коэффициент автокорреляции к-го порядка, то ряд содержит циклическиеколебания с периодичностью в к-моментов времени;
если, ни один изкоэффициентов не является значимым, то можно сделать одно из двухпредположений, относительно структуры этого ряда: либо ряд не содержит тенденциии циклических изменений и имеет структуру, сходную со структурой ряда,изображенного на рис. 5.1в, либо ряд содержит сильную нелинейнуютенденцию, для выявления которой нужно провести дополнительный анализ.
Примоделировании временных рядов нередко встречается ситуация, когда остатки /> содержат тенденцию илициклические колебания, когда в соответствии с предпосылками МНК остатки />должны быть случайными.
В том случае,когда каждое следующее значение /> зависитот />, говорят о наличииавтокорреляции остатков. Причинами автокорреляции могут быть: исходные данные сошибками в измерениях результативного признака; формулировка модели (модельможет не включать фактор, оказывающий существенное воздействие на результат).Очень часто этим фактором является фактор времени t).
Если причинаавтокорреляции – в неправильной спецификации функциональной формы модели, то следуетизменить форму связи факторных и результативных признаков.
Существуютдва наиболее распространенных метода определения автокорреляции остатков: 1)путем построения графика зависимости остатков /> отвремени и визуальное определение наличия или отсутствия автокорреляции; 2)использование критерия Дарбина-Уотсона и расчет величины
Одним изнаиболее распространенных способов моделирования тенденции временного рядаявляется построение аналитической функции, характеризующей зависимость уровнейряда от времени или тренда. Этот способ называют аналитическим выравниваниемвременного ряда.
Дляпостроения трендов чаще всего применяются следующие функции:
линейныйтренд: />;
гипербола:/>;
экспоненциальныйтренд: /> или />;
полиномиальныйтренд:
/> – полином 2-й степени;
/> – полином 3-й степени.
Расчет оценок параметров трендовых моделей спомощью метода наименьших квадратов в рамках регрессионных моделей, в которых вкачестве значений зависимой переменной выступают фактические уровни ряда />, а в роли независимойпеременной – время t. Для нелинейных трендовых моделей применяется процедурылинеаризации. В том случаи, если уравнение тренда преобразовать к линейномувиду невозможно, применяют нелинейные методы оценивания коэффициентов.
При наличиинеявной нелинейной тенденции следует дополнять описанные выше методыкачественным анализом динамики изучаемого показателя, с тем, чтобы избежатьошибок спецификации при выборе вида тренда.
Качественныйанализ предполагает изучение проблем возможного наличия в исследуемом временномряде поворотных точек и изменения темпов прироста, начиная с определенногомомента. В случае если уравнение тренда выбрано неверно при больших значениях t, результаты прогноза наоснове выбранного вида тренда будут недостоверными.
Существуетнесколько подходов к анализу структуры временных рядов, содержащих сезонные илициклические колебания. Простейший подход – построение аддитивной илимультипликативной модели временного ряда методом скользящей средней.
При краткосрочномпрогнозировании, а также при прогнозировании в ситуации изменения внешнихусловий, когда более важными являются последние реализации исследуемогопроцесса, более эффективными оказываются адаптивные методы, учитывающиенеравноценность уровней временного ряда.
Адаптивные модели прогнозирования – это моделидисконтирования данных, способные быстро приспосабливать свою структуру ипараметры к изменению условий. Инструментом прогноза в адаптивной моделиявляется математическая модель, аргументом которой выступает – время.
При оценкепараметров адаптивных моделей, в отличии от «кривых роста», наблюдениям(уровням ряда) присваиваются различные веса, в зависимости от того, насколькосильным признается их влияние на текущий уровень. Это позволяет учитыватьизменения в тенденции, а также любые колебания, в которых прослеживаетсязакономерность. В качестве примера можно назвать модель экспоненциальногосглаживания Брауна.
3. Примерпроведения прогнозирования прибыли с использованием пакета SPSS
Постановказадачи:
Необходимо построитьмодель, дающую возможность предсказывать размер прибыли некоторой торговойфирмы, если известны данные о ежемесячной прибыли за последние полтора года.
В качествеисходных данных возьмем экспериментальные данные, представленные в таблице 1.
Таблица 1.1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 12 16 22 25 27 30 35 37 40 43 43 45 47 44 41 38 36 33 32 30
Данныепредставляют собой временной ряд, где величина прибыли Y зависит от времени t.
Дляаналитического выравнивания и построения тренда будем использовать следующиефункции:
1. Линейная y(t) =a + b*t;
2. Логарифмическая y(t) = a* tb;
3. Экспоненциальная y(t)=e a+ b*t;
4. Квадратичная y(t) =a + b1*t+b2*t2;
5. Кубическая y(t) =a + b1*t+b2*t2+b3*t3;
где y (t) – расчетные значения моделируемого показателя;
t – время;
a, b1, b2, b3 – параметры модели.
Дляпроведения анализа ряда необходимо ввести исходные данные. Для этого послезапуска программы SPSS нужно:
1. Определитьпеременные;
2. Определитьданные.
Для ввода,редактирования и хранения данных используется лист данных. для определения,редактирования и хранения переменных используется лист переменных. Для переходав редактор переменных необходимо перейти на закладку «Обзор переменных».Таблица вида переменных представляет собой электронную таблицу, в которой построкам находятся переменные, а по графам – характеристики этих переменных(рис. 1). Для переменных можно задать такие характеристики как Имя, Тип,Ширина столбца, Десятичные разряды, выравнивание и т.д.
/>
Рисунок 1
В нашемпримере нам понадобятся две переменные Y и t.
Послеопределения переменных необходимо ввести данные. Для этого нужно перейти налист ввода данных и ввести статистические данные подлежащие анализу. В таблицеданных объекты располагаются по строкам а признаки по столбцам (рис. 2).
/>
Рисунок 2.
Дляпостроения указанных моделей, необходимо выбрать в главном меню программы опциюАнализ, затем подпункты Регрессия®Оценка кривой. Врезультате появится диалоговое окно «Оценка кривой» (Рис. 3).
/>
Рисунок 3.
В появившемсяокне необходимо выполнить следующие настройки:
1. Указатьзависимую переменную Y. Для этого нужно перенести имя переменной в поле «Зависимая(ые)».
2. Указатьнезависимый параметр в поле «Независимый».
3. Напанели «Модели» установить флажки рядом с названиями нужных моделей: линейная,экспоненциальная, логарифмическая, кубическая и квадратичная.
4. Длявизуального оценивания полученных моделей необходимо установить флажок«Привести график моделей».
/>
В результате впрограмме просмотра результатов будет сформирована страница результатов «Подгонкапараметра» (см. Приложение). Страница результатов содержит названия построенныхмоделей их характеристики, параметры моделей, а также показатели необходимыедля оценки моделей, такие как значение F-критерия Фишера,среднеквадратическое отклонение и коэффициент детерминации.
Исходя из того,что наибольшее значение принимает коэффициент детерминации кубической функции,а также при визуальном оценивании можно сделать вывод, что оптимальной модельюявляется кубическая модель:
Y(t) = 6,194 + 5,301*t – 0,141*t2 – 0,004*t3;
Дляосуществления прогноза на k периодов вперед необходимо подставить значение tk в полученное уравнение.Например, прогноз на два месяца вперед:
Y(20) = 6,194 + 5,301*22 –0,141*222 – 0,004*223 = 11, 98
Таким образом,согласно построенной модели прибыль через два месяца составит 11, 98 тыс. руб.
Заключение
Исходяиз изложенного в курсовой работе материала, можно сделать выводы:
1. прогнозирование– это научное, основанное на системе установленных причинно-следственных связейи закономерностей, выявление состояния и вероятностных путей развития явлений ипроцессов.
2. временнымрядом называется (рядом динамики) называется последовательность значенийстатистического показателя-признака, упорядоченная в хронологическом порядке, т.е.в порядке возрастания временного параметра. Отдельные наблюдения временногоряда называются уровнями этого ряда.
3. каждыйвременной ряд содержит два элемента:
1. значениявремени;
2. соответствующиеим значения уровней ряда.
4. адаптивныемодели прогнозирования – это модели дисконтирования данных, способные быстроприспосабливать свою структуру и параметры к изменению условий.
Списокиспользованной литературы
1. Федосеев В.В. Экономикматематическиемодели и прогнозирование рынка труда: Учеб. Пособие. – М.: Вузовский учебник,2005 – 144 ст.
2. Дуброва Т.А. Прогнозированиесоциально экономических процессов. Статистические методы и модели: уч. пособие.– М.: Маркет ДС, 2007. – 192 с.
3. Садовникова Н.А., Шмойлова Р.А. Анализвременных рядов и прогнозирование. Учебное пособие./ Московский международныйинститут эконометрики информатики, финансов и права – М., 2002 г., 67 с.