9.3. АНАЛИЗ МОДЕЛИ С АДДИТИВНОЙ КОМПОНЕНТОЙ: A=T+S+E Моделью с аддитивной компонентой называется такая модель, в которой вариация значений переменной во времени наилучшим образом описывается через сложение отдельных компонент. Предположив, что циклическая вариация не учитывается, модель фактических значений переменной А можно представить следующим образом: Фактическое значение = Трендовое значение + Сезонная вариация + Ошибка, т.е. A = T + S + E. В моделях как с аддитивной, так и с мультипликативной компонентой общая процедура анализа примерно одинакова: Шаг 1. Расчет значений сезонной компоненты. Шаг 2. Вычитание сезонной компоненты из фактических значений. Этот процесс называется десезонализацией данных. Расчет тренда на основе полученных десезонализированных данных. Шаг 3. Расчет ошибок как разности между фактическими и трендовыми значениями. Шаг 4. Расчет среднего отклонения (MAD) или среднеквадратической ошибки (MSE) для обоснования соответствия модели исходным данным или для выбора из множества моделей наилучшей.^ 9.3.1. Расчет сезонной компоненты в аддитивных моделях Пример 9.2. Вернемся к примеру 9.1 предыдущего параграфа, в котором рассматриваются квартальные объемы продаж компании Lewplan plc. Мы уже выяснили, что этим данным отвечает аддитивная модель, т.е. фактически объемы продаж можно выразить следующим образом: A = T + S + E. Для того чтобы элиминировать влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 19X6 г. Если поделить эту сумму на четыре, можно найти средний объем продаж в каждом квартале 19X6 года, т. е. (239 + 201 + 182 + 297)/4 = 229,75. Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке: апрель 19X6 — март 19X7 (251), июль 19X6 — июнь 19X7 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда. Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем: А - Т= S + E. К сожалению, оценки значений тренда, полученные в результате расчета скользящих средних по четырем точкам, относятся к несколько иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 19X6 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой и второй оценок, центрируя их на июль-сентябрь 19X6 г., т. е. (229,75 + 251)72 = 240,4. Это и есть десезонализированная средняя за июль-сентябрь 19X6 г. Эту десезонализированную величину, которая называется центрированной скользящей средней, можно непосредственно сравнивать с фактическим значением за июль-сентябрь 19X6 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл. 9.2. ^ Таблица 9.2. Расчет по 4 точкам центрированных скользящих средних значений тренда для модели А — Т = S + Е Дата ^ Объемпродаж,тыс. шт. Итогоза четыреквартала Скользящаясредняяза четыреквартала Центрированнаяскользящаясредняя ОценкасезоннойкомпонентыA –T=S + Е 1 2 3 4 5 6 Январь-март 19X6Апрель— июньИюль-сентябрьОктябрь- декабрьЯнварь-март 19X7Апрель-июньИюль-сентябрьОктябрь- декабрь 239201182297324278257384 919100410811156124313201402 --229,75251270,25289310,75330350,5 240,4260,6279,6299,9320,4340,3 -58,4+ 36,4+ 44,4-21,9- 63,4+ 43,8 1 2 3 4 5 6 Январь-март 19X8Апрель-июньИюль-сентябрьОктябрь-декабрьЯнварь-март 19X9 401360335462481 148015581638 370389,5409,5 360,2379,8399,5 + 40,8- 19,8-64,5 Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и то же число таким образом, чтобы общая их сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год. Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл. 9.2 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл. 9.3. Таблица 9.3. Расчет средних значений сезонной компоненты Год ^ Номер квартала 1 2 3 4 19X619X719X8 -+ 44,4+ 40,8 --21,9- 19,8 -58,4-63,4-64,5 +36,4+ 43,8- Итого + 85,2 -41,7 -186,3 + 80,2 Среднее значение 85,2-2 -41,7ч-2 - 186,32 80,23 Оценка сезоннойкомпоненты + 42,6 -20,8 -62,1 + 40,1 Сумма =-0,2 Скорректированная сезонная компонента* + 42,6 -20,7 -62,0 + 40,1 Сумма = 0 * В данном случае производилось округление двух значений сезонной компоненты до ближайшего большего числа, а двух значении — до ближайшего меньшего числа таким образом, чтобы общая сумма была равна нулю. Значения сезонной компоненты еще раз подтверждают наши выводы, сделанные в 9.2 на основе диаграммы. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс. шт. соответственно. Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезонов выступают дни недели, для элиминирования влияния ежедневной «сезонной компоненты» также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.9.3.2. Десезонализация данных при расчете трендаШаг 2 состоит в десезонализации исходных данных. Она заключается в вычитании соответствующих значений сезонной компоненты из фактических значений данных за каждый квартал, т.е. A — S = T + E, что показано ниже. Таблица 9.4 ^ Расчет десезонализированных данных Дата Номерквартала Объемпродаж,тыс. шт.А СезоннаякомпонентаS Десезонализированныйобъем продаж,тыс. шт.А - S = Т+ Е Январь-март 19X6 1 239 (+42,6) 196,4 Апрель-июнь 2 201 (-20,7) 221,7 Июль-сентябрь 3 182 (-62,0) 244,0 Октябрь-декабрь 4 297 (+40,1) 256,9 Январь-март 19X7 5 324 (+42,6) 281,4 Апрель-июнь 6 278 (-20,7) 298,7 Июль-сентябрь 7 257 (-62,0) 319,0 Октябрь-декабрь 8 384 (+40,1) 343,9 Январь-март 19X8 9 401 (+42,6) 358,6 Апрель-июнь 10 360 (-20,7) 380,7 Июль-сентябрь 11 335 (-62,0) 397,1 Октябрь-декабрь 12 462 (+40,1) 421,9 Январь-март 19X9 13 481 (+42,6) 438,4 Новые оценки значений тренда, которые еще содержат ошибку, можно использовать для построения модели основного тренда. Если нанести эти значения на исходную диаграмму, можно сделать вывод о существовании явного линейного тренда.^ Рис. 9.4. Фактические и десезонализированные квартальныобъемы продаж компании Lewplan plc Уравнение линии тренда имеет вид: Т = а + b x —номер квартала, где а и b характеризуют точку пересечения с осью ординат и наклон линии тренда. Для определения параметров прямой, наилучшим образом аппроксимирующей тренд, можно использовать метод наименьших квадратов. Таким образом, как мы знаем из предыдущей главы о линейной регрессии, уравнения для расчета параметров а и b будут иметь вид:где x — порядковый номер квартала, у — значение (Т + Е) в предыдущей таблице. С помощью калькулятора подсчитаем: х = 91, х2 = 819, у = 4158,7, ху = 32747,1, n = 13. Подставив найденные значения в соответствующие формулы, получим: b = 19,978, а = 180,046. Следовательно, уравнение модели тренда имеет следующий вид: Трендовое значение объема продаж, тыс. шт. = 180,0 + 20,0 х номер квартала.^ 9.3.3. Расчет ошибок Шаг 3 нашего алгоритма, предшествующий составлению прогнозов, состоит в расчете ошибок или остатка. Наша модель имеет следующий вид: А = Т + S + Е. Значение 5 было найдено в разделе 9.3.1, а значение Т — в разделе 9.3.2. Вычитая каждое это значение из фактических объемов продаж, получим значения ошибок. ^ Таблица 9.5. Расчет ошибок для модели с аддитивной компонентой Дата Номерквартала Объемпродаж,тыс. шт. А СезоннаякомпонентаS Трендовоезначение,тыс. шт. ^ Ошибка,тыс. шт.А - S-T=E Январь-март 19X6Апрель-июньИюль-сентябрьОктябрь- декабрь 1234 239201182297 (+42,6)(-20,7)(-62,0)(+40,1) 200220240260 -3,6+ 1,7+4,0- 3,1 Январь-март 19X7Апрель-июньИюль-сентябрьОктябрь- декабрь 5678 324278257384 (+42,6)(-20,7)(-62,0)(+40,1) 280300320340 + 1,4- 1,3- 1,0+ 3,9 Январь-март 19X8Апрель-июньИюль-сентябрьОктябрь- декабрь 9101112 401360335462 (+42,6)(-20,7)(-62,0)(+40,1) 360380400420 - 1,6+ 0,7-3,0+ 1,9 Январь-март 19X9 13 481 (+42,0) 440 -1,6 Последний столбец этой таблицы можно использовать в шаге 4 при расчете среднего абсолютного отклонения (MAD) или средней квадратической ошибки (MSE):В нашем случае ошибки достаточно малы и составляют от 1 до 2%. Тенденция, выявленная по фактическим данным, достаточно устойчива и позволяет получить хорошие краткосрочные прогнозы.^ 9.3.4. Прогнозирование по аддитивной модели Прогнозные значения по модели с аддитивной компонентой рассчитываются как F = Т + S (тыс. шт. за квартал), где трендовое значение Т = 180 + 20 х номер квартала, а сезонная компонента S составляет +42,6 в январе-марте, - 20,7 в апреле-июне, 62,0 в июле— сентябре и +40,1 в октябре- декабре. Порядковый номер квартала, охватывающего ближайшие три месяца с апреля по июль 19X9 г., равен 14, таким образом прогнозное трендовое значение составит: Т14 = 180 + 20 х 14 = 460 (тыс. шт. за квартал) . Соответствующая сезонная компонента равна - 20,7 тыс. шт. Следовательно, прогноз на этот квартал определяется как: F (апрель-июнь 19X9 г.) = 460 - 20,7 = 439,3 тыс. шт. Не следует забывать: чем более отдаленным является период упреждения, тем меньшей оказывается обоснованность прогноза. В данном случае мы предполагаем, что тенденция, обнаруженная по ретроспективным данным, распространяется и на будущий период. Для сравнительно небольших периодов упреждения такая предпосылка может действительно иметь место, однако ее выполнение становится менее вероятным по мере составления прогнозов на более отдаленную перспективу.