Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).
Ряд динамики – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).
Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают через y. Первый член ряда y1 называют начальным (базисным) уровнем, а последний yn – конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.
Ряды динамики, как правило, представляют в виде таблицы (см. табл. 25) или графически (см. рис. 17)
Таблица 25. Внешнеторговый оборот (ВО) России за период 2000-2006 гг.
Год
Млрд. долл. США
149,9
155,6
168,3
212,0
280,6
368,9
468,4
Рис. 17. Внешнеторговый оборот (ВО) России за период 2000-2006 гг.
Данные табл. 25 и рис. 17 наглядно иллюстрируют ежегодный рост внешнеторгового оборота (ВО) в России за период 2000-2006 гг.
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений уровней во времени, для рядов динамики рассчитывают показатели изменения уровней ряда динамики:
– абсолютное изменение (абсолютный прирост);
– относительное изменение (темп роста или индекс динамики);
– темп изменения (темп прироста).
Все эти показатели могут определяться базисным способом, когда уровень данного периода сравнивается с первым (базисным) периодом, либо цепным способом – когда сравниваются два уровня соседних периодов.
Абсолютное изменение (абсолютный прирост) уровней рассчитывается как разность между двумя уровнями ряда по формуле (69) – для базисного способа сравнения или по формуле (70) – для цепного. Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше уровня какого-либо предшествующего периода, и, следовательно, может иметь знак «+» (при увеличении уровней) или «–» (при уменьшении уровней).
; (69) . (70)
В табл. 26 в столбце 3 рассчитаны базисные абсолютные изменения по формуле (69), а в столбце 4 – цепные абсолютные изменения по формуле (70).
Таблица 26. Анализ динамики ВО России
Год
y
, %
,%
149,9
155,6
5,7
5,7
1,038
1,038
3,8
3,8
168,3
18,4
12,7
1,123
1,082
12,3
8,2
212,0
62,1
43,7
1,414
1,260
41,4
26,0
280,6
130,7
68,6
1,872
1,324
87,2
32,4
368,9
219,0
88,3
2,461
1,315
146,1
31,5
468,4
318,5
99,5
3,125
1,270
212,5
27,0
Итого
1803,7
318,5
3,125
Между базисными и цепными абсолютными изменениями существует взаимосвязь: сумма цепных абсолютных изменений равна последнему базисному изменению, то есть
. (71)
В нашем примере про ВО подтверждается правильность расчета абсолютных изменений по формуле (71): = 318,5 рассчитана в итоговой строке 4-го столбца, а = 318,5 – в предпоследней строке 3-го столбца табл. 26.
Относительное изменение (темп роста или индекс динамики) уровней рассчитывается как отношение (деление) двух уровней ряда по формуле (72) – для базисного способа сравнения или по формуле (73) – для цепного.
; (72) . (73)
Относительное изменение показывает во сколько раз уровень данного периода больше уровня какого-либо предшествующего периода (при >1) или какую его часть составляет (при <1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения (если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.
В табл. 26 в столбце 5 рассчитаны базисные относительные изменения по формуле (72), а в столбце 6 – цепные относительные изменения по формуле (73).
Между базисными и цепными относительными изменениями существует взаимосвязь: произведение цепных относительных изменений равно последнему базисному изменению, то есть
. (74)
В нашем примере про ВО подтверждается правильность расчета относительных изменений по формуле (74): = 1,038*1,082*1,260*1,324*1,315*1,270 = 3,125 рассчитано по данным 6-го столбца, а = 3,125 – в предпоследней строке 5-го столбца табл. 26.
Темп изменения (темп прироста) уровней – относительный показатель, показывающий, на сколько процентов данный уровень больше (или меньше) другого, принимаемого за базу сравнения. Он рассчитывается путем вычитания из относительного изменения 100%, то есть по формуле (75):
, (75)
или как процентное отношение абсолютного изменения к тому уровню, по сравнению с которым рассчитано абсолютное изменение (базисный уровень), то есть по формуле (76):
. (76)
В табл. 26 в столбце 7 рассчитаны базисные темпы изменения ВО по формуле (75), а в столбце 8 – цепные темпы изменения по формуле (76). Все расчеты в табл. 26 свидетельствуют о ежегодном росте ВО России за период 2000-2006 гг.
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении динамики изменений того или иного показателя ВЭД в разные периоды, в разных странах и т.д.
Обобщенной характеристикой ряда динамики служит прежде всего средний уровень ряда . Для разных видов рядов динамики он рассчитывается неодинаково. Ряды динамики бывают равномерные (с равными интервалами времени между уровнями), для которых средний уровень определяется по простой формуле средней величины, и неравномерные (с неравными интервалами), для которых используются формулы средних взвешенных (по интервалам времени) величин. В интервальном ряду динамики (в котором время задано в виде промежутков времени, к которым относятся уровни) определяется по формуле средней арифметической, а в моментном ряду (в котором время задано в виде конкретных моментов времени или дат, к которым относятся уровни) – по формуле средней хронологической. В табл. 27 приводятся виды рядов динамики и соответствующие формулы для расчета их среднего уровня .
Таблица 27. Виды средних величин, применяемых при расчете среднего уровня
Вид ряда динамики
Название средней величины
Формула средней величины
Номер формулы
Равномерный интервальный
Арифметическая простая
(77)
Равномерный моментный
Хронологическая простая
(78)
Неравномерный интервальный
Арифметическая взвешенная
(79)
Неравномерный моментный
Хронологическая взвешенная
(80)
В нашем примере про ВО России за период 2000-2006 гг. имеем равномерный интервальный ряд динамики, поэтому его средний уровень определяем по формуле (77): = 1803,7/7 = 257,671, то есть ВО России в период 2000-2006 гг. составлял ежегодно в среднем 257,671 млрд. долл. США.
Кроме среднего уровня ряда рассчитываются и другие средние показатели:
– среднее абсолютное изменение (средний абсолютный прирост);
– среднее относительное изменение (средний темп роста);
– средний темп изменения (средний темп прироста).
Каждый из этих показателей может рассчитываться базисным и цепным способом.
Базисное среднее абсолютное изменение – это частное от деления последнего базисного абсолютного изменения на количество изменений уровней (81); цепное среднее абсолютное изменение уровней ряда – это частное от деления суммы всех цепных абсолютных изменений на количество изменений (82):
Б = (81) Ц = (82)
По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность. Очевидно, что числители формулы (81) и (82) равны между собой по формуле (71), значит, среднее абсолютное изменение не зависит от способа расчета (базисный или цепной), так как результат получится одинаковый. В нашей задаче по формуле (81) или (82):
= 318,5/6 = 53,083, то есть ежегодно в среднем ВО растет на 53,083 млрд. долл.
Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (83), а цепное среднее относительное изменение – по формуле (84):
Б== (83) Ц= (84)
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашем примере про ВО: = = 1,209, то есть ежегодно в среднем в период 2000-2006 гг. ВО России растет в 1,209 раза.
Вычитанием 100% из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики. В нашем примере про ВО: = 1,209 – 1 = 0,209, то есть ежегодно в среднем в период 2000-2006 гг. ВО России растет на 20,9%.
Одна из основных задач изучения рядов динамики – выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случаях проявляется наглядно, в других – может маскироваться колебаниями случайного или неслучайного характера. Поэтому, чтобы сделать правильные выводы о закономерностях развития того или иного показателя, надо суметь отделить тренд от колебаний, вызванных случайными кратковременными причинами. На основании выделенного тренда можно экстраполировать (прогнозировать) развитие явления в будущем. С этой целью (устранить колебания, вызванные случайными причинами) ряды динамики подвергают обработке.
Существует несколько методов обработки рядов динамики, помогающих выявить основную тенденцию изменения уровней ряда, а именно: метод укрупнения интервалов, метод скользящей средней и аналитическое выравнивание. Во всех методах вместо фактических уровней при обработке ряда рассчитываются иные (расчетные) уровни, в которых тем или иным способом взаимопогашается действие случайных факторов и тем самым уменьшается колеблемость уровней. Последние в результате становятся как бы «выравненными», «сглаженными» по отношению к исходным фактическим данным. Такие методы обработки рядов динамики называются сглаживанием или выравниванием рядов динамики.
Наиболее совершенным методом обработки рядов динамики в целях устранения случайных колебаний и выявления тренда является выравнивание уровней ряда по аналитическим формулам (или аналитическое выравнивание). Суть аналитического выравнивания заключается в замене эмпирических (фактических, исходных) уровней yi теоретическими , которые рассчитаны по определенному уравнению, принятому за математическую модель тренда, где теоретические уровни рассматриваются как функция времени: = f(t).
При этом каждый фактический уровень yi рассматривается как сумма двух составляющих:
, (85)
где f(t) = - систематическая составляющая, отражающая тренд и выраженная определенным уравнением; - случайная величина, вызывающая колебания уровней вокруг тренда.
Задача аналитического выравнивания сводится к следующему:
1) определение на основе фактических данных формы (вида) гипотетической функции = f(t), способной наиболее адекватно отразить тенденцию развития исследуемого показателя;
2) нахождение по эмпирическим данным параметров указанной функции (уравнения);
3) расчет по найденному уравнению теоретических (выравненных) уровней.
В аналитическом выравнивании наиболее часто используются простейшие функции, представленные в табл. 28, где обозначено - теоретические (выравненные) уровни (читается как «игрек, выравненный по t»); t – условное обозначение времени (1, 2, 3 …); a0, a1, a2, ... – параметры аналитической функции; k – число гармоник (при выравнивании по ряду Фурье).
Выбор той или иной функции для выравнивания ряда динамики осуществляется на основании графического изображения эмпирических данных. Если по тем или иным причинам уровни эмпирического ряда трудно описать одной функцией, следует разбить анализируемый период на отдельные части и затем выровнять каждую часть по соответствующей кривой.
Таблица 28. Виды математических функций, используемые при выравнивании
Название функции
Вид функции
Формула
Прямая линия
(86)
Парабола 2-го порядка
или
(87)
Парабола 3-го порядка
(88)
Гипербола
(89)
Показательная
(90)
Степенная
(91)
Ряд Фурье
(92)
Нередко один и тот же ряд можно выровнять по разным аналитическим функциям и получить довольно близкие результаты. В нашем примере про ВО России можно произвести выравнивание и по прямой линии, и по параболе. Чтобы решить вопрос о том, использование какой кривой дает лучший результат, обычно сопоставляют суммы квадратов отклонений эмпирических уровней от теоретических (остатки), рассчитанным по разным функциям, то есть:
. (93)
Та функция, при которой эта сумма минимальна, считается наиболее адекватной, приемлемой. Однако сравнивать непосредственно суммы квадратов отклонений можно в том случае, если сравниваемые уравнения имеют одинаковое число параметров. Если же число параметров k разное, то каждую сумму квадратов делят на разность (n – k), выступающую в роли числа степеней свободы, и сравнивают уже квадраты отклонений уровней, рассчитанные на одну степень свободы (т.е. остаточные дисперсии на одну степень свободы).
Параметры искомых уравнений (a0, a1, a2, ...) при аналитическом выравнивании могут быть определены по-разному, но наиболее распространенным методом является метод наименьших квадратов (МНК). При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней y от теоретических уровней :
. (94)
В частности, при выравнивании по прямой вида (86) параметры и отыскиваются по МНК следующим образом. В формуле (94) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений:
(95)
где n – количество уровней ряда; t – порядковый номер в условном обозначении периода или момента времени; y – уровни эмпирического ряда.
Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда. Например, при нечетном числе уровней (как в нашем примере про ВО России – 7 уровней) серединная точка времени (год, месяц) принимается за нуль, тогда предшествующие периоды обозначаются соответственно –1, –2, –3 и т.д., а следующие за средним (центральным) – соответственно 1, 2, 3 и т.д. (см. 3-й столбец табл. 29). При четном числе уровней два серединных момента (периода) времени обозначают –1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д.
При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений (95) упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:
(96)
Как видим, при такой нумерации периодов параметр представляет собой средний уровень равномерного интервального ряда, то есть формулу (77). Определим по формуле (96) параметры уравнения прямой для нашего примера про ВО России, для чего исходные данные и все расчеты необходимых сумм представим в табл. 29.
Таблица 29. Вспомогательные расчеты для линейного тренда
Год
y
t
t2
yt
149,9
-3
-449,7
97,557
2739,775
25636,584
11614,681
155,6
-2
-311,2
150,929
21,822
11394,038
10418,577
168,3
-1
-168,3
204,300
1296,000
2848,509
7987,252
257,671
2085,879
0,000
2085,879
280,6
280,6
311,043
926,768
2848,509
525,719
368,9
737,8
364,414
20,122
11394,038
12371,795
468,4
1405,2
417,786
2561,806
25636,584
44406,531
Итого
1803,7
1494,4
1803,700
9652,171
79758,263
89410,434
Из табл. 29 получаем, что: a0 = 1803,7/7 = 257,671 и a1 = 1494,4/28 = 53,371. Отсюда искомое уравнение тренда: =257,671+53,371t. В 6-м столбце табл. 29 приведены теоретические (трендовые) уровни, рассчитанные по этому уравнению, а в итоге 7-го столбца – остатки по формуле (93). Для иллюстрации построим график эмпирических и трендовых уровней – рис. 18.
Рис. 18. Эмпирические и трендовые уровни ряда динамики ВО России
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическим (табличным) значением FТ (Приложение 8). При этом расчетный критерий Фишера определяется по формуле (97):
, (97)
где k – число параметров (членов) выбранного уравнения тренда.
Для проверки правильности расчета сумм в формуле (97) можно использовать следующее равенство (98):
. (98)
В нашем примере про ВО равенство (98) соблюдается (необходимые суммы рассчитаны в трех последних столбцах табл. 29): 89410,434 = 9652,171 + 79758,263.
Сравнение расчетного и теоретического значений критерия Фишера ведется при заданном уровне значимости с учетом степеней свободы: и . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.
Проверим тренд на адекватность в нашем примере про ВО по формуле (97):
FР = 79758,263*5/(9652,171*1) = 41,32 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ = 6,61 находим по Приложению 8 в 1-ом столбце [= k – 1 = 2 – 1 = 1] и 5-й строке [= n – k = 5]).
Как уже было отмечено ранее, в нашем примере про ВО России можно произвести выравнивание не только по прямой линии, но и по параболе, чего делать не будем, так как уже найденный линейный тренд адекватно описывает тенденцию.
При составлении прогнозов уровней социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (99):
, (99)
где – точечный прогноз, рассчитанный по модели тренда; – коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n–1 (приложение 9); – ошибка аппроксимации, определяемая по формуле (100):
. (100)
Спрогнозируем ВО России на 2007 и 2008 годы с вероятностью 0,95 (значимостью 0,05), для чего найдем ошибку аппроксимации по формуле (100): == 43,937 и найдем коэффициент доверия по распределению Стьюдента по Приложению 9: = 2,4469 при = 7 – 1= 6.
Прогноз на 2007 и 2008 годы с вероятностью 0,95 по формуле (99):
Y2007 = (257,671+53,371*4)2,4469*43,937 или 363,6<Y2007<578,7 (млрд. долл.);
Y2008 = (257,671+53,371*5)2,4469*43,937 или 417,0<Y2008<632,0 (млрд. долл.).
Как видно из полученных прогнозов, доверительный интервал достаточно широк (из-за достаточно большой величины ошибки аппроксимации). Более точный прогноз можно получить при выравнивании по параболе 2-го порядка.