--PAGE_BREAK--Различают следующие виды группировок:
1. Типологические группировки — их задача: выявление социально-экономических типов или однородных в существенном отношении групп.
2. Структурные группировки — их задача: изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака.
3. Аналитические группировки — их задача: выявления влияния одних признаков на другие (выявить связь между социально-экономическими явлениями).
4. Комбинационные группировки — в них производится разделение совокупности на группы по двум или более признакам. При этом группы, образованные по одному признаку, разбиваются на подгруппы по другому признаку.Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.
Для выявления наличия связей между признаками применяются самые разнообразные методы – как элементарные, не требующие привлечения математического аппарата, та и более сложные, связанные с проведением математических расчетов (дисперсионный анализ, применение критерия «χ-квадрат». К элементарным статистическим методам выявления взаимосвязей признаков относятся: применение аналитических и корреляционных таблиц, графический метод.
При выявлении наличия связи методом аналитической группировки формируется группировка единиц совокупности по факторному признаку Х, а затем для каждой выделенной j
-йгруппы рассчитываются средние значения результативного признака Y. Если при переходе от одной группы к другой средние значения будут изменяться с определенной закономерностью – возрастать или убывать, то между признаками Х и Yсуществует корреляционная связь.
При использовании метода корреляционных таблиц, охватывающих два интервальных ряда распределения – факторного и результативного признаков, прослеживают визуально, как именно расположена в таблице основная масса частот повторения в эмпирических данных сочетаний (хi, уi). Концентрация частот вдоль диагонали от левого верхнего угла таблицы к правому нижнему означает наличие прямой корреляционной связи между признаками. Если же частоты концентрируются около диагонали от левого нижнего угла к правому верхнему, то связь между признаками обратная.
Метод средних и относительных величин применяют при вычислении средних уровней себестоимости для однородной продукции, при изучении структуры и динамики себестоимости.
Графический метод помогает наглядно представить структуру себестоимости, происходящие в ней изменения, а также динамику ее составных частей. Графики в статистике имеют не только иллюстративное значение, они позволяют получить дополнительные знания о предмете исследования, которые в цифровом варианте остаются скрытыми, невыявленными. Графический метод состоит в построении корреляционного поля – множества точек в декартовой системе координат. По характеру расположения точек корреляционного поля можно сделать вывод о наличии или отсутствии стохастической связи и о характере связи (линейная или нелинейная, а если связь линейная – то прямая или обратная). При корреляционной связи вследствие различных случайных факторов точки (хi
, у
i)не лежат на одной линии, но все же их расположение обнаруживает определенную тенденцию, которая выражается видом эмпирической линии связи.
Простейшей формой корреляционной связи признаков является парная линейная корреляция, представляющая собой линейную зависимость результативного признака Yот факторного Х. Ее практическое значение состоит в том, что при исследовании взаимосвязи социально-экономических явлений во многих случаях среди всех факторов, влияющих на результативный признак, выделяют один важнейший фактор, который в основном определяет вариацию результативного признака.
Уравнение парной линейной корреляционной связи имеет следующий вид: где — расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии, а0 – среднее значение признака Yв точке х=0, а0, а1 – коэффициенты уравнения регрессии (параметры связи). Гипотеза о линейной зависимости между признаками Х и Yвыдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии.
В изучении корреляционных связей важным этапом корреляционно-регрессионного анализа является выбор адекватного (наиболее подходящего) эмпирическим данным уравнения регрессии. В качестве критерия подбора адекватной математической функции связи f(х) используются показатели:
R
2– индекс детерминации, показывающий, какая доля вариации расчетных значений признака Yобъясняется влиянием фактора Х;
— остаточная дисперсия, оценивающая среднее отклонение расчетных значений Yот эмпирических;
— средняя ошибка аппроксимации, выражающая в процентах меру отклонения расчетных значений Yот фактических;
Наилучшей является модель с наибольшим значением показателя R
2и наименьшим значением показателя или .
Индексный метод необходим для сводной характеристики динамики себестоимости сравнимой и всей товарной продукции, для изучения динамики и выявления влияния на нее отдельных факторов.
В статистике под индексом понимается относительная величина (показатель), выражающая изменение сложного экономического явления во времени, в пространстве или по сравнению с планом. В связи с этим различают динамические, территориальные индексы, а также индексы выполнения плана.
К какому бы экономическому явлению ни относились индексы, чтобы рассчитать их, необходимо сравнивать различные уровни, которые относятся либо к различным периодам времени, либо к плановому заданию, либо к различным территориям. В связи с этим различают базисный период (период, к которому относится величина, подвергаемая сравнению) и отчетный период (период, к которому относится сравниваемая величина). При исчислении важно правильно выбрать период, принимаемый за базу сравнения. Индексы могут относиться либо к отдельным элементам сложного экономического явления, либо ко всему явлению в целом.
Показатели, характеризующие изменение более или менее однородных объектов, входящих в состав сложного явления, называются индивидуальными индексами – ix.
Индекс получает название по названию индексируемой величины. Индексы измеряются либо в виде процентов (%), либо в виде коэффициентов.
Сложные явления, для которых рассчитывается сводный индекс, отличаются той особенностью, что элементы, их составляющие, неоднородны и, как правило, несоизмеримы друг с другом. Поэтому сопоставление простых сумм этих элементов невозможно. Сопоставимость может быть достигнута различными способами:
1. Сложные явления могут быть разбиты на такие простые элементы, которые в известной степени являются однородными;
2. Сравнение по стоимости, без разбиения на отдельные элементы.
Цель теории индексов – изучение способов получения относительных величин, используемых для расчета общего изменения ряда разнородных явлений.
В тех случаях, когда мы анализируем изменение во времени сравниваемой продукции, мы можем поставить вопрос о том, как в различных условиях (на различных участках) меняются составляющие индекса (цена, физический объем, структура производства или реализации отдельных видов продукции). В связи с этим строятся индексы постоянного состава, переменного состава, структурных сдвигов.
Индекс постоянного (фиксированного) состава по своей форме тождественен агрегатному индексу.
Этот индекс не учитывает изменение объема продажи продукции на различных рынках в текущем и базисном периодах.
Индекс переменного составаиспользуется для характеристики изменения средней цены в текущем и базисном периодах.
Индекс структурных сдвигов
Индекс цен Ласпейреса применяется в основном для расчета индекса потребительских цен, для оценки относительного изменения потребительских расходов населения в текущем периоде по сравнению с базисным при неизменных объеме и структуре потребления:
Индекс цен Паше позволяет получить стоимостные показатели отчетного периода в сопоставимых ценах (ценах базисного периода):
, где
— фактическая стоимость товара (товарооборот) отчетного периода;
— условная стоимость товара, реализованного в отчетном периоде по базисным ценам.
Компромиссом явился "идеальный индекс" Фишера:
ГЛАВА 2.
РАСЧЕТНАЯ ЧАСТЬ
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности в отчетном году (выборка 20%-ная механическая):
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб.
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб
1
160
18,240
16
148
17,612
2
140
17,080
17
110
13,970
3
105
13,440
18
146
17,666
4
150
17,850
19
155
17,980
5
158
18,170
20
169
19,266
6
170
19,210
21
156
17,940
7
152
17,936
22
135
16,335
8
178
19,580
23
122
15,250
9
180
19,440
24
130
15,860
10
164
18,860
25
200
21,000
11
151
17,818
26
125
15,250
12
142
17,040
27
152
17,784
13
120
15,000
28
173
19,030
14
100
13,000
29
115
14,490
15
176
19,360
30
190
19,950
2.1. ЗАДАНИЕ 1
Признак – себестоимость единицы продукции (определите как отношение затрат на производство продукции к выпуску продукции).
Число групп – пять.
РЕШЕНИЕ
Для начала определим признак – себестоимость единицы продукции (х), как отношение затрат на производство продукции к выпуску продукции по формуле:
затраты на производство продукции
Себестоимость единицы продукции = выпуск продукции
Результаты расчетов приведем в таблице:
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб.
Себестоимость единицы продукции, руб.
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб
Себестоимость единицы продукции,
руб.
1
160
18,240
114
16
148
17,612
119
2
140
17,080
122
17
110
13,970
127
3
105
13,440
128
18
146
17,666
121
4
150
17,850
119
19
155
17,980
116
5
158
18,170
115
20
169
19,266
114
6
170
19,210
113
21
156
17,940
115
7
152
17,936
118
22
135
16,335
121
8
178
19,580
110
23
122
15,250
125
9
180
19,440
108
24
130
15,860
122
10
164
18,860
115
25
200
21,000
105
11
151
17,818
118
26
125
15,250
122
12
142
17,040
120
27
152
17,784
117
13
120
15,000
125
28
173
19,030
110
14
100
13,000
130
29
115
14,490
126
15
176
19,360
110
30
190
19,950
105
продолжение
--PAGE_BREAK--
Ранжируем ряд распределения предприятий по возрастанию:
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб.
Себестоимость единицы продук
ции, руб.
Ранг
№ пред-приятия
п/п
Выпуск
продукции,
тыс.ед.
Затраты на
производство
продукции,
млн. руб
Себестои
мость единицы продук
ции, руб.
Ранг
1
160
18,240
114
8
16
148
17,612
119
17
2
140
17,080
122
24
17
110
13,970
127
28
3
105
13,440
128
29
18
146
17,666
121
21
4
150
17,850
119
18
19
155
17,980
116
13
5
158
18,170
115
11
20
169
19,266
114
9
6
170
19,210
113
7
21
156
17,940
115
10
7
152
17,936
118
16
22
135
16,335
121
20
8
178
19,580
110
6
23
122
15,250
125
26
9
180
19,440
108
3
24
130
15,860
122
23
10
164
18,860
115
12
25
200
21,000
105
2
11
151
17,818
118
15
26
125
15,250
122
22
12
142
17,040
120
19
27
152
17,784
117
14
13
120
15,000
125
25
28
173
19,030
110
4
14
100
13,000
130
30
29
115
14,490
126
27
15
176
19,360
110
5
30
190
19,950
105
1
Расчет величины интервала iпроизведем по формуле:
,
где хmax– максимальная величина признака, xmin– минимальная величина признака.
руб.
Получаем следующие интервальные группы:
№ группы
Интервал, руб.
I
105-110
II
110-115
III
115-120
IV
120-125
V
125-130
Построим интервальный ряд распределения предприятий по себестоимости единицы продукции:
Таблица 1.
Группировка предприятий по себестоимости единицы продукции в отчетном году
Группы предприятий по себестоимости единицы продукции
Число предприятий
105-110
3
110-115
6
115-120
9
120-125
6
125-130
6
ИТОГО
30
Интервальный ряд распределения предприятий показывает, что наибольшее число предприятий, то есть 9 из 30 (или 30% всех предприятий) имеют себестоимость единицы продукции от 115 до 120 руб.
Построим графики полученного ряда распределения. Графически определим значение моды и медианы.
Рис. 1. Гистограмма распределения предприятий по уровню себестоимости единицы продукции
Рис. 2. Полигон распределения предприятий по уровню себестоимости единицы продукции
Для графического изображения медианы, построим кумуляту и рассчитаем кумулятивно накопленные частоты:
Группы предприятий по себестоимости единицы продукции
Кумулятивно накопленные частоты
105-110
3
110-115
9
115-120
18
120-125
24
125-130
30
Рис. 3. Кумулята распределения предприятий по уровню себестоимости единицы продукции
Медиана, равная приблизительно 116,5 руб. показывает, что половина предприятий выборочной совокупности имеет себестоимость продукции меньше 116,5 руб., а другая половина больше 116,5 руб.
Мода, равная приблизительно 117,5 руб. показывает, что наиболее часто встречаются в совокупности предприятия со себестоимостью единицы продукции 117,5 руб.
Рассчитаем моду по следующей формуле
Мо = х
о
+
i
,
где хо — нижняя граница модального интервала;
ƒМо – частота модального интервала;
ƒМо-1– частота интервала, предшествующего модальному;
ƒМо+1– частота интервала, следующего за модальным.
Мо =
Рассчитаем медиану по формуле:
Ме =хо
+
i
,
где х
о — нижняя граница медианного интервала;
ΣM
е-1– сумма кумулятивно накопленных частот домедианного интервала.
Ме = 115 + 5 = 118,3
Рассчитаем характеристику интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент корреляции.
По данным интервального ряда построим расчетную таблицу:
№
группы
Группы предприятий по себ-ти ед. прод-ции
Число
пред-ий в группе, ƒ
Середина
интервала,
Х
i
Средняя арифметическая,
ƒ
I
105-110
3
107,5
118,5
-11
363
II
110-115
6
112,5
-6
216
III
115-120
9
117,5
-1
1
IV
120-125
6
122,5
4
22
V
125-130
6
127,5
9
486
ИТОГО
30
Среднее квадратическое отклонение рассчитаем по формуле:
σ = = 6,02 руб.
Коэффициент вариации рассчитаем по формуле:
V= *100% V
= *100% = 5,08%
Среднее значение себестоимости единицы продукции в интервальном ряду по выборочной совокупности предприятий составляет 118,5 руб. Значение себестоимости единицы продукции отклоняется в среднем от средней величины на +6,02 руб.
Таким образом, среднее значение себестоимости единицы продукции является типичным для данной совокупности предприятий, а сама совокупность однородной по этому показателю, так как коэффициент вариации составляет меньше 33%.
Вычислим среднюю арифметическую по исходным данным по формуле:
арифм.пр. =
арифм.пр = = 117,67 – более точная, так как брали исходные данные.
Средняя арифметическая простая меньше, чем средняя арифметическая взвешенная. Такие результаты расчета возможны в случае, если в интервальном ряду при расчете средней арифметической взвешенной значения середины интервала хiне совпадает с равномерным распределением этого интервального признака внутри групп, поэтому возникает округление.
2.2. ЗАДАНИЕ 2
Связь между признаками – выпуск продукции и себестоимость единицы продукции.
РЕШЕНИЕ
Установим наличие и характер связи между признаками – выпуск продукции (факторный признак) и себестоимость единицы продукции (результативный признак), образовав заданное число групп (пять) с равными интервалами по обоим признакам методами:
— аналитической группировки;
— корреляционной таблицы.
продолжение
--PAGE_BREAK--
Метод аналитической группировки
Построим аналитическую группировку по признаку выпуск продукции продукции с помощью расчетной таблицы:
№ группы
Группы предприятий по выпуску продукции, тыс.ед.
Номер предприятия
Выпуск продукции, тыс.ед.
Себестоимость единицы продукции, руб.
Всего
В среднем в группе
Всего
В среднем в группе
I
100-120
14
100
130
3
105
128
17
110
127
29
115
126
Итого
4
430
107,5
511
127,75
II
120-140
13
120
125
23
122
125
26
125
122
24
130
122
22
135
121
Итого
5
632
126,4
615
123
III
140-160
2
140
122
12
142
120
18
146
121
16
148
119
4
150
119
11
151
118
27
152
117
7
152
118
19
155
116
21
156
115
5
158
115
Итого
11
1650
150
1300
118,18
IV
160-180
1
160
114
10
164
115
20
169
114
6
170
113
28
173
110
15
176
110
8
178
110
Итого
7
1190
170
786
112,29
V
180-200
9
180
108
30
190
105
25
200
105
Итого
3
570
190
318
106
Всего
30
4472
149,07
3530
117,67
Таблица 2
Аналитическая группировка предприятий по себестоимости единицы продукции
№ группы
Группы предприятий по выпуску продукции, руб.
Число предприятий
Выпуск продукции, тыс. ед.
Себестоимость единицы продукции, руб.
Всего
В среднем в группе
Всего
В среднем в группе
I
100-120
4
430
107,5
511
127,75
II
120-140
5
632
126,4
615
123
III
140-160
11
1650
150
1300
118,18
IV
160-180
7
1190
170
786
112,29
V
180-200
3
570
190
318
106
ИТОГО
30
4472
149,07
3530
117,67
Аналитическая группировка показывает, что с увеличением выпуска продукции (Х), себестоимость единицы продукции (Y) уменьшается, то есть наблюдается обратная связь.
Измерим тесноту корреляционной связи между себестоимостью единицы продукции и выпуском продукции эмпирическим корреляционным отношением:
, где
— межгрупповая дисперсия результативного признака, характеризующая его вариацию за счет группировочного признака;
— общая дисперсия результативного признака.
Межгрупповая дисперсия вычисляется по формуле:
, где
— групповая средняя результативного признака;
— общая средняя результативного признака.
Общая дисперсия результативного признака:
, где
у – варианты результативного признака, а n– их число.
Для нахождения межгрупповой дисперсии составим расчетную таблицу 3. Значения групповых средних и общих средних результативного признака возьмем из таблицы 2:
Таблица 3
Расчетная таблица для нахождения межгрупповой дисперсии
№ группы
Группы пред-ий по выпуску продукции
Число предприятий
Себ-ть ед. продукции в среднем в группе,
I
100-120
4
127,75
10,08
101,61
406,44
II
120-140
5
123
5,33
28,41
142,05
III
140-160
11
118,18
0,51
0,26
2,86
IV
160-180
7
112,29
-5,38
28,94
202,58
V
180-200
3
106
-11,67
136,19
417,57
Всего
30
=117,67
-
-
1171,50
Для нахождения общей дисперсии составим расчетную таблицу 4:
Таблица 4
Расчетная таблица для определения общей дисперсии результативного признака
№ пред-приятия
п/п
№ пред-приятия
п/п
1
114
12996
16
119
14161
2
122
14884
17
127
16129
3
128
16384
18
121
14641
4
119
14161
19
116
13456
5
115
13225
20
114
12996
6
113
12769
21
115
13225
7
118
13924
22
121
14641
8
110
12100
23
125
15625
9
108
11664
24
122
14884
10
115
13225
25
105
11025
11
118
13924
26
122
14884
12
120
14400
27
117
13689
13
125
15625
28
110
12100
14
130
16900
29
126
15876
15
110
12100
30
105
11025
ИТОГО
3530
416638
Общая дисперсия результативного признака:
Определим корреляционное отношение:
Так как то связь между переменными х и у тесная.
Кроме того, квадрат корреляционного отношения – коэффициент детерминации , или 93,7% показывает, что вариация результативного признака – себестоимости единицы продукции на 93,7% происходит под влиянием вариации факторного признака – выпуска продукции, а на 6,3% (100%-93,7%) – под влиянием прочих неучтенных факторов.
продолжение
--PAGE_BREAK--
Метод корреляционной таблицы
Сгруппируем имеющиеся признаки на группы:
Себестоимость единицы продукции: Выпуск продукции:
№ группы
Интервал
I
105-110
II
110-115
III
115-120
IV
120-125
V
125-130
№ группы
Интервал
I
100-120
II
120-140
III
140-160
IV
160-180
V
180-200
Построим корреляционную таблицу:
Таблица 5
Корреляционная таблица для определения наличия корреляционной связи
Группы по выпуску продукции
Группы по себестоимости единицы продукции
ИТОГО
105-110
110-115
115-120
120-125
125-130
100-120
4
4
120-140
3
2
5
140-160
8
3
11
160-180
5
2
7
180-200
3
3
ИТОГО
3
5
10
6
6
30
Корреляционная таблица показывает наличие тесной обратной связи между признаком себестоимости единицы продукции и выпуском продукции. Т.к. наблюдается концентрация частот вдоль диагонали от левого нижнего угла к правому верхнему (т.е. большему значению Х – выпуску продукции соответствует меньшее значение Y– себестоимость единицы продукции). Интенсивная концентрация частот около диагонали таблицы указывает на факт тесной корреляционной связи.
2.3. ЗАДАНИЕ 3
По результатам выполнения задания №1 с вероятностью 0,954 определите:
1. Ошибку выборки среднего уровня себестоимости и границы, в которых будет находиться средний уровень себестоимости продукции в генеральной совокупности.
РЕШЕНИЕ
1. По результатам расчетов Задания 1 определено, что средний уровень себестоимости продукции составляет 118,5 руб.
Определим ошибку выборки μ и Δ. По расчетным данным составила 6,02= 36,24. Ошибку выборки рассчитаем по формуле:
, где n= 30
По условию задачи дано, что выборка 20%-ная механическая, следовательно: , отсюда N= 150.
При р = 0,954, t
= 2. Рассчитаем Δ по формуле:
Определим границы, в которых будет находиться средний уровень себестоимости продукции в генеральной совокупности:
С вероятностью 95,4% можно утверждать, что ошибка выборки среднего уровня себестоимости продукции будет находиться в пределах от 116,53 руб. до 120,47 руб.
2. Ошибку выборки доли предприятий с уровнем себестоимости единицы продукции 125 руб. и более и границы, в которых будет находиться генеральная доля.
РЕШЕНИЕ
2. Определим ошибку выборки доли предприятий с уровнем себестоимости единицы продукции 125 руб. и более.
Ошибку выборки доли определим по формуле:
, где
Рассчитаем , где m– количество предприятий, которые имеют себестоимость единицы продукции 125 руб. и более. В данном случае m=6
Определим границы, в которых будет находиться генеральная доля:
С вероятностью 95,4% можно утверждать, что средняя себестоимость единицы продукции 125 руб. и более будет находиться в пределах от 0,074 до 0,326.
2.4. ЗАДАНИЕ 4
Имеются данные о выпуске однородной продукции и ее себестоимости по двум филиалам фирмы:
Филиал
Базисный период
Отчетный период
Выпуск
продукции, тыс.ед.
Себестоимость
единицы
продукции,
тыс. руб.
Выпуск
продукции, тыс.ед.
Себестоимость
единицы
продукции,
тыс. руб.
№ 1
20
2,0
31,5
2,5
№ 2
20
2,1
10,5
2,7
Определите:
1. Индексы себестоимости единицы продукции в отчетном периоде по сравнению с базисным по каждому филиалу.
РЕШЕНИЕ
1. Определим индексысебестоимости единицы продукции в отчетном периоде по сравнению с базисным по каждому филиалу по формуле:
, где — себестоимость единицы продукции в отчетном периоде;
— себестоимость единицы продукции в базисном периоде;
Филиал №1: Филиал №2:
2. Общие индексы себестоимости переменного, постоянного состава, индекс структурных сдвигов.
Результаты расчетов представьте в таблице.
Сделайте выводы.
РЕШЕНИЕ
2. Определим индекс себестоимости переменного состава по формуле:
, т.е. средняя себестоимость единицы продукции в отчетном году повысилась на 500 руб.
Определим индекс себестоимости постоянного состава по формуле:
, т.е. в среднем себестоимость единицы продукции увеличилась на 525 руб… Индекс показал увеличение себестоимости за счет структурных сдвигов. Влияние структурных сдвигов на изменение себестоимости единицы продукции определим, исчислив индекс влияния структурных сдвигов.
Определим индекс структурных сдвигов по формуле:
, т.е. средняя себестоимость единицы продукции в отчетном году повысилась на 25 руб. за счет изменения структуры.
Исчисленные показатели взаимосвязаны: I
пер.сост.
=
I
фикс.сост.
*
I
стр.сдв.
1,24=1,259*0,988.
Результаты расчетов приведем в таблице:
Филиал
Базисный период
Отчетный период
Выпуск
продукции,
тыс.ед.,
Себестоимость
единицы
продукции,
тыс. руб.,
Выпуск
продукции, тыс.ед.,
Себестоимость
единицы
продукции,
тыс. руб.,
№ 1
20
2,0
31,5
2,5
1,244
1,259
0,988
№ 2
20
2,1
10,5
2,7
ГЛАВА 3.
АНАЛИТИЧЕСКАЯ ЧАСТЬ
3.1. АПРИОРНЫЙ АНАЛИЗ
Цель аналитической части работы является установление и изучение связи между начисленной заработной платой и сальдированным финансовым результатом (прибыль минус убыток) деятельности организаций по субъектам РФ в 2005 году (источник: Российский статистический ежегодник, 2006).
Исходные данные представлены в таблице 1.
Таблица 1
Область
Начисленная заработная плата, руб.*
Финансовый результат, в разах**
Астраханская
6884,2
1,1
Белгородская
6775,4
1,5
Брянская
5235,3
0,7
Владимирская
6066,8
1,4
Волгоградская
6160,0
2,1
Вологодская
8827,9
0,9
Воронежская
5382,2
1,0
Ивановская
5143,7
1,2
Калининградская
6781,3
1,9
Калужская
7066,4
1,4
Кировсая
5695,8
0,8
Костромская
5974,6
1,3
Курская
5475,9
1,2
Ленинградская
8595,9
1,2
Липецкая
6929,4
0,8
Московская
9557,7
1,4
Мурманская
12509,6
0,9
Нижегородская
6533,4
1,4
Новгородская
6940,8
1,8
Оренбургская
6163,5
1,4
Орловская
5430,6
1,0
Псковкая
5734,5
0,8
Ростовская
5944,7
1,2
Рязанская
6149,7
2,3
Самарская
7764,9
1,4
Смоленская
6190,6
4,4
Тамбовская
5008,5
0,3
Тверская
6486,3
1,1
Тульская
6412,4
1,8
Ярославская
7366,2
1,1
* — начисленная среднемесячная номинальная заработная плата;
** — сальдированный финансовый результат (прибыль минус убыток) деятельности организаций в фактически действовавших ценах по сопоставимому кругу организаций, в разах к предыдущему году.
Исходные данные на листе Excel:
1. Выявим наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения. Для этого:
— построим диаграмму рассеяния изучаемых признаков:
.
Рис.1. Аномальные значения признаков на диаграмме рассеяния
— визуально проанализируем диаграмму рассеяния, выявим и зафиксируем аномальные значения признаков, и удалим их из первичных данных:
Рис. 2. Координаты аномального значения признака на диаграмме рассеяния
— переносим аномальные значения исходных данных в таблицу 2, затем удаляем из исходных данных таблицы 1 строки с аномальными данными. С аномальными значениями у нас являются две области: Смоленская и Мурманская.
Таким образом таблица 2 принимает следующий вид:
Таблица 2
Аномальные единицы наблюдения
№
п/п
Область
Начисленная заработная плата, руб.*
Финансовый результат, в разах**
26
Смоленская
6190,6
4,4
17
Мурманская
12509,6
0,9
2. Рассчитаем описательные параметры выборочной и генеральной совокупностей с использованием инструмента Описательная статистика:
Таблица 3
По столбцу «Начисленная заработная плата, руб.»
По столбцу «Финансовый результат,
в разах»
Столбец1
Столбец1
Среднее
6517,429
Среднее
1,267857
Стандартная ошибка
211,995
Стандартная ошибка
0,082784
Медиана
6287,95
Медиана
1,2
Мода
5982,21
Мода
1,4
Стандартное отклонение
1121,772
Стандартное отклонение
0,438054
Дисперсия выборки
1258373
Дисперсия выборки
0,191892
Эксцесс
1,091682
Эксцесс
0,524914
Асимметричность
1,094538
Асимметричность
0,358501
Интервал
4549,2
Интервал
2
Минимум
5008,5
Минимум
0,3
Максимум
9557,7
Максимум
2,3
Сумма
182488
Сумма
35,5
Счет
28
Счет
28
Уровень надежности(95,4%)
443,4388
Уровень надежности(95,4%)
0,173164
По полученным данным можно сделать следующие выводы:
1. По имеющейся выборочной совокупности средняя область имеет начисленную заработную плату 6517,429. руб. и финансовый результат – 1,267857 раз к предыдущему году.
2. Медиана, равная 6287,95 руб. означает, что половина выборочной совокупности областей имеет начисленную заработную плату менее 6287,95 руб., а другая половина больше этой величины. Соответственно, медиана, равная 1,2 раза означает, что половина выборочной совокупности областей имеет финансовый результат менее 1,2 раза, а другая половина больше этой величины.
3. Мода, равная 5982,21 руб. означает, что наиболее часто в совокупности встречается начисленная заработная плата равная 5982,21 руб. Соответственно, мода, равная 1,4 означает, что наиболее часто в совокупности встречается финансовый результат равный 1,4 раз по отношению к предыдущему году.
4. Если средняя область имеет начисленную заработную плату 6517,429 руб, медиану, равную 6287,95 руб. и моду, равную 5982,21 руб. (), то следует говорить о правосторонней ассиметрии, соответственно вершина кривой сдвинута влево.
5. Если Ек>0, то следует говорить об островершинном распределении, если Ек
6. Максимальное значение признака начисленная заработная плата принимает значение, равное 9557,7 руб., минимальное значение признака начисленная заработная плата принимает значение, равное 5008,5 руб. Максимальное значение признака финансовый результат принимает значение, равное 2,3 раза, минимальное значение признака финансовый результат принимает значение, равное 0,3 раза.
3. Рассчитаем предельную ошибку выборки при P=0,997:
Таблица 4а
По столбцу «Начисленная заработная плата, руб.»
По столбцу «Финансовый результат,
в разах»
Столбец1
Столбец2
Среднее
6517,429
Среднее
1,2678571
Стандартная ошибка
211,995
Стандартная ошибка
0,0827845
Медиана
6287,95
Медиана
1,2
Мода
5982,21
Мода
1,4
Стандартное отклонение
1121,772
Стандартное отклонение
0,4380543
Дисперсия выборки
1258373
Дисперсия выборки
0,1918915
Эксцесс
1,091682
Эксцесс
0,5249141
Асимметричность
1,094538
Асимметричность
0,3585013
Интервал
4549,2
Интервал
2
Минимум
5008,5
Минимум
0,3
Максимум
9557,7
Максимум
2,3
Сумма
182488
Сумма
35,5
Счет
28
Счет
28
Уровень надежности(99,7%)
691,3781
Уровень надежности(99,7%)
0,2699845
4. Рассчитаем предельную ошибку выборки при P=0,683:
Таблица 4б
По столбцу «Начисленная заработная плата, руб.»
По столбцу «Финансовый результат,
в разах»
Столбец1
Столбец2
Среднее
6517,429
Среднее
1,2678571
Стандартная ошибка
211,995
Стандартная ошибка
0,0827845
Медиана
6287,95
Медиана
1,2
Мода
5982,21
Мода
1,4
Стандартное отклонение
1121,772
Стандартное отклонение
0,4380543
Дисперсия выборки
1258373
Дисперсия выборки
0,1918915
Эксцесс
1,091682
Эксцесс
0,5249141
Асимметричность
1,094538
Асимметричность
0,3585013
Интервал
4549,2
Интервал
2
Минимум
5008,5
Минимум
0,3
Максимум
9557,7
Максимум
2,3
Сумма
182488
Сумма
35,5
Счет
28
Счет
28
Уровень надежности(68,3%)
216,1355
Уровень надежности(68,3%)
0,0844013
5. Рассчитаем описательные параметры выборочной совокупности (σn
, σ2
n, , и Аsn) с использованием инструмента Мастер функций
Таблица 5
Выборочные показатели вариации и асимметрии
По столбцу «Начисленная заработная плата, руб.»
По столбцу «Финансовый результат,
в разах»
Стандартное отклонение
1101,558
Стандартное отклонение
0,4301607
Дисперсия
1213431
Дисперсия
0,1850383
Среднее линейное отклонение
843,8827
Среднее линейное отклонение
0,3298469
Коэффициент вариации, %
0,169017
Коэффициент вариации, %
0,3392817
Коэффициент асимметрии
0,485874
Коэффициент асимметрии
-0,307194
Если коэффициент вариации ≤ 33%, то средняя является типичной, а совокупность однородной. В нашем случае, коэффициент вариации начисленной заработной платы равен 0,17% и коэффициент вариации финансового результата равен 0,33%, что говорит о типичности средней и однородной совокупности.
6. Построение и графическое изображение интервального вариационного ряда распределения единиц совокупности по признаку начисленная заработная плата:
6.1.Построение промежуточной таблицы:
Таблица 6
Таблица 6
Карман
Карман
5008,5
5918,34
Преобразуется в
5918,34
6828,18
6828,18
7738,02
7738,02
8647,86
8647,86
Ещё
9557,7
а) первичная
б) итоговая
Таблица 7
Интервальный ряд распределения областей
по начисленной заработной плате
Карман
Частота
Интегральный %
5918,34
8
28,57%
6828,18
11
67,86%
7738,02
5
85,71%
8647,86
2
92,86%
9557,7
2
100,00%
Еще
100,00%
6.2.Приведение выходной таблицы и диаграммы к виду, принятому в статистике:
Таблица 7
Интервальный ряд распределения областей
по начисленной заработной плате
Группы областей по начисленной заработной плате
Число областей в группе
Накопленная частость группы, %
5008,5-5918,34
8
28,57%
5918,34-6828,18
11
67,86%
6828,18-7738,02
5
85,71%
7738,02-8647,86
2
92,86%
8647,86-9557,7
2
100,00%
Итого
28
3.2. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
продолжение
--PAGE_BREAK--
Построение аналитической группировки областей по признаку начисленная заработная плата
1. Ранжирование единиц совокупности по возрастанию факторного признака.Для построения ранжированного ряда областей применяктся инструмент ExcelСортировка(запуск осуществляется последовательностью: Данные – Сортировка). В появившемся диалоговом окне задаются необходимые параметры.
1.1 Ранжирование исходных данных:
Таблица 2.1
№
п/п
Область
Начисленная заработная плата, руб.*
Финансовый результат, в разах**
1
Астраханская
5008,5
0,3
2
Белгородская
5143,7
1,2
3
Брянская
5235,3
0,7
4
Владимирская
5382,2
1,0
5
Волгоградская
5430,6
1,0
6
Вологодская
5475,9
1,2
7
Воронежская
5695,8
0,8
8
Ивановская
5734,5
0,8
9
Калининградская
5944,7
1,2
10
Калужская
5974,6
1,3
11
Кировская
6066,8
1,4
12
Костромская
6149,7
2,3
13
Курская
6160,0
2,1
14
Ленинградская
6163,5
1,4
15
Липецкая
6412,4
1,8
16
Московская
6486,3
1,1
18
Нижегородская
6533,4
1,4
19
Новгородская
6775,4
1,5
20
Оренбургская
6781,3
1,9
21
Орловская
6884,2
1,1
22
Псковкая
6929,4
0,8
23
Ростовская
6940,8
1,8
24
Рязанская
7066,4
1,4
25
Самарская
7366,2
1,1
27
Тамбовская
7764,9
1,4
28
Тверская
8595,9
1,2
29
Тульская
8827,9
0,9
30
Ярославская
9557,7
1,4
2. Распределение областей по группам.Для наглядности и удобства работы на следующем этапе целесообразно использовать цветовую заливку групп.
1.2 Выделение групп областей с помощью заливки контрастным цветом:
Таблица 2.1
№
п/п
Область
Начисленная заработная плата, руб.*
Финансовый результат, в разах**
1
Астраханская
5008,5
0,3
2
Белгородская
5143,7
1,2
3
Брянская
5235,3
0,7
4
Владимирская
5382,2
1,0
5
Волгоградская
5430,6
1,0
6
Вологодская
5475,9
1,2
7
Воронежская
5695,8
0,8
8
Ивановская
5734,5
0,8
9
Калининградская
5944,7
1,2
10
Калужская
5974,6
1,3
11
Кировская
6066,8
1,4
12
Костромская
6149,7
2,3
13
Курская
6160,0
2,1
14
Ленинградская
6163,5
1,4
15
Липецкая
6412,4
1,8
16
Московская
6486,3
1,1
18
Нижегородская
6533,4
1,4
19
Новгородская
6775,4
1,5
20
Оренбургская
6781,3
1,9
21
Орловская
6884,2
1,1
22
Псковкая
6929,4
0,8
23
Ростовская
6940,8
1,8
24
Рязанская
7066,4
1,4
25
Самарская
7366,2
1,1
27
Тамбовская
7764,9
1,4
28
Тверская
8595,9
1,2
29
Тульская
8827,9
0,9
30
Ярославская
9557,7
1,4
3. Расчет средних групповых значений результативного признака
Y
– финансовый результат. Поскольку Excelне содержит встроенных функций для расчета среднего темпа роста, то вычисление среднего темпа роста произведем по формуле: )
Таблица 2.2
Зависимость финансового результата от
начисленной заработной платы
Номер группы
Группы областей по начисленной заработной плате
Число областей в группе
Средний темп роста на одну область
1
5008,5-5918,34
8
0,81
2
5918,34-6828,18
11
3,56
3
6828,18-7738,02
5
1,19
4
7738,02-8647,86
2
1,30
5
8647,86-9557,7
2
1,12
Итого
28
0,29
продолжение
--PAGE_BREAK--
Оценка тесноты связи изучаемых признаков на основе эмпирического корреляционного отношения
2.1 Расчет внутригрупповых дисперсий результативного признака. Величина общей дисперсии и внутригрупповой дисперсии для каждой группы рассчитывается с помощью функции ДИСПР инструмента Мастер функций:
Таблица 2.3
Показатели внутригрупповой вариации
Номер группы
Группы областей по начисленной заработной плате
Число областей в группе
Внутригрупповая дисперсия
1
5008,5-5918,34
8
0,08
2
5918,34-6828,18
11
0,14
3
6828,18-7738,02
5
0,11
4
7738,02-8647,86
2
0,01
5
8647,86-9557,7
2
0,06
Итого
28
0,40
2.2. Расчет общей, средней из внутригрупповых и факторной дисперсией.
Для расчета факторной дисперсии используется правило сложения дисперсий:
, согласно которому:
Поскольку Excelне содержит встроенных функций для расчета взвешенных средних, то вычисление средней величины производится по формуле:
, где n
j– кол-во областей j-й группы;
к — количество групп;
2.3. Расчет эмпирического корреляционного отношения. Расчет производится согласно формуле:
,
с помощью функции КОРЕНЬ.
Результаты выполненных расчетов представлены в таблице 2.4:
Таблица 2.4
Показатели дисперсии и эмпирического корреляционного отношения
Общая дисперсия
Средняя из внутригрупповых
Факторная дисперсия
Эмпирическое корреляционное отношение
0,185038265
0,10101299
0,084025275
0,673867014
Таким образом, можно сделать вывод о том, что связь между признаком начисленная заработная плата и признаком финансовый результат заметная, сильная, т.к. =0,67. Кроме того, квадрат корреляционного отношения – коэффициент детерминации , или 44,9% показывает, что вариация результативного признака – финансового результата на 44,9% происходит под влиянием вариации факторного признака – начисленной заработной платы, а на 55,1% (100% — 44,9%) – под влиянием прочих неучтенных факторов.
Оценка тесноты связи изучаемых признаков на основе линейного коэффициента корреляции (в предположении, что взаимосвязь признаков линейная)
В случае линейной связи факторного и результативного признаков оценить тесноту связи можно не только с помощью значения корреляционного отношения, но и используя линейный коэффициент корреляции r. Для определения тесноты связи на основе коэффициента r
в Excel
используется инструмент Корреляция.
Результатом работы инструментаКорреляция является таблица, содержащая рассчитанные линейные коэффициенты корреляции. В нашем случае корреляция парная, результативная таблица имеет вид:
Таблица 2.5
Линейный коэффициент корреляции признаков
Столбец 1
Столбец 2
Столбец 1
1
Столбец 2
0,195302983
1
Таким образом, можно сделать вывод, что связь между признаками прямая, незаметная (т.к. r= 0,195). Кроме того, с уверенностью можно утверждать, что взаимосвязь признаков криволинейная (т.к. r ≠ η).
Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия
Регрессионный анализ заключается в определении аналитического выражения связи между факторным признаком Х и результативным признаком Y
. В результате работы инструмента Регрессия Excelформирует следующий набор из четырех таблиц и одного графика:
1. Таблица Регрессионная статистика – содержит линейный коэффициент корреляции r, коэффициент детерминации R2 , количество наблюдений n, среднее квадратическое отклонение расчетных значений от фактических (стандартная ошибка) :
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R
0,195302983
R-квадрат
0,038143255
Нормированный R-квадрат
0,001148765
Стандартная ошибка
0,437802577
Наблюдения
28
2. Таблица Дисперсионный анализ – содержит значения факторной и остаточной дисперсий (графа MS) и другие параметры дисперсионного анализа:
Дисперсионный анализ
df
SS
MS
F
Значимость F
Регрессия
1
0,19762293
0,19762293
1,031052328
0,319268159
Остаток
26
4,983448499
0,191671096
Итого
27
5,181071429
3. Результативная таблица – содержит значения параметров а0 (свободный член регрессии), а1 (коэффициент регрессии) уравнения регрессии и их статистические оценки, включая границы доверительных интервалов для коэффициентов уравнения регрессии:
Коэффициенты
Стандартная ошибка
t-статистика
Y-пересечение
0,770797654
0,496460019
1,552587568
Переменная X 1
7,62662E-05
7,5109E-05
1,015407469
P-Значение
Нижние 95%
Верхние 95%
Нижние 68,3%
Верхние 68,3%
0,132610618
-0,249690521
1,791285829
0,264273679
1,277321629
0,319268159
-7,81225E-05
0,000230655
-3,65327E-07
0,000152898
4. Таблица Вывод остатка – содержит рассчитанные (сглаженные, предсказанные) значения (расчетные значения результативного признака) и значения остатков (отклонения расчетных значений от фактических):
ВЫВОД ОСТАТКА
Наблюдение
Предсказанное Y
Остатки
1
1,1527769
-0,8527769
2
1,16308809
0,03691191
3
1,170074073
-0,470074073
4
1,181277577
-0,181277577
5
1,184968861
-0,184968861
6
1,18842372
0,01157628
7
1,205194657
-0,405194657
8
1,208146158
-0,408146158
9
1,224177313
-0,024177313
10
1,226457672
0,073542328
11
1,233489416
0,166510584
12
1,239811883
1,060188117
13
1,240597425
0,859402575
14
1,240864357
0,159135643
15
1,259847013
0,540152987
16
1,265483085
-0,165483085
17
1,269075223
0,130924777
18
1,287531643
0,212468357
19
1,287981613
0,612018387
20
1,295829405
-0,195829405
21
1,299276637
-0,499276637
22
1,300146071
0,499853929
23
1,309725106
0,090274894
24
1,332589712
-0,232589712
25
1,362997044
0,037002956
26
1,426374254
-0,226374254
27
1,444068011
-0,544068011
28
1,499727081
-0,099727081
продолжение
--PAGE_BREAK--