--PAGE_BREAK--Таблица 3
Разработочная таблица для построения статистического ряда распределения и аналитической группировки
Группы банков по прибыли, млн руб.
Номер банка
Прибыль, млн руб.
Собственный капитал,
млн руб.
1
2
3
4
50-110
4
90
2300
11
100
2200
18
50
1800
Всего
3
240
6300
110-170
3
150
3000
5
130
3700
7
155
3780
17
140
2500
23
120
400
27
163
5100
Всего
6
858
18480
170-230
1
170
3900
2
200
4500
6
170
3200
8
190
4000
9
180
3100
10
210
4600
12
220
5280
14
180
4400
16
220
5000
19
190
4200
20
210
5600
28
200
4300
Всего
12
2340
52080
230-290
13
250
4700
15
276
6500
22
240
5850
24
230
4900
26
280
7088
29
260
6020
30
270
4800
Всего
7
1806
39858
290-350
21
346
7962
25
350
8400
Всего
2
696
16362
ИТОГО
30
5940
133080
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая таблица 4.
Таблица 4
Распределение банков по прибыли
Номер группы
Группы банков по прибыли, млн руб.,
Число банков,
f
1
50-110
3
2
110-170
6
3
170-230
12
4
230-290
7
5
290-350
2
Итого
30
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 — 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .
Таблица 5
Структура банков по прибыли
№ группы
Группы банков по прибыли, млн руб.
Число банков, fj
Накопленная
частота,
Sj
Накопленная
частоcть, %
в абсолютном выражении
в % к итогу
1
2
3
4
5
6
1
50-110
3
10
3
10,0
2
110-170
6
20
9
30,0
3
170-230
12
40
21
70,0
4
230-290
7
23,3
28
93,3
5
290-350
2
6,7
30
100,0
Итого
30
100,0
Вывод. Анализ статистического ряда распределения изучаемой совокупности банков показывает, что распределение банков по объему прибыли не является равномерным: преобладают банки с прибылью от 170 млн руб. до 230 млн руб. (это 12 банков, доля которых составляет 40%); 30% банков имеют прибыль менее 170 млн руб., а 70% – менее 230 млн руб.
1.2 Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Модля дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Для определения моды графическим способом на гистограмме распределения правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых будет модой распределения.
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3)
где хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 3 модальным интервалом построенного ряда является интервал 170 – 230 млн. руб., так как его частота максимальна (f3 = 12).
Расчет моды по формуле (3):
Mo=170+60*((12-6)/((12-6)+(12-7)))=202,727 млн руб.
Вывод.Для рассматриваемой совокупности банков наиболее распространенный объем прибыли характеризуется средней величиной 202,727 млн руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).
Для определения медианы графическим способом высоту наибольшей ординаты кумуляты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.
Рис. 2. Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 170 – 230 млн. руб., так как именно в этом интервале накопленная частота Sj= 21 впервые превышает величину, равную половине численности единиц совокупности
(=).
Расчет значения медианы по формуле (4):
Ме=170+60*((30/2-9)/12)=200 млн руб.
Вывод. В рассматриваемой совокупности банков половина банков имеют в среднем объем прибыли не более 200 млн руб., а другая половина – не менее 200 млн руб.
1.3 Расчет характеристик интервальногоряда распределения
Для расчета характеристик ряда распределения , σ, σ2, Vσна основе табл. 5 строится вспомогательная таблица 6 (– середина j-го интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Группы банков по объему прибыли, млн руб.
Середина интервала,
Число банков,
fj
1
2
3
4
5
6
7
50-110
80
3
240
-117,333
13924,000
41772
110-170
140
6
840
-57,333
3364,000
20184
170-230
200
12
2400
2,667
4,000
48
230-290
260
7
1820
62,667
3844,000
26908
290-350
320
2
640
112,667
14884,000
29768
Итого
30
5940
118680
Расчет средней арифметической взвешенной: (5)
=5940/30=198 млн руб.
Расчет среднего квадратического отклонения:
(6)
σ=118680/30=62,897 млн руб.
Расчет дисперсии:
σ2=61,641 2=3956
Расчет коэффициента вариации:
(7)
Vσ=62,897*100/198=31,77 %
Вывод.Анализ полученных значений показателей и σ говорит о том, что средний объем прибыли банков составляет 198 млн руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 62,897 млн руб. (или 31,77 %), наиболее характерные значения объема прибыли находятся в пределах от 135,103 млн руб. до 260,897 млн руб. (диапазон ).
Значение Vσ= 31,77 % не превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна.
Расхождение между значениями , Мо и Ме незначительно (=198 млн руб., Мо=202,727 млн руб., Ме=200 млн руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема прибыли банков (198 млн руб.) является типичной, надежной характеристикой исследуемой совокупности банков.
1.4 Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
(8)
=5940/30=198 млн руб.
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
продолжение
--PAGE_BREAK--ЗАДАНИЕ 2
По исходным данным:
1. Установите наличие и характер связи между признаками – прибыль и собственный капитал:
а) аналитической группировки;
б) корреляционной таблицы.
2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициентов детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполнения задания.
Выполнение Задания 2
2.1 Установление наличия и характера связи между признаками прибыль и собственный капиталметодами аналитической группировки и корреляционной таблицы
а. Применение метода аналитической группировки
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Прибыльи результативным признаком Y
–Собственный капитал. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы
Группы банков по объему прибыли,
млн руб.
Число банков
Собственный капитал,
млн руб.
всего
в среднем на один банк
1
2
3
4
5
Итого
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы
Группы банков по объему прибыли,
млн руб.,
х
Число банков,
fj
Собственный капитал,
млн руб.
всего
в среднем на один банк,
1
2
3
4
5=4:3
1
50-100
3
6300
2100
2
110-170
6
18480
3080
3
170-230
12
52080
4340
4
230-290
7
39858
5694
5
290-350
2
16362
8181
Итого
30
133080
4436
Вывод. Анализ данных табл. 8 показывает, что с увеличением объема прибыли от группы к группе систематически возрастает и объем собственного капитала по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
б. Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Прибыль известны из табл. 8. Для результативного признака Y – Собственный капитал величина интервала определяется по формуле (1) при k
= 5, у
max= 8400 млн руб., у
min= 400 млн руб.:
h=(8400-400)/5=1600 млн руб.
Границы интервалов ряда распределения результативного признака Yимеют следующий вид (табл. 9):
Таблица 9
Номер группы
Нижняя граница,
млн руб.
Верхняя граница,
млн руб.
1
400
2000
2
2000
3600
3
3600
5200
4
5200
6800
5
6800
8400
Подсчитывая с использованием принципа полуоткрытого интервала [ ) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 10).
Таблица 10
Распределение банков по сумме прибыли
Группы банков по объему собственного капитала, млн. руб.,
х
Число банков,
fj
400 – 2000
2
2000 – 3600
6
3600 – 5200
14
5200 – 6800
5
6800 — 8400
3
Итого
30
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).
Таблица 11
Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений
Группы банков по прибыли,
млн руб.
Группы банков по объему собственного капитала, млн руб.
400-2000
2000-3600
3600-5200
5200-6800
6800-8400
Итого
50-110
1
2
3
110-170
1
2
3
6
170-230
2
8
2
12
230-290
3
3
1
7
290-350
2
2
Итого
2
6
14
5
3
30
Вывод. Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков.
2.2 Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах. При отсутствии корреляционной связи между признаками Хи Yимеет место равенство =, а при наличии функциональной связи между ними — равенство=1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Yфакторов (систематических и случайных). Этот показатель вычисляется по формуле
(10)
где yi– индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n– число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
=133080/30=4436 млн руб.
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер
банка
п/п
Собственный капитал, млн руб.
1
2
3
4
5
1
3900
-536
287296
15210000
2
4500
64
4096
20250000
3
3000
-1436
2062096
9000000
4
2300
-2136
4562496
5290000
5
3700
-736
541696
13690000
6
3200
-1236
1527696
10240000
7
3780
-656
430336
14288400
8
4000
-436
190096
16000000
9
3100
-1336
1784896
9610000
10
4600
164
26896
21160000
11
2200
-2236
4999696
4840000
12
5280
844
712336
27878400
13
4700
264
69696
22090000
14
4400
-36
1296
19360000
15
6500
2064
4260096
42250000
16
5000
564
318096
25000000
17
2500
-1936
3748096
6250000
18
1800
-2636
6948496
3240000
19
4200
-236
55696
17640000
20
5600
1164
1354896
31360000
21
7962
3526
12432676
63393444
22
5850
1414
1999396
34222500
23
400
-4036
16289296
160000
24
4900
464
215296
24010000
25
8400
3964
15713296
70560000
26
7088
2652
7033104
50239744
27
5100
664
440896
26010000
28
4300
-136
18496
18490000
29
6020
1584
2509056
36240400
30
4800
364
132496
23040000
Итого
133080
90670008
681012888
Расчет общей дисперсиипо формуле (10):
=90670008/30=3022333,6
Общая дисперсия может быть также рассчитана по формуле
,
где –средняя из квадратов значений результативного признака,
–квадрат средней величины значений результативного признака.
Для демонстрационного примера
=681012888/30=22700429,6
=19678096
Тогда
=-=22700429,6-19678096=3022333,6
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Yпроявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k– число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по прибыли,
млн руб.
Число банков,
Среднее значение в группе
1
2
3
4
5
50-110
3
2100
-2336
16370688
110-170
6
3080
-1356
11032416
170-230
12
4340
-96
110592
230-290
7
5694
1258
11077948
290-350
2
8181
3745
28050050
Итого
30
66641694
Расчет межгрупповойдисперсии по формуле (11):
=66641694/30=2221389,8
Расчет эмпирического коэффициента детерминации по формуле (9):
=2221389,8/3022333,6=0,735 или 73,5%
Вывод.75,3% вариации суммы прибыли банков обусловлено вариацией объема прибыли, а 24,7% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
0,1 – 0,3
0,3 – 0,5
0,5 – 0,7
0,7 – 0,9
0,9 – 0,99
Характеристика
силы связи
Слабая
Умеренная
Заметная
Тесная
Весьма тесная
Расчет эмпирического корреляционного отношения по формуле (14):
=0,857 или 85,7 %
Вывод. Согласно шкале Чэддока связь между объемом прибыли и суммой собственного капитала банков является тесной.
продолжение
--PAGE_BREAK--