--PAGE_BREAK--Ошибки наблюдения
При большом числе единиц исследуемой совокупности ошибки и неточности могут погашаться, однако, если применяется выборочное наблюдение, тогда ошибки могут существенно повлиять на результаты исследования.
В ходе наблюдения могут возникнуть следующие ошибки:
1. Ошибки регистрации – ошибочные результаты наблюдения, полученные в результате недостаточной квалификации исследователя, неточности измерительных приборов, некорректности подсчетов и т.д.
2. Ошибки могут быть случайными и систематическими [12].
· Систематические ошибки репрезентативности – ошибки, вызванные нарушением правил выбора единиц совокупности для наблюдения;
· Ошибки репрезентативности (случайные) – ошибки, отражающие несовпадение выводов о части явления с выводами о явлении в целом. Такие ошибки возникают при применении несплошного метода наблюдения, случайные ошибки репрезентативности – ошибки, отражающие неравномерное распределение единиц в совокупности, в связи с чем, выборочная совокупность не корректно характеризует генеральную совокупность.
Средняя и предельная ошибка для показателей средней величины
Обобщающей характеристикой совокупности по изучаемому признаку является средняя величина признака. Поэтому, как правило, сначала рассчитывают среднее значение признака для выборочной совокупности ( ), а затем, исходя из меры соответствия между генеральной и выборочной совокупностями, определяют пределы, в которых может колебаться среднее значение признака в генеральной совокупности ( ).
Поскольку точные характеристики генеральной совокупности не определены, то указать единичное значение расхождения между средними для выборочной и генеральной совокупностей невозможно. В связи с этим, определяют средний размер всех возможных ошибок ( ) выборочного наблюдения. Другими словами, показатель называется средняя ошибка выборочной средней. Для повторного отбора[8]:
– дисперсия выборочной совокупности;
n – численность единиц выборочной совокупности [13].
С применением поправочного коэффициента на бесповторность средняя ошибка выборочной средней для бесповторного отбора будет определяться следующим образом:
– дисперсия выборочной совокупности;
N – численность единиц генеральной совокупности.
То есть, средняя в генеральной совокупности может отклониться от средней в выборочной совокупности в сторону увеличения или уменьшения на величину .
Предельная ошибка выборочной средней ( ) определяет границы, в пределах которых может колебаться среднее значение генеральной совокупности относительно среднего значения выборки. Различия между средней и предельной ошибкой обусловлены величиной коэффициента доверия t.
Суть этого коэффициента можно определить как ряд следующих заключений:
· предполагается наличие расхождения между параметрами выборки и параметрами генеральной совокупности, которое называется ошибкой;
· предполагается, что вместо полученных определенных результатов выборки, могли быть другие, несколько отличные результаты, и, следовательно, могли быть другие характеристики выборочной совокупности и другие ошибки [15];
· предполагается образование ряда распределения из возможных ошибок, причем, в таком ряду рассчитывается среднее значение – средняя ошибка выборки ( );
· предполагается наличие степени вероятности Р у каждой ошибки в этом ряду распределения;
· предполагается формирование распределения вероятностей ошибок Р(t), т.е. определение плотности вероятности ошибок (графическое изображение см. рис 2.);
· предполагается более высокая вероятность появления ошибок определенного размера (среднего размера ошибки) (графически отображается в виде возвышения «волны», характеризующей вероятность, см. рис. 2.);
· по оси абсцисс на графике откладывается значение t; тогда, чем ближе вероятность ошибки расположена к оси ординат (соответственно, к вероятности появления средней ошибки), тем меньше значение t.
· в зависимости от степени репрезентативности («доверия») выборочных данных, определяется значение t, от величины которого зависит вероятность появления ошибок других размеров, отличных от средней ошибки, следовательно, зависят границы колебания значения параметров генеральной совокупности относительно выборки [6].
Таким образом, количественное выражение t, в конечном итоге, является мерой «доверия» к реальности выборочных данных. Тогда предельная ошибка выборочной средней ( ) будет определяться следующим образом:
.
Отсюда, среднее значение генеральной совокупности имеет вид:
В статистике существуют наиболее распространенные уровни вероятностей, например: 0,954; 0,997 и др. Это означает, что, соответственно, в 6 случаях из 1000 и в 3 случаях из 1000 ошибка выборки может превысить пределы, определенные выборочным наблюдением.
Рис. 2.
На рисунке 2. затемненная площадь под кривой показывает вероятность появления средней ошибки выборочной средней. Площадь фигуры, образованной перпендикулярами, опущенными на ось абсцисс[1], и кривой плотности вероятности определяет вероятность появления предельной ошибки выборочной средней [17].
продолжение
--PAGE_BREAK--Средняя и предельная ошибка для показателей доли
Анализ генеральной совокупности не ограничивается расчетом средних величин. Для характеристики распространенности единиц совокупности с тем или иным значением изучаемого признака рассчитываются показатели структуры (доли).
Принцип транспонирования выводов о выборке на генеральную совокупность, принятый для средних величин, сохраняется и при определении показателей доли:
1. Средняя ошибка выборки ( )для доли (w) единиц, обладающих изучаемым признаком, при повторном отборе:
w – удельный вес единиц, обладающих изучаемым признаком;
– дисперсия для показателя доли;
n – численность единиц выборочной совокупности.
2. Средняя ошибка выборки ( )для доли (w) единиц, при бесповторном отборе:
N – численность единиц генеральной совокупности.
3. Предельная ошибка выборочной доли ( ):
Тогда, удельный вес единиц, обладающих изучаемым признаком, в генеральной совокупности будет находиться в пределах:
Определение необходимого объема выборки
Прежде чем приступить к осуществлению выборочного наблюдения необходимо определить количество единиц выборочной совокупности, обеспечивающее репрезентативность, и, следовательно, надежность результатов исследования [4].
На практике для реализации выборочного наблюдения исследователем задаются:
· степень точности исследования (вероятность);
· предельная ошибка, т.е. интервал отклонения, определяемый целями исследования.
Исходя из этих критериев, рассчитывается необходимая численность выборочной совокупности (n) на основе формулы предельной ошибки выборки. Как указывалось выше, предельная ошибка выборки определяется для средней величины ( ) и для доли (w), то, соответственно, имеем два варианта определения необходимой численности выборочной совокупности:
а) для повторного отбора:
б) для бесповторного отбора:
Понятие о малой выборке
В практике статистического исследования иногда необходимо сделать выводы по малому числу наблюдений. Это может быть связано с ограниченностью ресурсов на проведение выборки, или с ограниченным доступом к объекту исследования. Если число наблюдений (единиц выборочной совокупности) не превышает 30, то выборка называется малой. Расчет показателей для малой выборки осуществляется с применением специальной методики, учитывающей распределение вероятностей появления ошибок определенных размеров. Напротив, в выборочной совокупности с большим количеством единиц распределение ошибок предполагается нормальным или близким к нормальному.
Расчетная часть
Задача:
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности региона в отчетном году (выборка 20% — ная механическая), млн. руб.:
Таблица 1
№ предприятия
п /п
Выручка от продажи продукции
Затраты на производство и реализацию продукции
1
36,45
30,255
2
23,4
20,124
3
46,54
38,163
4
59,752
47,204
5
41,415
33,546
6
26,86
22,831
7
79,2
60,984
8
54,72
43,776
9
40,424
33,148
10
30,21
25,376
11
42,418
34,359
12
64,575
51,014
13
51,612
41,806
14
35,42
29,753
15
14,4
12,528
16
36,936
31,026
17
53,392
42,714
18
41
33,62
19
55,68
43,987
20
18,2
15,652
21
31,8
26,394
22
39,1204
32,539
23
57,128
45,702
24
28,44
23,89
25
43,344
35,542
26
70,72
54,454
27
41,832
34,302
28
69,345
54,089
29
35,903
30,159
30
50,22
40,678
Задание 1
Признак – уровень рентабельности продукции (рассчитайте путем деления прибыли от продаж, т.е. разности между выручкой от продажи продукции и затратами на ее производство и реализацию, на затраты на производство и реализацию продукции).
Число групп – пять.
Задание 2
Связь между признаками – затраты на производство и реализацию продукции и уровень рентабельности продукции.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,997 определите:
1. Ошибку выборки среднего уровня рентабельности организации и границы, в которых будет находиться средний уровень рентабельности в генеральной совокупности;
2. Ошибку выборки доли организаций с уровнем рентабельности продукции 23,9% и более и границы, в которых будет находиться генеральная доля.
Задание 4
Выпуск продукции и удельный расход стали по региону, в текущем периоде характеризуется следующими данными:
Таблица 2
Вид продукции
Фактический выпуск продукции, шт.
Расход стали на единицу продукции, кг
по норме
фактически
А
320
36
38
Б
250
15
12
В
400
10
9
Определите:
1. Индивидуальные индексы выполнения норм расхода стали.
2. Общий индекс выполнения норм расхода стали на весь выпуск продукции.
3. Абсолютную экономию (перерасход) стали.
Решение здания №1:
1. Рассчитываем уровень рентабельности по формуле, данной в условии задачи:
Уровень рентабельности =*1000
Таблица 3
№ предприятия
п/п
Выручка от продажи продукции
Затраты на производство и реализацию продукции
Уровень рентабельности продукции
1
36,45
30,255
204,7
2
23,4
20,124
162,8
3
46,540
38,163
219,5
4
59,752
47,204
265,8
5
41,415
33,546
234,6
6
26,86
22,831
176,5
7
79,2
60,984
298,7
8
54,720
43,776
250
9
40,424
33,148
219,5
10
30,21
25,376
190,5
11
42,418
34,359
234,5
12
64,575
51,014
265,8
13
51,612
41,806
234,5
14
35,42
29,753
190,5
15
14,4
12,528
149,4
16
36,936
31,026
190,5
17
53,392
42,714
250
18
41,0
33,62
219,5
19
55,680
43,987
265,8
20
18,2
15,652
162,8
21
31,8
26,394
204,8
22
39,204
32,539
204,8
23
57,128
45,702
250
24
28,44
23,89
190,5
25
43,344
35,542
219,5
26
70,720
54,454
298,7
27
41,832
34,302
219,5
28
69,345
54,089
282,1
29
35,903
30,159
190,5
30
50,220
40,678
234,6
2. Строим ранжированный ряд данных по уровню рентабельности продукции и сортируем по возрастанию
Таблица 4
№ предприятия
п/п
Выручка от продажи продукции
Затраты на производство и реализацию продукции
Уровень рентабельности продукции
15
14,4
12,528
149,4
2
23,4
20,124
162,8
20
18,2
15,652
162,8
6
26,86
22,831
176,5
24
28,44
23,89
190,5
29
35,903
30,159
190,5
14
35,42
29,753
190,5
16
36,936
31,026
190,5
10
30,21
25,376
190,5
22
39,204
32,539
204,8
1
36,45
30,255
204,7
21
31,8
26,394
204,8
9
40,424
33,148
219,5
3
46,54
38,163
219,5
18
41
33,62
219,5
25
43,344
35,542
219,5
27
41,832
34,302
219,5
11
42,418
34,359
234,5
13
51,612
41,806
234,5
5
41,415
33,546
234,6
30
50,22
40,678
234,6
17
53,392
42,714
250
8
54,72
43,776
250
23
57,128
45,702
250
4
59,752
47,204
265,8
19
55,68
43,987
265,8
12
64,575
51,014
265,8
28
69,345
54,089
282,1
7
79,2
60,984
298,7
26
70,72
54,454
298,7
3.Расчитаем количество интервалов по формуле Стерджеса:
k=1+3.32 lgn , где n-dнашем случае 30
k = 1+3.32 lg 30=1+3.32*1.4771=5.9
4. Рассчитаем длину интервала и шаг интервала по следующей формуле:
h
=
, где n=5 групп
Тогда шаг интервала:
h==2,986
Формируем группы:
1 группа: 14,94- 17,926
2 группа: 17,926- 20,912
3 группа: 20,912- 23,898
4 группа: 23,898 – 26,884
5 группа: 26,884 – 29,87
Для удобства проставим номера групп в таблицу относительно уровня рентабельности.
Таблица 5
№ предприятия
п/п
Выручка от продажи продукции
Затраты на производство и реализацию продукции
Уровень рентабельности продукции
№ групп
15
14,4
12,528
14,94
1
2
23,4
20,124
16,28
1
20
18,2
15,652
16,28
1
6
26,86
22,831
17,65
1
24
28,44
23,89
19,05
2
29
35,903
30,159
19,05
2
14
35,42
29,753
19,05
2
16
36,936
31,026
19,05
2
10
30,21
25,376
19,05
2
22
39,1204
32,539
20,23
2
1
36,45
30,255
20,48
2
21
31,8
26,394
20,48
2
9
40,424
33,148
21,95
3
3
46,54
38,163
21,95
3
18
41
33,62
21,95
3
25
43,344
35,542
21,95
3
27
41,832
34,302
21,95
3
11
42,418
34,359
23,46
3
13
51,612
41,806
23,46
3
5
41,415
33,546
23,46
3
30
50,22
40,678
23,46
3
17
53,392
42,714
25,00
4
8
54,72
43,776
25,00
4
23
57,128
45,702
25,00
4
4
59,752
47,204
26,58
4
19
55,68
43,987
26,58
4
12
64,575
51,014
26,58
4
28
69,345
54,089
28,21
5
7
79,2
60,984
29,87
5
26
70,72
54,454
29,87
5
Таблица 6
Интервальный ряд распределения предприятий по уровню рентабельности продукции
№
гр.
Вариант признака (
xj
)
Уровень рентабельности продукции
Частота (
fj
)
ЧИСЛО
ПРЕДПРИЯТИЙ,
ед.
Частость (
wj
)
ДОЛЯ ПРЕДПРИЯТИЙ В ОБЩЕМ ИТОГЕ
1
14,94 – 17,926
4
0,13
2
17,926 – 20,912
8
0,27
3
20,912 – 23,898
9
0,3
4
23,898 – 26,884
6
0,2
5
26,884 – 29,87
3
0,1
Итого
30
1,00
6. Определим моду.
Для вычисления моды в интервальном ряду сначала находится модальный интервал (в данном случае этот интервал 209.12– 23,898), имеющий наибольшую частоту, а значение моды определяется линейной интерполяцией:
Mo= x
о
+( х1 — хо ) *
,
,
где хо – нижняя граница модального интервала;
х1 – верхняя граница модального интервала;
, , – частота ni модального, до и послемодального интервала.
хо = 20,912; хо — х1 =2,986; - частота модального интервала = 9; - частота домодального интервала = 8; -частота послемодального интервала= 6
Получаем:
Mo=20,912+2,986*=21,66
7. Определим медиану.
Таблица 7
Вспомогательная таблица для расчёта медианы
№
гр.
Уровень рентабельности продукции
Число предприятий,
ед.
Накопленное число предприятий,
ед.
1
14,94-17,926
4
4
2
17,926-20,912
8
12
3
20,912-23,898
9
21>15
4
23,898-26,884
6
27
5
26,884-29,87
3
30
Итого
30
,
где хо – нижняя граница модального интервала;
х1 – верхняя граница модального интервала;
fMe – частота медианного интервала;
S
ме-1
— накопленная частота интервала предшествующего медианному.
— половина от общего числа наблюдений;
Получаем:
Задание 2.
1. Строим аналитическую группировку.
Таблица 8
Таблица для построения аналитической группировки
№ группы
Уровень рентабельности продукции
№ п/п
Затраты на производство и реализацию продукции одним предприятием, млн.руб.
1
14,94-17,926
15
12,528
2
20,124
20
15,652
6
22,831
Итого
4
2
17,926-20,912
24
23,89
29
30,159
14
29,753
16
31,026
10
25,376
22
32,539
1
30,255
21
26,394
Итого
8
3
20,912-23,898
9
33,148
3
38,163
18
33,62
25
35,542
27
34,302
11
34,359
13
41,806
5
33,546
30
40,678
Итого
9
4
23,898-26,884
17
42,714
8
43,776
23
45,702
4
47,204
19
43,987
12
51,014
Итого
6
5
26,884-29,87
28
54,089
7
60,984
26
54,454
Итого
3
Всего
30
продолжение
--PAGE_BREAK--
Таблица 9
Зависимость уровня рентабельности продукции
от затрат на производство и реализацию продукции
№
гр.
Уровень рентабельности продукции
Число предприятий, ед.
Средние в группе затраты на производство и реализацию продукции одним предприятием,
млн. руб.
1
14,94 – 17,926
4
17,784
2
17,926 – 20,912
8
28,764
3
20,912 – 23,898
9
36,129
4
23,898 – 26,884
6
45,733
5
26,884 – 29,87
3
56,509
Итого
30
35,6
2. Строим корреляционную таблицу.
Таблица 10
Интервальный ряд распределения предприятий
по затратам на производство и реализацию продукции
Затраты на производство и реализацию продукции, млн. руб.,
yj
Число предприятий, ед.,
fj
12,528 — 22,2192
3
22,2192 — 31,9104
8
31,9104 — 41,6016
9
41,6016 — 51,2928
7
51,2928 — 60,984
3
Итого
30
млн.руб.
1) 12,528 – 22,2192
2) 22,2192 – 31,9104
3) 31,9104 – 41,6016
4) 41,6016 – 51,2928
5) 51,2928 – 60,984
Корреляционная таблица, характеризующая наличие связи между уровнем рентабельности продукции
и затратами на производство и реализацию продукции
Таблица 11
Уровень рентабельности продукции
Затраты на производство и реализацию продукции, млн. руб.
Итого
12,528 — 22,2192
22,2192 — 31,9104
31,9104 — 41,6016
41,6016 — 51,2928
51,2928 — 60,984
14,94 – 17,926
3
3
17,926 – 20,912
8
1
9
20,912 – 23,898
8
1
9
23,898 – 26,884
6
6
26,884 – 29,87
3
3
Итого
3
8
9
7
3
30
3. Рассчитываем характеристики интервального ряда распределения
Таблица 12
Расчетная таблица для нахождения характеристик ряда распределения.
х
хц
f
14,94-17,926
16,433
4
65,732
5,574
22,296
31,069
124,276
17,926-20,912
19,419
8
155,352
2,588
20,704
6,698
53,584
20,912– 23,898
22,405
9
201,645
0,398
3,582
0,158
1,422
23,898– 26,884
25,391
6
152,346
3,384
20,304
11,451
68,706
26,884– 29,87
28,377
3
85,131
6,37
19,11
40,577
121,731
Итого
30
660,206
85,996
369,719
Средняя арифметическая — %
Дисперсия —
Среднее квадратическое отклонение -Размах вариации R= Xmax— Xmin= 29,87 – 14,94=14,93
Среднее линейное отклонение —
Коэффициент вариации — %
Так как V=15,9%, а 15,9%
=22,% является надежной и типичной характеристикой всей совокупности.
4. Строим таблицу для расчета общей дисперсии.
Таблица 13
Вспомогательная таблица для расчёта общей дисперсии
№ п/п
Затраты на производство и реализацию продукции, млн. руб.
yi
yi2
15
12,528
156,951
20
15,652
244,985
2
20,124
404,975
6
22,831
521,255
24
23,890
570,732
10
25,376
643,941
21
26,394
696,643
14
29,753
885,241
29
30,159
909,565
1
30,255
915,365
16
31,026
962,613
22
32,539
1058,787
9
33,148
1098,790
18
33,620
1130,304
5
33,546
1125,334
27
34,302
1176,627
11
34,359
1180,541
25
35,542
1263,234
3
38,163
1456,415
30
40,678
1654,700
13
41,806
1747,742
17
42,714
1824,486
8
43,776
1916,338
19
43,987
1934,856
23
45,702
2088,673
4
47,204
2228,218
12
51,014
2602,428
28
54,089
2925,620
26
54,454
2965,238
7
60,984
3719,048
Итого
1069,615
42009,644
продолжение
--PAGE_BREAK--