--PAGE_BREAK--
Т = Т1 + Т2 + Т3 + Т4 + Т5
Т=15208,47, Т2 = 231297559,74, N= 479
Средние значения выборок:
=35,6
= 31,1
= 28,7
= 26,38
= 19,8
Возведем в квадрат значение всех наблюдений и просуммируем их [6].
Вычисляем:
=567988,11
Общая сумма квадратов будет следующей:
— /
N
= 85112,2
Находим сумму квадратов между выборками:
(/n1+….+/nk) – T2/N= 8470,35
Теперь можно заполнить таблицу дисперсионного анализа [6].
Таблица №2. Дисперсионный анализ по одному признаку.
Компонента дисперсии
(1)
Сумма квадратов
(2)
Степень свободы
(3)
Средний квадрат
(4)=(2)/(3)
Между выборками
()-/N
k-1
(определяется делением)
Остаточная
(определяется вычитанием)
N-k
Полная
N-1
-----
Получаем:
Таблица №2а. Дисперсионный анализ по одному признаку. Результаты.
Компонента дисперсии
(1)
Сумма квадратов
(2)
Степень свободы
(3)
Средний квадрат
(4)=(2)/(3)
Между выборками
8470,35
4
2117,59
Остаточная
76641,85
474
161,69
Полная
85112,2
478
-----
Значение критериальной статистики равно:
F= средний квадрат между выборками / остаточный средний квадрат = 2117,59 / 161,69 = 13,09
Сравним Fи Fкритич: 13,09>2,37
Вывод. Следовательно, мы отвергаем гипотезу Н0, то есть можно предположить, что при 5%-ном уровне значимости УК в крови больных СКВ зависит от степени тяжести поражения почек.
Мы не знаем, какое распределение имеют наши выборки. Описанный метод применяется, как это было описано в статистической модели, для нормальных совокупностей. В связи с этим будет правомочно применить непараметрический метод для выяснения равенства нескольких средних.
2. Непараметрический дисперсионный анализ по одному признаку с применением критерия Краскала-Уоллиса для нескольких независимых выборок
продолжение
--PAGE_BREAK--Для проверки совпадений нескольких средних часто применяется непараметрический критерий, свободный от распределения. Его можно использовать, когда рассматриваемые совокупности не являются нормально распределенными [7].
Статистическая модель
Имеется kсовокупностей, в нашем случае 5 совокупностей. Каждая выборка извлекается из своей совокупности. Все наблюдения независимы.
Гипотезы
Н0: все kсовокупностей одинаково распределены.
Н1: нулевая гипотеза не верна.
Критическая область
Верхняя 5%-ная область распределения 2k-1. В нашем случае 24, что соответствует значению критерия, превышающему 9,49. Данное число взято из Таблицы А.2 на стр. 331 «Справочника по вычислительным методам статистики» Дж. Полларда. [6]
Вычисление значения критериальной статистики Для этого наблюдения xijзаменяются их рангами rij.Все n наблюдений упорядоченны по возрастанию от 1 до n. Находим сумму рангов R1, R2,…, Rk для k групп. Вычисляем критерий [4]:
H= ( R21/n1 +….+ R2k/nk) – 3 ( N+ 1 )
Значения комплемента упорядочены по возрастанию. Они иногда совпадают, тогда ранг принимает среднее значение.
Далее, используя Таблицу №1, присваиваем каждому значению комплемента соответствующий ранг в данных пяти выборках и получаем сумму рангов [5] .
Таблица №3. Таблица рангов наблюдений.
Нет
нефрита
Выборка объема n1= 210
Слабый
нефрит
Выборка объема
n2= 101
Средний
нефрит
Выборка объема
n3= 98
Нефротический синдром
Выборка объема
n4= 45
Почечная недостаточность
Выборка объема
n5= 25
УК
Ранг
УК
Ранг
УК
Ранг
УК
Ранг
УК
Ранг
36
282
11
45
7
33
10
39
20
86
38
315,5
35
264
27
144,5
5
28,5
20
86
40
352,5
37
296,5
6
31,5
6
31,5
21
95,5
31
188,5
15
59,5
5
28,5
15
59,5
24
115
33
220
40
352,5
40
352,5
20
86
3
26
33,8
242
13
5
28,5
25
126,5
12
50
37
296,5
33
220
45
405,5
28
28
10
39
38
315,5
33
220
45
405,5
32
197,5
13
33
220
5
28,5
46
420,5
46
420,5
18,2
77
37
296,5
40
352,5
45
405,5
33
220
46
420,5
48
436,5
25
126,5
24
115
44
396,5
10
39
40
352,5
33
220
24
115
25
126,5
13
42
375,5
50
453,5
43
383
22,5
105,5
20
86
35
264
25
126,5
24,5
119,5
24,5
119,5
30,4
181,5
15
59,5
20
86
20,5
92
38
315,5
13
35
264
50
453,5
9
34
12
50
33,3
231
48
436,5
50
453,5
12
50
54,7
471
14,7
56
45
405,5
18
74,5
32
197,5
20,7
94
34,1
247
38
315,5
20
86
43
383
13
22,4
102,5
15
59,5
33
220
35,5
273,5
26,1
137,5
17,8
72
13
53
43
383
44
396,5
11
45
33,5
237
40
352,5
10
39
50
453,5
11,7
47
29,6
171
40
352,5
12
50
34
244,5
34,4
252,5
13,6
54,5
38
315,5
23
110
12
50
13
35
264
32,7
210
34
244,5
13
13
37
296,5
60
478
30
176,5
25,1
132,5
42
375,5
50
453,5
35
264
22,5
105,5
32,3
204
51
462,5
22
99,5
31
188,5
16
68
45
405,5
22,2
101
33
220
32,5
207
25
26,5
20
86
41,9
373
39,3
345,5
33
220
21
95,5
41,7
371
40,2
359
33
220
22
99,5
37,1
299
13
39
334
10
39
33,4
233
39,1
337
35,8
278,5
37,4
304,5
33
220
37,7
306,5
41,7
371
22,4
102,5
34,3
250
33,5
237
38,2
323
35
264
33
220
43,8
393,5
37,4
304,5
37,3
302,5
36,9
293
16
68
10
39
39,6
346
41
365
16
68
37,9
309,5
13
33
220
31
188,5
39,3
343,5
32,8
211
32,15
202
52
465
37,2
301
24
115
38,8
332
51
462,5
37,8
308
25
126,5
48,1
439
33,5
237
49,1
445
38
315,5
13
48
436,5
36,15
286
29
165
13
27
144,5
43,8
393,5
32
197,5
26,6
141
48
436,5
40
352,5
32
197,5
52,8
470
40
352,5
20
86
27
144,5
36
282
32,3
204
13,6
54,5
45
405,5
10
39
10
39
43,5
390,5
33,9
243
19,5
79
35
264
45,74
417
51,2
464
35
264
13
40,4
362,5
19,5
79
49,1
445
46,05
424
24,2
118
38
315,5
13
33
220
13
25,2
134
40,4
362,5
43,5
390,5
28
152,5
30
176,5
32,3
204
27
144,5
36
282
41
365
35
264
10
39
40
352,5
29
165
25
126,5
29,7
172
50
453,5
30
176,5
30
176,5
20
86
32
197,5
27,6
149
13
31
188,5
21,4
98
15,6
64,5
45
405,5
23
110
35
264
20
86
34,3
250
13
45
405,5
18
74,5
46
425
15
59,5
50,4
461
59,2
475
30,4
181,5
48,2
440,5
13
50
453,5
37,3
302,5
22,5
105,5
46
420,5
35
264
13
35
264
25
126,5
24
115
15
59,5
20
86
45
405,5
18
74,5
38
315,5
28,9
161,5
28
152,5
47,5
432,5
30,5
183
36,7
291
37,9
309,5
45,5
414
47,8
434
40,3
360,5
43
383
39,2
341
60
478
34,7
255,5
36,5
287
34,1
247
32,6
208,5
32
197,5
46,7
427,5
38,4
325
45,7
415,5
39
334
37,15
300
46,9
429
31,4
192
39
334
15,6
64,5
32
197,5
52,15
466
34,1
247
42
375,5
52,2
467,5
44,7
399
43,8
393,5
13
26,5
139,5
39,1
337
13
36,6
289
16
68
13
30,3
180
26,5
139,5
33
220
47
430,5
43
383
43
383
50
453,5
36,9
293
46,6
426
52,2
467,5
29,4
168,5
59,3
476
38,5
327
30,6
184
13
41
365
35,6
276
15,5
63
40
352,5
38,7
331
21,2
97
45
405,5
38,2
323
22,8
108
25,5
135
26,1
137,5
28,3
156
27,7
150
43,2
388
28,15
155
22,5
46
420,5
38,5
327
45
105,5
35,6
276
26
136
33
220
32,4
206
48,3
442
50
453,5
47,5
432,5
50
453,5
32
197,5
50
453,5
35,6
276
33,5
237
56,9
473
28,9
161,5
40
352,5
35,2
271
42,5
378
50
453,5
46,2
425
52,7
469
49,1
445
38
315,5
33,7
241
32,6
208,5
30
176,5
28,9
161,5
44,4
398
48,2
440,5
38,15
321
42
375,5
28,4
157
33,5
237
39,4
345
38,6
329,5
34,3
250
37,7
306,5
27,3
148
39,2
341
29,2
167
39,2
341
33,5
237
18
74,5
31,2
191
23,4
112
36,9
293
57,3
474
45
405,5
45,3
413
16,5
71
34,9
257
43,1
387
30,8
185,5
13
34,5
254
28
152,5
16
68
28,9
161,5
23
110
27
144,5
41,6
369
43,4
389
36
282
49
443
25
126,5
41,5
368
35,5
273,5
35
264
33,1
229
41,7
371
39,15
339
30,8
185,5
45,7
415,5
35,4
272
35,8
278,5
27
144,5
19,5
79
29,4
168,5
33,3
231
36,6
289
42,6
379
30
176,5
36,1
285
43
383
33,3
231
28,7
158,5
28,7
158,5
45,1
412
31,8
193
33
220
39,1
337
29
165
46,7
427,5
41,05
367
29,9
173
50
453,5
47
430,5
34,4
252,5
11
45
20,6
93
36,6
289
38,6
289
29,48
170
25
126,5
13
38
315,5
34,7
255,5
38,2
323
43,8
393,5
40,3
360,5
38,5
327
60
478
50
453,5
36
282
55
472
33,5
237
25,1
132,5
24,8
121
Всего:
R1=
57877
R2=
23298.5
R3=
21259.5
R4=
8789
R5=
3072
N = 479
k= 5
R1= 57877
n1= 210
R2= 23298,5
n2= 101
R3= 21259,5
n3= 98
R4= 8789
n4= 45
R5= 3072
n5 = 25
Теперь можно полученные суммы рангов подставить в формулу и получить значение критериальной статистики Краскела-Уоллиса [4] :
Н=23,03
Полученный результат не является незначимым, поэтому нельзя считать, что выборки извлечены из одинаково распределенных совокупностей и что средние значения совокупностей совпадают. Но этот вывод является приближенным, так как в нашей таблице есть много совпадающих значений. Для учета влияния связей можно воспользоваться модифицированной формой статистики Краскела-Уоллиса [4]:
Н` = продолжение
--PAGE_BREAK--