Санкт-ПетербургскийГосударственныйУниверситет
Факультетприкладнойматематики– процессовуправления
Кафедрадиагностикифункциональныхсистем
Анализ зависимостимежду УК в кровибольных СКВи степеньютяжести пораженияпочек
Курсоваяработа
Варламова
Александра
Александровна
Научныйруководитель
доктор медицинскихнаук, профессорШишкин В.И.
Санкт-Петербург2008
Содержание
§1.Введение
§2.Постановказадачи
§3.Используемыеметоды
1.Дисперсионныйанализ по одномупризнаку дляпроверки равенстванесколькихсредних
2.Непараметрическийдисперсионныйанализ по одномупризнаку сприменениемкритерияКраскала-Уоллисадля несколькихнезависимыхвыборок
3.Непараметрическийдисперсионныйанализ по одномупризнаку сприменениемкритерия Джонкхиерадля несколькихвыборок, упорядоченныхпо возрастаниювлияния фактора
§4.Вывод
§5.Список литературы
§1. Введение
Формулировкапроблемы
Изложимпроблемнуюситуацию, имеющуюместо в настоящеевремя в решениизадач обработкирезультатовисследований.Известно, чтов распоряженииисследователейимеется большаяи постояннорастущая вобъеме базаданных результатовизмерений изразных областейестествознания: астрономии, экспериментальнойфизики, экономики, биологии, медицины.
По мнениюавтора, сформировавшемусявследствииознакомленияс содержаниемофициальныхвысказыванийведущих политикови ученых мира, наибольшегоразвития в 21веке средидругих наукдостигнутбиология имедицина. Известнои напечатано, например, вкниге Е.В. Гублера«Информатикав патологии, клиническоймедицине ипедиатрии»[1], что в этомаспекте решениезадач обработкирезультатовизмеренийприобретаетключевое значение. Следуя рекомендациямпособия «Кандидатскаядиссертация»[2] выполнимкритическийанализ ситуации, сложившейсяв настоящеевремя в Россиив решении задачобработкирезультатовнаблюдений.Уже на предварительномэтапе исследованияимеет местопротиворечиваяситуация: содной стороны– обработканайденных вмедицине результатовизмеренийявляется актуальнойзадачей в современнойнауке, с другойстороны – известно, что в медицинскихВУЗах математика, как дисциплинаучебного процесса, практическине изучается.Следовательно, то что методыобработкиданных медицинскихисследованийстали предоставлятьсяматематикам-специалистам, создает прецедентвыдвижениямедицины вчисло приоритетныхнаправленийРоссийскойнауки.
Изложивпроблемнуюситуацию, перейдемк определениюцели и объектаисследования.
§2. Постановказадачи
Предварительныезамечания
Системныезаболеваниясоединительнойткани, такиекак системнаякрасная волчанка, характеризуютсяпрежде всеговыраженнойпатологиейпо иммунологическойкомпоненте.Мониторингэтого контингентабольных позволяетотнести системныезаболеванияк числу крайнетяжелых недугов, поражающихлюдей в наиболеедеятельныйвозрастнойпериод ( в среднем30-50 лет )[8] и приводящихк ранней инвалидизации, а порой и к летальнымисходам. Усиливающеесягод от годанеблагоприятноевоздействиеокружающейсреды приводитк росту иммунодефицитовразличнойэтиологии, втом числе возрастаетзаболеваемостьсистемнымивариантамииммунокомплексныхпатологий.
В иммунокомплексныхпатологияхсистема комплементаиграет важную, хотя и не всегдаясную, роль.Таким образомизучение динамикикомплементаприобретаетключевоетеоретическоеи практическоезначение. Всвязи с этимнами предпринятанализ зависимостиуровня комплементас тяжестьютечения классическогоиммунокомплексногозаболеваниясистемнойкрасной волчанкой.
Объект, предмет, цель и задачаисследования
В качествеисходных данныхдля исследованияданы выборкичисленныхзначениймедико-биологическихпоказателейчеловеческогоорганизма, аименно: уровнякомплементав крови больныхсистемнойкрасной волчанкой( в дальнейшем– СКВ) и степеньютяжести пораженияпочек… В целяхполноты изложенияприведем необходимоеопределение: «Комплемент- система сывороточныхбелков, котораяактивируетсякомплексомантиген — антителос образованиембиологически-активныхвеществ, способныхвызывать необратимыеповрежденияклеточныхмембран. Комплементявляется однимиз факторовестественногоиммунитетаи широко применяетсяв диагностическихиммунологическихреакциях.»[3, ст. 57]
Объектомнашего исследованияявлялись выборочныеданные результатовизмеренийуровня комплемента( в дальнейшем- УК), причемизучаемыеданные представляютсобой пятьстолбцов чисел, в первом изкоторых представленыданные безнефрита, вовтором с нефритомслабовыраженным, в третьем снефритом среднейвыраженности, в четвертомс нефротическимсиндром, а впятом- с почечнойнедостаточностью.
Предметисследованияопределяем, как нахождениезависимостиУК в крови больныхСКВ и степеньютяжести пораженияпочек.
§3. Используемыеметоды
Будем использоватьметоды биометрическогоанализа, основанныена проверкегипотез однородностивыборок.[9]
Дисперсионный анализ по одному признаку для проверки равенства нескольких средних
Во многихслучаях практикиинтерес представляетвопрос о том, в какой мересущественновлияние тогоили иного факторана рассматриваемыйпризнак [9]. В данномслучае факторомявляется степеньпораженияпочек, а признаком- УК.
Научноеобоснованноерешение подобнойзадачи принекоторыхпредположенияхсоставляетпредмет дисперсионногоанализа, введенногоматематиком-статистикомР. А. Фишером.[10]
Статистическаямодель
Выборкипроизводятсяиз нормальныхсовокупностей.Первая выборкапроизводитьсяиз совокупностисо средним/>, вторая — со средним/>, k-я из совокупностисо средним />.Все наблюдениянезависимы.Будем считатьраспределениеданной мнесовокупностинормальным.
Гипотезы№1.
Н0: />=/>=…= />
Н1: не всесредние равны.все средниеравны.
Критическаяобласть.
Верхняя 5%-наяобласть Fk-1.N-k-распределения.В нашем случаеF4,474 -распределения, так как k=4, а />=n1+ n2 + n3 + n4 + n5=479. Эта областьопределяетсянеравенствомF>2.37. ( Определяетсяпо таблице, см.Таблица А.4а настр. 334 «Справочникапо вычислительнымметодам статистики»Дж. Поллард [6])
Вычислениезначениякритериальнойстатистики
Будем рассматриватьисходные данные, представленныеТаблицей №1.
Таблица №1.Значения УКв зависимостиот тяжести ГН.
.Нет нефрита
Выборка объема
n1= 210
Слабый нефрит
Выборка объема n2= 101
Средний нефрит
Выборка объема n3= 98
Нефротический синдром
Выборка объема
n4 = 45
Почечная недостаточность
Выборка объема
n5 = 25 36 11 7 10 20 38 35 27 5 20 40 37 6 6 21 31 15 5 15 24 33 40 40 20 3 33,8 5 25 12 37 33 45 28 10 38 33 45 32 33 5 46 46 18,2 37 40 45 33 46 48 25 24 44 10 40 33 24 25 42 50 43 22,5 20 35 25 24,5 24,5 30,4 15 20 20,5 38 35 50 9 12 33,3 48 50 12 54,7 14,7 45 18 32 20,7 34,1 38 20 43 22,4 15 33 35,5 26,1 17,8 13 43 44 11 33,5 40 10 50 11,7 29,6 40 12 34 34,4 13,6 38 23 12 35 32,7 34 37 60 30 25,1 42
50 35 22,5 32,3
51 22 31 16
45 22,2 33 32,5
25 20 41,9 39,3
33 21 41,7 40,2
33 22 37,1
39 10 33,4 39,1
35,8 37,4 33 37,7
41,7 22,4 34,3 33,5
38,2 35 33 43,8
37,4 37,3 36,9 16
10 39,6 41 16
37,9 33 31
39,3 32,8 32,15 52
37,2 24 38,8 51
37,8 25 48,1 33,5
49,1 38 48
36,15 29 27
43,8 32 26,6 48
40 32 52,8
40 20 27
36 32,3 13,6
45 10 10
43,5 33,9 19,5
35 45,74 51,2
35 40,4
19,5 49,1 46,05
24,2 38
33 25,2
40,4 43,5 28
30 32,3 27
36 41 35
10 40 29
25 29,7 50
30 30 20
32 27,6
31 21,4 15,6
45 23 35
20 34,3
45 18 46
15 50,4 59,2
30,4 48,2
50 37,3 22,5
46 35
35 25 24
15 20 45
18 38 28,9
28 47,5 30,5
36,7 37,9 45,5
47,8 40,3 43
39,2 60 34,7
36,5 34,1 32,6
32 46,7 38,4
45,7 39 37,15
46,9 31,4 39
15,6 32 52,15
34,1 42 52,2
44,7 43,8
26,5 39,1
36,6 16
30,3 26,5 33
47 43 43
50 36,9 46,6
52,2 29,4 59,3
38,5 30,6
41 35,6 15,5
40 38,7 21,2
45 38,2 22,8
25,5 26,1 28,3
27,7 43,2 28,15
22,5 46 38,5
45 35,6 26
33 32,4
48,3 50
47,5 50
32
50
35,6
33,5
56,9
28,9
40
35,2
42,5
50
46,2
52,7
49,1
38
33,7
32,6
30
28,9
44,4
48,2
38,15
42
28,4
33,5
39,4
38,6
34,3
37,7
27,3
39,2
29,2
39,2
33,5
18
31,2
23,4
36,9
57,3
45
45,3
16,5
34,9
43,1
30,8
34,5
28
16
28,9
23
27
41,6
43,4
36
49
25
41,5
35,5
35
33,1
41,7
39,15
30,8
45,7
35,4
35,8
27
19,5
29,4
33,3
36,6
42,6
30
36,1
43
33,3
28,7
28,7
45,1
31,8
33
39,1
29
46,7
41,05
29,9
50
47
34,4
11
20,6
36,6
38,6
29,48
25
38
34,7
38,2
43,8
40,3
38,5
60
50
36
55
33,5
25,1
24,8
Всего: Т1=7502,38
Т2=3157,44
Т3=2819,55
Т4=1223,50
Т5=505,60
Т = Т1 + Т2 + Т3+ Т4 + Т5
Т=15208,47, Т2= 231297559,74, N = 479
Средниезначения выборок:
/>=35,6
/>=31,1
/>=28,7
/>= 26,38
/>=19,8
Возведемв квадрат значениевсех наблюденийи просуммируемих [6].
Вычисляем:
/>=567988,11
Общая суммаквадратов будетследующей:
/>— />/N= 85112,2
Находим суммуквадратов междувыборками:
(/>/n1+….+/>/nk) – T2/N= 8470,35/>
Теперь можнозаполнитьтаблицу дисперсионногоанализа [6].
Таблица №2.Дисперсионныйанализ по одномупризнаку.
Компонента дисперсии
(1)
Сумма квадратов
(2)
Степень свободы
(3)
Средний квадрат
(4)=(2)/(3) Между выборками
(/>)-/>/N/>/>
k-1 (определяется делением) Остаточная (определяется вычитанием)
N-k
Полная
/>
N-1 -----
Получаем:
Таблица№2а. Дисперсионныйанализ по одномупризнаку. Результаты.
Компонента дисперсии
(1)
Сумма квадратов
(2)
Степень свободы
(3)
Средний квадрат
(4)=(2)/(3) Между выборками 8470,35 4 2117,59 Остаточная 76641,85 474 161,69 Полная 85112,2 478 -----
Значениекритериальнойстатистикиравно:
F = среднийквадрат междувыборками /остаточныйсредний квадрат= 2117,59 / 161,69 = 13,09
Сравним Fи Fкритич: 13,09>2,37
Вывод. Следовательно, мы отвергаемгипотезу Н0, то есть можнопредположить, что при 5%-номуровне значимостиУК в крови больныхСКВ зависитот степенитяжести пораженияпочек.
Мы не знаем, какое распределениеимеют нашивыборки. Описанныйметод применяется, как это былоописано встатистическоймодели, длянормальныхсовокупностей.В связи с этимбудет правомочноприменитьнепараметрическийметод для выясненияравенстванесколькихсредних.
2. Непараметрическийдисперсионныйанализ по одномупризнаку сприменениемкритерияКраскала-Уоллисадля несколькихнезависимыхвыборок
Для проверкисовпаденийнесколькихсредних частоприменяетсянепараметрическийкритерий, свободныйот распределения.Его можноиспользовать, когда рассматриваемыесовокупностине являютсянормальнораспределенными[7].
Статистическаямодель
Имеется kсовокупностей, в нашем случае5 совокупностей.Каждая выборкаизвлекаетсяиз своей совокупности.Все наблюдениянезависимы.
Гипотезы
Н0: все kсовокупностейодинаковораспределены.
Н1: нулеваягипотеза неверна.
Критическаяобласть
Верхняя 5%-наяобласть распределения/>2k-1.В нашем случае/>24, что соответствуетзначению критерия, превышающему9,49. Данное числовзято из ТаблицыА.2 на стр. 331 «Справочникапо вычислительнымметодам статистики»Дж. Полларда.[6]
Вычислениезначениякритериальнойстатистики
Для этого наблюденияxijзаменяютсяих рангами rij.Все n наблюденийупорядоченныпо возрастаниюот 1 до n. Находимсумму ранговR1, R2,…,Rk дляk групп.Вычисляемкритерий [4]:
H= />(R21/n1+….+ R2k/nk) – 3 ( N + 1 )
Значениякомплементаупорядоченыпо возрастанию.Они иногдасовпадают, тогда рангпринимаетсреднее значение.
Далее, используяТаблицу №1, присваиваемкаждому значениюкомплементасоответствующийранг в данныхпяти выборкахи получаемсумму рангов[5] .
Таблица №3.Таблица ранговнаблюдений.
Нет
нефрита
Выборка объема n1 = 210
Слабый
нефрит
Выборка объема
n2 = 101
Средний
нефрит
Выборка объема
n3 = 98
Нефротический синдром
Выборка объема
n4 = 45
Почечная недостаточность
Выборка объема
n5 = 25 УК Ранг УК Ранг УК Ранг УК Ранг УК Ранг 36 282 11 45 7 33 10 39 20 86 38 315,5 35 264 27 144,5 5 28,5 20 86 40 352,5 37 296,5 6 31,5 6 31,5 21 95,5 31 188,5 15 59,5 5 28,5 15 59,5 24 115 33 220 40 352,5 40 352,5 20 86 3 26 33,8 242 13 5 28,5 25 126,5 12 50 37 296,5 33 220 45 405,5 28 28 10 39 38 315,5 33 220 45 405,5 32 197,5 13 33 220 5 28,5 46 420,5 46 420,5 18,2 77 37 296,5 40 352,5 45 405,5 33 220 46 420,5 48 436,5 25 126,5 24 115 44 396,5 10 39 40 352,5 33 220 24 115 25 126,5 13 42 375,5 50 453,5 43 383 22,5 105,5 20 86 35 264 25 126,5 24,5 119,5 24,5 119,5 30,4 181,5 15 59,5 20 86 20,5 92 38 315,5 13 35 264 50 453,5 9 34 12 50 33,3 231 48 436,5 50 453,5 12 50 54,7 471 14,7 56 45 405,5 18 74,5 32 197,5 20,7 94 34,1 247 38 315,5 20 86 43 383 13 22,4 102,5 15 59,5 33 220 35,5 273,5 26,1 137,5 17,8 72 13 53 43 383 44 396,5 11 45 33,5 237 40 352,5 10 39 50 453,5 11,7 47 29,6 171 40 352,5 12 50 34 244,5 34,4 252,5 13,6 54,5 38 315,5 23 110 12 50 13 35 264 32,7 210 34 244,5 13 13 37 296,5 60 478 30 176,5 25,1 132,5 42 375,5
продолжение
Добавить курсовую работу в свой блог или сайт--PAGE_BREAK--
50 453,5 35 264 22,5 105,5 32,3 204
51 462,5 22 99,5 31 188,5 16 68
45 405,5 22,2 101 33 220 32,5 207
25 26,5 20 86 41,9 373 39,3 345,5
33 220 21 95,5 41,7 371 40,2 359
33 220 22 99,5 37,1 299 13
39 334 10 39 33,4 233 39,1 337
35,8 278,5 37,4 304,5 33 220 37,7 306,5
41,7 371 22,4 102,5 34,3 250 33,5 237
38,2 323 35 264 33 220 43,8 393,5
37,4 304,5 37,3 302,5 36,9 293 16 68
10 39 39,6 346 41 365 16 68
37,9 309,5 13 33 220 31 188,5
39,3 343,5 32,8 211 32,15 202 52 465
37,2 301 24 115 38,8 332 51 462,5
37,8 308 25 126,5 48,1 439 33,5 237
49,1 445 38 315,5 13 48 436,5
36,15 286 29 165 13 27 144,5
43,8 393,5 32 197,5 26,6 141 48 436,5
40 352,5 32 197,5 52,8 470
40 352,5 20 86 27 144,5
36 282 32,3 204 13,6 54,5
45 405,5 10 39 10 39
43,5 390,5 33,9 243 19,5 79
35 264 45,74 417 51,2 464
35 264 13 40,4 362,5
19,5 79 49,1 445 46,05 424
24,2 118 38 315,5 13
33 220 13 25,2 134
40,4 362,5 43,5 390,5 28 152,5
30 176,5 32,3 204 27 144,5
36 282 41 365 35 264
10 39 40 352,5 29 165
25 126,5 29,7 172 50 453,5
30 176,5 30 176,5 20 86
32 197,5 27,6 149 13
31 188,5 21,4 98 15,6 64,5
45 405,5 23 110 35 264
20 86 34,3 250 13
45 405,5 18 74,5 46 425
15 59,5 50,4 461 59,2 475
30,4 181,5 48,2 440,5 13
50 453,5 37,3 302,5 22,5 105,5
46 420,5 35 264 13
35 264 25 126,5 24 115
15 59,5 20 86 45 405,5
18 74,5 38 315,5 28,9 161,5
28 152,5 47,5 432,5 30,5 183
36,7 291 37,9 309,5 45,5 414
47,8 434 40,3 360,5 43 383
39,2 341 60 478 34,7 255,5
36,5 287 34,1 247 32,6 208,5
32 197,5 46,7 427,5 38,4 325
45,7 415,5 39 334 37,15 300
46,9 429 31,4 192 39 334
15,6 64,5 32 197,5 52,15 466
34,1 247 42 375,5 52,2 467,5
44,7 399 43,8 393,5 13
26,5 139,5 39,1 337 13
36,6 289 16 68 13
30,3 180 26,5 139,5 33 220
47 430,5 43 383 43 383
50 453,5 36,9 293 46,6 426
52,2 467,5 29,4 168,5 59,3 476
38,5 327 30,6 184 13
41 365 35,6 276 15,5 63
40 352,5 38,7 331 21,2 97
45 405,5 38,2 323 22,8 108
25,5 135 26,1 137,5 28,3 156
27,7 150 43,2 388 28,15 155
22,5
46 420,5 38,5 327
45 105,5 35,6 276 26 136
33 220 32,4 206
48,3 442 50 453,5
47,5 432,5 50 453,5
32 197,5
50 453,5
35,6 276
33,5 237
56,9 473
28,9 161,5
40 352,5
35,2 271
42,5 378
50 453,5
46,2 425
52,7 469
49,1 445
38 315,5
33,7 241
32,6 208,5
30 176,5
28,9 161,5
44,4 398
48,2 440,5
38,15 321
42 375,5
28,4 157
33,5 237
39,4 345
38,6 329,5
34,3 250
37,7 306,5
27,3 148
39,2 341
29,2 167
39,2 341
33,5 237
18 74,5
31,2 191
23,4 112
36,9 293
57,3 474
45 405,5
45,3 413
16,5 71
34,9 257
43,1 387
30,8 185,5
13
34,5 254
28 152,5
16 68
28,9 161,5
23 110
27 144,5
41,6 369
43,4 389
36 282
49 443
25 126,5
41,5 368
35,5 273,5
35 264
33,1 229
41,7 371
39,15 339
30,8 185,5
45,7 415,5
35,4 272
35,8 278,5
27 144,5
19,5 79
29,4 168,5
33,3 231
36,6 289
42,6 379
30 176,5
36,1 285
43 383
33,3 231
28,7 158,5
28,7 158,5
45,1 412
31,8 193
33 220
39,1 337
29 165
46,7 427,5
41,05 367
29,9 173
50 453,5
47 430,5
34,4 252,5
11 45
20,6 93
36,6 289
38,6 289
29,48 170
25 126,5
13
38 315,5
34,7 255,5
38,2 323
43,8 393,5
40,3 360,5
38,5 327
60 478
50 453,5
36 282
55 472
33,5 237
25,1 132,5
24,8 121
Всего:
R1=
57877
R2=
23298.5
R3=
21259.5
R4=
8789
R5=
3072
N = 479
k = 5
R1 = 57877
n1 = 210
R2 = 23298,5
n2 = 101
R3 = 21259,5
n3 = 98
R4 = 8789
n4 = 45
R5 = 3072
n5 = 25
Теперь можнополученныесуммы ранговподставитьв формулу иполучить значениекритериальнойстатистикиКраскела-Уоллиса[4] :
Н=23,03
Полученныйрезультат неявляется незначимым, поэтому нельзясчитать, чтовыборки извлеченыиз одинаковораспределенныхсовокупностейи что средниезначениясовокупностейсовпадают. Ноэтот выводявляетсяприближенным, так как в нашейтаблице естьмного совпадающихзначений. Дляучета влияниясвязей можновоспользоватьсямодифицированнойформой статистикиКраскела-Уоллиса[4]:
Н` = />
, где g –число группсовпадающихзначений, Тj= (t/> — t/>),t/>–число совпадающихнаблюденийв группе с номеромj .
Таблица №4.Группы совпадающихнаблюдений. Повторяющиеся значения УК
Кол-во повторений t j
Значение Tj 25 15600 5 4 60 6 2 6 10 9 720 11 3 24 12 5 120 13,6 2 6 15 6 210 15,6 2 6 16 5 120 18 4 60 19,5 3 24 20 11 1320 21 2 6 22 2 6 22,4 2 6 22,5 4 60 23 3 24 24 5 120 24,5 2 6 25 10 990 25,1 2 6 26,1 2 6 26,5 2 6 27 6 210 28 4 60 28,7 2 6 28,9 4 60 29 3 24 29,4 2 6 30 6 210 30,4 2 6 30,8 2 6 31 4 60 32 8 504 32,3 3 24 32,6 2 6 33 17 4896 33,3 3 24 33,5 7 336 34 2 6 34,1 3 24 34,3 3 24 34,4 2 6 34,7 2 6 35 13 2184 35,5 2 6 35,6 3 24 35,8 2 6 36 5 120 36,6 3 24 36,9 3 24 37 4 60 37,3 2 6 37,4 2 6 37,7 2 6 37,9 2 6 38 10 990 38,2 3 24 38,5 3 24 38,6 2 6 39 3 24 39,1 3 24 39,2 3 24 39,3 2 6 40 12 1716 40,3 2 6 40,4 2 6 41 3 24 41,7 3 24 42 4 60 43 7 336 43,5 2 6 43,8 4 60 44 2 6 45 12 1716 45,7 2 6 46 6 210 46,7 2 6 47 2 6 47,5 2 6 48 4 60 48,2 2 6 49,1 3 24 50 14 2730 51 2 6 52,2 2 6 60 3 24
g = 88
Теперь можнополученныерезультатыподставитьв модифицированнуюформулу и получитьуточненноезначениекритериальнойстатистикиКраскела-Уоллиса:
Н` = 23,037
Вывод.Скорректированноезначение Н`статистикиКраскела-Уоллисанесущественноотличаетсяот значенияН, т.о. мы можемотвергнутьгипотезу Н0на минимальномуровне значимости.Следовательно, мы подтвердилирезультатполученныйранее: существуетзависимостьмежду УК в кровибольных СКВи степеньютяжести пораженияпочек .
3.Непараметрическийдисперсионныйанализ по одномупризнаку сприменениемкритерия Джонкхиерадля несколькихвыборок, упорядоченныхпо возрастаниювлияния фактора
Нам заранееизвестно, чтоимеющиесягруппы результатовупорядоченыпо возрастаниювлияния фактора…В нашем случаефактором являетсястепень тяжестиГН. В таких случаяхцелесообразноиспользоватькритерий Джонхиера, более чувствительныйпротив альтернативоб упорядоченномвлиянии фактора[5].
Статистическаямодель
Имеется kсовокупностей, в нашем случае5 совокупностей.Каждая выборкаизвлекаетсяиз своей совокупности.Все наблюдениянезависимы.имеющиесягруппы результатовупорядоченыпо возрастаниювлияния фактора/>.1-й столбец Таблицы№1 отвечаетнаименьшемууровню фактора, последний –наибольшему, а промежуточныестолбцы получилиномера, соответствующиеих положению.В нашем случаефактором являетсястепень тяжестипоражения почек[4] .
Гипотезы
Н0:/>=/>=…=/>( влияние фактораупорядоченно.)
Н1: />/>/>/>…/>/>
Критическаяобласть
Верхняя5% область F-распределения, что в нашемслучае соответствуетзначению критерия, превышающемузначение 2,21. Данноечисло взятоиз таблицы А.4на стр. 334 [6].
Вычислениезначениякритериальнойстатистики
ВычислимстатистикуМанна – Уитни.Сравниваемk способовобработки, внашем случае5. Поступим следующимобразом: длякаждой парынатуральныхчисел u иv, где 1Јu
U = />,y/>/>)/>
Определимтак же статистикуДжонхиера как:
J = />
Для нахождениязначений статистикиМанна – Уитнибудем использоватьпрограмму,( таккак мы имеемвыборки большогообъема) написаннуюна языке FortranPower Station дляWindows, версия4.0.Выбор данногоязыка программированиясвязан с тем, что он максимальноприближен кобщепринятомуязыку математическихформул. [11].
implicit real*8 (a-h, o-z)
dimension a1(210), a2(101),a3(98),a4(45),a5(25)
open (unit=11, file='1.dat', access='sequential',status='old')
open (unit=12, file='2.dat', access='sequential',status='old')
open (unit=13, file='3.dat', access='sequential',status='old')
open (unit=14, file='4.dat', access='sequential',status='old')
open (unit=15, file='5.dat', access='sequential',status='old')
open (unit=16,file='res.dat',access='append',status='unknown')
do 2222 i=1,210
read (11, 21) a1(i)
21 format(e8.1)
2222 continue
do 2223 i=1,101
read (12, 21) a2(i)
2223 continue
do 2224 i=1,98
read (13, 21) a3(i)
2224 continue
do 2225 i=1,45
read (14, 21) a4(i)
2225 continue
do 2226 i=1,25
read (15, 21) a5(i)
2226 continue
u12=0
do 101 i=1,210
do 91 j=1,101
if (a1(i)
u12 = u12+1
elseif (a1(i).eq.a2(j)) then
u12= u12+0.5
else
u12= u12+0.0
endif
91 continue
101 continue
u13=0
do 102 i=1,210
do 92 j=1,98
if (a1(i)
u13 = u13+1
elseif (a1(i).eq.a3(j)) then
u13= u13+0.5
else
u13= u13+0.0
endif
92 continue
102 continue
u14=0
do 103 i=1,210
do 93 j=1,45
if (a1(i)
u14 = u14+1
elseif (a1(i).eq.a4(j)) then
u14= u14+0.5
else
u14= u14+0.0
endif
93 continue
103 continue
u15=0
do 104 i=1,210
do 94 j=1,25
if (a1(i)
u15 = u15+1
elseif (a1(i).eq.a5(j)) then
u15= u15+0.5
else
u15= u15+0.0
endif
94 continue
104 continue
u23=0
do 105 i=1,101
do 95 j=1,98
if (a2(i)
u23 = u23+1
elseif (a2(i).eq.a3(j)) then
u23= u23+0.5
else
u23= u23+0.0
endif
95 continue
105 continue
u24=0
do 106 i=1,101
do 96 j=1,45
if (a2(i)
u24 = u24+1
elseif (a2(i).eq.a4(j)) then
u24= u24+0.5
else
u24= u24+0.0
endif
96 continue
106 continue
u25=0
do 107 i=1,101
do 97 j=1,25
if (a2(i)
u25 = u25+1
elseif (a2(i).eq.a5(j)) then
u25= u25+0.5
else
u25= u25+0.0
endif
97 continue
107 continue
u34=0
do 108 i=1,98
do 98 j=1,45
if (a3(i)
u34 = u34+1
elseif (a3(i).eq.a4(j)) then
u34= u34+0.5
else
u34= u34+0.0
endif
98 continue
108 continue
u35=0
do 109 i=1,98
do 99 j=1,25
if (a3(i)
u35 = u35+1
elseif (a3(i).eq.a5(j)) then
u35= u35+0.5
else
u35= u35+0.0
endif
99 continue
109 continue
u45=0
do 110 i=1,45
do 100 j=1,25
if (a4(i)
u45 = u45+1
elseif (a4(i).eq.a5(j)) then
u45= u45+0.5
else
u45= u45+0.0
endif
100 continue
110 continue
U=u12+u13+u14+u15+u23+u24+u25+u34+u35+u45
22 format(2x,'u12=',f10.3)
23 format(2x,'u13=',f10.3)
24 format(2x,'u14=',f10.3)
25 format(2x,'u15=',f10.3)
26 format(2x,'u23=',f10.3)
27 format(2x,'u24=',f10.3)
28 format(2x,'u25=',f10.3)
29 format(2x,'u34=',f10.3)
30 format(2x,'u35=',f10.3)
31 format(2x,'u45=',f10.3)
32 format(2x,'U=',f10.3)
write(16,22)u12
write(16,23)u13
write(16,24)u14
write(16,25)u15
write(16,26)u23
write(16,27)u24
write(16,28)u25
write(16,29)u34
write(16,30)u35
write(16,31)u45
write(16,32)U
end
Обработавтаким образомрезультатынаблюдений, получаем значениястатистикиМанна – Уитни:
/>u12=8441,000
u13= 7793,500
u14= 3172,500
u15= 888,000
u23= 4637,500
u24= 1928,500
u25= 648,500
u34= 2054,500
u35= 805,500
u45= 411,000
Подставивв формулу полученныезначения получаемрезультат длястатистикиДжонхиера:
J= 30780,5
ЗначениестатистикиДжонхиера оченьвелико, чтосвидетельствуетв пользу гипотезыН1 об упорядоченномвлиянии фактора, в нашем случае– зависимостиУК в крови больныхСКВ от степенипораженияпочек. То естьмы снова подтвердилирезультат, полученныйранее.
Но посколькупредложенныевыборки велики, то можно проверитьполученныйрезультат, подсчитавприближеннуюстатистикуJ* для большойвыборки [4].
Вычислимвеличину:
J* = ( J– MJ ) / />/>
Где MJ = />(N2 — />), DJ = />(N2 ( 2N+ 3 ) — />(2nj +3))
В результатевычислениймы получаемзначение J*= 5,9.
Вывод. Полученныйрезультатпревышаеткритическоезначение, чтопозволяетотклонитьгипотезу Н0, и принять гипотезуН1. Таким образоммы подтверждаетсярезультат, полученныйс помощью статистикиJ – влияние факторав предложенныхвыборкахупорядоченно.
§4. Вывод
Цельюданной курсовойработы быланализ зависимостимежду УК в кровибольных СКВи степеньютяжести пораженияпочек. Исходныеданные былиподвергнутыметодам статистическогоанализа, независимыммежду собой.Результатомявляетсядоказательствоналичия зависимостиУК в крови больныхСКВ и степеньютяжести пораженияпочек в каждомиз использованныхметодов, чтопозволяетсформулироватьокончательныйвывод: УК в кровибольных СКВзависит отстепени тяжестипораженияпочек, причемУК уменьшаетсяс возрастаниемстепени тяжестипораженияпочек.
§5. Списоклитературы
Гублер Е.В. Информатика в патологии, клинической медицине и педиатрии. –Л.: Медицина, 1990.-176с.
Кузин Ф.А. Кандидатская диссертация. Методика написания, правила оформления и порядок защиты. Практическое пособие для аспирантов и соискателей ученой степени. –5-е изд., доп.-М.: Ось 89, 2000.-224с.
Энциклопедический словарь медицинских терминов: В 3-х томах. Около 60000 терминов.-М.: Советская энциклопедия, — Т.2. 1983.-448с.
Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере .-М.: Инфра – М., 1982.-528с.
Холлендер М., Вулф Д.А. Непараметрические методы статистики.-М.: Финансы и статистика., 1983.-518с.
Поллард Дж. Справочник по вычислительным методам статистики.-М.: Финансы и статистика., 1982.-344с.
Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей.-М.: Финансы и статистика,-Т.2. 1985.-488с.
Шишкин В.И., Кудрявцева Г.В. Регуляторная роль функциональной системы «Комплемент – простагландиды – пентозофосфатный путь обмена углеводов» в патогенезе основных ревматологических заболеваний.-СПб.: НИИХ. 2002.-38с.
Колмогоров А.Н. Теория вероятности и математическая статистика.-М.: Наука.,1986.-535с.
Фишер Р.А. Статистические методы для исследователей.-М.: Госстатиздат.,1982.-344с.
Фишер Ф.П., Суиндл Д.Ф. Системы программирования.-М.: Статистика.,1971.-606с.