Реферат по предмету "Бухгалтерский учет и аудит"


Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Федеральное агентство по образованию
Государственное образовательное учреждение высшегопрофессионального образования
“Якутский государственный университет им. М.К. Аммосова”
Технический институт (филиал) в г. Нерюнгри
Педагогический факультет
Кафедра Математики и Информатики
КУРСОВАЯ РАБОТА
по дисциплине «Теория вероятностей и математическаястатистика»
на тему: «Дисперсионный анализ показателей смертностейнаселения Нерюнгринского улуса»
Студентка:
Копотева К. Г., гр. ПМ-04
Руководитель:
Преподаватель:
доцент кафедры к.ф.–м.н.
Попова А.М.
 
 
 
Оценка курсовой работы:__________________
Принял:_______________ Дата _____________
Нерюнгри 2007

Содержание
 
Введение
1.        Теоретическая часть
1.1.    Однофакторный дисперсионный анализ
1.2.    Линейный множественный регрессионный анализ
1.3.    Множественный корреляционный анализ
2.        Аналитическая часть
2.1.    Сбор и первичная обработка данных
2.2.    Дисперсионный анализ
2.3.    Построение уравнения множественной регрессии
2.4.    Исключение незначимых факторов
3.        Заключение
4.        Список литературы
5.        Приложение

Введение
 
Анализируя данные, о смертности населения за 2004-2006 год, полученные вНерюнгринской городской больнице (см. таблицу 1), можно сделать вывод о том,что общий коэффициент смертности, то есть число умерших от всех причин на 1000человек населения, увеличивается (рис.1).
Показатель смертности на 1000 человек населения
Таблица 12004 год 2005 год 2006 год 7.3 7.8 8.1
/>
Рисунок 1
Несмотря на повышение рождаемости, демографическая ситуация вНерюнгринском улусе характеризуется уменьшением численности населения. Главнойпричиной демографического кризиса является преобладание смертности надрождаемостью. Именно поэтому, чтобы снизить показатель смертности необходимоболее детально изучить все причины и факторы, приводящие к ее увеличению. Несомненно,в изучении причин, важно исследование значимости отдельных нозологических формзаболеваний. Зная, какие заболевания приводят чаще всего к летальному исходу,можно разработать программу профилактических работ направленную на уменьшениечисла данных заболеваний и предотвращения их дальнейшего развития на раннемэтапе.
Цель: определение видов заболеваний оказывающих наибольшее влияние напоказатели летальности, основываясь на статистике смертности населенияНерюнгринского улуса по классам болезней и возрастам за 2006 год.
Задачи:
1.        сбор статистических данных необходимых для определения закономерностиизменения смертности по причинам заболеваний;
2.        проведение однофакторного дисперсионного анализа, с целью определениявлияния различных болезней на общее количество смертности населения;
3.        исключение отдельных факторов, оказывающих незначительное влияние;
4.        построение уравнения множественной регрессии, отражающего соотношениемежду смертностью и различными классами заболеваний.

1. Теоретическая часть
 
1.1.         Однофакторный дисперсионный анализ
 
Дисперсионный анализ (от латинскогоDispersio — рассеивание) — статистический метод, позволяющий анализироватьвлияние различных факторов на исследуемую переменную. Метод был разработанбиологом Р. Фишером в 1925 году и применялся первоначально для оценкиэкспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимостьдисперсионного анализа для экспериментов в психологии, педагогике, медицине идр.
Целью дисперсионного анализаявляется проверка значимости различия между средними с помощью сравнениядисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые,каждое из которых характеризует влияние того или иного фактора или ихвзаимодействия. Последующее сравнение таких слагаемых позволяет оценитьзначимость каждого изучаемого фактора, а также их комбинации.
Пусть генеральные совокупности Х1, Х2,…,Хр распределены нормально и имеют одинаковую, хотя инеизвестную дисперсию. Математические ожидания которых известны и могут бытьразличны при заданном уровне значимости α. Проверим при заданном уровнезначимости нулевую гипотезу Н0: М(Х1)= М(Х2) = … = М(Хр) оравенстве всех математических ожиданий. Это означает, что мы устанавливаемзначимо или нет, различаются выборочные средние.
На практике дисперсионный анализ применяют, чтобы установить оказывает лисущественное влияние качественный фактор F,имеющий p уровней: F1,F2, …, Fp, на изучаемую величину.
Основная идея дисперсионного анализа состоит в сравнение «факторнойдисперсии», то есть рассеяние, порождаемое изменением уровня фактора, и«остаточной дисперсии», обусловленной случайными причинами.   Если их различиезначимо, то фактор существенно влияет на Х и при изменении его уровнягрупповые средние различаются значимо. Если установили, что фактор существенновлияет на Х, а требуется выяснить, какой из уровней оказывает наибольшеевоздействие, то дополнительно производим попарное сравнение средних.Дисперсионный анализ также применяется для установления однородности несколькихсовокупностей (если математические ожидания одинаковы, то совокупностиоднородны). В более сложных случаях исследуют воздействие нескольких факторовна различные постоянные или различные уровни и выясняют влияние отдельныхуровней и их комбинацию (многоуровневый анализ).
Будем считать, что количество наблюдений на каждом уровне фактораодинаково и равно q. Оформим результатынаблюдений в виде таблицы:
Номер
испытания
Уровни фактора Fj
F1
F2 …
Fp
1
2

q
x11
x21

xq1
x12
x22

xq2




x1p
x2p

xqp
Групповое
среднее
/>
/> …
/>
Сумму квадратов отклонения можно определить по формулам:
1.        Общая сумма квадратов отклонений наблюдаемых значений от общего среднего/> [1]:
/>.              (1)
/> характеризует влияниефактора F и случайных причин на Х.
2.        Факторная сумма отклонений групповых средних от общей средней,характеризующая рассеяние между группами [1]:
/>.             (2)  
/> характеризует воздействиефактора F на величину Х.

Остаточная сумма квадратов отклонений наблюдаемых значений группы отсвоего группового среднего, характеризующая рассеяние внутри групп [1]:
/>.     (3)
/>/> отображаетвлияние случайных причин на Х.
Вводя обозначения [1]:
/>,                    (4)
получим формулы, более удобные для расчетов [1]:
/>,                         (5)
/> .                      (6)
Разделив суммы квадратов на соответствующее число степеней свободы,получим общую, факторную и остаточную дисперсии [1]:
/> .            (7)
Если справедлива гипотеза Н0, то все эти дисперсииявляются несмещенными оценками генеральной дисперсии.
Вычисляем /> и сравниваем с Fкр (критерий Фишера — Снедекора) [1]:
Fкр (α; n-1;nk-(k-1)),
/>,                                                                           (8)
где α – уровень значимости; n – количествофакторов; k – количество испытаний.
Если Fнабл  Fкр, то гипотеза о равенстве дисперсий будетпринята.
Если число испытаний на разных уровнях различно (q1испытаний на уровне F1, q2 – на уровне F2, …, qр — на уровнеFр), то [1]:
/>,         (9)
где /> сумма квадратовнаблюдавшихся значений признака на уровне Fj,
/> сумма наблюдавшихсязначений признака на уровне Fj .
При этом объем выборки, или общее число испытаний, равен />. Факторная сумма квадратовотклонений вычисляется по формуле [1]:
/> .         (10)
Остальные вычисления проводятся так же, как в случае одинакового числаиспытаний [1]:      
/>.               (11)
 
1.2.   Линейный множественный регрессионный анализ
Регрессионный анализ, по-видимому, наиболее широко используемый методмногомерного статистического анализа. Термин ''множественная регрессия''объясняется тем, что анализу подвергается зависимость одного признака(результирующего) от набора независимых (факторных) признаков. Разделениепризнаков на результирующий и факторные осуществляется исследователем на основесодержательных представлений об изучаемом явлении (процессе). Все признакидолжны быть количественными (хотя допускается и использование дихотомическихпризнаков, принимающих лишь два значения, например 0 и 1).При поведенииэкспериментов в множественной ситуации исследователь записывает показанияприборов о состоянии функции отклика (y) и всехфакторов, от которых она зависит (xi).
При построении регрессионных моделей, прежде всего, возникает вопрос овиде функциональной зависимости, характеризующей взаимосвязи междурезультирующим признаком и несколькими признаками-факторами. Выбор формы связидолжен основываться на качественном, теоретическом и логическом анализесущности изучаемых явлений. Чаще всего ограничиваются линейной регрессией, т.е.зависимостью вида [2]:
Y=a0+a1x1+a2x2+…+anxn                                        (12)
где Y — результирующий признак; x1, …, xn — факторные признаки; a1,…,an — коэффициенты регрессии; а0 — свободный член уравнения. ai находимметодом наименьших квадратов, для этого рассматривается функции [2]:
/>      (13)
Находим частные производные по неизвестным переменным, приравниваем кнулю и получаем систему уравнений. Решая систему, можем найти наименьшеезначение функции.
Так как запись множественной регрессии (линейной) в матричной форме имеетвид [2]:
Y=X*A,                                           (14)
где Y — это вектор-столбец опытных значений изучаемойхарактеристики; X –матрица всех значений всехрассматриваемых факторов, полученных при проведении измерений или наблюдений; А– вектор-столбец искомых коэффициентов аппроксимирующего полинома (12) [2]:
Y=/> ;                                                                             (15)

X=/>;                                                     (16)
Y=/>;                                         (17)
Тогда функционал F метода наименьших квадратов имеетвид [2]:
/>     (18)
Для оценки адекватностирассчитанной регрессионной модели вычисляется коэффициент детерминации, он показывает,какая часть дисперсии функции отклика объясняется вариацией линейной комбинациивыбранных факторов x1,x2,…, xj,xn[2]:
 />,                                                               (19)
где /> — прогнозные значения
и множественный коэффициенткорреляции [2]:
/>.                                                                                (20)
 Значение коэффициента множественнойкорреляции оценивается с помощью таблицы 2 [1]:
Таблица Чеддока               Таблица2диапазон измерения характер тесноты
/> слабая
/> умеренная
/> заметная
/> высокая
/> весьма высокая

1.3. Множественныйкорреляционный анализ
Расчеты обычно начинают свычисления парных коэффициентов корреляции, характеризующих тесноту связи междудвумя величинами. В множественной ситуации вычисляют два типа парныхкоэффициентов корреляции:
1. /> -коэффициенты, определяющие тесноту связи между функцией отклика yи одним из факторов /> [2]:
/>/>.  (21)
2. /> -коэффициенты, показывающие тесноту связи между одним из факторов xiифактором xm(i,m=/>)[2]:
/>              (22)
.
Значение парного коэффициентаизменяется, как указывалось выше, изменяется от -1 до +1. Если, например,коэффициент /> - величина отрицательная,то это значит, что xiуменьшаетсяс увеличением y. Если /> положителен, то xiувеличиваетсяс увеличением y.
Значимость парных коэффициентовкорреляции можно проверить двумя способами:
1) сравнениес табличным значениями /> [2]:
/>,                                                  (23)
2) поt-критерию Стьюдента [2]:
/>,                                             (24)
Где /> -среднеквадратическая погрешность выборочного парного коэффициента корреляции[2]:
/>.                                       (25)
Здесь /> определяетсяпо таблице с числом степеней свободы />.
Доверительный интервал для парныхкоэффициентов корреляции [2]:
/>,                                                       (26)
где /> -парный коэффициент корреляции в генеральной совокупности.
         Если один из коэффициентов/> окажется равным 1, то этоозначает, что факторы xiи xm  функционально(не вероятностно) связаны между собой и тогда целесообразно один из нихисключить из рассмотрения, причем оставляют тот фактор, у которого коэффициент /> больше.
После вычисления всех парныхкоэффициентов корреляции и исключения из рассмотрения того или иного фактораможно построить матрицу коэффициентов корреляции вида [2]:
/>.                                    (27)
                                                                                         Используяматрицу (23) можно вычислить частные коэффициенты, которые показывают степеньвлияния одного из факторов xi нафункцию отклика y при условии,что все остальные факторы закреплены на постоянном уровне. Формула длявычисления частных коэффициентов корреляции такова [2]:
/>,                                   (28)
где /> -определитель матрицы, образованной из матрицы (27) вычеркиванием 1-й строки, i-гостолбца. Определители />, /> вычисляются аналогично.Как и парные коэффициенты, частные коэффициенты корреляции изменяются от -1 до+1.

2. Аналитическая часть
 
2.1. Сбор и первичная обработка данных
 
В ходе сбора материалов исследования, определенных выбранной темой, былиполучены статистические данные по динамике смертности всего населенияНерюнгринского улуса по классам болезней и возрастам. Классы заболеваний, висходных данных имеют следующую классификацию:
I. Некоторые инфекционные и паразитарные заболевания;
II. Новообразования;
III. Болезни крови, кроветворных органов и отдельныенарушения,   вовлекшие иммунный механизм;
IV. Болезни эндокринной системы, расстройства питания инарушения обмена веществ;
V. Психические расстройства и расстройства поведения;
VI. Болезни нервной системы;
VII. Болезни глаза и его придаточного аппарата;
VIII. Болезни уха и сосцевидного отростка;
IX. Болезни системы кровообращения;
X. Болезни органов дыхания;
XI. Болезни органов пищеварения;
XII. Болезни кожи и подкожной клетчатки;
XIII. Болезни костно–мышечной системы и соединительнойткани;
XIV. Болезни мочеполовой системы;
XV. Беременность, роды и послеродовый период;
XVI. Отдельные состояния, возникающие в перинатальномпериоде;
XVII. Врожденные аномалии (пороки развития), деформации ихромосомные нарушения;
XVIII. Симптомы, признаки и отклонения от нормы, выявленныепри клинических и лабораторных исследованиях, не классифицированные в другихрубриках;
XIX. Травмы, отравления и некоторые другие последствиявоздействия внешних причин;
XX. Внешние причины заболеваемости и смертности.
После обработки этих данных была полученатаблица 1 [см. Приложение], в которой представлено количественное изменениесмертности по причинам различных заболеваний. В эту таблицу вошли следующиеклассы болезней: некоторые инфекционные и паразитарные заболевания,новообразования, болезни эндокринной системы, расстройства питания и нарушенияобмена веществ, психические расстройства и расстройства поведения, болезнинервной системы, болезни системы кровообращения, болезни органов дыхания,болезни органов пищеварения, болезни костно–мышечной системы и соединительнойткани, болезни мочеполовой системы, беременность, роды и послеродовый период,врожденные аномалии (пороки развития), деформации и хромосомные нарушения,симптомы, признаки и отклонения от нормы, выявленные при клинических илабораторных исследованиях, не классифицированные в других рубриках, травмы,отравления и некоторые другие последствия воздействия внешних причин, внешниепричины заболеваемости и смертности.
Таким образом, функцией отклика является смертность населения вконкретной возрастной группе, а факторами, влияющими на ее изменение, являютсяклассы заболеваний.
2.2. Дисперсионный анализ
Методом дисперсионного анализа, выясним, оказывает ли влияние различныезаболевания на показатель смертности населения. То есть, проверим, выполняетсяли гипотеза о равенстве математических ожиданий (Н0: М(Х1)= М(Х2) = … = М(Хр)). Дляэтого рассчитаем значения наблюдавшихся признаков /> изначения их квадратов /> для каждогозаболевания по формуле (4). Затем, вычислив их сумму, результаты вычисленийприведены в таблице 2 [см. Приложение]. Подставим в формулы (5), (6), получимзначения общей и факторной дисперсий:
/>13498;
/>5906,7;
Эти значения подставляем в формулу (11) вычисляем остаточную суммуквадратов отклонений наблюдаемых значений группы от своего группового среднего.
/>7591,5
Теперь мы можем вычислить Fнабл,для этого используем формулу (8), и сравниваем с Fкр,который, смотрится по таблице критерия Фишера – Снедекора [1].
Fнабл =14, 1090;
Fкр(0,01; 15; 18)=3,23.
Сравнивая полученные значения, мы делаем вывод о том, что различия междудисперсиями не значимо, то есть фактор (заболевания) оказывает существенноевлияние на функцию отклика (смертность). Следовательно, среднее наблюдаемоезначение на каждом уровне (групповые средние) различаются значимо.
2.3.    Построение уравнения множественной регрессии       
 
Следующим этапом, мы построим уравнение множественной регрессии. Дляэтого мы воспользовались Пакетом анализа данных для вычисления основныхстатистических параметров выборки. Для того чтобы отыскать команду вызованадстройки Пакет анализа в Microsoft Excel, необходимо воспользоваться меню Сервис – Анализданных.… В появившемся диалоговом окне выбрать пункт Регрессия. В поле Входнойинтервал Y: указать диапазон значений нашего у, в полеВходной интервал X: указать все значения наших x. В разделе параметры вывода указать Выходной интервал:ввести любую, удобную для вас ячейку. Результаты работы режима Регрессияпредставлен в таблице 3 [см. Приложение]. Таким образом, наше уравнениерегрессии имеет вид:
/>
 
2.4.    Исключение незначимых факторов
 
Для того чтобы исключить заболевания, которые оказывают незначительноевлияние на смертность население, вначале рассчитаем парные коэффициентыкорреляции по формулам (21), (22), и построим корреляционную матрицу (см.таблицу 4 [Приложение]). Используя полученную матрицу, вычислим по формуле (28)частные коэффициенты корреляции, получим:
Ryx1 0,012345
Ryx9 -0,85883735
Ryx2 0,79942633
Ryx10 -0,9606058
Ryx3 0,01902545
Ryx11 -0,66239756
Ryx4 -0,7279617
Ryx12 -0,81452592
Ryx5 0,25701348
Ryx13 -0,16934424
Ryx6 0,30479306
Ryx14 0,9030776
Ryx7 -0,9799582
Ryx15 0,10681524
Ryx8 0,96909722
Ryx16 0,97533032
 
Сравнивая частные коэффициенты корреляциии парные коэффициенты, исключаем незначительные факторы. Факторы, которые послесравнения этих коэффициентов оказались незначимы, можно исключить из уравнениярегрессии. В уравнение регрессии, которое мы получили, таковыми оказались x1, x3, x4, x9, x10, x11, x12, x13 и x16. То есть инфекционные и паразитарные заболевания,болезни эндокринной системы, расстройства питания и нарушения обмена веществ,психические расстройства и расстройства поведения, болезни костно–мышечнойсистемы и соединительной ткани, болезни мочеполовой системы, беременность, родыи послеродовый период, врожденные аномалии (пороки развития), отравления инекоторые другие последствия воздействия внешних причин, отдельные состояния,возникающие в перинатальном периоде не оказывают существенного влияния насмертность.
Так как мы исключили некоторые факторы,уравнение регрессии изменилось, поэтому необходимо вновь, воспользовавшисьПакетом Анализ данных, построить новое уравнение регрессии (см. таблицу 5[Приложение]). Теперь уравнение представимо в виде:
/>
Данное уравнение отображает функциональную связь между смертностью иразличными классами заболеваний.

Заключение
 
В данной курсовой работе рассмотрены заболевания, влияющие на изменение смертностиНерюнгринского улуса. Были выбраны факторы, методом исключения эффектов, приводящиек высокой смертности. Применяя методы теории вероятностей и математическойстатистики, было построено уравнение, показывающее зависимость изучаемого явления(смертности) от выбранных факторов (классов заболеваний).
Проведя анализ полученной модели, выяснилось, что наиболее часто приводятк летальному исходу болезни системы кровообращения, таким образом, этот классзаболеваний стоит на первом месте. На втором месте стоят внешние причинызаболеваемости и смертности, и на третьем – новообразования.
В заключении, необходимо отметить, что профилактика именно этихзаболеваний приведет к уменьшению показателя летальности и позволит преодолетьдемографический кризис.

Список литературы
 
1.        Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособиедля вузов. — М.: Высш. шк., 1997.
2.        Львовский В.Н. Статистические методы построения эмпирических формул:Учеб. пособие для вузов. — М.: Высш. шк., 1988.
3.        Вентцель Е.С. Теория вероятностей: Учебник для вузов. — М.: Высш. шк.,1999.
4.        «Многомерный статистический анализ на ЭВМ с использованием пакета Microsoft Excel»/М.,1997.
5.        «Государственный доклад о состоянии здоровья населения Нерюнгринскогоулуса в 2006 году»; (редкол.: Вербицкая Л.И. и др.), 2007.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.