План
1. Дисперсійний аналіз
2. Кореляційний і регресійний аналіз
3.Парна регресія
Література
Аналіз експериментальних даних
В дослідженняхдля обробки експериментальних даних найбільш широко застосовуються такі методи математичноїстатистики, як дисперсійний, кореляційний і регресійний аналіз.1. Дисперсійний аналіз
Дисперсійнийаналіз – основна задача – визначення впливу різнихфакторів на мінливість ознаки, яка вивчається. Наприклад урожай в польовихумовах, успішність студентів. Загальне варіювання (мінливість) — /> можна розчленувати на триосновні частини:
варіюванняваріантів — />;
варіюванняповторів — />;
випадковіваріювання — />
/> (1)
Особливостями дисперсійногоаналізу є такі положення:
1. Замість середніх для окремих варіантівдосліду обчислюється одна загальна середня арифметична для всього досліду вцілому.
2. Замість індивідуальних помилок середніхкожного варіанта досліду обчислюють одну усереднину похибку загальноїсередньої, яку використовують для оцінки розрізнювання варіантів.
3. Середню похибку досліду знаходять шляхомрозкладання загальної дисперсії всіх даних досліду на складові частини, якіхарактеризують варіювання, яке пов’язане з факторами, які вивчаються в досліді,і варіювання випадкове, яке обумовлене різноманітним випадковим впливомзовнішніх умов на мінливість при знаків і властивостей, які вивчаються.
Визначеннявипадкового варіювання часто є основною задачею дисперсійного аналізу. Воно даєможливість визначити помилку досліду і найменшу суттєву різницю (Н С Р), тобтоту мінімальну різницю між середніми, яка в даному експерименті є суттєвою
/>
де t – критерійСтьюдента для прийнятого рівня значущості і числа ступенів волі залишковоїдисперсії (береться з таблиці).
Sd– похибка різниці обчислюється за формулою
/> /> (2)
де n – число, щоповторюється в порівняльних варіантах;
/> -залишковий середній квадрат (дисперсія помилок);
/> -узагальнена помилка середньої
Вибираємо 5%рівень значущості, що означає, що похибка може повторитися 5 раз із 100.
/> (3)2. Кореляційний і регресійнийаналіз
Якщо необхідновизначити залежність між двома або декількома признаками і встановити їхвзаємний зв’язок використовують кореляції і регресії. Теорія кореляції вивчаєвзаємозв’язок між величинами, які досліджуються. Діалектичний підхід довивчення природи і суспільства вимагає розглядати явища у взємозв’язку і внеперервному змінюванні. Теорія кореляції дозволяє виразити ці взаємозв’ки укількісній формі.
Найбільш простимвидом зв’язку між величинами є функціональна залежність, коли кожному значеннюоднієї величини відповідає одне конкретно визначене значення другої величини.
Дофункціональних зв’зків відноситься наприклад, залежність між об’ємом води W,часом t і використанням Q:
/> (4)
Якщо зміннавеличина у змінюється в залежності від іншої змінної х, але на зміну у впливаєбагато інших факторів, врахувати які інколи не в змозі, то тоді кожномузначенню х відповідає декілька значень у. Такі зв’зки називаютьсякореляційними, або зв’язок між змінними величинами х і у називається кореляційним,якщо різним значенням однієї із них (х) відповідають групові середні другої (у)або навпаки. В таких випадках одна величина розглядається як незалежна змінна іназивається аргументом (х), а друга – залежна змінна і називається функцією(у). Загальний вигляд рівняння кореляційного зв’язку y=f(x), де х — аргумент, у– функція.
При графічномузображенні статистичного звя’зку часто точки розміщують так, що можна провестиряд ліній різноманітного типу.
Післявстановлення форми зв’язку і її типу визначають її тісноту. В якості числовогопоказника зв’язку простої лінійної кореляції використовують коефіцієнткореляції
/> (5)
де /> і /> - відхилення значень х і увід своїх середніх /> і /> в п порівнювальних парах.
Стандартнупохибку коефіцієнта кореляції визначають з рівняння
/> (6)
r – коефіцієнткореляції; п – число пар значень, за якими обчислений коефіцієнт кореляції.Значення коефіцієнта кореляції записується разом з його похибкою у вигляді />. Критерій суттєвогокоефіцієнта кореляції t обчислюють з рівняння
/> або/> (7)
Зіставленняфактичного і теоретичного (табличного) значень t при числі ступеню волі п-2 даєможливість оцінити суттєвість r при тому чи іншому рівню значущості.
Якщо />, то кореляційний зв’язокіснує, а якщо /> - не існує.
Поряд зкоефіцієнтом кореляції для характеристики зв’язку між двома ознакамивикористовують коефіцієнт детермінації />,який чисельно рівний квадрату коефіцієнта кореляції:
/> (8)
Коефіцієнтдетермінації показує частину тих змін, які у залежності, яку вивчаютьобумовлені факторіальними ознаками і дають більш чітке уявлення про ступіньспряження ознак. Наприклад, якщо коефіцієнт кореляції рівний 0,20 – 0,30, токоефіцієнт детермінації /> тобтотільки 4-9% всіх вимірів однієї ознаки пов’язані із змінами другої. При /> число зв’язківзбільшується до 25-30% і тільки при /> біля97% зміна результативної ознаки пов’язано із змінами факторіального.
Кореляційневідношення обчислюється
/> (9)
де η –кореляційне відношення; Sv – сума квадратів відхилення заваріантами;
Sy –загальна сума квадратів.
Кореляційневідношення використовується для оцінки криволінійної форми зв’зку між ознакамиі має додатній знак, змінюється від 0 до 1.
При малому числіспостережень кореляційне відношення обчислюється:
/> (10)
де /> - сума квадратів відхиленьгрупових і середніх /> від загальноїсередньої /> (групове варіювання), якахарактеризує ту частину варіювання ознаки />,яка пов’язана з мінливістю ознаки />.
/> -сума квадратів різниці між кожним значенням і загальною середньою />, яка характеризує загальневаріювання ознаки />.
Похибка /> і критерій істотногокореляційного відношення обчислюється за рівнянням:
/> ;/> (11)
Фактичнезначення /> порівнюють з теоретичним,який приймається для вибраного рівня значущості при числі ступенів волі /> з таблиці. Якщо />, то кореляційне відношеннясуттєве.
Квадрат кореляційноговідношення називають індексом детермінації:
/> (12)
Він показує тудолю варіювання ознаки />, яка обумовленазмінами ознаки />.
Обчислившикоефіцієнт кореляції можна отримати загальну уяву про спряження ознак які вивчаються.
Регресійнийаналіз – наукове дослідження закономірностей між явищами,які залежать від багатьох факторів. Мета його – відшукати рівняння лінії, яканайбільш точно виражає залежність однієї ознаки від іншої. За формою регресіяможе бути прямолінійною і криволінійною, а за характером – простою, колизмінювання вислідної ознаки відбувається під зміною однієї факторіальноїознаки, і множинною, коли зміна обумовлена декількома факторіальними ознаками.
Регресивнийаналіз дозволяє передбачити можливість зміни однієї ознаки на основі відомихзмін другої шляхом розрахунку емпіричних формул, які показують, що зв’язок міжними існує.
При лінійнійрегресії залежність між ознаками виражається коефіцієнтом регресії, якийпоказує в якому напрямку і на яку величину змінюється одна ознака при змінідругої на одиницю виміру.
Обчислюється коефіцієнтрегресії за рівняннями:
/>;/>. (13)
Де /> - коефіцієнт кореляції;
/> і/> - середні квадратичнівідхилення;
/> і/> вивчаються у рядах.
Коефіцієнтирегресії мають знак коефіцієнта кореляції:
/> (14)
Ця властивістьвикористовується для перевірки чи правильно обчислений коефіцієнт регресії.
Похибкукоефіцієнтів регресії обчислюють за рівнянням:
/> і/>. (15)
Критерійсуттєвості коефіцієнта регресії дорівнює критерію суттєвості коефіцієнтакореляції, тобто:
/> (16)
Часто залежністьміж признаками, які вивчаються буває криволінійною, вона може мати різні формиі описується відповідними рівняннями. В цьому випадку, головна задачарегресійного аналізу полягає в тому, щоб по характеру розпреділення точок награфіку підібрати аналітичну залежність, яка описує закономірність зміни ознак.Після того, Як аналітична залежність підібрана, необхідно математичнимиперетвореннями привести її до рівняння прямої лінії, тобто перетворити вихіднідані і обчислити значення параметрів, які входять в аналітичну залежність.Приведення криволінійної залежності до рівняння прямої лінії дозволяєвикористати прийоми регресійного аналізу.
Приклад.
Технікуприведення кореляційного і регресійного аналізу розглянемо на прикладі дляневеликого числа спостережень (/>) відзмінної (/>). /> - вологість грунту; /> - наліплювання грунту.
1. Розрахункизручно вести складаючи таку таблицю.
Розрахункидопоміжних величин для обчислення кореляції і регресії />по />.
№
пари Значення ознаки
/>
/>
/>
/>(%)
/>(г/см2)
1
2
3
4
5
6
7
8
9
10
11
12
Сума
19,9
20,9
26,1
29,4
30,5
40,3
44,8
47,8
55,6
58,3
64,5
76,6
/>
0,0
0,6
1,1
1,2
1,7
1,7
2,6
3,4
4,2
5,8
6,3
7,3
/>
396,01
436,81
681,21
864,36
930,25
1624,09
2007,04
2284,84
3091,36
3398,89
4160,25
5867,56
/>
0,00
0,36
1,21
1,44
2,89
2,89
6,76
11,56
17,64
33,64
39,69
53,29
/>
0,00
12,54
28,71
35,28
51,85
68,51
116,48
162,52
233,52
338,14
406,35
559,18
/>
Розв’язання:
2. Заданими таблиці обчислюємо шість допоміжних величин: />;
/>
/>
/>
/>
/>
3. Обчислюєтьсякоефіцієнт кореляції, регресії і рівняння регресії:
коефіцієнткореляції
/>
коефіцієнтрегресії /> і />
/>
Рівняннярегресії
/>
Таким чиномшукана залежність має вигляд: />
4. Визначаєтьсяпохибка і критерій значущості для коефіцієнта кореляції:
Похибкакоефіцієнта кореляції
/>
критерій значущостікоефіцієнта кореляції
/>
5. Фактичнезначення /> порівнюється з теоретичним/>, яке приймається рівним:8-9 ступенів волі (при /> - це 10-11 парспостережень) – 2,3; для 10-14 ступенів волі – 2,2; для 15-24 ступенів волі –2,1; для 25-100 ступенів волі – 2,0. Кореляція і регресія визначаєтьсясуттєвою, якщо />. В нашомуприкладі />, так як />. Значить між вологістюгрунту і її налипання є суттєвий прямий зв’язок.
6. Заотриманим рівнянням регресії обчислюють теоретичне значення />для крайніх величин /> (19,9 і 76,6, згіднотаблиці)
/>;
/>
Знайдені точки (/> /> і/> />) наносяться на графіці,з’єднуючи їх прямою, маємо теоретичну лінію регресії. Вона показує, щозбільшення вологості грунту на 1% відповідає збільшенню налипання на 0,13 г/см2.3. Парна регресія
Парна залежністьможе бути апроксимована прямою лінією, параболою, гіперболою, логарифмічною,степеневою або показниковою функцією, поліномом і інше.
/>
Рис.Вигляди основних ліній різних зв’язків між змінними величинами і їх рівняння.
1. Пряма, яка проходить через початоккоординат має рівняння /> (3, а).
2. Пряма, що не проходить через початоккоординат має рівняння />, або />. Ці залежності вимагаютьвизначення двох параметрів />і />. (3, б, в).
3. Парабола з вершиною в початку координаті симетрична одній із осей має рівняння />.Формула один параметр /> із зменшеннямякого зменшується розхил параболи (рис.3, г).
4. Парабола, симетрична прямій паралельнійосі /> має рівняння />. Функція квадратична. Уформулі необхідно визначити три параметра: />,/> і />(рис.3, д, є).
5. Гіпербола, асимптотично наближається доосей координат, рівняння має вигляд />,необхідно визначити параметр />(рис.3,ж).
6. Гіпербола асимптотично наближається допрямих, паралельних до осей координат, рівняння має вигляд />. Параметри /> і /> є координатами точки />. Знак параметра /> залежить від розміщеннягіперболи по відношенню до асимптот (рис.3, з).
7. Степеневі криві (рис.3, и, к), рівняння />, де /> може бути додатнім, цілимабо дробовим.
8. Показникові крива, коли із зростаннямоднієї величини /> спостерігаєтьсяпідсилене зростання />. Рівняння /> (рис.8.3, л).
Двох факторнеполе можна апроксимувати, площиною, параболоїдом другого порядку,гіперболоїдом. Для /> - змінних фактівзв’язок можна встановити за допомогою /> -мірного простору рівняннями другого порядку
/> (17)
де /> - функція метибагатофакторних змінних;
/> -незалежні фактори;
/> -коефіцієнт регресії, що характеризують вплив фактора /> на функцію мети;
/> -коефіцієнти, які характеризують подвійний вплив факторів /> і /> на функцію мети.
При побудовітеоретичної регресійної залежності, оптимальною буде така функція, в якійвиконуються умови найменших квадратів />,де /> - фактичні координатиполя; /> - середнє значенняординати з абсцисою />, обчисленою зрівняння. Після кореляції апроксимують рівнянням прямої. Лінію регресіїрозраховують з умови найменших квадратів:
/> (18)
При цьому криваАВ найкращим чином вирівнює значення постійних коефіцієнтів /> і />, тобто коефіцієнтіврівняння регресії. Їх обчислюють за формулами:
/> (19)
/> (20)
Критеріємблизькості кореляційної залежності між /> і/> до лінійної функціональноїзалежності є коефіцієнт парної або просто коефіцієнт кореляції />. Він просто показуєступінь лінійності зв’язку /> і />.
/> (21)
де /> — число вимірів.
Задовільнатіснота зв’язку при />, добра при />. Для визначення процентумінливості шуканої функції /> відносноїї середнього значення, який визначається мінливістю фактора />, обчислюють коефіцієнтдетермінації
/> (22)
Рівняннярегресії прямої записати таким виразом:
/> (23)
Література:
1. Белый И.В. и др. Основы научныхисследований и технического творчества / И.В. Белый, К.П. Власов, В.Б.Клепиков. — Х,: Вища шк. Изд-во при Харьк. ун-те, 1989-200с.
2. Белуха Н.Т. Основы научныхисследований в экономике. — К.: Вища шк. Головное изд-во, 1985.— 215с.
3. Вознюк С.Т. и др. Основы научныхисследований. Гидромелиорация / Вознюк С.Т., Гончаров С.М., Ковалев С.В. — К.:Вища шк. Головное издательство, 1985-192с.
4. Воловик П.М. Теорія імовірностейі математична статистика в педагогіці —Х.: Вища шк., 1969-222с.
5. Гмурман В.Е. Теория вероятностейи математическая статистика. Изд. 4-е — М.: Высшая школа, 1972. — 367с.
6. Митропольский А.К. Техникастатистических вычислений. М.: Наука, 1971, 576с.
7. Нечаев Ю.И. Основы научныхисследований — Киев, Одесса: Вища шк. Головное изд-во, 1983, — 160с.
8. Румшиский Л.Э. Математическаяобработка результатов эксперимента. М.: Наука, 1971,— 192с.
9. Сиденко В.М. Грушко И.М. Основынаучных исследований. Харьков. Вища шк, 1977, — 240с.
10. Сытник В.Ф. Основы научныхисследований. К.: Вища шк. Головное изд-во. 1978, — 184с.