--PAGE_BREAK--1. Система показників статистики тваринництва
1.1 Методологія розрахунку основних показників статистики тваринництва в сегменті великої рогатої худоби (ВРХ)
Продукція тваринництва поділяється на дві групи:
1) продукція нормальної життєдіяльності тварин, реалізація якої для вживання за межами тваринництва не пов'язана з забоєм (ліквідуванням) самих тварин (молоко, вовна, яйця, мед і т. п.). У створенні цієї продукції тварини виступають в якості засобів праці;
2) продукція приплоду і приросту, або продукція вирощування тварин. Реалізація цієї продукції за межами тваринництва пропонує забій тварин. Використання цієї продукції вирощування тварин для відтворення стада пов'язано з подальшим його залишенням в сфері тваринництва. Таким чином, тварини, які ростуть чи відгодовуються, виступають як пов'язані у виробництві предмети праці, або інакше, незавершене виробництво м'ясного контингенту, а також тварин основного стада. Вирощена доросла худоба, племінна, представляє собою закінчену готову продукцію, яка використовується в ролі засобів праці.
Загальний обсяг продукції тваринництва визначається кількістю одержаного приплоду і обсягом приросту вирощеного за рік молодняка худоби, приросту дорослої худоби, одержаного в результаті її відгодівлі, а також кількості молока, вовни, яєць та іншої продукції тваринництва, одержаної у процесі господарського використання худоби та птиці, непов’язаної з її забоєм, облікованою у порівнянних цінах.
Виробництво молока характеризується фактично надоєним коров’ячим, овечим, козиним молоком, незалежно від того, чи було воно реалізовано, чи частина його використана у господарстві на випоювання телят і поросят. Молоко, яке висмоктане телятами при їх підсосному утриманні у виробництво молока не включається.
Середньорічний надій молока від однієї корови наводиться у розрахунку на поголів’я корів на початок року, незалежно від того, чи доїлась корова у даному періоді. У сільськогосподарських підприємствах при визначенні надою молока від однієї корови із загального поголів’я корів у господарстві виключаються корови, що перебувають на відгодівлі, корови м’ясного стада, а також корови, призначені для групового та підсосного утримання телят, якщо ці корови не доїлись.
Молочна продуктивність корів характеризується середньою удійністю корів. Обчислюють два показники: середній надій на одну дійну корову і середній надій від однієї корови молочного стада. Якщо середній надій на одну дійну корову характеризує середній рівень молочної продуктивності корів, то середній надій від однієї корови молочного стада визначає одночасно ступінь використання корів для виробництва молока та рівень їх молочної продуктивності.
До дійних корів належать корови, що за звітний період дали приплід та доїлися у звітному періоді. Ялові корови, що доїлися, до дійних не відносяться.
Основним показником продуктивності корів є другий показник – середньорічний надій молока від однієї корови молочного стада, який ї є основним показником вихідних даних у дійсній курсовій роботі.
1.2 Основні статистичні показники продуктивності ВРХ в Україні у 2006–2007 роках
В табл. 1.1 – 1.3 наведені основні показники тваринництва та продуктивності корів по надою молока в Україні за даними Державного комітету статистики України.
Таблиця 1.1. Тваринництво
Таблиця 1.2. Виробництво продукції тваринництва в Україні
Таблиця 1.3. Темпи виробництва валової продукції сільського господарстваза 2004–2006 роки
продолжение
--PAGE_BREAK--
Таблиця 1.4. Виробництво основних продуктів тваринництваза січень-вересень 2007 року
Таблиця 1.5. Виробництво основних продуктів тваринництва за січень-грудень 2006 року
2. Статистичні угрупування результатів спостережень за продуктивністю ВРХ
2.1 Результативна та факторні ознаки досліджуємої статистичної вибірки
Другою стадією статистичного дослідження є статистичне зведення і групування, оскільки після збору даних, ми повинні їх звести, згрупувати для обробки.
Зведення – це комплекс послідовних операцій по узагальненню конкретних поодиноких факторів, які утворюють сукупність, для виявлення типових рис і закономірностей, що належать досліджуваному явищу в цілому. Зведення може бути просте і складне.
Просте зведення – це простий підрахунок підсумків первинних статистичних даних.
Складне зведення передбачає групування, види групувальної ознаки, встановлення меж групування, підрахунок групових і узагальнюючих підсумків, а також викладення результатів зведення у вигляді таблиць чи графіків.
Одним із найважливіших методів статистики є групування. Під групуванням в статистиці розуміють розподіл одиниць статистичної сукупності на групи, однорідні в якому-небудь суттєвому відношенні.
Тому в статистиці групування використовується для вирішення різних завдань, таких як, наприклад:
- визначення і вивчення структури і структурних зрушень сукупності;
- виявлення соціально-економічних типів явищ і процесів;
- виявлення і характеризування зв'язків і залежностей між явищами та їх ознаками (таке дослідження має назву аналітичної функції групування).
Відповідно до цих трьох функцій розрізняють різні види групування: структурні, типологічні і аналітичні.
Групування, в результаті якого виділяють однорідні групи або типи явищ, як вираз конкретного суспільного процесу називаються типологічними.
Структурними групуваннями називаються групування, які характеризують розподіл одиниць однотипної сукупності за будь-якою ознакою. Типологічні і структурні групування дуже близькі один до одного: типологічні групування виділяють самі типи, а структурні – вказують питому вагу окремих типів у загальній масі.
Аналітичні групування – це групування, які визначають взаємозв'язок між різними ознаками одиниць статистичної сукупності. За допомогою такого групування можна виявити певні взаємозв'язки між факторними і результативними ознаками. Аналітичні групування є дуже складними і для того, щоб зрозуміти, як вони будуються, необхідно чітко виділити факторні і результативні ознаки в досліджуваному явищі.
Групування можуть бути прості і комбіновані. Прості групування – це такі групування, які здійснені на підставі однієї ознаки. Комбіновані групування – це групування, які здійснені за двома і більше ознаками.
Комбінаційні групування дають можливість комплексного характеризування досліджуваного явища чи процесу.
Для того, щоб зробити групування за кількісною ознакою, необхідно визначитися з кількістю груп та з інтервалом групування.
Величина інтервалу
,
де xmax максимальне значення, xmin – мінімальне значення, n – кількість груп сукупності.
Таблиця 2.1. Ранжування вибірки за першою факторною ознакою Xi
Таблиця 2.2. Ранжування вибірки за другою факторною ознакою Xj
Таблиця 2.3. Ранжування вибірки за результативною ознакою Y
Рис. 2.1. – Попередній графічний аналіз функціональних зв’язків в ранжованих вибірках
2.2 Группування результативної та факторних ознак
Таблиця 2.4. Інтервальний варіаційний ряд розподілу результативної ознаки
Таблиця 2.6. Показники середніх величин інтервалів группування
Таблиця 2.5. Розподіл вибірки на групи за інтервалами результативної ознаки
3
.
Статистична оцінка продуктивності ВРХ та факторів, що на неї впливають
3.1 Ряди розподілу та їх графічне зображення (огіва, кумулята, гістограма, полігон)
Рис. 3.1. – Графічне зображення статистичних показників розподілу в групах ряду результативної ознаки Y
3.2 Узагальнюючі показники рядів розподілу, прості та зважені середні величини
Середня величина – це узагальнюючі показник, які характеризують рівень варіруючої ознаки в якісно однорідній сукупності.
Сукупність, яку ми збираємося характеризувати середньою величиною повинна бути:
1) якісно однорідною, однотипною;
2) складатися з багатьох одиниць.
Середні величини можуть бути абсолютними або відносними залежно від вихідної бази. Середні можуть бути прості і зважені.
Найбільш простим видом середніх величин є середньоарифметична проста:
, (3.1)
де n – кількість одиниць сукупності,
x – варіруюча ознака.
Вона застосовується в тому випадку, коли у нас варіруюча арифметична ознака має різні значення, і є незгруповані дані.
Якщо ж ми маємо згруповані дані, або варіруюча ознака зустрічається декілька раз, то застосовується середня арифметична зважена.
, (3.2)
де x – варіруюча ознака,
f – абсолютна кількість повторення варіруючої ознаки.
В табл. 3.1, використовуючи дані розрахунків табл. 2.4–2.5, наведені результати розрахунку середньозваженої середньої величини результативної ознаки Y – середньорічних надоїв молока на 1 корову.
Таблиця 3.1. Розрахунок зважених середніх, моди та медіани методом моментів
3.3 Мажорантність середніх показників та обчислення моди і медіани способом моментів
До середніх структурних відносяться дві величини, які називаються «мода» і «медіана».
Мода (модальна величина) ряду – це така величина, яка найбільш часто зустрічається в даному розподілі.
(3.3)
x0– це нижня межа модального інтервалу.
i – величина інтервалу.
f2 – частота модального інтервалу,
f1 – частота передмодального інтервалу (того, що передує
модальному)
f3 – частота позамодального інтервалу (того, що йде після модального
інтервалу)
Медіаною називається така величина, що займає серединне положення у варіаційному ряду, в якому варіанти розташовані в зростаючому або спадаючому порядку.
Для дискретного ряду: (3.4)
Для варіаційного ряду: (3.5)
x0– це нижня межа медіального інтервалу.
i – величина інтервалу.
Sm-1 – сума накопичених частот до медіанного інтервалу.
fm – частота медіанного інтервалу.
Структурні величини мода і медіана застосовуються для вивчення внутрішньої будови рядів розподілу, тобто їх структури.
В табл. 3.1 наведені результати розрахунків моди та медіани для вибірки результативної ознаки Y.
В табл. 3.2 наведені результати розрахунку показників рядів факторних та результативної ознаки за допомогою «електронних таблиць» Excel –2000 (вбудовані статистичні розрахунки).
Таблиця 3.2. Розрахунок показників рядів факторних та результативної ознаки за допомогою «електронних таблиць» Excel –2000 (вбудовані статистичні розрахунки)
3.4 Зважені показники варіації рядів розподілу ()
Для вимірювання та оцінки варіації використовують абсолютні та відносні характеристики. До абсолютних відносяться: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсія; відносні характеристики представлені низкою коефіцієнтів варіації.
Варіаційний розмах характеризує діапазон варіації, це різниця між максимальним і мінімальним значеннями ознаки:
(3.6)
Узагальнюючою мірою варіації є середнє відхилення індивідуальних значень ознаки від центру розподілу.
Середня арифметична величина виборки розраховуэться як:
(3.7)
Середньозважене лінійне відхилення: (3.8)
Середнє квадратичне відхилення: (3.9)
Середній квадрат відхилень – дисперсія: , (3.10)
де — середнє арифметичне інтервального ряду розподілу, f – частота.
Середнє лінійне та середнє квадратичне відхилення – іменовані числа (в одиницях вимірювання ознаки).
Порівнюючи варіації різних ознак або однієї ознаки у різних сукупнос-тях, використовують відносні характеристики варіації. Коефіцієнти варіації розраховуються як відношення абсолютних, іменованих характеристик до центру розподілу і часто виражаються процентами:
Лінійний коефіцієнт варіації: (3.11)
Квадратичний коефіцієнт варіації: (3.12)
В табл. 3.1 – 3.2 наведені результати розрахунків показників варіації, виконані методом моментів та автоматизованим розрахунком вбудованими алгоритмами статистичної обробки.
Середньозважена величина вибірки методом моментів розраховується на основі таблиць групування 2.4 -2.5, 3.1 по формулі:
(3.13)
де mi — момент першого порядку для групування i – груп вибірки
а – один із показників середніх величин інтервалів в вибірці, для
спрощення вибираємо показник на одному з кінцевих інтервалів
(3.14)
продолжение
--PAGE_BREAK--4. Кореляційний аналіз продуктивності та факторів, що на неї впливають
4.1 Рангова кореляція – розрахунок коефіцієнта Спірмена (коефіцієнт кореляційних рангів)
Нехай і вибірки з безперервних розподілів (розподіл відмінний від нормального). Кожному значенню поставимо у відповідність його ранг у варіаційному рядові . Аналогічно, кожному значенню поставимо у відповідність його ранг у варіаційному рядові .
Ранговий коефіцієнт кореляції Спирмена , як і звичайний коефіцієнт кореляції, характеризує залежність між вибірками випадкових величин. Вибірковим значенням рангового коефіцієнта кореляції Спирмена називають величину
(4.1)
Коефіцієнт – непараметрична міра залежності між і .
Гіпотеза при альтернативній гіпотезі перевіряється за допомогою статистики
(4.2)
Якщо , то гіпотеза відхиляється (тобто між і існує рангова кореляційна залежність), і не відхиляється в противному випадку. Рівень значимості критерію .
Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
N – обсяг вибірок
Spearman R – коефіцієнт рангової кореляції Спирмена
t (N‑2) – статистика для перевірки гіпотези
p-level – р-уровень
Тому що , то гіпотеза відхиляється (або, що те ж р-level
Ранговий кореляційний зв'язок між Xi і Y є значимим.
Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
Тому що , то гіпотеза відхиляється (або, що те ж р-level
Ранговий кореляційний зв'язок між Xj і Y є значимим.
На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.
Одновимірна лінійна регресійна модель представляється як:
, (4.3)
де – постійна складова доходу (початок відліку);
– коефіцієнт регресії;
– відхилення фактичних значень надою від оцінки (математичного сподівання) середньої величини надою в і-тому хазяйстві.
Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць між фактичними значеннями доходу та його оцінками є мінімальною, що можна записати як
. (4.4)
Відмітимо, що залишкова варіація (4.4) є функціоналом від параметрів регресійного рівняння:
(4.5)
За методом найменших квадратів параметри регресії і є розв’язком системи двох нормальних рівнянь [48]:
, (4.6)
.
Розв’язок цієї системи має вигляд:
, (4.7)
.
Середньоквадратична помилка регресії, знаходиться за формулою
, (4.8)
Коефіцієнт детермінації для даної моделі
(4.9)
повинен дорівнювати: >0,75 – сильний кореляційний зв’зок, 0,36>>0,75 – кореляційний зв’язок середньої щільності;
Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.
Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.
При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0проти альтернативи H1, котрі полягають в наступному:
H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0: b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:
(4.10)
що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.
Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a
. Рівень істотності a
=0,05.Кількість ступенів вільності наступна: f1=1, f2=28.
Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):
(4.11)
який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.
Щільність зв’язку оцінюється індексом детермінації: R=, проте інтерпретується тільки R2. Якщо коефіцієнт детермінації більше 0,6, то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним.
На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.
Рис. 3.1. – Побудова лінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
Рис. 3.2. – Побудова лінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000
Рис. 3.3. – Побудова нелінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
Рис. 3.4. – Побудова нелінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000
4.2 Аналіз множинної кореляції
4.2.1 Перевірка передумови проведення кореляційного аналізу
Лінійна багатовимірна модель (ЛБМ) Y=f (X1, X2) має такий вигляд [68]
y=β0+ β1x1+ … + βpxp (4.12)
y – залежна змінна – ендогенна змінна
x1, x2…xp – залежні змінні – екзогенні змінні.
У зв’язку з тим, що економетрична модель обов’язково має випадкову помилку, модель (3.21) переписується у вигляді (4.13)
y=β0+ β1x1+ … + βpxp+ε (4.13)
де ε – випадкова помилка або перешкода.
Якщо після необхідних обчислень визначені чисельні значення коефіцієнтів β, то кажуть, що ми отримали оцінку коефіцієнтів моделі:, тобто оцінкою коефіцієнта β є його чисельне значення b=.
Якщо замінити у виразі (4.13) коефіцієнти моделі оцінками, то ми отримаємо такий вираз
(4.14)
Основними передумовами використання моделі (4.12–4.13), а такі моделі ще називаються регресійними багатовимірними моделями, є наступне:
1) M (ε)=0 математичне сподівання відхилення равно 0;
2) відхилення взаємонезалежні із змінними cov (xi,)=0
3) для 2‑х визначень відхилень коефіцієнтів коваріації між ними також дорівнює 0 – cov
4) відхилення ε нормально розподілена величина з параметрами (0; 1)
ε=N (ε, 0; 1)
5) від виміру до виміру дисперсія відхилення не змінюється
П’ята властивість. носить спеціальну назву: гомоскедастичність (одно-рідність). Якщо умова 5) не виконана, то кажуть, що дисперсія має властивість гетероскедастичності.
Чисельний аналіз регресійної моделі починають з того, що визначають значення регресійних коефіцієнтів β1… βрта коефіцієнтів β0, який має спеціальну назву – вільний член.
Регресійні коефіцієнти визначають за допомогою методів найменших квадратів.
(4.15)
Візьмемо частичні похідні по кожному з виразів, дорівняти їх і отримаємо систему рівнянь
Ця система рівнянь має спеціальну назву – нормальна система.
(4.16)
Невідомі у системі (4.16) – це коефіцієнти в0, в1…
х1, y1– ми маємо внаслідок спостережень
в0, в1– це коефіцієнти, які ми повинні визначити
n – кількість спостережень, вони нам завжди відомі.
4.2.2 Побудова множинного лінійного кореляційного рівняння, розрахунок коефіцієнтів регресії, перевірка суттєвості та визначення парних коефіцієнтів кореляції
Використовуючи таблицю вихідних даних (Додаток А), розраховуємо багатовимірну лінійну регресійну модель за допомогою «електронних таблиць» EXCEL-2000. Результати розрахунків наведені в табл. 4.1
Як видно з даних розрахунків табл. 4.1 – 4.2, лінійні багатовимірні рівняння регресії описують наступні статистичні процеси:
1. Рівняння багатовимірної лінійної регресії:
а) 2‑параметрична модель з «нульовим» вільним членом (n=30).
Y=0,6358*Xi+0,1293*Xj
б) 2‑параметрична модель з значущим вільним членом (n=30).
Y=-19,5974+0,6488*Xi+0,3335*Xj
2. Коефіцієнт детермінації для даних моделей:
а) Коефіцієнт детермінації R2 (2-параметрична модель з «нульовим» вільним членом) = 0,6076 (n=30), сила регресійного зв’язка – середньої щільності (0,36>>0,75).
б) Коефіцієнт детермінації R2 (2-параметрична модель з значущим вільним членом (n=30).) = 0,6497 (n=30), сила регресійного зв’язка – середньої щільності (0,36>>0,75).
Згідно з таблицями критичних значень критерія Фішера:
– для багатовимірної (і=2) лінійної вибірки з n‑1=29 величин табличне значення Fтабл = 1,93 при рівні довірчої ймовірності Р=0,95 [48].
Як видно з даних розрахунків (табл. 4.1 –4.2), проведених за допомогою «електронних таблиць» EXCEL-2000, фактичні значення критерія Фішера для багатовимірних вибірок (і=2) з n‑1=29 величин становлять:
а) F (2‑параметрична модель з «нульовим» вільним членом) = 21,6829 (n=30)> 3,33 (табл. критерій Фішера);
Таблиця 4.1. Результати розрахунків багатовимірної лінійної регресійної моделі Y=f (Xi, Xj) за допомогою «електронних таблиць» EXCEL-2000 (варіант з «нульовим» вільним членом)
Таблиця 4.2. Результати розрахунків багатовимірної лінійної регресійної моделі Y=f (Xi, Xj) за допомогою «електронних таблиць» EXCEL-2000 (варіант з значущим вільним членом)
б) F (2‑параметрична модель з значущим вільним членом) = 25,038 (n=30)> 3,33 (табл. критерій Фішера);
Тобто набагато перевищують мінімально-критеріальні значення по Фішеру і отримані регресійні багатовимірні рівняння є значущими.
Парні кореляції кореляції Пирсона обчислюються по формулі (наприклад для ):
(4.17)
Для перевірки значимості коефіцієнтів кореляції використовують критерій. Коефіцієнт кореляції характеризує тісноту лінійного зв'язку між перемінними. Для цього знаходять статистику:
(4.18)
Якщо , то коефіцієнт кореляції значимий, у противному випадку – немає.
p – р-рівень, що відповідає статистиці
Якщо р>0,05, то гіпотеза : не значимий не відхиляється.
Якщо р: не значимий відхиляється (коефіцієнт кореляції значимий).
Якщо , то зв'язок строго функціональний
Якщо , то зв'язок сильний (щильний)
Якщо , то зв'язок середній
Якщо , то зв'язок помірний
Якщо , то зв'язок слабкий
Якщо , то зв'язок відсутній (x, y некорелльовані)
Розрахунки, виконані спеціалізованою програмою «Статистика» дають наступні характеристики парних коефіцієнтів кореляції:
Для пари (Xi, Xj) коефіцієнт кореляції дорівнює r (Xi, Xj)=0,37,
p=0,044
Для пари (Xi, Y) коефіцієнт кореляції дорівнює r (Xi, Y)=0,7467, p=0,000
Для пари (Xj, Y) коефіцієнт кореляції дорівнює r (Xj, Y)=0,5583, p=0,001
Множинний коефіцієнт кореляції розраховується за допомогою парних коефіцієнтів кореляції за формулою:
(4.19)
Що відповідає результатам програмних розрахунків, наведених в табл. 4.2.
4.2.3 Визначення множинного індексу кореляції, мажорантності парних та часткових коефіцієнтів, розрахунок коефіцієнта детермінації, часткових коефіцієнтів детермінації
Коефіцієнт детермінації показує частку розсіювання відносно , що порозумівається побудованою регресією. Це коефіцієнт кореляції в квадраті.
продолжение
--PAGE_BREAK--