Зміст
Вступ… 2
Вихідні дані… 3
Розділ 1. Предмет, завдання і система показників ефективностісільськогосподарського виробництва… 4
1.1 Предмет і завдання статистикивиробництва льоноволокна… 4
1.2 Система показників статистикивиробництва льоноволокна… 4
Розділ 2. Статистична оцінка показників виробництвальоноволокна… 13
2.1 Ряди розподілу вибірковоїсукупності, їх характеристика, графічне зображення. 13
2.2 Статистична оцінка показниківвибіркової і генеральної сукупності… 24
2.3 Перевірка статистичної гіпотези про відповідністьемпіричного ряду розподілу нормальному… 32
Розділ 3. Кореляційний аналіз виробництва льоноволокна… 37
3.1 Проста прямолінійна кореляція… 39
3.2 Криволінійна кореляція… 44
3.3 Множинна кореляція… 45
3.4 Непараметрична кореляція… 51
Висновки… 56
Література… 57
/>Вступ
Широке розповсюдження в економічному аналізі мають методи математичноїстатистики. Ці методи застосовуються в тих випадках, коли зміну аналізованихпоказників можна представити як випадковий процес. Статистичні методи, будучиосновним засобом вивчення масових явищ, що повторюються, грають важливу роль впрогнозуванні поведінки економічних показників. Коли зв'язок між аналізованимихарактеристиками не детермінований, а стохастичний, то статистичні іімовірнісні методи — це практично єдиний інструмент дослідження. Найбільшерозповсюдження з математико-статистических методів в економічномуаналізі отримали методи множинного і парного кореляційного аналізу.
Для вивчення одновимірних статистичних совокупностей використовуються: варіаційний ряд, закони розподілу,вибірковий метод. Для вивчення багатовимірних статистичних совокупностей застосовують кореляції, регресії,дисперсійний, коваріационний, спектральний, компонентний,факторний види аналізу, статистики, що вивчаються в курсах теорії.
Економетрічеськие методи будуються на синтезі трьох галузей знань:економіки, математики і статистики. Основою економетрії є економічна модель, під якою розуміється схематичнепредставлення економічного явища або процесу за допомогою наукової абстракції,віддзеркалення їх характерних рис.
Метою даної курсової роботи є статистичне дослідження даних, якіхарактеризують виробництво льнас метою виявлення взаємозв'язку міждосліджуваними показниками.
/>Вихідні дані Урожайність льоноволокна, ц/га Якість льонотрести, номер Витрати праці на 1 центнер трести, люд/год 7,8 0,85 6,9 6,6 0,5 3,33 10,7 1,23 3,97 11,8 0,77 3,24 5,9 0,56 6,67 3,7 0,6 1,43 9,8 0,54 2,66 5,6 0,58 3,59 8,7 0,65 3,28 5,1 0,63 7,85 7,2 0,7 5,75 3,7 0,64 3,94 6 0,72 6,63 5,7 0,5 4,74 9,8 0,97 4,05 7,5 0,88 7,25 5,2 0,65 5,52 4,3 0,5 2,33 7,6 0,6 5,4 6,3 0,78 2,32 10,9 0,72 6,68 12,1 0,88 10,38 13,1 1,37 3,81 3,7 0,56 4,51 13,4 1,46 3,23
/>Розділ 1. Предмет, завдання і системапоказників ефективності сільськогосподарського виробництва/>1.1 Предмет і завдання статистики виробництва льоноволокна
Величезне значення в народному господарстві України має така культура якльон.
Льон є одним з найголовніших сировинних ресурсів текстильноїпромисловості. Велике застосування отримало використання цієї культури і вмедичних цілях, особливо цінним є насіння льону.
Основні завдання статистики виробництва льону — збір, обробка і аналізстатистичних даних, що характеризують стан, розвиток галузі і виконання виробничихпланів. Ці дані використовуються для складання річних і перспективних планіввиробництва льону. Інформаційними джерелами статистики виробництва льонуслужать: періодична звітність і річні звіти колгоспів, радгоспів і ін.державних і кооперативних з.-х. підприємств, засновані на даних первинногобухгалтерського і виробничого обліку в цих господарствах; переписи; вибірковіобстеження. У статистиці виробництва льону застосовується наступна системаосновних показників: розмір земельної площі і угідь, склад і розподіл їх поземлекористувачах; посівні площі і сортові посіви; валові збори і врожайністькультури; чисельність і використання робочої сили, оплата праці, продуктивністьпраці; розміри основних фондів, їх структура, фондовооруженность і енергоозброєністьпраці, собівартість продукції, рентабельність виробництва окремих продуктів івсього господарства і ін./>1.2 Система показників статистики виробництва льоноволокна
Для обліку і планування вироблюваної промислової продукції застосовуютьсянатуральні, умовно-натуральні і вартісні показники. Вказані показники широкозастосовуються в статистичній звітності підприємств за підсумками своєїдіяльності.
Натуральні показники продукції виражаються в певних натуральних одиницях,об'єднуючих певними фізичними властивостями, вимірювані вагою, об'ємом,завдовжки відповідними мірами ваги, об'єм, довжина і тому подібне (кг, т.,кубометри, метри, кілометри і так далі).
Облік продукції в натуральному виразі не може дати повного уявлення провеличину проведеної продукції. У натуральних показниках неможливо визначити водному показнику підсумкову величину виробництва за наявності багатообразногоасортименту проведеної продукції, не можна також виразити і величину незавершеноговиробництва.
Умовно-натуральні показники близько стоять до натуральних показників зтією тільки різницею, що різні види продуктів, виробів виражаються в одиницяходного певного продукту за допомогою перекладних коефіцієнтів. Ці коефіцієнтиможуть бути побудовані або на основі споживчого значення продукту, або наоснові трудомісткості, або на основі витрат на виробництво і так далі
Умовно-натуральному методу обліку продукції властиві недолікинатурального методу. Умовно-натуральні показники використовуються для отриманняузагальнювальних показників об'єму більш менш однорідної продукції.
Вартісні (ціннісні) показники є прийнятнішими як узагальнювальніпоказники величини, об'єму проведеної продукції на даному підприємстві абогалузі в цілому, а також і по всьому народному господарству.
Умножаючи кількість проведених продуктів на їх ціни і підсумовуючиотримані твори, отримують узагальнювальний показник кількості проведеноїпродукції в ціннісному виразі. За допомогою даного показника враховуються такожоб'єми проведених напівфабрикатів, незавершеного виробництва і інші видивиконаної роботи промисловими підприємствами. Оцінка у вартісних показникахроботи промислових підприємств припускає фіксацію результатів діяльностівиробничих структур на певну дату або в рамках певного відрізання часу.
При виборі оцінного показника у вартісному виразі необхідно такожкористуватися одними і тими ж різновидами цін, і саме, цінами оптом,роздрібними, цінами підприємств або цінами промисловості даної галузі. Проте ів цьому сенсі ціни повинні характеризуватися одними і тими ж принципами їхформування.
Особливості статистики сільськогосподарського виробництва пов'язані ізспецифікою даної галузі виробництва. Головні особливості сільськогосподарськоговиробництва пояснюються сезонним характером відтворення сільськогосподарськоїпродукції. Завдяки сезонності сільськогосподарського виробництва йогопродукція, що складається з продуктів землеробства і тваринництва може повноюмірою врахована тільки в рамках річного періоду.
Річна продукція підраховується у всіх господарствах з різними формамивласності.
Для отримання сумарних об'ємів створеної продукції проводять її оцінку увартісних показниках, про що мова піде в наступному параграфі.
Загальний об'єм того або іншого продукту землеробства, проведеного завегетаційний період, — період від проростання рослини до їх прибирання,зміряний у вагових одиницях, називається валовим збором або урожаєм.
Середня величина цього ж продукту, отримана з розрахунку на одиницюземляної пощади, зайнятою даною культурою, носить назву врожайності.
Валовий збір кожної культури дорівнює твору врожайності на посівну площузайнятою даною культурою.
В зв'язку з цим важливе значення надається обліку площ, придатних длявирощування відповідних сільськогосподарських культур. У зв'язку з цими встатистиці існує декілька категорій посівних площ:
1. обсіменена (тобто засіяна);
2. весняна продуктивна;
3. прибиральна;
4. фактично прибрана;
5. зайнята під посів.
1. Обсіменена площа — це площа. на якій проведені витрати насіння, праці,пального, тяглової сили і тому подібне Ця площа підраховується в двохваріантах:
а) площа, обсіменена під урожай даного року, яка включає озимі посівивосени минулого року і ярини — весною поточного року. Причому площі всіх ділянок,де насіння висєєвалісь кілька разів, стільки ж раз включаються в загальнийпідсумок даного показника;
б) площа, обсіменена в даному році, відрізняється від попередньогопоказника тільки тим, що замість озимих посівів минулого року в неї входятьозимі посіви поточного. Знання величини обсімененої площі дозволяє підрахуватитрудові і матеріальні витрати пов'язані з даним посівом.
2. Весняна продуктивна площа — це площа, зайнята посівами до кінцявесняної сівби. Весняна продуктивна площа є основною категорією посівних площ.Саме ця категорія використовується для розрахунку врожайності, для аналізуструктури і динаміки посівних площ.
3. Прибиральна площа — це площа, на якій повинні бути організованіприбиральні роботи. Для її підрахунку з весняної продуктивної площі необхідновідняти літню загибель посівів, посіви багаторічних трав, які в даному році незабиратимуться і не додадуть площі, де урожай зніматиметься двічі за сезон. Цякатегорія посівної площі використовується для визначення витрат, пов'язаних іззбиранням врожаю.
4. Фактично прибрана площа відрізняється від прибиральної на величинуплощ, на яких прибирання по тих або інших причинах не проводилося, хоча урожайбув отриманий.
5. Площа зайнята під посів — це фізична площа, на якій були проведеніпосіви. Вони більше весняної продуктивної на величину площі осінньо-зимовоїзагибелі озимини. Відношення площі, зайнятої під посів, до загальної площіріллі утворює коефіцієнт використання ріллі.
Зведення про стан посівних площ по самих різних сільськогосподарськихкультурах збирається статистичними організаціями щорічно як в ході посівнихробіт, так і після його закінчення в господарствах з різними формами власності:колгоспи, радгоспи, фермерські і індивідуальні господарства.
Врожайність, валовий збір найважливіших культур враховується статистикоюв ході завершення робіт за підсумками сільськогосподарського року. У звітах, щопредставляються в кінці осіннього періоду (до 1 листопада) і в річному звітіповідомляються відомості про весняну продуктивну площу, валовому зборі запідсумками приймання збору і врожайності з 1 гектара весняної продуктивноїплощі. Там же наводяться дані про площі, зайняті багаторічними насадженнями повидах, і про валовий збір ягід, винограду, плодів, з виділенням насіннячок,кісточкових, горіхоплодних і субтропічних. Розміри валового збору з присадибнихгосподарств визначаються розрахунковим способом на основі даних про посівніплощі і врожайність, відомості про яку отримують з вибіркового бюджетногообстеження приватних господарств.
Всі перераховані показники діяльності сільськогосподарських підприємствмають величезне значення в аналітичній роботі з метою з'ясування динаміки змінврожайності, валового збору кожної культури. При цьому, вирівнюючи динамічніряди з використанням раніше представленими статистичними методами, виявляютьзакономірності їх розвитку за тривалі періоди часу, а також чинники, щовпливають на їх зміну.
При порівнянні даних про валовий збір і врожайність за два періоди широковикористовують індексний метод. Індивідуальний індекс врожайності по одномугосподарству для кожної окремої культури обчислюється як відношення їїврожайності в звітному році (Y1) до їїврожайності в базисному році (Y0).
Для вимірювання ж динаміки врожайності по декількох господарствах зрізним рівнем врожайності або по групі однорідних культур, валовий збір якихможна підсумовувати (наприклад, по групі зернових), необхідно будувати загальнііндекси врожайності. Зміну середній врожайності можна зміряти за допомогоюіндексу змінного складу по формулі:
/>
де Jnс — індекс врожайностізмінного складу (змінними величинами є врожайність і площа);
y0, y1 — середня врожайність по групігосподарств або по групі однорідних культур в поточному і базисному періодахвідповідно;
S0, S1 — посівні площі в кожномугосподарстві (по кожній культурі) в поточному і базисному періоді відповідно.
Крім того, можна використовувати показники середньої врожайності по всіхгосподарствах в їх динаміці, тобто будувати індекс фіксованого складу поформулі
/>
де Jф.с. — індекс врожайності фіксованого складу, решта позначень ті ж,що і в попередній формулі.
Відомо, що середня врожайність може змінюватися як за рахунок зміниврожайності, так і за рахунок зміни структури площ.
Оцінка сільськогосподарської продукції в натуральному виразі має великезначення у визначенні стану роботи тих або інших економічних структур. Протеобмежуватися цим при оцінці результатів роботи окремих господарств потериторіях і формах власності неможливо у зв'язку з різноманітністю видівпродукції, вироблюваних в кожному господарстві і неможливо їх підсумовувати внатуральному виразі.
Узагальнювальними показниками роботи підприємств матеріальних галузейвиробництва повною мірою стають сумірними при вартісній, грошовій їх оцінці.
Стосовно сільського господарства основними вартісними показниками євалова, товарна, реалізована, чиста продукція.
Валова продукція сільського господарства обчислюється як сума валових продукций землеробства і тваринництва. Їхпитома вага у валовій продукції сільського господарства приблизно однаково.Валова продукція землеробства складається з наступних складових: вартостівалових зборів всіх сільськогосподарських культур урожаю поточного року,включаючи і такі побічні продукти як солома, вартості продукції вирощуваннябагаторічних насаджень, приросту вартості незавершеного виробництва (озимихпосівів, пари, зяб і тому подібне).
Товарна продукція сільського господарства є величиною вартості продукціївиробленій в даному році, реалізованій по роздрібних цінах.
У товарну продукцію включаються наступні види проведених робіт.
1. Вартість всіх продуктів, проданих державі в порядку реалізаціїукладених контрактів.
2. Вартість всіх продуктів, реалізованих своїм робочим і службовцем абовикористаних на потреби громадського харчування.
3. Вартість всіх інших реалізованих продуктів.
Показник товарності окремих сільськогосподарських підприємстврозраховуються як приватне від ділення товарної продукції сільськогогосподарства на валову продукцію за той же період в одних і тих же цінах. Прицьому ні в товарну, ні у валову продукцію не включають малотоварні продукти,якими є силос, солома, відходи виробництва і тому подібне При цьому з валовоїпродукції виключають вартість вирощування багаторічних насаджень і незавершеневиробництво.
Показник товарності визначається не тільки в цілому посільськогосподарській продукції даного підприємства (колгосп, радгосп,фермерське господарство і тому подібне), але і по окремих найважливішихпродуктах даного господарства.
Окрім товарної продукції в сільськогосподарському виробництві ведетьсяоблік реалізованої продукції, тобто вартості продукції, яка була продана заринковою ціною в поточному періоді часу (місяць, квартал, рік).
Одним з найважливіших вартісних показників, що відображають стангосподарської діяльності сільськогосподарського підприємства є чиста продукція,яка характеризує знов створену вартість, тобто той дохід, який формує фондоплати праці і накопичення даного господарства.
Величину чистої продукції сільського господарства підраховують шляхомвіднімання з річної валової продукції у вартісному виразі суму матеріальнихвиробничих витрат того ж року.
До матеріальних витрат відноситься вартість насіння і посадочнихматеріалів, кормів, підстилки, добрив, хімікатів, медикаментів, палива, горючихі змащувальних матеріалів, матеріалів використовуваних для поточного ремонтусільськогосподарських споруд, а також вартість амортизації основних виробничихсільськогосподарських фондів.
Провести оцінку господарської діяльності сільськогосподарськогопідприємства за підсумками поточного (звітного) року значно важче, ніж церобиться на промислових підприємствах. Це пояснюється тим, що, по-перше, одна іта ж продукція даного сільськогосподарського підприємства реалізується порізних цінах залежно від того, де і кому була продана продукція. По-друге,значна частина продукції взагалі не реалізується, а залишається в господарствідля використання на виробничі потреби усередині даного підприємства (колгосп,радгосп, фермерське господарство). Ці обставини вимушують шукати інші формиоцінок роботи в сільському господарстві. В даному випадку в практиці удаютьсядо розмежування і відповідної оцінки товарної і нетоварної частин вироблюваноїпродукції.
Товарна частина оцінюється по фактичних цінах реалізації, а нетоварначастина оцінюється за собівартістю.
Валова, товарна і чиста продукція в сільськогосподарському секторівиробництва оцінюється як в поточних цінах даного року, так і в незмінних,зіставних цінах. Це робиться для отримання економічної інформації на підставіякої можна буде визначити не тільки загальні показники що характеризуютьдіяльність трудівників аграрного сектора, але і бачити ці показники в розвитку.Крім того, на базі цих показників можна буде визначати безліч інших якіснихпоказників, таких як продуктивність, ефективність праці і тому подібне
Періодичний перегляд зіставних незмінних цін необхідний, оскільки з часомміняється номенклатура продукції, умови її виробництва, що викликаєзастарівання співвідношення цін, встановлених в зіставних цінах певного року.
/>Розділ 2. Статистична оцінкапоказників виробництва льоноволокна/>2.1 Ряди розподілу вибіркової сукупності, їх характеристика,графічне зображення
В результатістатистичного спостереження отримують велику кількість різноманітних відомостейпро кожну одиницю досліджуваної сукупності. Проте, щоб на основі цих відомостейможна було зробити певні висновки, потрібно всю масу окремих даних привести довідповідного порядку, систематизувати, обробити і на цій основі дати зведенухарактеристику всієї сукупності фактів за допомогою узагальнюючих статистичнихпоказників. Цього досягають на другому етапі статистичного дослідження, якийназивається зведенням і групуванням статистичних матеріалів.
Отже, статистичнимзведенням називається наукова обробка первинних даних статистичного спостереженняз метою отримання узагальнюючих характеристик досліджуваного явища чи процесуза рядом суттєвих для них ознак.
Статистические ряды распределенияявляются одним из наиболее важных элементов статистики. Они представляют собой составнуючасть метода статистических сводок и группировок, но, по сути, ни одно из статистическихисследований невозможно произвести, не представив первоначально полученную врезультате статистического наблюдения информацию в виде статистических рядовраспределения.
Основною умовоюдля одержання правильних висновків при аналізі рядів динаміки є порівнянністьйого елементів.
Ряди динамікиформуються в результаті зведення й угруповання матеріалів статистичногоспостереження. Повторювані в часі (по звітних періодах) значення однойменнихпоказників у ході статистичного зведення систематизуються в хронологічнійпослідовності.
При цьому кожнийряд динаміки охоплює окремі відособлені періоди, у яких можуть відбуватисязміни, що приводять до непорівнянності звітних даних з даними інших періодів.Тому для аналізу ряду динаміки необхідний приведення всіх складових йогоелементів до порівнянного виду. Для цього відповідно до завдань дослідженнявстановлюються причини, що обумовили непорівнянність аналізованої інформації, ізастосовується відповідна обробка, що дозволяє робити порівняння рівнів рядудинаміки.
Результати зведення і угрупування матеріалів статистичного спостереженняоформляються у вигляді статистичних рядів розподілу. Статистичні ряди розподілує впорядкованим розподілом одиниць сукупності, що вивчається, на групи за группіровочному (що варіює) ознакою. Вонихарактеризують склад (структуру) явища, що вивчається, дозволяють судити про однорідністьсукупності, межі її зміни, закономірності розвитку спостережуваного об'єкту.Залежно від ознаки статистичні ряди розподілу діляться на:
— атрибутивні (якісні);
— варіаційні (кількісні)
а) дискретні;
б) інтервальні.
Атрибутивні ряди утворюються по якісних ознаках, якими можуть виступатипосада працівників торгівлі, професія, пів, освіта і так далі
Варіаційні ряди будуються на основі кількісної группіровочного ознаки. Варіаційніряди складаються з двох елементів: варіант і частот.
Варіанту — це окреме значення варійованої ознаки, яке він приймає у рядірозподілу. Вони можуть бути позитивними і негативними, абсолютними івідносними. Частота — це чисельність окремих варіант або кожної групиваріаційного ряду. Частоти, виражені в долях одиниці або у відсотках допідсумку, називаються частостямі. Сума частот називаєтьсяоб'ємом сукупності і визначає число елементів всієї сукупності.
Частості — це частоти, виражені у вигляді відносних величин (доляходиниць або відсотках). Сума частостейдорівнює одиниці або 100 %. Заміна частот частостямі дозволяє зіставляти варіаційні ряди з різним числом спостережень.
Варіаційні ряди залежно від характеру варіації підрозділяються надискретних (переривчасті) і інтервальних (безперервні). Дискретні ряди розподілузасновані на дискретних (переривчастих) ознаках, що мають тільки цілі значення.
Інтервальні ряди розподілу базуються на значенні ознаки, що безперервнозмінюється, приймає будь-які (у тому числі і дроби) кількісні вирази, тобтозначення ознак таких рядах задається у вигляді інтервалу.
За наявності достатньо великої кількості варіантів значень ознаки первиннийряд є труднообозрімим, і безпосередній розгляд його не дає уявлення пророзподіл одиниць за значенням ознаки в сукупності. Тому першим кроком увпорядкуванні первинного ряду є його ранжирування — розташування всіх варіантівв зростаючому (що убуває) порядку.
Для побудови дискретного ряду з невеликим числом варіантів виписуютьсяваріанти значень ознаки, що все зустрічаються, а потім підраховується частотаповторення варіанту. Рядрозподілу прийнято оформляти у вигляді таблиці, що складається з двох колонок(або рядків), в одній з яких представлені варіанти, а в іншій — частоти.
Для побудови ряду розподілу ознак, що безперервно змінюються, абодискретних, представлених у вигляді інтервалів, необхідно встановити оптимальнечисло груп (інтервалів), на які слід розбити всі одиниці сукупності, щовивчається.
Ряди розподілу зручно вивчати за допомогою графічного методу.
Статистичний графік — це креслення, на якому статистичні сукупності,такі, що характеризуються певними показниками, описуються за допомогою умовнихгеометричних образів або знаків. Представлення даних таблиць у вигляді графікасправляє сильніше враження, ніж цифри, дозволяє краще осмислити результатистатистичного спостереження, правильно їх тлумачити, значно полегшує розуміннястатистичного матеріалу, робить його наочним і доступним. Це, проте, зовсім неозначає, що графіки мають лише ілюстративне значення. Вони дають нове знанняпро предмет дослідження, будучи методом узагальнення початкової інформації.
Значення графічного методу в аналізі і узагальненні даних велике.Графічне зображення дозволяє здійснити контроль достовірності статистичнихпоказників, оскільки, представлені на графіці, вони яскравіше показують наявнінеточності, пов'язані або з наявністю помилок спостереження, або з суттю явища,що вивчається. За допомогою графічного зображення можливі вивченнязакономірностей розвитку явища, встановлення існуючих взаємозв'язків. Простезіставлення даних не завжди дає можливість уловити наявність причиннихзалежностей, в той же час їх графічне зображення сприяє виявленню причиннихзв'язків, особливо у разі встановлення первинних гіпотез, що підлягають потімподальшій розробці. Графіки також широко використовуються для вивченняструктури явищ, їх зміни в часі і розміщення в просторі. У них виразнішевиявляються порівняльні характеристики і виразно види основні тенденціїрозвитку і взаємозв'язку, властиві явищу, що вивчається, або процесу.
Для зображення і внесення думок про розвиток явища в часі і складісукупності разом з графіками будуються діаграми.
Використовуються діаграми: стовпчикові, стрічкові, квадратні, круги,лінійні, радикальні і ін. Вибір виду діаграми залежить в основному відособливостей початкових даних, мети дослідження.
Проаналізуємо наявну інформацію.
1) проведемо групування і складемо ряд розподілу, вибравши в якостіознаки групування ознаку показник «Урожайність льоноволокна ».
Візначаємо ширину інтервалу за формулою:
/>
/>
Визначаємограниці інтервалів:
/>
Визначаємокількість статистичних одиниць, які потрапляють у кожний інтервал розподілу:
/>
Визначаємо відносні частоти статистичниходиниць, які потрапляють у кожний інтервал розподілу:
/>
Будуємогістограму ряду розподілу:
/>
Будуємо полігон ряду розподілу:
/>
Будуємо кумулятуряду розподілу:
/>
2) проведемо групування і складемо ряд розподілу, вибравши в якостіознаки групування ознаку показник «Якість льонотрести».
Візначаємо ширину інтервалу за формулою:
/>
/>
Визначаємограниці інтервалів:
/>
Визначаємокількість статистичних одиниць, які потрапляють у кожний інтервал розподілу:
/>
Визначаємо відносні частоти статистичниходиниць, які потрапляють у кожний інтервал розподілу:
/>
Будуємогістограму ряду розподілу:
/>
Будуємо полігонряду розподілу:
/>
Будуємо кумулятуряду розподілу:
/>
3) проведемо групування і складемо ряд розподілу, вибравши в якостіознаки групування ознаку показник «Витрати праці на 1 центнер трести».
Візначаємо ширину інтервалу за формулою:
/>
/>
Визначаємограниці інтервалів:
/>
Визначаємокількість статистичних одиниць, які потрапляють у кожний інтервал розподілу:
/>
Визначаємо відносні частоти статистичниходиниць, які потрапляють у кожний інтервал розподілу:
/>
Будуємогістограму ряду розподілу:
/>
Будуємо полігонряду розподілу:
/>
Будуємо кумулятуряду розподілу:
/>
Виконаємокомбінаційне групування за ознаками «Урожайність льоноволокна» та «Якістьльонотрести»: Урожайність льоноволокна, ц/га Якість льонотрести, номер Разом 0,5-0,74 0,74-0,98 0,98-1,22 1,22-1,46 3,7-6,15 10 10 6,15-8,6 6 6 8,6-11,05 3 2 5 11,05-13,7 2 2 4 Разом 13 8 2 2
Аналізкомбінаційного групування вказує на існування прямого зв’язку між урожайністюльоноволокна та якістю льонотрести.
Виконаємокомбінаційне групування за ознаками «Урожайність льоноволокна» та «Витрати праці на 1 центнертрести, люд/год»: Урожайність льоноволокна, ц/га Витрати праці на 1 центнер трести, люд/год Разом 1,43-3,67 3,67-5,91 5,91-8,15 8,15-10,38 3,7-6,15 3 4 3 10 6,15-8,6 2 2 2 6 8,6-11,05 2 2 1 5 11,05-13,7 2 1 1 4 Разом 9 9 6 1
Аналізкомбінаційного групування вказує на відсутність прямого зв’язку між урожайністюльоноволокна та витратами праці на 1 центнер трести.
Виконаємокомбінаційне групування за ознаками «Якість льонотрести» та «Витрати праці на 1 центнертрести»:Якість льонотрести, номер Витрати праці на 1 центнер трести, люд/год Разом 1,43-3,67 3,67-5,91 5,91-8,15 8,15-10,38 0,5-0,74 6 6 2 14 0,74-0,98 2 1 4 1 8 0,98-1,22 1,22-1,46 3 3 Разом 8 10 6 1
Аналізкомбінаційного групування вказує на наявність певного прямого зв’язку міжякістю льонотрести та витратами праці на 1 центнер трести./>2.2 Статистична оцінка показників вибіркової і генеральної сукупності
Вибірковим називається таке статистичне дослідження, при якому узагальнювальніпоказники сукупності, що вивчається, встановлюються по деякій її частині,сформованій на основі положень випадкового відбору.
У основі вибіркового дослідження лежить несуцільне спостереження, при якомуобстежуються не всі одиниці сукупності, а лише певна їх частина.
Вибіркове дослідження широко застосовується на практиці, оскільки володієістотними перевагами в порівнянні з іншими методами отримання статистичнихданих. До них відносяться:
· Достатньовисока точність результатів обстеження завдяки використанню більшкваліфікованих кадрів, що приводить до скорочення помилок реєстрації;
· Економіячасу і засобів в результаті скорочення об'єму роботи, велика оперативність в отриманніданих про результати обстеження;
· Можливістьдослідження дуже великих статистичних совокупностей;
· Вибірковийметод є єдино можливим, якщо збір інформації пов'язаний з руйнуванням абовтратою одиниць спостереження, наприклад, при органалітічеськом контролі якостіпродукції;
· Можливістьдослідження повністю недоступних совокупностей. При вибірковому дослідженні вивчається порівняно невелика частинастатистичної сукупності (5-10%, рідше 20-25% об'єму її одиниць).
Проведення вибіркового дослідження є достатньо складним процесом, виконанняякого включає:
· обгрунтуваннядоцільності застосування вибіркового методу в даному дослідженні;
· складанняпрограми дослідження;
· встановленняоб'єму вибірки — n;
· обгрунтуванняспособу формування вибірки;
· відбір одиницьз Генеральної сукупності ( формування вибірки);
· вимірюванняознак, що вивчаються, у окремих одиниць;
· обробка отриманоїінформації і розрахунок характеристик вибірки;
· визначенняпомилки вибірки;
· розповсюдженнявибіркових характеристик на Генеральну сукупність.
Для постановки завдання вибіркового дослідження необхідно ввести наступніпоняття:
- Генеральна сукупність — сукупність, що вивчається, з якої проводитьсявідбір одиниць, що підлягають вивченню, вона може бути кінцевою (N) абонескінченною (н).
- Вибіркова сукупність ( вибірка) — частина одиниць генеральноїсукупності, відібрана для вивчення (n). Якість результатів вибіркового дослідженнязалежить від того, наскільки склад вибірки представляє генеральну сукупність,інакше кажучи, наскільки вибірка репрезентативна.
Під репрезентативністю вибірки розуміється відповідність її властивостейі структури властивостям і структурі генеральної сукупності. Репрезентативністьвибірки може бути забезпечена тільки при об'єктивності відбору даних, щогарантується принципами випадковості відбору одиниць.
Принцип випадковості припускає, що на включення або виключення статистичноїодиниці з вибірки не може вплинути ніякій інший чинник, окрім випадку. Цей принциплежить в основі методів випадкового відбору, за допомогою яких формуєтьсявибірка.
Використання методів випадкового відбору при формуванні вибірки дозволяє надаліпри обробці використовувати апарат теорії вірогідності.
Найчастіше за допомогою вибіркового дослідження визначаються наступніхарактеристики генеральної сукупності:
· Середнє значенняознаки в сукупності — X, розраховується як середня арифметична.
· Частка альтернативноїознаки в сукупності — d. Альтернативною вважається ознака, що набуває два значення.Якщо одне з них змінюється як задане, то частка альтернативної ознаки характеризуватимепитому вагу статистичних одиниць, що володіють заданим значенням альтернативноїознаки, наприклад, частка браку у виготовленій партії продукції;
· Дисперсіяознаки в сукупності — /> 2, як показник варіації.
У загальному вигляді завдання вибіркового дослідження формулюється такимчином: Хай є деяка генеральна сукупність відомого об'єму ( N одиниць).Необхідно на основі відомих характеристик вибірки отримати статистичні оцінкихарактеристик генеральної сукупності.
Статистичною оцінкою або статистикою характеристики (параметра)генеральної сукупності називають наближене значення шуканої характеристики(параметра), отримане за даними вибірки.
У статистиці використовуються два види оцінок — точкові і інтервальні.
Точковою статистичною оцінкою параметра генеральної сукупності називаєтьсяконкретне числове значення шуканої характеристики.
Інтервальна оцінка є числовими інтервалами, що імовірно містять значення параметрагенеральної сукупності.
Якість статистичних оцінок визначається наступними їх властивостями:
Спроможність: оцінка вважається спроможною, якщо при необмеженому збільшенніоб'єму вибірки її помилка прагне до 0.
Незміщеність: оцінка вважається незміщеною, якщо при даному об'ємі вибіркиn математичне очікування помилки дорівнює 0. Для незміщеної оцінки її математичнеочікування точно дорівнює математичному очікуванню характеристики вибірки.
Незміщена оцінка не завжди дає хороше наближення оцінюваного параметра,оскільки можливі значення отримуваної оцінки можуть бути сильно розсіянінавколо свого середнього значення. Тому оцінка повинна відповідати ще однійвимозі — ефективності.
Ефективність: оцінка вважається ефективною, якщо її помилка, звана помилкоювибірки, є величиною мінімальною.
Для точкових оцінок справедливі наступні твердження:
· Точковоюоцінкою генеральної частки є вибіркова частка
· Точковою оцінкоюгенеральною середньою є вибіркова середня
Таким чином, заздалегідь відомо, що оцінки для вказаних параметрів єспроможними і незміщеними. Для решти параметрів генеральної сукупності це твердженняне є справедливим. У математичній статистиці доводиться, що точковою оцінкою генеральноїдисперсії є вибіркова дисперсія, відкоректована на відношення />. Аналогічно, точковоюоцінкою генерального среднеквадратічеського відхилення є вибірковесреднеквадратічеськоє відхилення, відкоректованена />.
В цьому випадку точкові оцінки генеральної дисперсії і генерального среднеквадратічеського відхилення є спроможнимиі незміщеними. Основним недоліком точкових оцінок є те, що вони не враховуютьпомилки вибірки, тобто не є ефективними. Тому переважнішими є інтервальні оцінкипараметрів генеральної сукупності, в яких ці помилки враховуються. Інтервальні оцінкивідповідають всім трьом вимогам якості статистичної оцінки. Застосування інтервальнихоцінок означає, що характеристики генеральної сукупності укладаються в певний діапазонзначень. Щоб їх отримати, необхідно розрахувати відповідні помилки вибірки.
Розрахуємосередні арифметичні значення ознак в вибірковій сукупності. Розрахунки будемовиконувати на основі групувань, проведених вище. Для виконання розрахунків необходимо визначити середнє значення відповідної ознаки в кожній групі.
Ознака«Урожайність льоноволокна»: Номер інтервалу
/>
/> 1 4,89 10 2 7,166667 6 3 9,433333 3 4 12 6
Отже, />
Ознака «Якістьльонотрести»Номер інтервалу
/>
/> 1 0,603125 16 2 0,855 6 3 4 1,353333 3
Отже, />
Ознака «Витратипраці на 1 центнер трести»:Номер інтервалу
/>
/> 1 2,823333 9 2 4,632222 9 3 6,996667 6 4 10,38 1
Отже, />
Розрахованівибіркові середні досліджуваних ознак є точковими оцінками генеральних середніхвідповідних ознак.
Розрахуємовибіркові дисперсії досліджуваних ознак:
/>
Розрахуємосередні квадратичні відхилння досліджуваних ознак:
/>
Розрахуємоточкові незміщені оцінки дисперсій генеральної сукупності.
/>
Розрахуємонезміщені середні квадратичні відхилння досліджуваних ознак:
/>
Вважаючи, щонадані дані є 5% вибіркою, розрахуємо інтервальні оцінки показників.
Середні похибкивибірки:
/>
Граничні похибки вибіркипри довірчій ймовірності 0,997:
/>
Отже, довірчіінтервали для генеральних середніх:
/>
/>
/>
Розрахуємокоефіцієнти варіації:
Ознака«Урожайність льоноволокна»:
/> - свідчить пронеоднорідність досліджуваної сукупності
Ознака «Якістьльонотрести»
/> — свідчить про однорідністьдосліджуваної сукупності
Ознака «Витратипраці на 1 центнер трести»:
/> — свідчить пронеоднорідність досліджуваної сукупності
Розрахуємоструктурі середні – моду та медіану кожної ознаки.
Медіана (Ме) — цевеличина, яка відповідає варіанту, що знаходиться в середині ранжируваногоряду.
Модою(Мо-пермалой) називають значення ознаки, яке зустрічається найчастіше у одиницьсукупності. Для дискретного ряду модою буде варіант з найбільшою частотою.
Ознака«Урожайність льоноволокна»:
/>
/>
Ознака «Якістьльонотрести»
/>
/>
Ознака «Витратипраці на 1 центнер трести»:
Цей ряд розподілу є двомодальним.
/>
/>/> 2.3 Перевіркастатистичної гіпотези про відповідність емпіричного ряду розподілу нормальному
Основною метою аналізу варіаційних рядів є виявлення закономірностірозподілу, виключаючи при цьому вплив випадкових для даного розподілу чинників.Цього можна досягти, якщо збільшувати об'єм досліджуваної сукупності іодночасно зменшувати інтервал ряду. При спробі зображення цих даних графічно миотримаємо деяку плавну криву лінію, яка для полігону частот буде деякою межею.Цю лінію називають кривою розподіли.
Іншими словами, крива розподілу є графічне зображення у виглядібезперервної лінії зміни частот у варіаційному ряду, яке функціональнопов'язане із зміною варіант. Крива розподілу відображає закономірність зміничастот за відсутності випадкових чинників. Графічне зображення полегшує аналізрядів розподілу.
Відомо достатньо багато форм кривих розподіли, по яких може вирівнюватисяваріаційний ряд, але в практиці статистичних досліджень найчастішевикористовуються такі форми, як нормальний розподіл і розподіл Пуассона.
Нормальнийрозподіл залежить від двох параметрів: середньою арифметичною /> і середньогоквадратичного відхилення />. Його крива виражається рівнянням
/>
Якщо потрібно отримати теоретичні частоти f' при вирівнюванніваріаційного ряду по кривій нормального розподілу, то можна скористатисяформулою:
/>
За допомогою цієї формули ми отримуємо теоретичний (імовірнісне)розподіл, замінюючи ним емпіричний (фактичне) розподіл, по характеру вони неповинні відрізнятися один від одного.
Порівнюючи отримані величини теоретичних частот n* з емпіричними (фактичними) частотами n, переконуємося, що їх розбіжностіможуть бути вельми невеликі.
Об'єктивна характеристика відповідності теоретичних і емпіричних частотможе бути отримана за допомогою спеціальних статистичних показників, якіназивають критеріями згоди.
Для оцінки близькості емпіричних і теоретичних частот застосовуютьсякритерій згоди Пірсону, критерій згоди Романовського, критерій згодиКолмогорова.
Найбільш поширеним є критерій згоди К. Пірсона />, який можна представити як сумувідносин квадратів розбіжностей між n* і n до теоретичних частот:
/>
Обчисленезначення критерію /> необхідно порівняти з табличним(критичним) значенням />. Табличне значення визначаєтьсяпо спеціальній таблиці, воно залежить від прийнятої вірогідності Р і числа мірсвободи до (при цьому до = m — 3, де m — число груп у ряді розподілу длянормального розподілу). При розрахунку критерію згоди Пірсону повиннадотримуватися наступна умова: достатньо великим повинне бути число спостережень(n /> 50),при цьому якщо в деяких інтервалах теоретичні частоти 5.
Якщо />,то розбіжності між емпіричними і теоретичними частотами розподілу можуть бутивипадковими і припущення про близькість емпіричного розподілу до нормального неможе бути спростована.
Перевіримо статистичну гіпотезу про відповідність статистичного розподілуза ознакою «Урожайність льоноволокну» нормальному закону розподілу.Номер інтервалу
/>
/>
/> 1 4,89 10 5,337562 2 7,166667 6 8,373766 3 9,433333 3 7,076648 4 12 6 2,782567
/>
Критичнее значення критерія Пірсона при рівні значущості 0,058 та ступені свободи /> дорівнює 3,84
Оскількирозраховане значення критерію Персона більше за критичне, то розбіжності міжемпіричними і теоретичними частотами розподілу не можуть бути випадковими іприпущення про близькість емпіричного розподілу до нормального повинна бути спростоване.
Отже,
Перевіримо статистичну гіпотезу про відповідність статистичного розподілуза ознакою «Якість льонотрести» нормальному закону розподілу.Номер інтервалу
/>
/>
/> 1 0,603125 16 8,020999 2 0,855 6 8,833321 3 0,102868 4 1,353333 3 0,537173
/>
Критичнее значення критерія Пірсона при рівні значущості 0,05 та ступені свободи /> дорівнює 3,84
Оскількирозраховане значення критерію Персона більше за критичне, то розбіжності міжемпіричними і теоретичними частотами розподілу не можуть бути випадковими іприпущення про близькість емпіричного розподілу до нормального повинна бути спростоване.
Перевіримо статистичну гіпотезу про відповідність статистичного розподілуза ознакою «Витрати праці на 1 центнер трести» нормальному закону розподілу.Номер інтервалу
/>
/>
/> 1 2,823333 9 6,979346 2 4,632222 9 11,23498 3 6,996667 6 6,021962 4 10,38 1 0,211756
/>
Критичнее значення критерія Пірсона при рівні значущості 0,05 та ступені свободи /> дорівнює 3,84
Оскількирозраховане значення критерію Персона більше за критичне, то з ймовірністю 95% розбіжностіміж емпіричними і теоретичними частотами розподілу не можуть бути випадковими іприпущення про близькість емпіричного розподілу до нормального повинна бути спростоване.
/>Розділ 3. Кореляційний аналізвиробництва льоноволокна
Одним з найважливіших завдань статистики є вивчення об'єктивно існуючих зв'язківміж явищами. При дослідженні таких зв'язків з'ясовуються причинно-наслідкові відносиниміж явищами, а це, у свою чергу, дозволяє виявити чинники, що роблять основний впливна варіацію явищ, що вивчаються, і процесів. Причинно-наслідкові відносини є такимзв'язком явищ, при якому зміну одну з них, — причини, веде до зміни іншого — следствія. Причинно-наслідкова форма зв'язку визначаєвсі інші форми, носить загальний і багатообразний характер. Для описупричинно-наслідкового зв'язку між явищами і процесами використовується ділення статистичнихознак, що відображають окремі сторони взаємозв'язаних явищ, на факторних і результативних.Факторними вважаються ознаки, обуславлівающие зміна інших, пов'язаних з ними ознак, що є причинами і умовами такихзмін. Результативними є ознаки, такими, що змінюються під впливом факторних. Формипрояву існуючих взаємозв'язків вельми різноманітні. Як найзагальніші їх види виділяютьфункціональний і статистичний зв'язки. Функціональною називають такий зв'язок, приякому певному значенню факторної ознаки відповідає одне і лише одне значення результативне.Такий зв'язок можливий за умови, що на поведінку однієї ознаки (результативного) впливає тільки друга ознака (факторний) і ніякі інші. Такі зв'язкиє абстракціями, в реальному житті вони зустрічаються рідко, але знаходятьшироке застосування в точних науках в е р б першу чергу, в математиці.
Функціональний зв'язок виявляється у всіх випадках спостереження і для кожноїконкретної одиниці сукупності, що вивчається. У масових явищах виявляються статистичнізв'язки, при яких строго певному значенню факторної ознаки ставиться у відповідністьбезліч значень результативного. Такі зв'язки мають місце, якщо на результативнуознаку діють декілька факторних, а для опису зв'язку використовується один або декількавизначальних (врахованих) чинників.
Строга відмінність між функціональним і статистичним зв'язком можнаотримати при їх математичному формулюванні.
Функціональний зв'язок можна представити рівнянням: />
Статистичний зв'язокможе бути представлена рівнянням наступного вигляду: />
Де />-частина значення результативної ознаки, що виникає унаслідок діїнеконтрольованих чинників або помилок вимірювання.
По напряму кореляційні зв'язки діляться на прямих і зворотних. При прямомузв'язку результативна ознака росте із збільшенням факторного, при зворотній — зростанняфакторної ознаки призводить до зниження значень результативної ознаки. Наприклад,чим більше стаж роботи, тим вище продуктивність праці — прямий зв'язок, а чимвище продуктивність праці, тим нижче собівартість одиниці продукції — зворотнийзв'язок. За формою (аналітичному виразу) зв'язку діляться на лінійні (прямолінійні) і нелінійні ( криволінійні) зв'язки. Лінійні зв'язки виражаються рівняннямпрямої, а нелінійні — рівнянням параболи, гіперболи, статечної і тому подібне Покількості взаємодіючих чинників зв'язку діляться на парний ( однофакторную) і множинний( багатофакторну) зв'язки. При парному зв'язку на результативну ознаку діє одинфакторний, при множинній — декілька факторних ознак. Дослідження статистичного зв'язкупроводиться в наступному порядку:
якісний аналіз зв'язку — визначення складу ознак, попередній аналіз формизв'язку;
· збірданих на основі статистичного спостереження;
· кількіснаоцінка тісноти зв'язку за емпіричними даними;
· регресійнийаналіз (аналітичний опис зв'язку):
· вибірформи зв'язку
· оцінкапараметрів моделі
· оцінкаякості моделі.
Основним методом вивчення статистичного взаємозв'язку є статистичне моделюваннязв'язку на основі кореляційного і регресійного аналізу. Завданням кореляційногоаналізу є кількісне визначення тісноти зв'язку між двома ознаками при парному зв'язкуабо між результативним і декількома факторними при множинному зв'язку. Регресійнийаналіз полягає у визначенні аналітичного виразу зв'язку у вигляді рівняння регресії.Регресією називається залежність середнього значення випадкової величинирезультативної ознаки від величини факторного, а рівнянням регресії — рівняння описуєкореляційну залежність між результативною ознакою і одним або декількомфакторними./>3.1 Проста прямолінійна кореляція
Найповніше в статистиці розроблена методологія парної кореляції, щорозглядає вплив варіації однієї факторної ознаки на результатний. Дослідження парноїкореляції здійснюється на основі кореляційного аналізу, який припускає послідовневирішення ряду завдань:
• Виявлення зв'язку;
• Опис зв'язку в табличній і графічній формах;
• Вимірювання тісноти зв'язку;
• Формулювання виводів про характер існуючого зв'язку.
Завдання виявлення зв'язку між факторною і результативною ознаками можебути вирішена за допомогою наступних прийомів: — візуалізація зв'язку (побудоваі візуальний аналіз кореляційного поля); — використання результатіваналітичного угрупування і ін. Кореляційним полем є точковий графік в системі координат{x,y}. Кожна крапка відповідає одиницісукупності. Положення крапок на графіці визначається величиною двох ознак — факторного і результативного. Точки кореляційного поля можуть розташовуватися награфіці хаотично, без всякої закономірності — тоді робиться вивід провідсутність зв'язку між ознаками; або певним чином уздовж деякої гіпотетичноїлінії — тоді робиться вивід про існування зв'язку між ознаками.
При другому способі — використанні результатів аналітичного угрупування зв'язоквважається встановленим, якщо угрупування показує зміну середнього значеннярезультативної ознаки в групах при зміні факторної ознаки (підставиугрупування).
Опис виявленого зв'язку при проведенні кореляційного аналізу проводиться вдвох формах — табличною і графічною. При табличному описі зв'язку статистичні одиницігрупуються за значенням факторної ознаки ( розташовуються в порядку йогозростання або убування)
Графічний опис зв'язку полягає в побудові лінії емпіричної регресії — ламанійлінії, що сполучає на кореляційному полі крапки, абсцисами яких є значення факторноїознаки ( індивідуальні значення або групові значення), а ординатами — середнізначення результативної ознаки. Емпірична лінія регресії відображає основну тенденціюданої залежності. Якщо по своєму вигляду вона наближається до прямої лінії, то можнаприпустити наявність прямолінійного зв'язку між ознаками.
Тіснота зв'язку показує міру впливу факторної ознаки на загальну варіаціюрезультативної ознаки.
На емпіричному рівні, при проведенні кореляційного аналізу тіснота зв'язкувимірюється за допомогою інтегральних показників, побудованих на правилі складаннядисперсії. Відповідно до нього загальна дисперсія результативної ознаки розкладаєтьсяна внутрішньогрупову і міжгрупову.
Через співвідношення дисперсій визначаються показники, що вимірюють ступіньтісноти зв'язку між результативними і факторними ознаками: коефіцієнт детерміації/>2 і емпіричнекореляційне відношення /> .
Коефіцієнт детерміації розраховується по формулі:
/>
Приведене відношення визначає питома вага варіації, з'ясовної впливом врахованогочинника на результат, в загальній варіації результативної ознаки. Показникзмінюється в діапазоні від 0 до 1.
Коефіцієнт детерміації складно інтерпретується, тому на його основі розраховуєтьсяще один показник тісноти зв'язку — емпіричне кореляційне відношення />.
Емпіричне кореляційне відношення розраховується по формулі: />. Діапазонзміни цього показника: від 0 до 1. Нульове значення емпіричного кореляційного відношенняозначає відсутність зв'язку між результативною і факторною ознаками, при /> зв'язок класифікуєтьсяяк функціональна.
Якщо відомо, що між результативною і факторною ознакою існує лінійний зв'язок,то для оцінки її тісноти використовується лінійний коефіцієнт кореляції, щорозраховується по формулі:
/>
Наоснове предоставленных данных исследуем с помощью коэффициента линейнойкорреляции тесноту связи между признаками Х («Урожайность льноволокна»), В(«Качество ленотрести») («Расходы труда на 1 центнер ленотрести»):
/>
/>
/>
/>
/>
/>
Таким чином, згідно із класифікацією Чеддоказв'язок між показниками «Урожайність льоноволокна» та «Якість льонотрести»можна вважати прямим тісним, зв'язок між показниками «Урожайність льоноволокна»та «Витрати праці на 1 центнер льонотрести» можна вважати прямим слабким, азв'язок між показниками «Якість льонотрести» та «Витрати праці на 1 центнерльонотрести» відсутня.
Для коефіцієнтукореляції /> значення критерію Стьюдентастановить:
/>
Для коефіцієнтукореляції /> значення критерію Стьюдентастановить:
/>
Для коефіцієнтукореляції /> значення критерію Стьюдентастановить:
/>
Критичнее значення критерію Стьюдента при рівнізначущості 0,05 та /> становить 2,063.
Оскількирозраховані значення критерію Стьюдента для коефіцієнтів кореляції більші закритичне, можна стверджувати, що числові значення цих коефіцієнтів не являютьсявипадковими.
/>3.2 Криволінійна кореляція
Між параметрамимоделі можливі також випадки криволінійної кореляції Для дослідження такоїзалежності потрібно досліджувану сукупність розділити на інтервали, які маютьпрямолінійний характер, і дослідити кожний участок окремо.
Дослідимокриволінійну кореляцію між ознаками Х та У. Дослідимо окремо участки /> та />
/>
/>
Бачимо, що приурожайності льоноволокна меншою за 8 ц/га, залежність між урожайністюльоноволокна та якістю льонотрести є помірною, а при урожайності льоноволокнабільше за 8 ц/га, залежність між урожайністю льоноволокна та якістю льонотрестиє тісною.
Дослідимокриволінійну кореляцію між ознаками Х та />. Дослідимо окремо участки /> та />:
/>
Бачимо, що приурожайності льоноволокна меншою за 8 ц/га, залежність між урожайністюльоноволокна та витратами праці на 1 центнер льонотрести є помірною, а приурожайності льоноволокна більше за 8 ц/га, залежність між урожайністюльоноволокна та витратами праці на 1 центнер льонотрести є слабкою.
Дослідимокриволінійну кореляцію між ознаками У та />. Дослідимо окремо участки /> та />:
/>
Бачимо, що при /> залежність міжякістю льонотрести та витратами праці на 1 центнер льонотрести є прямоюпомірною, а при /> залежність між якістю льонотрестита витратами праці на 1 центнер льонотрести є зворотньою функціональною./>3.3 Множинна кореляція
Двомірні кореляційні моделі ( парна кореляція) використовуються увипадках, коли серед чинників, що впливають на результативну ознаку, є домінуючий.Такі зв'язків небагато, частіше зустрічаються залежності результативної ознаки віддекількох факторних, оскільки економічні явища знаходяться під впливом значногочисла одночасно і чинників, що сукупно діють.
Завдання множинногокореляційно-регресійного аналізу в загальному вигляді формулюється таким чином:Хай деяка статистична сукупність, що складається з n одиниць спостереженняволодіє певним набором ознак, один з яких грає роль результативного, а останні- факторних. На основі спостережуваних значень всіх ознак потрібно виявити і описатизв'язок між ними у вигляді множинної кореляційної моделі вигляду: />.
Рішення даної задачі вимагає послідовного виконання наступних етапів дослідженнямножинного кореляційного зв'язку:
• попередній відбір чинників, що включаються в модель;
• попередній опис зв'язку;
• уточнення моделі на основі аналізу кореляційної матриці;
• визначення тісноти зв'язку;
• оцінка надійності множинної кореляційної моделі;
• інтерпретація моделі.
Вивчення множинної регресії ( кореляції) вимагає вимірювання не тільки прямоїдії кожного чинника на результат, але і обліку впливу чинників один на одного,тобто обліку наявності міжфакторних зв'язків. Загальне число зв'язків завждизначно більше числа чинників, що включаються в модель. Воно визначається виразом:
/>
де />–кількість факторних ознак, включених в модель.
У загальному випадку, при великому числі чинників, що враховуються,необхідно будувати складні моделі, що вимагають проведення складних розрахунків;моделі виходять громіздкими. З іншого боку, — чим велика кількість чинників враховується,тим адекватніше побудована модель. Для вирішення вказаного протиріччя заздалегідьобмежується число чинників, що враховуються. Доцільність їх включення в модельвизначається наступними міркуваннями:
· вони повиннібути соїзмеріми, мати кількісний вираз;
· чинники неповинні бути інтеркорреліровани, тобто тісно зв'язаними міжсобою;
· вониповинні пояснювати варіацію результативної ознаки.
При включенні в модель інтеркоррелірованних чинників неможливо визначити ізольований вплив таких чинниківна результативний показник, а оцінки параметрів рівняння множинної регресії будутьненадійними, залежними від спостережень.
Попередній опис множинного кореляційного зв'язку ( МКЗ) здійснюється черезпобудову відповідного рівняння регресії. Практика показує, що можна використовуватинаступні п'ять функцій, оскільки вони описують всі реально існуючі залежності міжсоціально-економічними явищами:
1. лінійна;
2. статечна;
3. показова (експотенциональная);
4. параболічна;
5. гіперболічна.
Працювати з нелінійними функціями складно, тому основне значення мають лінійнімоделі через їх простоту і логічність економічної інтерпретації. Нелінійні формизавжди можна привести до лінійної, використовуючи відомий в математиці прийом лінеаризаціїфункцій. Величина кожного параметра в рівнянні прямої може бути визначена пометоду найменших квадратів.
При виборі форми рівняння множинної регресії необхідно мати на увазі:
1. Чимскладніше функція, тим гірше інтерпретуються параметри моделі.
2. Складні функції( поліноми) з великою кількістю чинників вимагають великого числа спостережень( на кожен параметр не менше 6 спостережень)
Остаточний відбір чинників, тобто уточнення кореляційної моделі проводитьсяна основі аналізу кореляційної матриці. Кореляційна матриця складається зпарних лінійних коефіцієнтів кореляції юшок r, що відображають тісноту зв'язкурезультативної і факторної ознаки і коефіцієнтів інтеркорреляції, щовідображають тісноту зв'язку між i-м і j-м факторними ознаками.
Оцінка тісноти множинного кореляційного зв'язку проводиться на основідвох показників: множинного коефіцієнта детерміації і множинного коефіцієнтакореляції .
Для двохфакторної моделі множинний коефіцієнт кореляції визначається поформулі:
/>
Діапазон зміни множинного коефіцієнта кореляції від 0 до 1. «0» означає відсутністьзв'язку, «1» — наявність функціонального множинного зв'язку між ознаками. Длякласифікації тісноти зв'язку використовується шкала Чеддока.
Для оцінки надійності виявленого зв'язку порівнюється множиннийкоефіцієнт кореляції з лінійними кореляційними коефіцієнтами кореляції між результатомі факторними ознаками, включеними в модель. Зв'язок визнається надійним, якщо
/>
Завершуючим етапом множинної кореляції є інтерпретація параметрів побудованоїкореляційної моделі. Чим більше величина цих параметрів ( коефіцієнтів регресії),тим значніше вплив даних чинників на результат. Важливе значення мають знак передкоефіцієнтами регресії. Знак “+” свідчитьпро зростання результату при збільшенні факторної ознаки, знак “-” — про зменшення результату призростанні факторного.
Опишемо зв'язокміж урожайністю льоноволокну (факторна змінна Х1), витратами праці на 1 центнерльонотрести (факторна змінна Х2) та якістю льнотрести (результуюча змінна У).Для побудови моделі лінійної регресії скористаємось матричною формулою
/>
/> 0,29041
/> 0,065151
/> -0,00789
Таким чином, економетрична модель маєвигляд:
/>Y X1 X2 Y^ U 0,5 4,3 2,33 0,551326 -0,05133 0,5 5,7 4,74 0,623528 -0,12353 0,5 6,6 3,33 0,693026 -0,19303 0,54 9,8 2,66 0,906252 -0,36625 0,56 3,7 4,51 0,495322 0,064678 0,56 5,9 6,67 0,621474 -0,06147 0,58 5,6 3,59 0,625998 -0,046 0,6 3,7 1,43 0,519346 0,080654 0,6 7,6 5,4 0,74188 -0,14188 0,63 5,1 7,85 0,56027 0,06973 0,64 3,7 3,94 0,499768 0,140232 0,65 5,2 5,52 0,584944 0,065056 0,65 8,7 3,28 0,829916 -0,17992 0,7 7,2 5,75 0,71315 -0,01315 0,72 6 6,63 0,628286 0,091714 0,72 10,9 6,68 0,946396 -0,2264 0,77 11,8 3,24 1,031728 -0,26173 0,78 6,3 2,32 0,681404 0,098596 0,85 7,8 6,9 0,74318 0,10682 0,88 7,5 7,25 0,72095 0,15905 0,88 12,1 10,38 0,995536 -0,11554 0,97 9,8 4,05 0,89541 0,07459 1,23 10,7 3,97 0,954534 0,275466 1,37 13,1 3,81 1,111782 0,258218 1,46 13,4 3,23 1,135806 0,324194
1) розрахуємокоефіцієнт детермінації: />. Цей показник показує, щовариація залежної змінної залежить від варіації пояснюючих змінних на 55,8%
2) розрахуємокоефіцієнт множинної кореляції:
/>
Бачимо, щозв'язок між пояснюючими та залежною змінними є тісним.
3) Статистичназначущість звязку, отриманого на основі економетричної моделі, оцінимо закритерієм Фішера.
/>
Розрахуємокритичне значення критерію Фішера при рівні значущості 0,05 та ступені свободи 2та 25:
/>
Оскільки фактичнезначення критерія Фішера є більшим за критичне, то економетрична модель єдостовірною.
4) Розрахуємокритерій Стьюдента для оцінки статистичної значущості кожної оцінки параметрівеконометричної моделі: />