МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ АВТОМОБІЛЬНО-ДОРОЖНІЙУНІВЕРСИТЕТ
Кафедраобліку і аудиту
К У Р С О В А Р О Б О Т А
ЗДИСЦИПЛІНИ «СТАТИСТИКА»
Виконав: студент гр. ЕА – 22
Дабарська Анна
Залікова книжка № 044031
Перевірила: Голеско I.О.
Харків– 2009
ЗМІСТ
ВСТУП1. План статистичного дослідження
1.1Метаі задачі дослідження
1.2 Об'єкті предмет дослідження. Економічна сутність показників, що вивчаються
1.3 Методидослідження
2. Збірі систематизація первинних даних
2.1Отриманнявибіркових даних. Розрахунок похідних показників
2.2Групування даних. Розрахунок описової статистики і перевірка однорідностівибіркової сукупності
2.2.1Групування з використанням рівних інтервалів
2.2.2Групування з використанням нерівновеликих інтервалів
2.2.3Розрахунок узагальнюючих характеристик і перевірка однорідності вибірковоїсукупності
2.3Поширення вибіркових результатів на генеральну сукупність. Оцінка достатностіобсягу вибірки
2.4.Аналіз закономірностей розподілу досліджуваних показників
3.ПАРНИЙ КОРЕЛЯЦІЙНО-РЕГРЕСІЙНИЙ АНАЛІЗ ЗАЛЕЖНОСТЕЙ
3.1Кореляційний аналіз парних зв'язків />
3.2Регресійний аналіз парного зв'язку />
3.2.1Вибір рівняння регресії між двома ознаками
3.2.2Оцінка істотності параметрів регресії і рівняння зв'язку
Висновок
Список використаної літератури
ВСТУП
Курс ”Статистика” охоплюєметодологічні основи статистики, системи соціально – економічних показників,які відображають рівень забезпеченості і співвідношення ресурсів суспільноговиробництва, їх використання, результати господарювання, життєвий рівеньнаселення; методи вивчення об’єктивно існуючих статистичних закономірностей уформі розподілу сукупностей, взаємозв’язків, тенденцій розвитку.
Статистика як наука покликанавідображати реалії суспільного життя, його проблеми, успіхи і невдачі.Оволодіння методами статистичного вимірювання й аналізу складних суспільнихявищ – невід’ємний елемент підготовки висококваліфікованих економістів.Надмірна централізація статистики в минулому сприяла формуванню відомчої монополіїна збір і обробку інформації, позбавляла статистичні органи аналізу таконтролю.
Недосконала методологія та пряміприписки зменшували вірогідність офіційних статистичних даних. Низький рівеньстатистичної роботи не відповідав вимогам життя; фундаментальні методидослідження і досвід зарубіжної науки недооцінювались.
Для того щоб підняти статистику досучасного наукового рівня, задовольнити потреби системи управління та інших соціально– економічних суб’єктів в якісній, різноманітній і своєчасній інформації,потрібна докорінна її перебудова.
Забезпечення вірогідності інадійності статистичної інформації можливе за умови підвищення наукового рівнявсієї статистичної методології, наближення її до методології і стандартівсвітової практики.
Головна особливість статистики якнауки — це те, що досліджуючи не окремі чинники, а масові соціально –економічні явища і процеси, виступаючі як безліч окремих чинників, що володіютьяк індивідуальними, так і загальними ознаками.
Предметом статистики виступаютьрозміри і кількісні співвідношення соціально – економічних явищ, закономірностіїх зв'язку і розвитку. Це є другою особливістю статистики як науки
Третя особливість статистики якнауки полягає в тому, що вона характеризує структуру суспільних явищ. Структура– це внутрішньо будова масових явищ, тобто внутрішньо будова статистичноїмножини. Статистика повинна цю структуру знайти, виразити за допомогоюстатистичних показників.
Зміни в просторі, тобто встатистиці, виявляються за допомогою аналізу структури суспільного явища, азміни рівня і структури явища досліджуються в часі, тобто в динаміці. Така четвертаособливість статистики як науки.
Явища суспільного життявзаємозв'язані і взаємообумовлені: зміна одних явищ зумовлюється інші. Томувиявлення зв'язку є п'ятою особливістю статистики як науки, оскільки пізнаннядійсності неможливе без пізнання всіх або принаймні основних взаємозв'язківсуспільних явищ.
Статистика – суспільна наука, якавивчає кількісну сторону якісно певних масових соціально–економічних явищ іпроцесів, їх структуру і розподіл, розміщення в просторі, рух в часі, виявляючидіючу кількісну залежність, тенденції і закономірності, причому в конкретнихумовах місця і часу .
1 План статистичного дослідження
1.1 Метаі задачі дослідження
Метою курсової роботи є самостійнепоглиблене вивчення теоретичних основ найважливіших тем дисципліни, придбанняпрактичних навичок, проведення статистичних досліджень економічних об’єктів іззастосуванням сучасних засобів обробки початкових даних. Основна мета роботи –це виконання статистичного дослідження для вирішення наступної практичноїзадачі. Підприємству в процесі розробки бізнес–плану необхідно розрахувативаловий дохід від різних варіантів здійснення виробничої діяльності. Методомпрямого розрахунку цього показника через низку обставин використовуватинеможливо. Необхідно досліджувати залежність валового доходу підприємства відтехніко — економічних показників і розробити його статистичну модель, щодозволяє швидко і якісно передбачати значення валового доходу на підставівизначаючих його величину чинників. Передбачається, що на річний валовий дохідпідприємства (Y) можуть робити істотний вплив наступні чинники: середньорічнавартість виробничих фондів (X1); середньорічна чисельність працюючих (X2);фондовіддача (X3); фондоозброєність (X4); продуктивність праці (X5) .
Для аналізу залежності і побудовимоделі необхідно, вирішити наступні задачі:
— отримати випадкову 10 – процентнувибірку з генеральної сукупності, представленої 360 підприємствами;
— провести розрахунок по кожномувідібраному для дослідження підприємств значень показників фондовіддачі (X3),фондоозброєність (X4) і продуктивності праці (X5) ;
— розрахувати для всіх показниківописову статистику, побудувати гістограму і визначити закон розподілурезультативної змінної, перевірити вибірку на присутність аномальнихспостережень ( при необхідності виключити відповідні підприємства з подальшогодослідження );
— перевірити достатність об'ємувибірки для отримання достовірних результатів ;
— провести парний кореляційно –регресійний аналіз залежності Y = φ (X1), Y = φ (X2), Y = φ(X3), Y = φ (X4), Y = φ (X5), відзначити можливість прогнозу Y напідставі парної залежності, заповнити матрицю парних коефіцієнтів кореляції івибрати з її використовуванням два – три чинники, що мають якнайменшу кореляціюміж собою, але щонайвищою кореляцію з результативним показником Y;
— провести парний кореляційно –регресійний аналіз залежності Y від двох-трьох чинників, відібраних з комплексутих, що вивчаються( X1, X2, X3, X4, X5);
— розробити рекомендації повикористовуванню парний кореляційно – регресійний моделі на практиці (розробитиприклад використовування моделі для планування ).
Таким чином, мета статистичногодослідження, як і будь-якого наукового дослідження, — розкриття єства масовихявищ і процесів, властивими їм закономірностями. Відмітної особливістю цихзакономірностей є те, що вони відносяться не до кожної окремої одиницісукупності, а до всієї маси одиниць в цілому.
1.2Об'єкті предмет дослідження Економічна сутність показників, що вивчаються
Об'єктом статистичного дослідженняє статистична сукупність — множина одиниць, що володіють масовістю,однорідністю, певною цілісністю, взаємозалежністю станів окремих одиниць інаявністю варіації. В даній курсовій роботі об'єктом виступає підприємство.
Предметом статистичного дослідженняє розміри і кількісні співвідношення соціально-економічних явищ, закономірностіїх зв'язку і розвитку. В даній курсовій роботі предметом виступає дохідпідприємства.
Генеральна сукупність — усясукупність реально існуючих статистичних об'єктів, з яких буде витягатися вибірковасукупність. Тобто генеральною сукупністю виступають 360 підприємств. Вибірковасукупність — це сукупність одиниць, відібраних з генеральної сукупності завизначеними правилами й ознаками. В даній курсовій роботі вибірковою сукупністювиступають відібрані нами 36 підприємств.
У статистиці особлива увагаприділяється вивченню основних виробничих фондів. При цьому головними задачамистатистики є визначення обсягу, складу, динаміки і використання основних фондів.
Показники використання основнихвиробничих фондів :
— річний валовий дохідпідприємства;
— середньорічна вартість виробничихфондів;
— середньорічна чисельністьпрацюючих;
— продуктивність праці;
— фондовіддача;
— фондоозброєність;
Основні фонди враховуються,насамперед, у натуральному вираженні. Однак облік основних фондів унатуральному вираженні повинний доповнюватися обліком у грошовій оцінці. Тількина основі обліку основних виробничих фондів у грошовій оцінці можна визначитиїхній загальний обсяг, вивчити структуру, визначити річну суму амортизації,будувати баланс і здійснювати багато важливих економічних розрахунків,пов'язаних з характеристикою використання основних фондів, їх відтворенням.Існує оцінка основних фондів по первісній вартості і відбудовної.
Повна первісна вартість – це вартістьосновних фондів у момент їхнього придбання.
Повна відбудовна вартість – це сумавитрат, необхідних для придбання даного виду основних фондів у сучасних умовах.
Залишкова вартість визначаєтьсяшляхом відрахування з повної вартості суми зносу основних фондів. Обсяг і складосновних виробничих фондів не залишається незмінним. За рахунок вибуття фізичнозношених і морально застарілих основних фондів їхній обсяг зменшується.Зменшується він також за рахунок відрахувань в амортизаційний фонд і втрати,яка зазнається через інші причини.
Таким чином, середньорічна вартістьосновних виробничих фондів складає суму вартості фондів на початок року завинятком усіх відрахувань і витрат на відновлення і ремонт.
Поліпшення використання основнихфондів є одним з найважливіших факторів ефективності виробництва. Поліпшеннявикористання основних фондів означає додатковий випуск продукції. Тому основнимпоказником використання основних виробничих фондів є показник випуску продукціїна кожну одиницю вартості основних фондів, — фондовіддача. Тісно з нимзв'язаний і інший показник, що визначається як відношення середньорічноївартості основних виробничих фондів до середньорічної чисельності робітників, — фондоозброєність. Праця є основним чинником виробництва. Отже, статистичнедослідження трудових ресурсів і їхнє використання украй важливе при аналізірезультатів діяльності окремих чи підприємств їхніх сукупностей.
Чисельність працівниківпідприємства визначається на визначені дати і як середня чисельність ( обліковачи явочна) за визначені періоди.
Середньоспискове число працівниківвизначають шляхом розподілу суми облікового числа за всі дні досліджуваногоперіоду на календарне число днів даного періоду. Середньоявочне числопрацівників визначається шляхом розподілу суми людино-днів на число днів роботипідприємства в даному періоді.
Найважливішим показником прививченні статистикою як наукою виробництва є продуктивність праці, динамікафакторів, що визначають її ріст, шляхи її підвищення. Продуктивність працівизначається кількістю продукції, створюваної в одиницю часу, або витратамичасу на виробництво одиниці продукції. Економічні дослідження звичайно зв'язаніз вивченням великої кількості об'єктів, що утворюють генеральну сукупність томуяк економісти будемо використовувати вибірковий метод. Річний валовий дохідпідприємства характеризує кінцевий річний результат діяльності підприємства і єрізницею між валовою виручкою — повною сумою грошових надходжень від реалізаціїтоварної продукції, робіт, послуг і матеріальних цінностей — і всіма витратамина виробництво і реалізацію продукції. Продуктивність праці — продуктивністьвиробничої діяльності людей; вимірюється кількістю продукції, проведеноїпрацівником у сфері матеріального виробництва за одиницю робочого часу, або кількістючасу, яке затрачує на виробництво одиниці продукції.
1.3 Методи дослідження
Для вивчення предмету статистикирозроблені і застосовуються специфічні прийоми, способи і методи, що направленіна вивчення кількісних закономірностей, що виявляються в структурі, динаміці,взаємозв'язках соціально-економічних явищ.
Статистичне дослідження складаєтьсяз трьох етапів:
1) статистичне спостереження;
2)первісна обробка, зведення,угрупування результатів спостереження;
3)аналіз отриманої інформації.
На першому етапі застосовують методмасового спостереження. Вимога масовості пояснюється тим, що статистичнізакономірності виявляються тільки в достатньо великому масиві даних завдяки діїзакону великих чисел: в узагальнених статистичних показниках, розрахованих наоснові масових спостережень, взаємо погашаються слідства, породжені випадковимипричинами, і залишаються слідства, обумовлені загальними для всіх чинниківпричинами. Друга стадія полягає в тому, що зібрані факти класифікуються,групуються по певних ознаках, підраховуються певні показники, проектуються ізаповнюються таблиці. Інформація на цій стадії обробляється методомстатистичних угрупувань. На третьому етапі проводиться аналіз статистичноїінформації на основі узагальнених статистичних показників: абсолютних,відносних і середніх величин, індексів і ін.
2 Збір ісистематизація первинних даних
2.1 Отриманнявибіркових даних. Розрахунок похідних показників
Економічні дослідження звичайнобули пов'язані з вивченням великої кількості об'єктів, утворюючих генеральнусукупність, тому економіст повинен уміти використовувати в практичнійдіяльності вибірковий метод.
Генеральна сукупність, щовивчається в курсовій роботі, має обсяг Ni,рівний 360.
Репрезентативну вибірку можнаотримати декількома способами. Перш за все потрібно розрізняти індивідуальний ісерійний відбори. У свою чергу вони можуть бути організовані яквласно-випадковий, механічний і типовий відбір. Часто ці способи відборупоєднуються в цілях досягнення більш високої репрезентативності.
Початкові дані для вирішенняпоставленої задачі одержуємо з генеральної сукупності, представленої 360підприємствами. По величині результативного показника (Y), що вивчається, вонабула розділена на 10 типових груп (таблиця 1).
Таблиця 2.1– Структура генеральної і вибіркової сукупностейТипові групи Генеральна сукупність Вибіркова сукупність обсяг, N частка, % обсяг, N частка, % I 10 2,78 1 2,78 II 20 5,56 2 5,56 III 40 11,11 4 11,11 IV 50 13,89 5 13,89 V 60 16,67 6 16,67 VI 60 16,67 6 16,67 VII 50 13,89 5 13,89 VIII 40 11,11 4 11,11 IX 20 5,56 2 5,56 X 10 2,78 1 2,78 Разом 360 100,0 36 100,0
Черезнеможливість вивчення всіх об'єктів генеральної сукупності проведемо вивченняцікавлячого нас явища з використанням вибіркового методу. При цьому вибіркаповинна мати ту ж структуру, що і генеральна сукупність.
Для формуваннярепрезентативної вибірки необхідний механізм випадкового добору об'єктів згенеральної сукупності. У курсовій роботі в основу цього механізму покладені передостанняй остання цифри номера залікової книжки(4та 6).
Відбірвихідних даних проводимо таким чином: по передостанній цифрі залікової книжкивстановлюємо номер першого об'єкту, що вивчається, в кожній типовій групі, а поостанній цифрі — періодичність відборуоб'єктівв цій групі. Відбір здійснюємо пропорційно розмірам типових груп в генеральнійсукупності. Вибірковасукупність повинна складатися з 36 підприємств(n =36).
Таблиця 2.2 –Вибіркова сукупність (варіант 46)Група Номери об'єктів в групі Кількість об'єктів в групі I 3 1 II 3,4, 2 III 3,4,5,6 4 IV 3,4,5,6,7 5 V 3,4,5,6,7,8 6 VI 3,4,5,6,7,8 6 VII 3,4,5,6,7 5 VIII 3,4,5,6 4 IX 3,4 2 X 3 1 Разом 36
По кожномуобраному підприємству вибрали три показники, значення яких відображено в таблицівихідних даних (табл. 3). Потімна підставі цих первинних показниківрозрахуємо похідні показники, такі як: фондовіддача (Хi3,),фондоозброєність (Хi4) і продуктивність праці (Хi5). Їхрозраховуємо для кожного підприємства таким чином:
— фондовіддача: Хi3= Y/Хi1, грн./грн.;
— фондоозброєність: Хi4 = Х1/Хi2, тис.грн./чол.;
— продуктивністьпраці: Хi5 = Y/Хi2, тис. грн./чол.
Значеннязмінних Хi3, Хi4, і Хi5 розрахували до 3цифрипісля десяткової коми. Результати розрахунків приводимо в таблиці 1.3.
Таблиця2.3 – Вихідні дані достатистичного дослідження Порядковий номер Значення змінних групи Підприємства в групі Спостереження, і
Yi
Xi1
Хi2
Xi3
Xi4
Xi5 I 3 1 994 831 407 1,196 2,041 2,442 II 3 2 1688 1187 554 1,422 2,142 3,046 4 3 1736 1479 528 1,173 2,801 3,287 III 3 4 2248 1848 753 1,216 2,454 2,985 4 5 2325 1867 705 1,245 2,648 3,297 5 6 2614 1916 698 1,312 2,744 3,601 6 7 2651 1890 764 1,402 2,473 3,469 IV 3 8 3780 2502 948 1,510 2,639 3,987 4 9 3840 2541 961 1,511 2,644 3,995 5 10 3878 2507 969 1,546 2,587 4,002 6 11 3905 2559 999 1,525 2,561 3,908 7 12 3980 2632 990 1,512 2,658 4,020 V 3 13 4835 3231 1184 1,496 2,728 4,083 4 14 4865 2847 1159 1,708 2,456 4,197 5 15 4819 3176 1066 1,517 2,979 4,520 6 16 4884 3374 1230 1,447 2,743 4,970 7 17 4911 3142 1187 1,563 2,647 4,137 8 18 4962 3175 1198 1,562 2,650 4,141 VI 3 19 5766 3802 1369 1,516 2,777 4,211 4 20 5837 3835 1379 1,522 2,781 4,232 5 21 5849 3890 1407 1,503 2,764 4,157 6 22 5858 3946 1415 1,484 2,788 4,139 7 23 5963 4045 1447 1,474 2,795 4,120 8 24 5999 3968 1422 1,511 2,790 4,218 VII 3 25 6736 4702 1568 1,432 2,998 4,295 4 26 6820 4372 1585 1,559 2,758 4,302 5 27 6860 4498 1594 1,525 2,821 4,303 6 28 6894 4602 1627 1,498 2,828 4,237 7 29 6940 4550 1611 1,525 2,824 4,307 VIII 3 30 7794 5104 1790 1,527 2,851 4,354 4 31 7784 5097 1787 1,527 2,852 4,355 5 32 7975 5015 1828 1,590 2,743 4,362 6 33 8050 5168 1814 1,557 2,848 4,437 IX 3 34 8895 5953 2054 1,494 2,898 4,330 4 35 9100 5950 2063 1,529 2,884 4,411 X 3 36 9948 8554 2507 1,162 3,412 3,968 Сума значень 191883 129755 46567 52,814 98,02 143,85 Середнє значення 5330,83 3604,306 1293,528 1,467 2,723 3,996
2.2 Групуванняданих
Розрахунокописової статистики і перевірка однорідності вибіркової сукупності
Групуваннявихідних даних проводиться з метою аналізу структури і закономірностейрозподілу досліджуваних показників. У відповідних дослідженнях групуваннявиконують для кожного досліджуваного показника. У курсовій роботі його слідвиконати тільки для результативного показника Y, але різними способами.
Якщо варіація ознаки виявляється впорівняно вузьких межах і розподіл носить більш менш рівномірний характер, тобудують угрупування з рівними інтервалами.
Нерівні інтервали застосовуються встатистиці, коли значення ознаки варіюють нерівномірно і в значних розмірах, щохарактерне для більшості соціально – економічних явищ, особливо при аналізімакроекономічних показників.
2.2.1 Групуванняз використанням рівних інтервалів
Групування зрівними інтервалами доцільні в тих випадках, коли варіація виявляється впорівняно вузьких інтервалах і розподіл одиниць сукупності по даній ознаці єпрактично рівномірною. Оптимальну кількість груп K з рівними інтерваламивизначимо по формулі Стерджесса:
/>,
K=1+3,322*lg36=7
де n– кількість спостережень(обсяг вибірки); n=36;
lg n –десятковий логарифм числа n.
Отриманезначення К округляємо до цілого у велику сторону. Потім розраховуємо ширину групувальногоінтервалу h:
/>,
де />max– максимальне значення показника, що вивчається, у вибірці;Ymax=9948
/>min– мінімальне значення показника, що вивчається, у вибірці.Ymin=994
Значенняhтакожокругляємо до цілого у велику сторону.
h=/>=1279
Післяцього можемо встановити межі групувальних інтервалів:
· нижня межа першого групувальногоінтервалу
a1=Ymin;
a1=994;
· верхня межа першого групувальногоінтервалу
b1=a1+h;
b=969+1279=2273;
Межі наступнихінтервалів встановлюємо так: нижня межа чергового інтервалу приймається рівнійверхній межі попереднього інтервалу, а верхня межа дорівнює нижній плюс ширинагрупувального інтервалу. В результаті весь діапазон зміни значень змінноїрозбивається на 7 рівних по величині інтервалів.
Одночасно зівстановленням меж групувальних інтервалів задаємо умови віднесення спостереженьна інтервал. Їх задаємо у вигляді подвійної нерівності:
ak £Y
Відповідно доцієї умови на інтервал з номером k відносимо ті значення досліджуваної ознаки,які більше або рівні нижньої границі і менше верхньої границі.
Далі розподілимоодиниці вибіркової сукупності (підприємства) по інтервалах у залежності відвеличини результативної ознаки.
Таблиця 2.4 –Групування підприємств по величині валового доходу, тис. грн.
Номер інтервалу,
k Межі інтерва-лів
Частота
fk
Кумулятивна частота,
/>
Частка,
wk=fk/n
Кумулятивна
частка,
/> 1 994-2273 4 4 4/36=0,111 0,111 2 2273-3552 3 4+3=7 3/36=0,083 0,111+0,083=0,194 3 3552-4831 5 7+5=12 5/36=0,138 0,194+0,138=0,332 4 4831-6110 12 12+12=24 12/36=0,333 0,332+0,333=0,665 5 6110-7389 5 24+5=29 5/36=0,138 0,665+0,138=0,803 6 7389-8668 4 29+4=33 4/36=0,111 0,803+0,111=0,914 7 8668-9948 3 33+3=36 3/36=0,083 0,914+0,083=0,997 Разом - 36 - 1 -
Після рознесення даних доінтервалів, у табл. 4 підраховуємо частоту попадання спостережень доінтервалу(fk), розраховуємо частки(wk), кумулятивні частоти(Sf) та частки(Sw).
2.2.2 Групуванняз використанням нерівновеликих інтервалів
Групування знерівновеликими інтервалами застосовуються для опису статистичних данихрозподілу, що мають явну асиметрію, частот і часток. Ширину і межі цихінтервалів встановлюють на основі логічного аналізу попередніх відомостей проякісні і кількісні характеристики досліджуваного явища.
У курсовійроботі в якості одного з можливих рішень задачі групування підприємств зарозмірами валового доходу використовуємо досить просту формалізовану процедурурозділення підприємств на групи.
Ця процедуравиділення груп об'єктів з нерівними інтервалами досліджуваної ознаки така.Необхідно ранжирувати значення ознаки. Потім весь інтервал її можливих значень[964; 9964] розділити на два інтервали, відокремлюваних друг від друга середнімзначенням />ознаки/>.
Ymin= 994 />=5330.08 Ymax=9948
На першомуінтервалі [994; 5330.08] будутьрозташовані варіанти досліджуваної ознаки менше середнього значення />, надругому [5330.08;9964] – більше, ніжсереднє значення />.
У випадку асиметричногорозподілу точка, що відповідає середньому значенню ознаки />=5330.08,не ділитиме інтервал [994;9948]на рівні частини, а буде зміщена до якого-небудь з кінців інтервалу.
Вибираємо з двохінтервалів, розділених значенням середньої величини, інтервал найменшоїдовжини, для чого порівнюємо по модулю величини />=5330.08-994=4336.08і />=9948-5330.081=4617.92.
Довжинунайменшого з двох порівнюваних інтервалів поділяємо навпіл і отримане значення />додаємо досереднього />і вичитаємо з нього.
∆Y=4336.08/2=2168.04.
/>=5330.08-2168.04=3162.04;
/>=5411+2223,5=7498.12.
Одержуємокоординати двох точок (3162.04) і (7498.12), які відзначаємо на числовій осіваріаційного ряду вліво і вправо від середнього значення:/> /> /> /> /> /> />
/>/>/>/>/>/> Дрібні Середні Великі
994 3162.04 5330.08 7498.12 9948
В результатічислова вісь, що відповідає ранжированому варіаційному ряду досліджуваноїознаки, розділяється на три інтервали [994;3162,04], [3162.04;7498,12] і [7498,12;9948],довжини яких можуть бути інтерпретовані як величини, що відмежовують дрібні, середніі великі одиниці сукупності.
Післявстановлення меж інтервалів розробимо таблицю частот і часток та побудуємогістограму розподілу підприємств.
Таблиця 2.5 – Групуванняпідприємств за обсягом валового доходу, тис.грн.
Номер інтерва-лу,
K Межі інтервалів
Частота
fk
Кумулятивна частота,
/>
Частка,
wk=fk/n
Кумулятивна
частка,
/>/> 1 994-1122 1 1 0,03 0,03 2 1122-8802 32 33 0,89 0,92 3 8802-9948 3 36 0,08 1 Разом 36 1
/>
Рис. 2.1 — Гістограма розподілу значень Y
2.2.3 Розрахунокузагальнюючих характеристик і перевірка однорідності вибіркової сукупності
Наступний етапаналізу сукупності спостережень — розрахунок узагальнюючих характеристикдосліджуваної статистичної сукупності. Цей розрахунок можна виконати за незгрупованими або згрупованими даними (на підставі частотної таблиці). Більшточними є результати, отримані з використанням не згрупованих даних.
У курсовій роботірозрахунок зазначених показників описової статистики виконаємо для кожноїзмінної за не згрупованими даними. Для розрахунку використаємо формули, що приведенів табл. 2.6.
Таблиця 2.6 –Формули для розрахунку узагальнюючих показників вибіркових сукупностейУзагальнюючі показники Результативна змінна Y Факторні змінні Xi Середнє
/>
/> Середнє квадратич-не відхилення
/>
/> Коефіцієнт варіації
/>
/>
Примітка. 1)i-номерспостереження,i=1,2...,n;36
2)j- номер чинника, j=1,2,3,4,5
Таблиця 2.7 –Розрахунки узагальнюючих показників вибіркових сукупностейУзагальнюючі показники Результативна змінна Y Факторні змінні X1 Факторні змінні Х2 Факторні змінні Х3 Факторні змінні Х4 Факторні змінні Х5 Середнє 5330.08 3604.306 1293.528 1.467 2.723 3.996 Середнє квадратич-не відхилення 2234.139 1549.276 472.749 0,124 0,228 23,449 Коефіцієнт варіації, 42.984 36.547 35,326 8,453 8.373 586,812
Розрахуноквиконується на підставі вихідних даних, приведених у табл. 2.3. Проаналізувавшидані таблиці 2.3, можна зробити такі висновки:
Сукупності показників У, Х1, Х2 таХ5 не однорідні, оскільки їх коефіцієнти варіації більші ніж 33%. А сукупностіпоказників Х3 та Х4 являються однорідними, бо значення їх коефіцієнтів варіаціїзначно менше 33%.Отже, чим менше значення коефіцієнта варіації, тим одноріднішіоб'єкти досліджуваної сукупності і надійніше рішення, прийняті з використаннямописової статистики. Сукупність вважається однорідною, якщо />.
Подальший аналіз проводимо повибірці, що складається з 30 підприємств.
Формуємо новутаблицю вихідних даних.
Таблиця2.8 – Вихідні дані достатистичного дослідження (зменшена вибірка)Порядковий номер Значення змінних групи Підприєм-ства в групі Спостере-ження, і
Yi
Xi1
Хi2
Xi3
Xi4
Xi5 I 4 2248 1848 753 1,216 2,454 2,985 5 2325 1867 705 1,245 2,648 3,298 6 2514 1916 698 1,312 2,745 3,602 7 2651 1890 764 1,403 2,474 3,47 II 8 3780 2502 948 1,511 2,639 3,987 9 3840 2541 961 1,511 2,644 3,996 10 3878 2507 969 1,547 2,587 4,002 11 3905 2559 999 1,526 2,562 3,909 12 3980 2632 990 1,512 2,659 4,02 III 13 4835 3231 1184 1,496 2,729 4,084 14 4865 2847 1159 1,709 2,456 4,198 15 4819 3176 1066 1,517 2,979 4,521 16 4884 3374 1230 1,448 2,743 3,971 17 4911 3142 1187 1,563 2,647 4,137 18 4962 3175 1198 1,563 2,65 4,142 IV 19 5766 3802 1369 1,517 2,777 4,212 20 5837 3835 1379 1,522 2,781 4,233 21 5849 3890 1407 1,504 2,765 4,157 22 5858 3946 1415 1,485 2,789 4,14 23 5963 4045 1447 1,474 2,795 4,121 24 5999 3968 1422 1,512 2,79 4,219 V 25 6736 4702 1568 1,433 2,999 4,296 26 6820 4372 1585 1,56 2,758 4,303 27 6860 4498 1594 1,525 2,822 4,304 28 6894 4602 1627 1,498 2,829 4,237 29 6940 4550 1611 1,525 2,824 4,308 VI 30 7794 5104 1790 1,527 2,851 4,354 31 7784 5097 1787 1,527 2,852 4,356 32 7975 5015 1828 1,59 2,743 4,363 33 8050 5168 1814 1,558 2,849 4,438 Сума значень 159522 105801 38454 44,836 81,84 122,363 Середнє значення 5317,4 3526,7 1281,8 1,495 2,728 4,079
Розраховуємооптимальну кількість груп К з рівними інтервалами по формулі Стерджесса:
/>,
K=1+3,322*lg30=6.
Розрахуємоширину групувального інтервалу h:
h=/>=967.
Таблиця 2.9 –Групування підприємств по величині валового доходу, тис. грн.
Номер інтервалу,
k Межі інтервалів
Частота,
fk
Кумулятив-на частота,
/>
Частка,
wk=fk/n
Кумулятивна
частка,
/> 1 2248-3215 4 4 0,133 0.133 2 3215-4182 5 9 0,167 0.3 3 4182-5149 6 15 0,201 0.501 4 5149-6116 6 21 0,2 0.701 5 6116-7083 5 26 0,167 0.868 6 7083-8050 4 30 0,133 1 Разом - 30 - 1 -
Таблиця 2.10 –Розрахунки узагальнюючих показників вибіркових сукупностейУзагальнюючі показники Результативна змінна Y Факторні змінні X1 Факторні змінні Х2 Факторні змінні Х3 Факторні змінні Х4 Факторні змінні Х5 Середнє 5317,4 3526,7 1281,8 1,495 2,728 4,079 Середнє квадратич-не відхилення 1686.758 1043.374 340.578 0.095 0.133 0.334 Коефіцієнт варіації 31.721 29.585 26.57 6.355 4.875 8.188
2.3 Поширеннявибіркових результатів на генеральну сукупність. Оцінка достатності обсягувибірки
Кінцевою метою вибірковогоспостереження є характеристика генеральної сукупності. Враховуючи, що на основівибіркового обстеження не можна точно оцінити досліджуваний параметргенеральної сукупності, знайдемо межі, у яких він знаходиться. Для цьогонеобхідно з імовірністю 0,95 визначити граничну помилку /> вибіркової середньоїрезультативного показника (середнього доходу підприємств, що входять увибірку), і довірчі межі середнього доходу /> всіх підприємств генеральноїсукупності:
/>,
/>572.624
/>,
де n – обсяг вибірки;
N – обсяг генеральної сукупності.
Обсяг вибірки повинен бутидостатнім для отримання достовірних висновків про явище, що вивчається. Узв'язку з цим в курсовій роботі слід визначити, яким повинен бути обсяг вибіркидля проведення дослідження. З цією метою розраховуємо мінімальний обсягвибірки, необхідний для оцінки генеральної середньої результативного показниказ 5-процентною помилкою на рівні довірчої вірогідності 0,95. Розрахунок виконуємопо формулі для безповторної власно-випадкової вибірки:
/>,
/>= 102.0345
де t –коефіцієнт довіри, що відповідає рівню довірчої імовірності 0,95 (t=1,96);
/>– припустима граничнаабсолютна величина помилки оцінки генеральної середньої:
/>
/>265.87
В результатірозрахунків виявилося, що фактичний обсяг вибірки менше мінімального.Визначаємо фактичну величину помилки оцінки генеральної середньої. Для цьогоформулу, по якій проводили розрахунок мінімального обсягу вибірки,перетворюємо. А потім підставляємо фактичне значення обсягу вибірки, дисперсіїознаки і коефіцієнта довіри і знаходимо відповідне їм значення помилки оцінкигенеральної середньої.
/>
/> />
/>=11.332.
2.4 Аналіззакономірностей розподілу досліджуваних показників
З метою найбільшповного опису поводження досліджуваної ознаки в статистичних дослідженнях частопотрібно визначити закон її розподілу. У курсовій роботі зробимо це тільки длярезультативної перемінної.
Встатистиці для опису поведінки випадкових дискретних і безперервних величинвикористовуються різні закони розподілу. Нормальний закон використовується дляопису розподілу випадкових безперервних величин.
Досліджувана результативна змінна єнеперервною величиною, тому що обсяг доходу підприємства не може бутипредставлений кінцевим набором чисел координатної осі. Дохід, теоретично, можеприймати будь-яке значення від 0 до нескінченно великого числа, однак напрактиці він обмежений через обмеженість ресурсів. Як показала практика,більшість явищ і подій у реальному житті можна звести до нормального закону ійого модифікацій, тому саме цьому закону приділяється велика увага в теоріїймовірностей і статистиці. Нормальність розподілу характерна для збалансованихоб'єктів, що не мають різких переходів і розходжень. Тому бажано, щоб результативнийпоказник мав розподіл, близький до нормального.
Для перевірки гіпотези пронормальність розподілу результативного показника по даним вибірки будуємогістограму та полігон розподілу емпіричних значень.
/>
Рис. 2.2 — Гістограма розподілуемпіричних значень
Розраховуємо моду та медіану поданим вибірки за формулами:
/>,
де /> – нижня межа модальногоінтервалу;
/>– величина модального інтервалу;
/> – частоти відповідно впопередньому і наступним за модальним інтервалах.
/>
Графічно моду визначають погістограмі. Для цього виберемо найвищий прямокутник, який і є модальним. Даліправу верхню вершину прямокутника, що передує модальному (частота fMо-1),з'єднуємо із правою верхньою вершиною модального прямокутника (частота fMо),а ліву верхню вершину цьогопрямокутника – з лівою верхньою вершиною прямокутника, наступного за модальним(частота fMо+1). З точки перетинання опускаємо перпендикуляр нагоризонтальну вісь. Основа перпендикуляра покаже значення моди Мо.
При обчисленнімедіани спочатку знаходимо інтервал, що містить медіану. Медіанним є інтервал,накопичена частота якого дорівнює чи перевищує половину всього обсягусукупності.
/>,
де /> – нижня межамедіанного інтервалу;
/> – ширина медіанногоінтервалу;
/> – накопичена частотаінтервалу, передуючого медіанному;
/> – частота медіанного інтервалу.
/>
/>
Рис. 2.3 Графічне визначеннямедіани
Графічно медіана визначаємопо кумуляті. Останню ординату кумуляти, рівну сумі всіх частот або часток,ділимо навпіл. З отриманої точки проводимо перпендикуляр до кумуляти. Абсциса точкиперетинання і дає значення медіани.
Співвідношенняммоди, медіани і середньої арифметичної користаються для розпізнаваннясиметричності варіації. Необхідною, але недостатньою умовою симетричності єрівність трьох характеристик: />=Ме=Mо. У рядах із правосторонньоюасиметрією />>Ме>Мо,з лівосторонньою асиметрією />
Як показникиформоутворення застосовуються:
— коефіцієнтасиметрії Пирсона
/>
/>0,39
(якщо Ка>0, то скошеність правобічна,якщо Ка
Скошеність правобічна,оскільки Ка = 0,438.
— ексцес
/>
/>
(якщо Ех=0, то розподілблизький до нормального, якщо Ех>0, розподіл гостровершинний, Ех
Порядок розрахунку теоретичнихчастот кривої нормального розподілу:
1) визначити середини інтервалів />;
2) знайти нормоване відхиленнякожної варіанти результативного показника від його середньої арифметичний: />;
3) по таблиці розподілу функції /> (додатокБ) визначити її значення;
4) обчислити теоретичні частоти поформулі: />,
5) побудувати і порівняти графікиемпіричних (полігон) і теоретичних частот.
Таблиця 11 — Розрахуноктеоретичних частот кривої нормального розподілуМежі інтервалів fk Yk
/> tk
/>
/>/>
/>
/> 2248-3215 4 2731,5 -2585,9 -1,53 0,1257 2,16 1,84 3,39 1,57 3215-4182 4 3698,5 -1618,9 -0,96 0,2613 4,49 -0,49 0,24 0,05 4128-5149 6 4638,5 -678,9 -0,4 0,3653 6,28 -0,28 0,08 0,01 5149-6116 6 5632,5 315,1 0,19 0,3894 6,7 -0,7 0,49 0,07 6116-7083 6 6599,5 1282,1 0,76 0,285 13,07 -7,07 49,98 3,82 7083-8050 4 7566,5 2249,1 1,33 0,1669 22,87 -18,87 356,08 15,57 Разом 30 - - - - 55.57 - - 21.09
Будуємо графік співставлення дляпорівняння емпіричних та теоретичних частот.
/>
Рис.2.4Графік теоретичних і емпіричних частот
Сума теоретичних і емпіричнихчастот повинна бути рівною, але може не збігатися через округлення врозрахунках.
Для перевірки гіпотезипро близькість емпіричного і теоретичного розподілів розрахуємо критерій згодиПирсона /> іпорівняємо його з табличним значенням />, яке визначають для рівня значущості/> і числаступенів свободи df = k-3 по додатку В. Якщо />, то з імовірністю 95% можнастверджувати, що в основі емпіричного розподілу підприємств по величинівалового доходу лежить закон нормального розподілу, а розбіжності міжтеоретичнимий емпіричними частотами пояснюються випадковими факторами.
/>3,09
/> = 7,81.
Отже, в основіемпіричного розподілу підприємств по величині валового доходу лежить законнормального розподілу, а розбіжності між теоретичними й емпіричними частотамипояснюються випадковими факторами.
Так як коефіцієнти варіації ≤33% та результативний показник розподіляється згідно з законом нормальногорозподілу, то можна сказати, що вибіркова сукупність, що вивчається, майжеоднорідна.
3 ПАРНИЙКОРЕЛЯЦІЙНО-РЕГРЕСІЙНИЙ АНАЛІЗ ЗАЛЕЖНОСТЕЙ
3.1 Кореляційнийаналіз парних зв'язків />
Кореляційнийаналіз проводиться з метою виявлення наявності зв'язку між результативною іфакторної змінними й оцінки його сили й істотності. Якщо факторних зміннихдекілька (у загальному випадку m), то проводять аналіз залежностірезультативної змінної Y від кожної факторної перемінної:
/> ,j=1, 2, …, m
Таким чином, намнеобхідно провести кореляційний аналіз залежності валового доходу підприємствавід середньорічної вартості основних фондів />, середньосписковоїчисельності працюючих />, фондовіддачі />, фондоозброєності/> івід продуктивності праці />.
Для виявленнянаявності залежності однієї змінної від іншої побудуємо кореляційні поля ірозрахуємо коефіцієнти лінійної кореляції />. Використовуємо такі формули:
/>
(j=1,2,3,4,5)
де />; />; />
Розрахуноксередніх для добутків і середніх для квадратів значень досліджуваних зміннихнаводимо в табл. 3.1.