Министерствообразования и науки Украины
Севастопольскийнациональный технический университет
ФакультетЭкономики и менеджмента
Кафедраменеджмента и экономико — математических методов
Отчёт полабораторной работе №4
Подисциплине: «Прикладная статистика»
На тему:«Однофакторный регрессионный анализ при помощи системы GRETL»
Вариант 1
Целью данной работыявляется научиться применять теоретические знания по теме «Одномерныйрегрессионный анализ» при решении экономических задач с помощью системы GRETL.
Задание 1
Компания «Лагуна»,которая обеспечивает стеклянными бутылками множество изготовителейбезалкогольных напитков, обладает следующей информацией, относящейся к числуящиков при одной отгрузке и соответствующим транспортным затратам (см. Таблицу1).
Таблица 1 ? Данныек заданию 1Число ящиков на отгрузку Транспортные затраты в гривнах Вар 3
150 6532
220 9771
350 15227
430 17575
580 23998
650 27800
730 29466
820 35447
850 34420
980 42188
Проведите анализ затрат взависимости от числа ящиков к разгрузке. Представьте экономическое обоснованиерезультатов регрессионного анализа. Спрогнозируйте сумму затрат при ростеотгрузки до 1000 ящиков.
Решение:
Допустим, чтотранспортные затраты зависят от числа ящиков на отгрузку. Для проверки этогопостроим график зависимости и рассчитаем коэффициент корреляции, составивкорелляционную матрицу.
Далее построимрегрессионные модели вида:/>и />, где /> – число ящиков (шт.),/>– транспортныезатраты (грн).
Наши данные в системеgretl:
1. Построим сначаларегрессионную модель вида />
В зависимую переменнуювыбираем cost_var3, в независимую оставляем const и добавляем num_y.
Уравнение регрессии вданном случае: y = 192,181+41,7539x1
Так как р-значение(вероятность ошибки) меньше 0,05, то принимается альтернативная гипотеза, икоэффициент регрессии значим, то есть число ящиков существенно отражается натранспортные затраты.
Сумма квадратов ошибок истандартная ошибка регрессии отражают степень разброса фактических значений отрасчетных, полученных по модели, то есть чем меньше сумма квадратов ошибок истандартная ошибка регрессии, тем точнее модель.
В нашем случае, модель несовершенно точно отражает.
Так как вычисленноезначение p
Построим графикфактических данных и расчетных в окне model через путь: графики – fitted,actualplot – в зависимости от num_y.
График показывает, чтотранспортные затраты возрастают с увеличением числа ящиков к разгрузке.
2. Построим регрессионнуюмодель вида/>аналогичным путем:
Стандартная ошибкарегрессии достаточно высока в сравнении со средним значением зависимойпеременной.
Коэффициент детерминации99% выше, чем у 1 модели, что свидетельствует о высокой степени соответствияпостроений модели исходными данными.
На основе регрессионногоанализа 2 модели вида y = 42,0288x при уровне значимости в 5% принимаемальтернативную гипотезу о существенном влиянии числа ящиков на транспортныезатраты.
Для выбора моделисоставим таблицу статистических оценок уравнения регрессии и сравним критериикачества регрессионного уравнения и в первом и во втором случае:
Таблица 2 –
Статистические оценкирегрессионных моделей
/>
/> Значимость коэффициентов по критерию Стъюдента значим значимы Адекватность регрессионного уравнения по критерию Фишера адекватно адекватно Стандартная ошибка регрессии 840,721 887,157 Коэффициент детерминации 0,99911 0,99429 Log-likelihood -81,0052 -80,9539 AIC 164,01 165,908 BIC 164,313 166,513 HQC 163,678 165,244
Анализируя характеристикидвух моделей, можно прийти к выводу о том, что в первой модели коэффициентдетерминации выше, более того, в этой модели меньше ошибка и лучше показателикачества регрессионного уравнения. Следовательно, более точной является перваямодель. Таким образом, модель зависимости транспортных затрат от числа ящиковбудет иметь вид: y = 42,0288x
Уравнение регрессиипоказывает, что если число ящиков увеличивать, то соответственно транспортныезатраты возрастут.
Задание 2
Компания «Фаворит»продает компьютерные программы. Ее отдел маркетинга получил данные (количествопрограмм, цены программ, средний доход потребителей, приобретающих такой товар)из филиалов компании, расположенных по территории области). Проведите анализспроса на продукцию фирмы. Подберите наилучшую модель, описывающую зависимостьспроса от цены или дохода (линейную, квадратичную, кубическую). Представьтеэкономическое обоснование результатов регрессионного анализа.
Таблица 2 – Данные дляанализа к заданию 2Количество Доход, грн Вариант 5 311 388 250 391 209 394 323 388 253 398 520 479 109 353 381 438 329 415 253 392 420 437 321 394 250 382 174 385 156 367 305 380 450 465 411 419 364 416 339 390 269 377 114 341 318 403 256 380 291 386 377 402 388 419 484 457 364 434 380 435
Решение:
Сначала проведем оценкурегрессионного уравнения вида
График показывает, чтоспрос на компьютеры возрастает с увеличением дохода потребителей. Коэффициенткорреляции между данными составляет 0,91, что говорит о сильной положительнойсвязи между переменными.
Далее построимрегрессионные модели вида:
/> и />, где /> – средний доход потребителей(грн), /> –продажа компьютеров (шт.)
Оценка регрессионногоуравнения вида />
Регрессионное уравнениебудет иметь вид: y = 0.79x, где х - средний доход потребителей, у – спрос накомпьютеры.
При уровне значимости5%принимается альтернативная гипотеза о значимости коэффициентов регрессионногоуравнения (р
Стандартная ошибкарегрессии – 78,95, что является достаточно высоким результатом по сравнению сосредним значением зависимой переменной – 312,3.
Коэффициент детерминации94% свидетельствует о том, что степень соответствия построенной модели исходнымданным высока.
На основе результатовдисперсионного анализа можно принять альтернативную гипотезу, т.е. можно утверждать,что уравнение регрессии адекватно отражает зависимость между переменными.
Теперь проведем оценкурегрессионного уравнения вида: />
Регрессионное уравнениеимеет вид: у = -846,609+2,87х.
Средняя ошибка регрессииниже, чем в предыдущем случае и составляет 43,46.
При уровне значимости 5%принимается альтернативная гипотеза о значимости коэффициентов регрессионногоуравнения (р
Коэффициент детерминации82% говорит о более низкой степени соответствии построенной модели исходнымданным в отличие от предыдущей.
На основе дисперсионногоанализа при уровне значимости в 5% можно принять альтернативную гипотезу, тоесть можно утверждать, что уравнение регрессии адекватно отражает зависимостьмежду переменными.
Для выбора моделисоставим таблицу статистических оценок уравнения регрессии и сравним критериикачества регрессионного уравнения в первом и во втором случае.
/>
/> Значимость коэффициентов по критерию Стъюдента значим значимы Адекватность регрессионного уравнения по критерию Фишера адекватно адекватно Стандартная ошибка регрессии 78,95 43,46 Коэффициент детерминации 94% 82% Log-likelihood -173,124 -154,961 AIC 348,249 313,382 BIC 349,65 316,185 HQC 348,697 314,279
Анализируя характеристикидвух моделей можно прийти к выводу о том, что в второй модели меньше ошибка илучше показатели качества регрессионного уравнения. Следовательно, более точнойявляется вторая модель.
Таким образом, модельзависимости спроса на компьютеры от среднего дохода потребителей будет иметьвид: у = -846,609+2,87х.
В случае, если неучитывать во внимание средний уровень дохода потребителей, то спрос накомпьютеры будет находиться на отметке — 847 единиц. Уравнение регрессиипоказывает, что если средний доход возрастет на 1 грн, то это приведет кувеличению спроса на 2,87 штук.
Задание 3
Менеджер торговогопредприятия, занимающегося реализацией продуктов питания, имеет следующиеданные о ежеквартальной оборачиваемости оборотных средств и уровнерентабельности. Проанализируйте эти данные и составьте регрессионную модельзависимости рентабельности от оборачиваемости оборотных средств.
Таблица 3 –
Исходные данные квыполнению задания 3.квартал 1 2 3 4 5 6 7 8 Вариант 1 Число оборотов 5,49 4,68 4,67 4,54 4,56 6,02 5,72 5,43 Уровень рентабельности, % 0,78 0,38 0,21 0,51 0,95 1,05 0,83 0,98
Решение:
Пусть уровень рентабельностизависит от оборачиваемости оборотных средств. Для проверки этого предположенияпостроим график и рассчитаем коэффициент корреляции.
Ниже представлен графикзависимости уровня рентабельности от оборачиваемости оборотных средств.
Коэффициент корреляциимежду данными составляет 0,66, что говорит о средней положительной связи междупеременными.
Далее построимрегрессионные модели вида: /> и />, где /> – число оборотов (раз), /> – уровень рентабельности(%).
Сначала построим модельвида />
Регрессионное уравнениебудет иметь вид: у = 0,14х, где х – число оборотов оборотных средств в квартал,у – уровень рентабельности.
При уровне значимости в5% принимается гипотеза о значимости коэффициентов регрессионного анализа(p
Стандартная ошибкарегрессии — 0,261225, что является высоким результатом по сравнению со среднимзначением зависимой переменной – 0,71125.
Коэффициент детерминации90% свидетельствует о высоко степени соответствия построенной модели исходнымданным.
На основе результатовдисперсионного анализа при уровне значимости в 5% можно принять альтернативнуюгипотезу, т.е. можно утверждать, что уравнение регрессии адекватно отражаетзависимость между переменными.
Проведем оценкурегрессионного уравнения вида: />
Результаты представленыниже. Из полученных данных видно, что регрессионное уравнение имеет вид: у = -1,05+0,34х
Средняя ошибка регрессииниже, чем в предыдущем случае и она составляет 0,2505.
При уровне значимости в5% принимается гипотеза о не значимости коэффициентов регрессионного уравнения(p >0,05)
Коэффициент детерминацииговорит о более низкой степени соответствия построенной модели исходным даннымв отличие от предыдущей, причем намного, составляет 33%.
На основе результатовдисперсионного анализа при уровне значимости в 5% можно принять нулевуюгипотезу, т.е. можно утверждать, что уравнение регрессии неадекватно отражаетзависимость между переменными.
Для выбора моделисоставим следующую таблицу:
/>
/> Значимость коэффициентов по критерию Стъюдента значим незначимы Адекватность регрессионного уравнения по критерию Фишера адекватно неадекватно Стандартная ошибка регрессии 0,261225 0,250463 Коэффициент детерминации 89% 34% Log-likelihood -0,0784 0,87 AIC 2,15679 2,25047 BIC 2,23623 2,40935 HQC 1,62099 1,17887
Анализируя характеристикидвух моделей можно прийти к выводу о том, что в второй модели меньше ошибка, нов первой лучше показатели качества регрессионного уравнения, более того, втораямодель неадекватна, т.е. не соответствует исходным данным и оценкам, полученнымпри помощи регрессионного анализа и регрессионная модель отражает анализируемыеданные не точно. Следовательно, более точной является первая модель.
Таким образом, модельзависимости уровня рентабельности от числа оборотов оборачиваемых средств вквартал будет иметь вид: у = 0,14х.
Задание 4
По статистическим данным,описывающим зависимость уровня рентабельности на предприятии от удельного весапродовольственных товаров в товарообороте построить уравнение регрессии.
Таблица 4 –
Исходные данные к заданию4квартал 1 2 3 4 5 6 7 8 Вариант 1 Удельный вес продовольственных товаров в товарообороте, %. 10 12 13 14 12 11 13 15 Уровень рентабельности, % 15 16 18 19 15 14 17 20
Решение
Результат расчетакоэффициента корреляции между данными
Коэффициент корреляциисоставляет 0,92, что говорит о высокой положительной зависимости междупеременными
Построим уравнениярегрессии вида: /> и />, где /> – удельный вес прод.товаров втоварообороте (%),/>– уровень рентабельности (%).
1. />
Таким образом, порезультатам регрессионного анализа, регрессионное уравнение будет иметь вид: у= 1,34х, где х – удельный вес продовольственных товаров в товарообороте (%), у– уровень рентабельности (%)
2. />
В этом случаерегрессионное уравнение будет иметь вид: у = 1,47 + 1,22х.
Проведём дисперсионныйанализ
На основе результатовдисперсионного анализа при уровне значимости в 5% можно принять альтернативнуюгипотезу, т.е. можно утверждать, что уравнение регрессии адекватно отражаетзависимость между переменными.
Для выбора моделисоставим следующую таблицу:
/>
/> Значимость коэффициентов по критерию Стъюдента значим незначимы Адекватность регрессионного уравнения по критерию Фишера адекватно неадекватно Стандартная ошибка регрессии 0,833003 0,876652 Коэффициент детерминации 99% 83% Log-likelihood -9,35 -9,15 AIC 20,7113 22,2952 BIC 20,7907 22,4541 HQC 20,1755 21,2236
Анализируя характеристикидвух моделей можно прийти к выводу о том, что в первой модели меньше ошибка илучше показатели качества регрессионного уравнения, более того, вторая модельнеадекватна, т.е. не соответствует исходным данным и оценкам, полученным припомощи регрессионного анализа и регрессионная модель отражает анализируемыеданные не точно. Следовательно, более точной является первая модель.
Таким образом, модельзависимости уровня рентабельности от числа оборотов оборачиваемых средств в кварталбудет иметь вид: у = 1,34х.