МИНИСТЕРСТВОСЕЛЬСКОГО ХОЗЯЙСТВА И ПРОДОВОЛЬСТВИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
БЕЛОРУССКИЙГОСУДАРСТВЕННЫЙ АГРАРНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Контрольнаяработа по предмету
Статистика
Подготовила студентка
3-го курса ФПУ 71зэи
№ зачетной книжки 507039
Боровик МаринаАлександровна
Проверил______________________
Отметка озачете________________
«___»__________2008г.__________
Минск 2009
Задание 1.Статистические гипотезы и методы их проверки
Статистическаягипотеза представляетсобой некоторое предположение о законе распределения случайной величины или опараметрах этого закона, формулируемое на основе выборки [3, 5, 11]. Примерамистатистических гипотез являются предположения: генеральная совокупностьраспределена по экспоненциальному закону; математические ожидания двухэкспоненциально распределенных выборок равны друг другу. В первой из нихвысказано предположение о виде закона распределения, а во второй – о параметрахдвух распределений. Гипотезы, в основе которых нет никаких допущений оконкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими.
Гипотезу, утверждающую, что различиемежду сравниваемыми характеристиками отсутствует, а наблюдаемые отклоненияобъясняются лишь случайными колебаниями в выборках, на основании которыхпроизводится сравнение, называют нулевой (основной)гипотезой и обозначают Н0.Наряду с основной гипотезой рассматривают и альтернативную(конкурирующую, противоречащую) ей гипотезу Н1. И если нулеваягипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
Различают простые и сложные гипотезы.Гипотезу называют простой, еслиона однозначно характеризует параметр распределения случайной величины.Например, если l является параметромэкспоненциального распределения, то гипотеза Н0о равенстве l=10– простая гипотеза. Сложной называютгипотезу, которая состоит из конечного или бесконечного множества простыхгипотез. Сложная гипотезаН0о неравенстве l>10состоит из бесконечного множества простых гипотезН0 о равенстве l=bi, где bi– любое число, большее 10. ГипотезаН0 о том, чтоматематическое ожидание нормального распределения равно двум при неизвестнойдисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределениислучайной величины Х понормальному закону, если не фиксируются конкретные значения математическогоожидания и дисперсии.
Проверка гипотезы основывается навычислении некоторой случайной величины – критерия, точное или приближенноераспределение которого известно. Обозначим эту величину через z, ее значение является функцией отэлементов выборки z=z(x1, x2, …, xn). Процедурапроверки гипотезы предписывает каждому значению критерия одно из двух решений –принять или отвергнуть гипотезу. Тем самым все выборочное пространство исоответственно множество значений критерия делятся на два непересекающихсяподмножества S0и S1. Если значениекритерия z попадает в областьS0, то гипотезапринимается, а если в область S1,то гипотеза отклоняется. МножествоS0называется областью принятия гипотезы илиобластью допустимых значений, а множество S1 – областью отклонения гипотезы или критической областью.Выбор одной области однозначно определяет и другую область.
Принятие или отклонение гипотезы Н0 по случайной выборкесоответствует истине с некоторой вероятностью и, соответственно, возможны дварода ошибок. Ошибка первого рода возникает с вероятностью aтогда, когда отвергается верная гипотезаН0и принимается конкурирующая гипотеза Н1.Ошибка второго рода возникает с вероятностью b в томслучае, когда принимается неверная гипотезаН0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность – этовероятность не совершить ошибку первого рода и принять верную гипотезуН0. Вероятностьотвергнуть ложную гипотезуН0называется мощностью критерия.Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 1.1.
Таблица 1.1.
Гипотеза Н0 Решение Вероятность Примечание Верна Принимается 1 — a Доверительная вероятность Отвергается a Вероятность ошибки первого рода Неверна Принимается b Вероятность ошибки второго рода Отвергается 1 — b Мощность критерия
Например, когда некоторая несмещеннаяоценка параметра q вычислена по выборке объема n, и эта оценка имеет плотность распределения f(q), рис. 1.1.
/>
Рис. 1.1. Области принятия иотклонения гипотезы
Предположим, что истинное значениеоцениваемого параметра равно Т.Если рассматривать гипотезу Н0о равенстве q=Т,то насколько велико должно быть различие между q и Т, чтобы эту гипотезу отвергнуть.Ответить на данный вопрос можно в статистическом смысле, рассматриваявероятность достижения некоторой заданной разности между qи Т на основе выборочногораспределения параметра q.
Целесообразно полагать одинаковымизначения вероятности выхода параметра q за нижний иверхний пределы интервала. Такое допущение во многих случаях позволяетминимизировать доверительный интервал, т.е. повысить мощность критерияпроверки. Суммарная вероятность выхода параметра q запределы интервала с границами q1–a/2 и qa/2, составляет величину a. Этувеличину следует выбрать настолько малой, чтобы выход за пределы интервала былмаловероятен. Если оценка параметра попала в заданный интервал, то в такомслучае нет оснований подвергать сомнению проверяемую гипотезу, следовательно,гипотезу равенства q=Т можно принять. Но если после получения выборки окажется,что оценка выходит за установленные пределы, то в этом случае есть серьезныеоснования отвергнуть гипотезу Н0.Отсюда следует, что вероятность допустить ошибку первого рода равна a (равна уровню значимости критерия).
Если предположить, например, чтоистинное значение параметра в действительности равно Т+d ,то согласно гипотезе Н0о равенстве q=Т –вероятность того, что оценка параметра q попадет вобласть принятия гипотезы, составит b, рис. 1.2.
/>
Рис.1.2. Области принятия иотклонения гипотезы
При заданном объеме выборкивероятность совершения ошибки первого рода можно уменьшить, снижая уровеньзначимости a. Однако при этом увеличиваетсявероятность ошибки второго рода b (снижается мощностькритерия). Аналогичные рассуждения можно провести для случая, когда истинноезначение параметра равно Т–d.
Единственный способ уменьшить обевероятности состоит в увеличении объема выборки (плотность распределения оценкипараметра при этом становится более «узкой»). При выборе критическойобласти руководствуются правилом Неймана – Пирсона: следует так выбиратькритическую область, чтобы вероятность a была мала,если гипотеза верна, и велика в противном случае. Однако выбор конкретногозначения a относительно произволен. Употребительныезначения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетовсоставлены таблицы интервалов с границами q1–a/2и qa/2 для типовых значений a и различных способов построения критерия.
При выборе уровня значимостинеобходимо учитывать мощность критерия при альтернативной гипотезе. Иногдабольшая мощность критерия оказывается существеннее малого уровня значимости, иего значение выбирают относительно большим, например 0,2. Такой выбор оправдан,если последствия ошибок второго рода более существенны, чем ошибок первогорода. Например, если отвергнуто правильное решение «продолжить работупользователей с текущими паролями», то ошибка первого рода приведет кнекоторой задержке в нормальном функционировании системы, связанной со сменойпаролей. Если же принято решения не менять пароли, несмотря на опасностьнесанкционированного доступа посторонних лиц к информации, то эта ошибкаповлечет более серьезные последствия.
В зависимости от сущности проверяемойгипотезы и используемых мер расхождения оценки характеристики от еетеоретического значения применяют различные критерии. К числу наиболее частоприменяемых критериев для проверки гипотез о законах распределения относяткритерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значенияхпараметров – критерии Фишера, Стьюдента.
/>При проверке гипотез широкоеприменение находит ряд теоретических законов распределения. Наиболее важным изних является нормальное распределение. С ним связаны распределения хи-квадрат,Стьюдента, Фишера, а также интеграл вероятностей. Для указанных законов функциираспределения аналитически не представимы. Значения функций определяются потаблицам или с использованием стандартных процедур пакетов прикладных программ.Указанные таблицы обычно построены в целях удобства проверки статистическихгипотез в ущерб теории распределений – они содержат не значения функцийраспределения, а критические значения аргумента z(a).
Для односторонней критической областиz(a)=z1–a, т.е. критическое значение аргумента z(a)соответствует квантили z1–a уровня 1–a, рис 1.3, так как
/>.
/>
Рис. 1.3. Односторонняя критическаяобласть
Для двусторонней критической области,с уровнем значимости a, размер левой области a2, правой a1(a1+a2=a), рис. 1.4. Значения z(a2)и z(a1)связаны с квантилями распределения соотношениями
z(a1)= z1–a1,z(a2)=za2,
так как
/>,
/>
Для симметричной функции плотностираспределения f(z) критическую область выбирают изусловия a1=a2=a/2 (обеспечивается наибольшая мощность критерия). В такомслучае левая и правая границы будут равны |z(a/2)|.
/>
Рис. 1.4. Двусторонняя критическаяобласть
Нормальноераспределение
Этот вид распределения являетсянаиболее важным в связи с центральной предельной теоремой теории вероятностей:распределение суммы независимых случайных величин стремится к нормальному сувеличением их количества при произвольном законе распределения отдельныхслагаемых, если слагаемые обладают конечной дисперсией. Кроме того, А.М.Ляпунов доказал, что распределение параметра стремится к нормальному, если напараметр оказывает влияние большое количество факторов и ни один из них неявляется превалирующим. Функция плотности нормального распределения
/>
– унимодальная, симметричная, аргументх может принимать любыедействительные значения, рис. 1.5.
/>
Рис. 1.5. Плотность нормальногораспределения
Функция плотности нормальногораспределения стандартизованной величины u имеетвид
/>.
Вычисление значений функциираспределения Ф(u) длястандартизованного неотрицательного аргумента u(u>=0) можнопроизвести с помощью полинома наилучшего приближения [9, стр. 694]
Ф(u)=1– 0,5(1 + 0,196854u + 0,115194u2 + 0,000344u3 + 0,019527u4) – 4
Такая аппроксимация обеспечиваетабсолютную ошибку не более 0,00025. Для вычисления Ф(u) в области отрицательных значенийстандартизованного аргумента u (u
Ф(u)= 1 – Ф(– u).
Иногда в справочниках вместо значенийфункции Ф(u) приводят значения интеграла вероятностей (для u>0)
/>, u > 0
Интеграл вероятностей связан сфункцией нормального распределения стандартизованной величины u соотношением
Ф(u)= 0,5 + F(u).
Распределениехи-квадрат
Распределению хи-квадрат (c2-распределению) с k степенями свободы соответствуетраспределение суммы
/>
квадратов n стандартизованныхслучайных величин ui, каждая изкоторых распределена по нормальному закону, причем k из них независимы, n>=k.Функция плотности распределения хи-квадрат с kстепенями свободы
/>, x >= 0,
где х=c2,Г(k/2) – гамма-функция.
Число степеней свободы k определяет количество независимыхслагаемых в выражении для c2. Функцияплотности при k, равном одномуили двум, – монотонная, а при k>2– унимодальная, несимметричная, рис. 1.6.
/>
Рис. 1.6. Плотность распределенияхи-квадрат
Математическое ожидание и дисперсиявеличины c2 равны соответственно k и 2k. Распределение хи-квадрат является частным случаем более общегогамма-распределения, а величина, равная корню квадратному из хи-квадрат с двумястепенями свободы, подчиняется распределению Рэлея.
С увеличением числа степеней свободы(k>30) распределениехи-квадрат приближается к нормальному распределению с математическим ожиданием k и дисперсией 2k. В таких случаях критическое значение
c2(k; a) » u1–a(k, 2k),
где u1–a(k, 2k) – квантильнормального распределения. Погрешность аппроксимации не превышает несколькихпроцентов.
РаспределениеСтьюдента
Распределение Стьюдента (t-распределение, предложено в 1908 г. английским статистиком В. Госсетом, публиковавшим научные труды под псевдонимом Student)характеризует распределение случайной величины
/>
где u0, u1, …, ukвзаимно независимые нормальнораспределенные случайные величины с нулевым средним и конечной дисперсией.Аргумент t не зависит отдисперсии слагаемых. Функция плотности распределения Стьюдента
статистический гипотеза математический ожидание
/>
Величина k характеризует количество степеней свободы. Плотностьраспределения – унимодальная и симметричная функция, похожая на нормальноераспределение, рис. 1.7.
/>
Рис. 1.7. Плотность распределенияСтьюдента
Область изменения аргумента t от минус до плюс бесконечности.Математическое ожидание и дисперсия равны 0 и k/(k–2) соответственно, при k>2. По сравнению с нормальным распределениеСтьюдента более пологое, оно имеет меньшую дисперсию. Это отличие заметно принебольших значениях k, чтоследует учитывать при проверке статистических гипотез (критические значенияаргумента распределения Стьюдента превышают аналогичные показатели нормальногораспределения). Таблицы распределения содержат значения для односторонней(пределы интегрирования от r(k; a ) до бесконечности)
/>
или двусторонней (пределы интегрирования от – r(k; a) до r(k; a))
/>
критической области.
Распределение Стьюдента применяетсядля описания ошибок выборки при kk, превышающем 100, данноераспределение практически соответствует нормальному, для значений k из диапазона от 30 до 100 различиямежду распределением Стьюдента и нормальным распределением составляют несколькопроцентов. Поэтому относительно оценки ошибок малыми считаются выборки объемомне более 30 единиц, большими – объемом более 100 единиц. При аппроксимациираспределения Стьюдента нормальным распределением для односторонней критическойобласти вероятность
Р{t>t(k;a)} = u1–a(0,k /(k–2)),
где u1–a(0, k/(k–2))– квантиль нормального распределения. Аналогичное соотношение можно составить идля двусторонней критической области.
РаспределениеФишера
Распределению Р.А. Фишера (F-распределению Фишера – Снедекора)подчиняется случайная величина
х=[(y1/k1)/(y2/k2)],
равная отношению двух случайных величин у1и у2, имеющиххи-квадрат распределение с k1и k2 степенямисвободы. Область изменения аргумента х от0 до бесконечности. Плотность распределения
/>.
В этом выражении k1 обозначаетчисло степеней свободы величины y1с большей дисперсией, k2– число степеней свободы величины y2с меньшей дисперсией. Плотность распределения – унимодальная, несимметричная,рис. 1.8.
/>
Рис. 1.8. Плотность распределенияФишера
Математическое ожидание случайнойвеличины х
m1 = k2/(k2–2) при k2>2,
дисперсия
т2 = [2k22(k1 + k2 –2)]/[k1(k2 –2)2(k2–4)] при k 2 > 4.
При k1>30и k2>30 величинах распределена приближеннонормально:
с центром распределения (k1–k2)/(2k1k2) и дисперсией(k1+k2)/(2k1k2).
/>Проверка гипотез озаконе распределения
Обычно сущность проверки гипотезы озаконе распределения ЭД заключается в следующем. Имеется выборка ЭДфиксированного объема, выбран или известен вид закона распределения генеральнойсовокупности. Необходимо оценить по этой выборке параметры закона, определитьстепень согласованности ЭД и выбранного закона распределения, в которомпараметры заменены их оценками. Пока не будем касаться способов нахожденияоценок параметров распределения, а рассмотрим только вопрос проверкисогласованности распределений с использованием наиболее употребительныхкритериев.
Критерий хи-квадрат К. Пирсона
Использование этого критерия основанона применении такой меры (статистики) расхождения между теоретическим F(x)и эмпирическим распределением Fп(x), которая приближенно подчиняетсязакону распределения c2. Гипотеза Н0 осогласованности распределений проверяется путем анализа распределения этойстатистики. Применение критерия требует построения статистического ряда.
Итак, пусть выборка представленастатистическим рядом с количеством разрядов y.Наблюдаемая частота попаданий в i-йразряд ni. В соответствиис теоретическим законом распределения ожидаемая частота попаданий в i-й разряд составляет Fi. Разностьмежду наблюдаемой и ожидаемой частотой составит величину (ni–Fi). Длянахождения общей степени расхождения между F(x) и Fп(x) необходимо подсчитать взвешенную суммуквадратов разностей по всем разрядам статистического ряда
/>.
Величина c2при неограниченном увеличении n имеетраспределение хи-квадрат (асимптотически распределена как хи-квадрат). Этораспределение зависит от числа степеней свободы k, т.е. количества независимых значений слагаемых ввыражении (3.7). Число степеней свободы равно числу y минус число линейныхсвязей, наложенных на выборку. Одна связь существует в силу того, что любаячастота может быть вычислена по совокупности частот в оставшихся y–1 разрядах. Кроме того, если параметры распределениянеизвестны заранее, то имеется еще одно ограничение, обусловленное подгонкойраспределения к выборке. Если по выборке определяются f параметровраспределения, то число степеней свободы составит k=y–f–1.
Очевидно, что чем меньше расхождениемежду теоретическими и эмпирическими частотами, тем меньше величина критерия.Область принятия гипотезы Н0определяется условием c2k;a), где c2(k; a) –критическая точка распределения хи-квадрат с уровнем значимости a. Вероятность ошибки первого рода равна a, вероятность ошибки второго рода четко определить нельзя,потому что существует бесконечно большое множество различных способовнесовпадения распределений. Мощность критерия зависит от количества разрядов иобъема выборки. Критерий рекомендуется применять при n>200, допускается применение при n>40, именно при таких условияхкритерий состоятелен (как правило, отвергает неверную нулевую гипотезу).
Для нормального закона возможныезначения случайной величины лежат в диапазоне от минус до плюс бесконечности,поэтому при расчетах оценок вероятностей крайний левый и крайний правыйинтервалы расширяются до минус и плюс бесконечности соответственно. Вычислитьзначения функции нормального распределения можно, воспользовавшись стандартнымифункциями табличного процессора или полиномом наилучшего приближения.
Сумма взвешенных квадратов отклоненияc2=1,32. Число степеней свободы
k = 6–1–2=3,
так как уклонения связаны линейным соотношением
/>,
кроме того, на уклонения наложены еще две связи, ибо по выборке былиопределены два параметра распределения. Критическое значение c2(3; 0,05)=7,815 определяется по табл.П.3 приложения. Поскольку соблюдается условие c2
Критерий А.Н.Колмогорова
Для применения критерия А.Н.Колмогорова ЭД требуется представить в виде вариационного ряда (ЭД недопустимообъединять в разряды). В качестве меры расхождения между теоретической F(x)и эмпирической Fn(x) функциями распределения непрерывнойслучайной величины Х используетсямодуль максимальной разности
/>
А.Н. Колмогоров доказал, что каковабы ни была функция распределения F(x) величины Х при неограниченном увеличении количества наблюдений n функция распределения случайнойвеличины
/>
асимптотически приближается к функции распределения
/>.
Иначе говоря, критерий А.Н.Колмогорова характеризует вероятность того, что величина
/>
не будет превосходить параметр l для любой теоретической функции распределения. Уровень значимостиa выбирается из условия
/>,
в силу предположения, что почти невозможно получить это равенство, когдасуществует соответствие между функциями F(x) и Fn(x). Критерий А.Н. Колмогорова позволяетпроверить согласованность распределений по малым выборкам, он проще критерияхи-квадрат, поэтому его часто применяют на практике. Но требуется учитывать дваобстоятельства.
1. В соответствии с условиями егоприменения необходимо пользоваться следующим соотношением
/>
где
/>.
2. Условия применения критерияпредусматривают, что теоретическая функция распределения известна полностью –известны вид функции и значения ее параметров. На практике параметры обычнонеизвестны и оцениваются по ЭД. Но критерий не учитывает уменьшение числастепеней свободы при оценке параметров распределения по исходной выборке. Этоприводит к завышению значения вероятности соблюдения нулевой гипотезы, т.е.повышается риск принять в качестве правдоподобной гипотезу, которая плохосогласуется с ЭД (повышается вероятность совершить ошибку второго рода). Вкачестве меры противодействия такому выводу следует увеличить уровеньзначимости a, приняв его равным 0,1 – 0,2, чтоприведет к уменьшению зоны допустимых отклонений.
Критерий Р. Мизеса
В качестве меры различиятеоретической функции распределения F(x) и эмпирической Fn(x) по критерию Мизеса (критерию w2) выступает средний квадрат отклоненийпо всем значениям аргумента x
/>(3.9)
Статистика критерия
/>(3.10)
При неограниченном увеличении n существует предельное распределениестатистики nwn2. Задавзначение вероятности a можно определить критические значения nwn2(a). Проверка гипотезы о законе распределения осуществляетсяобычным образом: если фактическое значение nwn2окажется больше критического или равно ему, то согласно критерию Мизеса суровнем значимости a гипотеза НОо том, что закон распределения генеральной совокупности соответствует F(x),должна быть отвергнута.
Достоинством критерия Мизеса являетсябыстрая сходимость к предельному закону, для этого достаточно не менее 40наблюдений в области часто используемых на практике больших значений nwn (а не несколько сот, как для критерияхи-квадрат).
Сопоставляя возможности различныхкритериев, необходимо отметить следующие особенности. Критерий Пирсона устойчивк отдельным случайным ошибкам в ЭД. Однако его применение требует группированияданных по интервалам, выбор которых относительно произволен и подверженпротиворечивым рекомендациям. Критерий Колмогорова слабо чувствителен к видузакона распределения и подвержен влиянию помех в исходной выборке, но прост вприменении. Критерий Мизеса имеет ряд общих свойств с критерием Колмогорова:оба основаны непосредственно на результатах наблюдения и не требуют построениястатистического ряда, что повышает объективность выводов; оба не учитываютуменьшение числа степеней свободы при определении параметров распределения повыборке, а это ведет к риску принятия ошибочной гипотезы. Их предпочтительноприменять в тех случаях, когда параметры закона распределения известны априори,например, при проверке датчиков случайных чисел.
При проверке гипотез о законераспределения следует помнить, что слишком хорошее совпадение с выбраннымзаконом распределения может быть обусловлено некачественным экспериментом(«подчистка» ЭД) или предвзятой предварительной обработкой результатов(некоторые результаты отбрасываются или округляются).
Выбор критерия проверки гипотезыотносительно произволен. Разные критерии могут давать различные выводы осправедливости гипотезы, окончательное заключение в таком случае принимается наоснове неформальных соображений. Точно также нет однозначных рекомендаций повыбору уровня значимости.
Рассмотренный подход к проверкегипотез, основанный на применении специальных таблиц критических точекраспределения, сложился в эпоху «ручной» обработки ЭД, когда наличиетаких таблиц существенно снижало трудоемкость вычислений. В настоящее времяматематические пакеты включают процедуры вычисления стандартных функцийраспределений, что позволяет отказаться от использования таблиц, но можетпотребовать изменения правил проверки. Например, соблюдению гипотезы Н0 соответствуеттакое значение функции распределения критерия, которое не превышает значениедоверительной вероятности 1–a (оценка статистикикритерия соответствует доверительному интервалу). В частности, для примера 3.1значение статистики критерия хи-квадрат равно 1,318. А значение функциираспределения хи-квадрат для этого значения аргумента при трех степенях свободысоставляет 0,275, что меньше доверительной вероятности 0,95. Следовательно, нетоснований отвергать нулевую гипотезу.
Задание 2
Задача. Рассчитайтесреднее арифметическое и среднее квадратическое отклонения и коэффициентывариации. Объясните их содержание.
№
п/п
Сумма
денежной
выручки,
у.е.
Стоимость основных производственных
фондоф,
тыс. у.е.
Оборотные
фонды,
тыс. у.е.
Численность
работников,
чел.
Площадь
сельхоз-
угодий,
га
Энерге-
тические
мощности,
л.с.
Покупка
кормов,
ц
Услуги сельхоз-
химии,
тыс. у.е.
Услуги агропром-техники, тыс.
у.е. 1 2 3 4 5 6 7 8 9 1 1310 1544 288 38 510 480 25 - - 2 1262 1562 322 37 430 410 30 - 6 3 1092 498 304 36 354 342 30 - 6 4 1074 536 330 30 350 340 35 5 - 5 1144 586 354 28 390 370 20 5 - 6 1206 464 318 32 414 390 15 4 5 7 1302 626 370 40 510 400 - 6 5 8 1414 608 340 42 520 426 - 8 5 9 1546 646 388 40 530 430 - 10 - 10 1506 644 374 44 532 440 15 15 - 11 1454 716 410 43 520 410 20 14 4 12 1522 704 424 37 560 504 - 13 4 13 1636 674 390 42 606 640 - 10 - 14 1644 652 396 41 610 710 30 8 - 15 1686 598 384 44 620 678 - 5 5 16 1614 570 348 45 630 540 15 10 5 17 1636 516 306 50 636 550 25 10 6 18 1574 474 290 60 600 614 20 15 6 19 1546 458 286 55 570 600 10 5 8 20 1484 424 310 54 554 410 10 4 8 21 976 406 272 33 320 374 30 4 - ИТОГО 29628 13906 7204 871 10766 10058 330 151 73 Ср. арифм. отклон 1410,86 662,19 343,1 41,5 512,7 478,9 15,7 7,2 3,5
Ср. квадр.
откл. 294,5 302,2 45,2 8,0 96,3 110,7 8,4 3,7 1,9 Vx, % 20,9 45,6 13,2 19,3 18,8 23,1 53,5 51,4 54,3
1. Среднее арифметическоеотклонение рассчитываем по формуле:
/>,
где Х – значение вариантапоказателя; n – число хозяйств или опытов.
Например:
Х = 29628\21=1410,86 ит.д.
Значения среднихарифметических отклонений представлены в таблице.
2. Среднее квадратическоеотклонение рассчитываем по формуле:
σ2x = ∑(xi — x¯)2\n
σ2x = (1310-1410,86)2 +(1262-1410,86)2+(1092-1410,86)2 +(1074-1410,86)2 +(1144-1410,86)2 +(1206-1410,86)2+(1302-1410,86)2 +(1414-1410,86)2 +
(1546-1410,86)2+(1506-1410,86)2 +(1454-1410,86)2 +(1522-1410,86)2 +
(1636-1410,86)2+(1644-1410,86)2 +(1686-1410,86)2 +(1614-1410,86)2 +
(1636-1410,86)2+(1574-1410,86)2 +(1546-1410,86)2 +(1484-1410,86)2 +
(976-1410,86)2 \21 =86711,3
σx = 294,5
Таким образом, суммаденежной выручки в среднем отклоняется в сторону увеличения среднейарифметической и в сторону ее уменьшения на 294,5 тыс. у. е.
σ2x = (1544-662,19)2 + (1562-662,19)2 +(498-662,19)2+(536-662,19)2 +
+ (586-662,19)2 +(464-662,19)2+(626-662,19)2 +(608-662,19)2 +
+(646-662,19)2 +(644-662,19)2+(716-662,19)2 +(704-662,19)2 +
+(674-662,19)2 +(652-662,19)2+(598-662,19)2 +(570-662,19)2 +
+(516-662,19)2 +(474-662,19)2+(458-662,19)2 +(424-662,19)2 +
+(406-662,19)2/21=91352,7
σx = 302,2
Стоимость основныхпроизводственных фондов в среднем отклоняется в сторону увеличения среднейарифметической и в сторону ее уменьшения на 302,2 тыс. у. е.
σ2x = (288343,1)2 +(-322-343,1)2 +(304-343,1)2+(330-343,1)2 +(354-343,1)2 +(318-343,1)2 +(370-343,1)2 +(340-343,1)2 +(388-343,1)2+(374-343,1)2 + (410-343,1)2 +(424-343,1)2 +(390-343,1)2 +(396-343,1)2 +(384-343,1)2+ (348-343,1)2 +(306-343,1)2 +(290-343,1)2 +(286-343,1)2 +(310-343,1)2 + (272-343,1)2/21 = 2045,6
σx = 45,2
Оборотные фонды в среднемотклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 45,2 тыс. у. е.
σ2x = (38-41,5)2 + (37-41,5)2 + (36-41,5)2+ (30-41,5)2 + (28-41,5)2 + (32-41,5)2 + (40-41,5)2 + (42-41,5)2 + (40-41,5)2 +(44-41,5)2 + (43-41,5)2 + (37-41,5)2 + (42-41,5)2 + (41-41,5)2 + (44-41,5)2 + (45-41,5)2+ (50-41,5)2 + (60-41,5)2 + (55-41,5)2 + (54-41,5)2 + (33-41,5)2 /21= 64,05
σx = 8,0
Численность работников всреднем отклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 8,0 чел.
σ2x = (510-512,7)2 +(430-512,7)2 +(354-512,7)2+(350-512,7)2 +(390-512,7)2 +(414-512,7)2 +(510-512,7)2 +(520-512,7)2 +(530-512,7)2+(532-512,7)2 + (520-512,7)2 +(560-512,7)2 +(606-512,7)2 +(610-512,7)2 +(620-512,7)2+ (630-512,7)2 +(636-512,7)2 +(600-512,7)2 +(570-512,7)2 +(554-512,7)2 + (320-512,7)2/21= 9272,12
σx = 96,3
Площадь сельхозугодий всреднем отклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 96,3 га.
σ2x = (480-478,9)2 +(410-478,9)2 +(342-478,9)2+(340-478,9)2 +(370-478,9)2 + (390-478,9)2 +(400-478,9)2 +(426-478,9)2 +(430-478,9)2+(440-478,9)2 + (410-478,9)2 +(504-478,9)2 +(640-478,9)2 +(710-478,9)2 +(678-478,9)2+ (540-478,9)2 +(550-478,9)2 +(614-478,9)2 +(600-478,9)2 +(410-478,9)2 + (374-478,9)2/21=12252,81
σx = 110,7
Энергетические мощности всреднем отклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 110,7 л.с.
σ2x = (25-15,7)2 +(30-15,7)2 +(30-15,7)2+(35-15,7)2 +(20-15,7)2 +(15-15,7)2 + (15-15,7)2 +(20-15,7)2 +(30-15,7)2 +(15-15,7)2+(25-15,7)2 +(20-15,7)2 + (10-15,7)2 +(10-15,7)2 +(30-15,7)2 /21= 70,7
σx = 8,4
Покупка кормов в среднемотклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 8,4 ц.
σ2x = (5-7,2)2 +(5-7,2)2 +(4-7,2)2+(6-7,2)2 +(8-7,2)2 +(10-7,2)2 +(15-7,2)2 +(14-7,2)2 +(13-7,2)2 +(10-7,2)2 +(8-7,2)2+(5-7,2)2 +(10-7,2)2 +(10-7,2)2 +(15-7,2)2 +(5-7,2)2 +(4-7,2)2 +(4-7,2)2/21=13,6
σx = 3,7
Услуги сельхозхимии всреднем отклоняется в сторону увеличения средней арифметической и в сторону ееуменьшения на 3,7 тыс. у.е.
σ2x = (6-3,5)2 +(6-3,5)2 +(5-3,5)2 +(5-3,5)2+(5-3,5)2 +(4-3,5)2 +(4-3,5)2 +(5-3,5)2 + (5-3,5)2 +(6-3,5)2 +(6-3,5)2 +(8-3,5)2+(8-3,5)2 /21=3,7
σx = 1,9
Услуги агропромтехники всреднем отклоняются в сторону увеличения средней арифметической и в сторону ееуменьшения на 1,9 тыс. у.е.
3. Коэффициент вариации Vx, отражает среднюю колеблемостьпоказателя и рассчитывается по формуле:
Vx = (σx\ х)·100.
В нашем случае Vx = (294,5\1410,86)·100 = 20,9%.
Vx = (302,2\662,19)·100 = 45,6%.
Vx = (45,2\343,1)·100 = 13,2%.
Vx = (8,0\41,5)·100 = 19,3%.
Vx = (96,3\512,7)·100 = 18,8%.
Vx = (110,7\478,9)·100 = 23,1%.
Vx = (8,4\15,7)·100 = 53,5%.
Vx = (3,7\7,2)·100 = 51,4%.
Vx = (1,9\3,5)·100 = 54,3%.
Задание 3
На основе приведенныхниже данных рассчитайте индивидуальные и общие индексы.Количественные и качественные показатели производства продукции
№
п/п Виды продукции Количество, ц Цена за 1 ц, у.е. Индивидуальные индексы
V0
базисный период
V1
текущий год
C0
базисный период
C1
текущий год Физического объема Цен 1 Овощи 502 546 128 152 1,09 1,19 2 Фрукты 696 686 112 123 0,99 1,10 3 Молоко 206 172 218 209 0,83 0,96 4 Говядина 298 282 142 158 0,95 1,11
1. Индивидуальные индексырассчитываем по формулам:
In =W1 /W0 ,
где W1 ,W0 — значение показателя соответственно в отчетном и базисномгоду.
Соответственно: In =V1 /V0, In =C1 /C0 ,
In овощи = 546/502=1,09, In овощи = 152/128=1,19 ,
In фрукты = 686/696=0,99, In фрукты = 123/112=1,10 ,
In молоко = 172/206=0,83, In молоко = 209/218=0,96,
In говядина = 282/298=1,11, In говядина = 158/142=1,11 .
2. Общие индексыстоимости всей продукции вычисляем по формуле :
Ic= ∑V1C1/ ∑V0C0
Ic=∑ V1C1/ ∑V0C0 = 546*152+686*123+172*209+282*158 /502*128+696*112+206*218+298*142= 247874/229432=1,080 или 108 %.
Индекс показывает, что стоимостьвсей продукции увеличилась в отчетном периоде по сравнению с базисным, на 8%.
Общий индекс физическогообъема продукции вычисляем по формуле:
Iv= ∑V1C0/ ∑V0C0
Iv= ∑V1C0/ ∑V0C0 = 546*128+686*112+172*218+282*142 /502*128+696*112+206*218+298*142= 224260/229432= 0,977 или 97,7%
Индекс показывает, чтообъем производства продукции в отчетном периоде по сравнению с базисным снизилсяна 2,3%.
Список литературы
1. Громыко Г.Л. Статистика. – М.:Изд-во МГУ им. Ломоносова, 1981.
2. Гусарев В.М. Теория статистики. –М.: ЮНИТИ, 1998.
3. Елисеева И.И., Юзбашев. Общаятеория статистики: учеб. для вузов. – М.: Финансы и статистика, 1995.
4. Ефимов М.Р., Петров Е.В., РумянцевВ.Н. Общая теория статистики: Учебник для вузов. – М.: Инфра-М, 1996.
5. Национальное счетоводство: учебникдля вузов / Под ред. Г.Д.Кулагиной. – М.: Финансы и статистика, 1997.
6. Общая теория статистики:Статистическая методология в коммерческой деятельности: учебник для вузов / Подред. А.С. Спирина и О.Е.Башиной. – М.: Финансы и статистика, 1994.
7. Социальная статистика: учебник длявузов / Под ред. И.И.Елисеевой. – М.: Финансы и статистика, 1997.
8. Статистика: Курс лекций для вузов/ Под ред. В.Г.Ионина. – М.: ИНФРА-М, 1996.
9. Экономическая статистика: Учебник/ Под ред. Ю.Н.Иванова. – М.: ИНФРА-М, 1998.
10. Статистика. Раздел 1 «Общаятеория статистики и математическая статистика». Курс лекций. / Сост.:Мизина Е.В. – Донецк: ДонГТУ, 2001.