--PAGE_BREAK--
12. Роль и значение относительных величин, их использование в экономическом анализе. Группы относительных величин.
В статистике относительные показатели используют в сравнительном анализе, в обобщении и синтезе. Относительные показатели — это цифровые обобщающие показатели, они есть результат сопоставления двух статистических величин. По своей природе относительные величины производны от деления текущего (сравниваемого) абсолютного показателя на базисный показатель.
Относительные показатели могут быть получены или как соотношения одноименных статистических показателей, или как соотношения разноименных статистических показателей. В первом случае получаемый относительный показатель рассчитывается или процентах, или в относительных единицах, или в промилле (в тысячных долях). Если соотносятся разноименные абсолютные показатели, то относительный показатель в большинстве случаев бывает именованным.
Относительные величины, используемые в статистической практике:
относительная величина структуры;
относительная величина координации;
относительная величина планового задания;
относительная величина выполнения плана;
относительная величина динамики;
относительная величина сравнения;
относительная величина интенсивности.
Относительная величина структуры (ОВС) характеризует структуру совокупности, определяет долю (удельный вес) части в общем объеме совокупности. ОВС рассчитывают как отношение объема части совокупности к абсолютной величине всей совокупности, определяя тем самым удельный вес части в общем объеме совокупности (%):
где mi — объем исследуемой части совокупности; M — общий объем исследуемой совокупности.
Относительная величина координации (ОВК) характеризует соотношение между двумя частями исследуемой совокупности, одна из которых выступает как база сравнения (%):
где mi — одна из частей исследуемой совокупности; mб — часть совокупности, которая является базой сравнения.
Относительная величина планового задания (ОВПЗ) используется для расчета в процентном отношении увеличения (уменьшения) величины показателя плана по сравнению с его базовым уровнем в предшествующем периоде, для чего используется формула
где Рпл — плановый показатель; Р0 — фактический (базовый) показатель в предшествующем периоде.
Относительная величина выполнения плана (ОВВП) характеризует степень выполнения планового задания за отчетный период (%) и рассчитывается по формуле
где Рт — уровень текущий; Рб — уровень базисный;
где Рт — уровень текущий; Рт-1 — уровень, предшествующий текущему.
Относительная величина сравнения (ОВСр) — соотношение одноименных абсолютных показателей, относящихся к разным объектам, но к одному и тому же времени (например, соотносятся темпы роста населения в разных странах за один и тот же период времени):
где МА — показатель первого одноименного исследуемого объекта; МБ — показатель второго одноименного исследуемого объекта (база сравнения).
Все предыдущие показатели относительных величин характеризовали соотношения одноименных статистических объектов. Однако есть группа относительных величин, которые характеризуют соотношение разноименных, но связанных между собой статистических показателей. Эту группу называют группой относительных величин интенсивности (ОВИ), которые выражаются, как правило, именованными числами. В статистической практике относительные величины интенсивности применяются при исследовании степени объемности явления по отношению к объему среды, в которой происходит распространение этого явления. ОВИ здесь показывает, сколько единиц одной совокупности (числитель) приходится на одну, на десять, на сто единиц другой совокупности (знаменатель).
Примерами относительных величин интенсивности могут служить, скажем, показатели уровня технического развития производства, уровня благосостояния граждан, показатели обеспеченности населения средствами массовой информации, предметами культурно-бытового назначения и т.д. ОВИ рассчитывается по формуле
где А — распространение явления; ВА — среда распространения явления А.
При расчете относительных величин интенсивности может возникнуть проблема выбора адекватной явлению базы сравнения (среды распространения явления). Например, при определении показателя плотности населения нельзя брать в качестве базы сравнения общий размер территории того или иного государства, в этом случае базой сравнения может быть лишь территория в 1 км2. Критерием правильности расчета является сопоставимость по разработанной методологии расчета сравниваемых показателей, применяющихся в статистической практике.
13. Средние величины. Категории средних величин (степенные средние, структурные средние). Виды средних величин.
Средние величины используются на этапе обработки и обобщения полученных первичных статистических данных. Потребность определения средних величин связана с тем, что у различных единиц исследуемых совокупностей индивидуальные значения одного и того же признака, как правило, неодинаковы.
Средней величиной называют показатель, который характеризует обобщенное значение признака или группы признаков в исследуемой совокупности.
Если исследуется совокупность с качественно однородными признаками, то средняя величина выступает здесь как типическая средняя. Например, для групп работников определенной отрасли с фиксированным уровнем дохода определяется типическая средняя расходов на предметы первой необходимости, т.е. типическая средняя обобщает качественно однородные значения признака в данной совокупности, каковым является доля расходов у работников данной группы на товары первой необходимости.
При исследовании совокупности с качественно разнородными признаками на первый план может выступить нетипичность средних показателей. Такими, к примеру, являются средние показатели произведенного национального дохода на душу населения (разные возрастные группы), средние показатели урожайности зерновых культур по всей территории России (районы разных климатических зон и разных зерновых культур), средние показатели рождаемости населения по всем регионам страны, средние температуры за определенный период и т.д. Здесь средние величины обобщают качественно разнородные значения признаков или системных пространственных совокупностей (международное сообщество, континент, государство, регион, район и т.д.) или динамических совокупностей, протяженных во времени (век, десятилетие, год, сезон и т.д.). Такие средние величины называют системными средними.
Таким образом, значение средних величин состоит в их обобщающей функции. Средняя величина заменяет большое число индивидуальных значений признака, обнаруживая общие свойства, присущие всем единицам совокупности. Это, в свою очередь, позволяет избежать случайных причин и выявить общие закономерности, обусловленные общими причинами.
Используются две категории средних величин:
степенные средние;
структурные средние.
Первая категория степенных средних включает: среднюю арифметическую, среднюю гармоническую, среднюю квадратическую и среднюю геометрическую.
Вторая категория (структурные средние) — это мода и медиана.
Введем следующие условные обозначения:
- величины, для которых исчисляется средняя;
/> — средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;
— частота (повторяемость индивидуальных значений признака).
Различные средние выводятся из общей формулы степенной средней:
при k = 1 — средняя арифметическая; k = -1 — средняя гармоническая; k = 0 — средняя геометрическая; k = -2 — средняя квадратическая.
Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней.
14. Средняя арифметическая (простая и взвешенная). Условия применения.
Средняя арифметическая — самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая — это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности.
Формула средней арифметической (простой) имеет вид
где n — численность совокупности.
Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая:
Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек:
При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной, которая имеет вид
Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:
1 — 800 ак. — 1010 руб.
2 — 650 ак. — 990 руб.
3 — 700 ак. — 1015 руб.
4 — 550 ак. — 900 руб.
5 — 850 ак. — 1150 руб.
Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА):
ОСС = 1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500;
КПА = 800+650+700+550+850=3550.
В этом случае средний курс стоимости акций был равен
15. Средняя гармоническая (простая и взвешенная). Условия применения.
Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1.
Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:
К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая — со скоростью 100 км/ч, вторая — 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:
В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид
Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.
16. Средняя геометрическая (простая и взвешенная). Условия применения.
Чаще всего средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000). Существуют формулы для простой и взвешенной средней геометрической.
Для простой средней геометрической
Для взвешенной средней геометрической
17. Средняя квадратическая (простая и взвешенная). Условия применения.
Основной сферой ее применения является измерение вариации признака в совокупности (расчет среднего квадратического отклонения).
Формула простой средней квадратической
Формула взвешенной средней квадратической
18. Статистический анализ структуры. Структурные средние: мода и медиана.
Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.
Медиана (Ме) — это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.
Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.
Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10): 2= 8,5.
То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле
где n — число единиц в совокупности.
Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.
Численное значение медианы обычно определяют по формуле
где xМе — нижняя граница медианного интервала; i — величина интервала; S-1 — накопленная частота интервала, которая предшествует медианному; f — частота медианного интервала.
Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
где xМо — нижняя граница модального интервала; iМо — величина модального интервала; fМо — частота модального интервала; fМо-1 — частота интервала, предшествующего модальному; fМо+1 — частота интервала, следующего за модальным.
Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.
19. Ряды распределения, их виды и приемы построения.
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд — значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд — это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Другие формы вариационного ряда — групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд — это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй — число единиц совокупности с определенным значением признака.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от — до» (варианты), во второй — число единиц, входящих в интервал (частота).
Частота (частота повторения) — число повторений отдельного варианта значений признака, обозначается fi, а сумма частот, равная объему исследуемой совокупности, обозначается
где k — число вариантов значений признака
Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:
где R = xmax — xmin; m = 1 + 3,322 lgn (формула Стерджесса); n — общее число единиц совокупности.
20. Графическое изображение статистических данных. Понятие о статистическом графике. Элементы статистического графика.
21. Классификация видов графиков.
Для изображения рядов распределения существует 3 основные вида графиков:
Гистограмма распределения Полигон распределения частот Кумулятивная кривая
22. Гистограмма распределения. Правила построения. Свойства.
Для графического изображения интервальных вариационных рядов применяется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам интервала.
К примеру,
частота
интервалы
12
200-400
17
400-600
15,5
600-800
По гистограмме можно определить моду – наиболее часто встречающееся значение признака у единиц данной совокупности.
Модальным считается интервал, которому соответствует максимальное значение частоты.
Для нахождения моды графически на гистограмме, нужно соединить линии, как показано на рисунке, и опустить перпендикуляр из построенного прямоугольника вниз к оси абсцисс (интервалы).
продолжение
--PAGE_BREAK--
Мо = Хмо +
i* (
fmo– (
fmo-1))/(
fmo-1)+(
fmo+1)
Мо=400+200*((17-12)/((17-12)+(17-15,5)))=553,84
23. Полигон распределения частот. Правила построения. Свойства.
Для построения полигона распределения частот, соединяем середины столбцов гистограммы.
24. Кумулятивная кривая. Правила построения. Свойства.
Для построения этой кривой нужно рассчитать накопленные частоты, определяющиеся суммированием частот интервалов. Причем, последняя накопленная частота должна оказаться равной сумме всех частот. При построении кумуляты нижняя граница первого интервала будет равна нулю, а верхняя граница – вся частота данного интервала.
частота
интервалы
накопленная
частота
12
200-400
12
17
400-600
модальный интервал
медианный интервал
12+17=29
15,5
600-800
29+15,5=44,5
Итого: 44,5
По кумулятивной кривой можно определить медиану.
Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.
Место медианы (
Nме) =(
n+1)/2
К примеру, (44,5+1)/2=22,75
Превышающие значение накопленной частоты = 29>22.75, поэтому медианный интервал –
[400-600].
Ме
= Хме
+ i * (((n+1)/2)-S(-1))/fme
Me=400+200*((22,75-12)/17)=526,47
25. Показатели центра распределения вариационного ряда (средняя, мода, медиана).
1.Средняя арифметическая – значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности.
Для дискретного ряда –
Х (сред.)=
∑х
i
fi/
∑
fi
Для интервального ряда –
Х (сред.)=
∑х
´
i
fi/
∑
fi
2. Мода – наиболее часто встречающееся значение признака у единиц данной совокупности.
Модальным считается интервал, которому соответствует максимальное значение частоты.
Хмо– это нижняя граница модального интервала
Fmo– частота модального интервала
fmo-1– частота интервала, предшествующая модальному
fmo+1– частота интервала следующего за модальным
Мо = Хмо +
i* (
fmo– (
fmo-1))/(
fmo-1)+(
fmo+1)
3. Медиана.
Медианным является интервал, в котором значение накопленной частоты превышает значение показателя места медианы.
Место медианы
( Nме
) =(n+1)/2
Хме – нижняя граница медианного интервала
N– количество единиц в совокупности
S(-1)– накопленная частота интервала, предшествующая медианному
Fme – частота медианного интервала
Ме = Хме +
i* (((
n+1)/2)-
S(-1))/
fme
26. Соотношение средней, моды и медианы в вариационном ряду.
27. Показатели степени вариации (размах, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия).
1.Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности.
R=Xmax-Xmin
2. Среднее квадратическое отклонение – это обобщающая характеристика абсолютных размеров вариаций признака в совокупности.
∂=
ö2
3. Дисперсия – это средняя арифметическая квадратов отклонений индивидуального значения признака от общей средней.
∂2=
∑((х
i-
x(сред.))2)/
∑
ni
4. Среднее линейное отклонение вычисляется по формуле:
d(сред.) =
∑|х
i-х(сред.)
|/
n – для несгруппированных данных
d(сред.) =
∑|х
i-х(сред.)
|*
fi/
∑
fi – для сгруппированных данных
28. Показатель однородности совокупности – коэффициент вариации.
V=
∂/
x*100% — показатель относительной колеблемости.
Всегда выражается в %.
Если V
29. Виды дисперсий: внутригрупповая, межгрупповая и общая. Правило сложения дисперсий.
Общая дисперсия – ее величина характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности.
Межгрупповая дисперсия – отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора положенного в основу группировки.
∂2=
∑((Х
i(сред.)-Хо(сред.))*
ni)/
∑
ni,
где Х
i – среднее по отдельной группе, а Хо – для всей совокупности.
Средняя внутригрупповая дисперсия – характеризует случайную вариацию, возникающую под влиянием неучтенных факторов, и не зависит от признака фактора, положенного в основу группировки.
∂2(сред.) =
∑(
∂
i2*
ni)/
∑
ni,
где
∂
i2 – дисперсия по отдельной группе,
∂i2=
∑(Х-Х
i)2*
F/
∑
F
Перечисленные виды дисперсий взаимосвязаны между собой следующим равенством:
∂2=
∂2+
∂2(сред.)
Это равенство – правило сложения дисперсий:
Величина общей дисперсии равна сумме межгрупповой и средней внутригрупповой дисперсии.
30. Вариации альтернативного признака.
Альтернативный признак – это качественный признак, имеющий 2 взаимоисключающие разновидности.
АП принимает всего 2 значения:
Единица – это наличие признака Ноль – это отсутствие признака
p+
q=1,
где
p – это доля обладающих признаком
q – не обладающих признаком.
Среднее значение альтернативного признака рассчитывается по формуле:
Х(сред.) = ((1*
p)+(0*
q))/ (
p+
q)=
p
Дисперсия альтернативного признака рассчитывается по формуле:
∂2=((1-
p)2*
p+(0-
p)2*
q)/
p+
q=
p*
q
Предельное значение вариации альтернативного признака = 0,25, оно получается, когда p=
q=0,5.
31. Показатели формы распределения (показатель асимметрии, эксцесса).
Существует еще одна характеристика распределения данных, полученных по непрерывным шкалам, которую исследователь тоже должен обязательно учитывать. Это форма распределения.
Данные распределения старшеклассников по возрасту являются примером нормального распределения. Нормальным является такое распределение, при котором кривая построенного по его данным графика представляет собой колоколообразную симметричную кривую.
Например, если мы построим график по данным распределения старшеклассников по возрасту, то получим соответствующую колоколообразную кривую. Если же мы построим график по массиву третьеклассников и учителей, опрошенных в одной школе, мы получим две кривые. Нормальное распределение — это теоретическая кривая. Практически любые эмпирические данные в той или иной степени отклоняются от нормального распределения вероятностей, закону которого подчиняются распределения случайных величин. Но поскольку все расчеты, включающие значение среднего арифметического и стандартного отклонения, основаны на теории вероятности, в аналитическую задачу исследователя входит оценка (по крайней мере, приблизительная) того, насколько правомерно использовать данный тип анализа к полученным результатам. Поэтому даже на уровне описания (не говоря уже о множественном анализе), прежде чем приводить данные по их средним значениям (среднее арифметическое и стандартное отклонение), необходимо оценить характер формы распределения — в какой степени она приближается к нормальному распределению.
Для этого используют показатели скоса (асимметрии, skewness) и эксцесса (kurtosis). В скобках указываются термины, которые обычно у разных авторов используются для обозначения одних и тех же понятий. В частности, здесь приведены англоязычные обозначения рассматриваемых характеристик, которые приводятся в компьютерной программе обработки и анализа социологических данных — SPSS.
Показатель скоса (skewness) позволяет оценить степень и направленность асимметрии кривой распределения. В случае идеального нормального распределения асимметрия равна нулю.
В эмпирической социологии идеальные нормальные распределения практически не встречаются. Но существуют методы оценки степени приближения полученного распределения к нормальному. Коэффициент скоса имеет числовое значение и знак, указывающий направленность скоса. Чем больше величина отличается от нуля, тем большая асимметрия у полученного распределения, и, соответственно, большая погрешность может проявиться при применении коэффициентов статистического анализа, формула которых включает значения стандартного отклонения.
Существуют специальные процедуры оценки степени допустимости такой погрешности, а также искусственной нормализации шкалы. Исследователь может, при необходимости, осуществлять преобразование данных. С различными способами преобразования данных можно ознакомиться в специальной справочной и учебной литературе; но исследователю необходимо обязательно оценить степень асимметрии. (Простейшим косвенным показателем, указывающим на асимметрию, является расхождение между значениями среднего арифметического, моды и медианы; при идеальном нормальном распределении все три показателя равны).
Показатель эксцесса (kurtosis) показывает, в какой степени «крутизна» полученной кривой приближается к нормальному распределению.
Показатели асимметрии и эксцесса необходимы исследователю в первую очередь для того, чтобы он мог установить — в какой степени в анализе может быть использовано стандартное отклонение.
32. Кривые распределения. Критерии согласия
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.
Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.
Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона
Кривую Пуассона можно выразить отношением
где Px — вероятность наступления отдельных значений х; - средняя арифметическая ряда.
При выравнивании эмпирических данных теоретические частоты можно определить по формуле
где f' — теоретические частоты; N — общее число единиц ряда.
Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом, который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения
где m — число групп; k = (m — 3 ) — число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле
где D — максимальное значение разности между накопленными эмпирическими и теоретическими частотами; — сумма эмпирических частот.
По таблицам значений вероятностей — критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
33. Понятие нормального распределения. Графическое изображение. Свойства.
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением
где у — ордината кривой нормального распределения; — стандартизованные отклонения; е и π — математические постоянные; x — варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.
Если нужно получить теоретические частоты f' при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой
где - сумма всех эмпирических частот вариационного ряда; h — величина интервала в группах; — среднее квадратическое отклонение; — нормированное отклонение вариантов от средней арифметической; все остальные величины легко вычисляются по специальным таблицам. продолжение
--PAGE_BREAK--