--PAGE_BREAK--Статистические распределения и их характеристики
Мода – значение признака, которое наиболее часто встречается в совокупности
, — нижняя граница модального интервала (интервал с наибольшей частотой), — величина интервала, — частота в модальном интервале.
Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.
— положение медианы
, — нижняя граница медианного интервала, — накопленная частота интервала, предшествующего медианному, — частота медианного интервала.
Квартель
,
,
Дециль
, (от 1/10 до 9/10)
Показатели вариации (колеблемости) признака
Среднее линейное отклонение – на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
-для несгруппированных данных (первичного ряда):
-для вариационного ряда:
Среднее квадратическое отклонение
— для несгруппированных данных:
— для вариационного ряда:
Дисперсия
— для несгруппированных данных:
— для вариационного ряда:
Коэффициент вариации (используется для характеристики однородности совокупности по исследуемому признаку)
— до 17% – совокупность совершенно однородна, 17%-33% — достаточно однородна, >33% — неоднородна.
Сложение дисперсий
Величина общей дисперсии () характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности
, — общая средняя арифметическая для всей совокупности
Межгрупповая дисперсия () отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки
, — средняя в каждой группе, — число единиц в каждой группе
Средняя внутригрупповая дисперсия () характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.
, где — дисперсия по отдельной группе
или
Равенство:
Корреляционное отношение
, >0,5 – связь между групповым фактором и результирующим признаком – тесная,
продолжение
--PAGE_BREAK--Показатель асимметрии
, — центральный момент третьего порядка
Средняя квадратическая ошибка: , n
– число наблюдений
Если , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.
— правосторонняя асимметрия, — левосторонняя асимметрия.
Показатель эксцесса (островершинности)
, — центральный момент четвертого порядка
>0 – высоковершинное, = -2 – предел)
Средняя квадратическая ошибка: n
– число наблюдений
Кривые распределения
Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.
Плотность распределения (расчет теоретических частот)
, — нормированное отклонение
, — определяется по таблице (приложение 1)
Критерий согласия К. Пирсона (для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения)
f
– эмпирические частоты в интервале,
f
’
– теоретические частоты в интервале
Критерий согласия Романовского
,
m
– число групп,
m
-3 – число степеней свободы при исчислении частот нормального распределения
Если к
Критерий Колмогорова
, D
– максимальное значение разности между накопленными эмпирическими и теоретическими частотами,
n
– сумма эмпирических частот
Распределение Пуассона (теоретические частоты)
,
n
– общее число независимых испытаний, λ – среднее число появления редкого события в
n
одинаковых независимых испытаниях,
m
– частота данного события, е=2,71828
Выборочное наблюдение
N – объем генеральной совокупности
n – объем выборочной совокупности (число единиц, попавших в выборку)
— генеральная средняя (среднее значение признака в генеральной совокупности)
— выборочная средняя
р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности)
w – выборочная доля
— генеральная дисперсия
— выборочная дисперсия
— среднее квадратическое отклонение признака в генеральной совокупности
S – среднее квадратическое отклонение признака в выборочной совокупности.
Неравенство Чебышеба
При неограниченном числе наблюдений, независящих друг от друга из генеральной совокупности с вероятностью сколь угодно близкой к 1, можно утверждать, что расхождение между выборочной и генеральной средней будет сколь угодно малой величиной .
Теорема Ляпунова
Дает количественную оценку ошибки. При неограниченном объеме из генеральной совокупности с Р расхождения выборочной и генеральной средней равна интегралу Лапласа
, — нормированная функция Лапласа (интеграл Лапласа)
Р – гарантированная вероятность
t – коэффициент доверия, зависящий от Р
Р
,683
0,954
0,997
t
1
2
3
— предельная ошибка выборки
, — стандартная среднеквадратическая ошибка
, — предельная (максимально возможная) ошибка средней,
t
– коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки
, — предельная (максимально возможная) ошибка доли
Средняя ошибка (n>30) при случайной повторной выборке:
,
При случайной бесповторной выборке:
,
продолжение
--PAGE_BREAK--Формулы ошибок простой случайной выборки
Способ отбора единиц
повторный
бесповторный
Средняя ошибка μ:
Для средней
Для доли
Предельная ошибка Δ:
Для средней
Для доли
Доверительные интервалы для генеральной средней –
Доверительные интервалы для генеральной доли –
Доверительная вероятность – функция от t, вероятность находится по приложению3
Формулы для определения численности простой и случайной выборки
Способ отбора единиц
повторный
бесповторный
Численность выборки (n):
Для средней
Для доли*
*В случае, когда частость wдаже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (если w=0,5, то w(1-w)=0,25).
Типичная выборка
Применяется в тех случаях, когда из генеральной совокупности можно выделить однокачественные группы единиц (или однородные), затем из каждой группы случайно отобрать определенное число единиц в выборку.
Стандартная среднеквадратическая ошибка:
Повторный отбор — , — средняя из внутригрупповых
Бесповторный отбор -
Отбор единиц при типичной выборке из каждой типичной группы:
1.Равное число единиц , — число единиц, отобранных из
i
-ой типичной группы,
n
– общий объем,
R
– число групп
2.Пропорциональный отбор , — доля
i
-ой группы в общем объеме генеральной совокупности
3.Отбор единиц с учетом вариации случайного признака
Серийная выборка
Вместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение.
Средняя стандартная ошибка:
Повторный отбор — , , m
– число отобранных серий, — средний уровень признака в серии, — средний уровень признака для всей выборочной совокупности
Бесповторный отбор — , M
– общее число серий
продолжение
--PAGE_BREAK--