Введение
Выборочным называется такое статистическоеисследование, при котором обобщающие показатели изучаемой совокупностиустанавливаются по некоторой ее части, сформированной на основе положенийслучайного отбора.
В основе выборочного исследования лежит несплошное наблюдение,при котором обследуются не все единицы совокупности, а лишь определенная ихчасть.
Выборочное исследование широко применяется на практике, посколькуобладает существенными преимуществами по сравнению с другими методамиполучения статистических данных. К ним относятся:
• Достаточно высокая точностьрезультатов обследования благодаря использованию более квалифицированныхкадров, что приводит к сокращению ошибок регистрации;
• Экономия времени и средств врезультате сокращения объема работы, большая оперативность в получении данных орезультатах обследования;
• Возможность исследованияочень больших статистических совокупностей;
• Выборочный метод являетсяединственно возможным, если сбор информации связан с разрушением или потерейединиц наблюдения, например, при органалитическом контроле качества продукции;
• Возможность исследованияполностью недоступных совокупностей
Обоснованиецелесообразности применения выборочного метода
Выборочноестатистическое наблюдение является наиболее широко применяемым видом несплошного наблюдения. При выборочном методеобследованию подвергается сравнительно набольшая часть всей изучаемойсовокупности (обычно до 5–10%, реже до 15–20%). При этом подлежащая изучениюстатистическая совокупность, из которой производится отбор части единиц,называется генеральной совокупностью. Отобранная из генеральной совокупностинекоторая часть единиц, подвергающаяся обследованию, называется выборочнойсовокупностью или выборкой. Значение выборочного метода состоит в том, что приминимальной численности обследуемых единиц проведение исследованияосуществляется в более короткие сроки и с минимальными затратами труда исредств. Это повышает оперативность статистической информации, уменьшает ошибкирегистрации.
Подвыборочным понимается метод статистического исследования, при которомобобщающие показатели изучаемой совокупности устанавливаются по некоторой еечасти, организованной по принципу случайного отбора.
Прислучайном отборе каждой единице изучаемого объекта (массового явления,генеральной совокупности) обеспечивается определенная (обычно равная)вероятность попасть в количество обследуемых единиц (в выборку) и тем самымисключается субъективность, тенденциозность и односторонность в подборе этихединиц.
При строгомсоблюдении принятых правил отбора выборочное наблюдение репрезентативно вшироком смысле слова: при нем обеспечивается близкое соответствие составаохваченной наблюдением выборки и состава генеральной совокупности. Благодаряэтому по данных выборочного наблюдения можно определить с желательной степеньюприближения интересующие исследователей характеристики изучаемого явления.
Выборочныйметод при проведении ряда исследований является единственно возможным,например, при контроле качества продукции (товара).
Выборочныйметод иногда применяется для проверки данных даже сплошного учета. Минимальнаячисленность обследуемых единиц позволяет провести исследование более тщательнои квалифицированно. Так, при переписи населенияпрактикуются выборочные контрольные обходы для проверки правильности записейсплошного наблюдения.
Большуюактуальность приобретает выборочный метод в условиях перехода к рыночнойэкономике. Развитие различных форм собственности, изменения в характереэкономических отношений, как, обусловливают изменения функций учета и статистики,сокращение и упрощение статистической отчетности.
Посравнению с другими методами, применяющими не сплошное наблюдение, выборочныйметод имеет существенное преимущество. При соблюдении правил научнойорганизации выборочного наблюдения появляется возможность количественной оценкиошибки репрезентативности (представительности).
Более того,способы определения ошибок выборки при различных приемах формированиявыборочной совокупности и распространение характеристик выборки на генеральнуюсовокупность составляют основное содержание статистической методологиивыборочного метода.
Логикавыборочного наблюдения:
1. определение объекта и целей выборочного наблюдения;
2. выбор схема отбора единиц для наблюдения;
3. расчет объема выборки;
4. проведение случайного отбора установленного числа единиц из генеральнойсовокупности;
5. наблюдение отобранных единиц по установленной программе;
6. расчет выборочных характеристик в соответствии с программой выборочногонаблюдения;
7. определение ошибки, ее размера;
8. распространение выборочных данных на генеральную совокупность;
9. анализ полученных данных.
Основныепреимущества выборочного наблюдения:
1. Выборочное наблюдение можно осуществить по более широкой программе.
2. Выборочное наблюдение более дешевое с точки зрения затрат на егопроведение.
3. Выборочное наблюдение можно организовать тогда и в тех случаях,когда отчетностью мы воспользоваться не можем.
Основныенедостатки:
1. Полученные данные всегда содержат в себе ошибку, о результатах наблюденияможно судить лишь с определенной степенью достоверности. Но по сравнению сдругими видами наблюдения это достоинство выборочного метода.
2. Для его проведения требуются квалифицированные кадры.
Вся совокупность единиц, из которых производится отбор, называется генеральной.Совокупность единиц отобранных называется выборочной.
Проведениевыборочного наблюдения складывается из ряда последовательных этапов:
· 1) обоснование целесообразности проведения выборочного метода всоответствии с задачами исследования;
· 2) составление программы проведения статистического исследованиявыборочным методом;
· 3) решение организационных вопросов сбора исходной информации;
· 4) установление доли выборки, т.е. части подлежащих обследованиюединиц генеральной совокупности;
· 5) обоснование способов формирования выборочной совокупности;
· 6) осуществление отбора единиц из генеральной совокупности для ихобследования;
· 7) фиксация в отобранных единицах выборки значений изучаемыхпризнаков;
· 8) статистическая обработкаполученной в выборке информации с определением обобщающих характеристикизучаемых признаков;
· 9) определение количественной оценки ошибки выборки;
· 10) распространение обобщающих выборочных характеристик на генеральнуюсовокупность.
· 11) В зависимости от способа организации выборочного наблюдения иприменяемых способов отбора различают также виды выборочного наблюдения:
· 1) простая случайная выборка(собственно-случайная);
· 2) механическая случайная выборка;
· 3) типическая случайная выборка;
· 4) серийная (гнездовая) выборка;
· 5) многоступенчатая (многостепенная иликомбинационная) выборка.
Выборкуможно производить из конечной (ограниченной) и неограниченной генеральнойсовокупности. Поэтому целесообразно различать выборочный метод и по этомупризнаку. Иногда различают также большие, охватывающие значительное числообследуемых единиц, выборки и малые выборки.
Каждый изуказанных основных способов отбора может реализоваться по схеме повторного(когда зафиксированная в выборке единица возвращается в генеральнуюсовокупность) или бесповоротного отбора (когда зафиксированная единицаисключается из дальнейшего просмотра и может попасть в выборку только одинраз). Целесообразно различать выборки и по этому признаку.
Задача №1.
Вычислитьиндексы сезонности и построить сезонную волну за полугодие. Сделать вывод Индексы сезонности I II III всего за три года В среднем за три года Январь 30,2 31,5 31,2 92,9 31 16,77 Февраль 29,8 31,1 30,8 91,7 30,6 16,55 Март 29,6 30,9 30,5 91 30,3 16,39 Апрель 29,4 30,6 30,3 90,3 30,1 16,28 Май 30,5 31,9 31,5 93,9 31,3 16,93 Июнь 30,8 32,2 31,8 94,8 31,6 17,09 Итого 180,3 188,2 186,1 554,6 184,9 100,01
Решение:
Всего затри года =I+II+III
Январь =30,2+31,5+31,2=92,9
Февраль =29,8+31,1+30,8=91,7
Март =29,6+30,9+30,5=91
Апрель =29,4+30,6+30,3=90,3
Май =30,5+31,9+31,5=93,9
Июнь =30,8+32,2+31,8=94,8
Итого I= январь I+ февраль I+март I+апрель I+май I+июнь I=30,2+29,8+29,6+29,4+30,5+30,8=180,3
Итого II= январь II+февраль II+март II+май II+июнь II= 31,5+31,1+30,9+30,6+31,9+32,2=188,2
Итого III= январь III+февраль III+март III+апрель III+май III+ июнь III= 31,2+30,8+30,5+30,3+31,5+31,8=186,1
Итого всегоза три года = 92,9+91,7+91+90,3+93,9+94,8=554,6
В среднемза три года = (I+II+III)/3 = Всего за три года/3. По этойформуле рассчитаем для всех месяцев:
Январь =92,9/3=31
Февраль =91,7/3=30,6
Март =91/3=30,3
Апрель =90,3/3=30,1
Май =93,9/3=31,3
Июнь =94,8/3=31,6
Итого =554,6/3=184,9
Индекссезонности (Ис) =Всего за три года для каждого месяца / общую среднюю затри года*100%. По этой формуле рассчитае6 мдля каждого месяца:
Ис январь =31/184,9*100=16,77
Ис февраль= 30,6/184,9*100=16,55
Ис март =30,3/184,9*100=16,39
Ис апрель =30,1/184,9*100=16,28
Ис май=31,3/184,9*100=16,93
Ис июнь =31,6/184,9*100=17,09
Итого Ис =16,77+16,55+16,39+16,28+16,93+17,09=100,01
Строимсезонную волну:
/>
Вывод: Правильность полученной сезонной волны зависит от числа уровнейряда и от характера их изменения: чем больше уровней ряда, тем более точныебудут результаты. Если посмотреть на полученных данных сезонной волны, видносущественный спад в марте и апреле, а в мае и июне видимое увеличение среднихпоказателей.
Задача №2.
Имеются данныео 23 рабочих-сдельщиках, представленные в следующей таблице:Номер рабочих Стаж работы, лет Месячная выработка продукции, у. е. 1 18,0 737 2 23,5 827 3 26,2 844 4 21,5 792 5 23 797 6 19,5 770 7 19,7 762 8 33 857 9 30,2 829 10 31 869 11 28 842 12 29 825 13 27,5 823 14 18 769 15 26 807 16 22 782 17 23 775 18 27,2 805 19 22 757 20 22,4 787 21 24,5 795 22 25 805 23 25,8 812
Дляизучения зависимости между приведенными показателями произвести группировкурабочих по стажу работы, выделив 5 групп с равными интервалами. По каждой изних и совокупности подсчитать количество рабочих (абсолютное и в процентах китогу), средний стаж работы, среднемесячную выработку продукции. Результатыпредставить в таблице, сделать краткие выводы.
Решение:
Определяемвеличину интервала (i):
i = (Xmax-Xmin)/5=(33–18)/5=3.
Разбиваемна группы: (18; 21); (21; 24); (24; 27); (27; 30); [30; 33].
Строимвспомогательную таблицу для рассчитанныхРазмер интервала Номер рабочих Стаж работы, лет Месячная выработка продукции, у. е. (18; 21) 1 18 737 6 19,5 770 7 19,7 762 14 18 769 Итого 4 75,2 3038 (21; 24) 2 23,5 827 4 21,5 792 5 23 797 16 22 782 17 23 775 19 22 757 20 22,4 787 Итого 7 157,4 5517 (24; 27) 3 26,2 844 15 26 807 21 24,5 795 22 25 805 23 25,8 812 Итого 5 127,5 4063 (27; 30) 11 28 842 12 29 825 13 27,5 823 18 27,2 805 Итого 4 111,7 3295 [30; 33] 8 33 857 9 30,2 829 10 31 869 Итого 3 94,2 2555
Строимитоговую таблицуГруппы п\п по стажу работы, лет Количество рабочих, человек Стаж работы, лет Месячная выработка продукции, у. е. абсолютное в% к итогу всего в среднем на 1 рабочего всего в среднем на 1 рабочего
1
2
3=2*100/23
4
5=4/2
6
7=6/2 [18; 21] 4 17,4 75,2 18,8 3038 506,3 (21; 24) 7 30,4 157,4 22,5 5517 788,1 (24; 27) 5 21,7 127,5 25,5 4063 812,6 (27; 30) 4 17,4 111,7 27,9 3295 823,8 {30; 33] 3 13,1 94,2 31,4 2555 851,7
Вывод: Для всех 5 групп «Группировки рабочих по стажу работы» характерныследующие характеристики: среднемесячная выработка продукции пропорциональнорастет, а количество рабочих уже с третьей группы резко уменьшается. Можнопредположить, что на данном предприятии происходит внедрение новых процессовпроизводства, в связи с чем ручной труд заменяется машинным.
Задача №3.
1. Построить прогноз методом среднего абсолютного прироста. Обосноватьвыбор метода прогнозирования, предварительно проверив предпосылки егореализации.
2. Построить прогноз методом среднего темпа роста, предварительнопроверив предпосылки его реализации.
3. Построить прогноз, методом экстраполяции трендовых моделей.
4. Произвести оценку точности прогнозов, полученных методом экстраполяциитрендовых моделей на основе:
· средней квадратической ошибки;
· коэффициента несоответствия.
Сделатьвыводы.
Исходныеданные
Динамикачисла семей, состоявших на учете на учёте на получение жилья в одном изрегионов Республики Беларусь за январь-октябрь 2009 г.Месяц Число семей, состоявших на учете на получение жилья, тыс. ед. январь 179,6 февраль 181,2 март 203,3 апрель 206,1 май 226,9 июнь 248 июль 261,3 август 231,9 сентябрь 255,1 октябрь 299
Решение:
1. Прогнозметодом среднего абсолютного прироста.Месяц
Число семей, состоявших
на учете на получение
жилья, тыс. ед. yi
yi2
Δr
Δ2
_ _
y Δ
_ _
yi- y Δ
_ _
(yi- y Δ) январь 179,6 32256,16 - - 179,6 февраль 181,2 32833,44 1,6 2,56 192,867 -11,667 136,111 март 203,3 41330,89 22,1 488,41 206,134 -2,834 8,028 апрель 206,1 42477,21 2,8 7,84 219,401 -13,3 176,91 май 226,9 51483,61 20,8 432,64 232,668 -5,768 33,27 июнь 248 61504 21,1 445,21 245,935 2,065 4,264 июль 261,3 68277,69 13,3 167,89 259,202 2,098 4,401 август 231,9 53777,61 -29,4 864,36 272,469 -40,569 1645,844 сентябрь 255,1 65076,01 23,2 538,24 285,736 -30,636 938,564 октябрь 299 89401 43,9 1927,21 299 Итого 2292,4 538417,62 119,4 4883,36 2393,012 -100,612 2947,392
Δ=(yn-y1)/(n-1)=(октябрь-январь)/9=(299–179,6)/9=13,267
Для тогочтобы найти Δr, нужно от каждого месяца отнять предыдущий: Δrфевраля=февраль-январь;Δr марта = март-февраль и так для всех месяцев.
_ _ Δ2= значение Δrвозведённоевквадрат.
y Δ февраля = yi января + е значение Δ, для марта =Δ+ yiфевраля.
Дляосуществления прогноза должна выполняться предпосылка:δ2ост≤р2;
Проверим:δ2=∑(yi – y Δ)2/n=2947,392/10=294,739
р2=1/2*∑ Δ2/n=1/2*4883,36/10=244,168; δ2ост≤р2, условие не выполняется, следовательно прогноз построитьнельзя.
2. Прогнозметодом среднего темпа ростаМесяц
Число семей, состоявших на учете на получение
жилья, тыс. ед. yi
Tr
_
yiTr январь 179,6 - 171,218 февраль 181,2 1,008 192,101 март 203,3 1,122 194,746 апрель 206,1 1,014 214,4 май 226,9 1,101 234,338 июнь 248 1,093 246,905 июль 261,3 1,054 219,125 август 231,9 0,887 241,047 сентябрь 255,1 1,1 282,529 октябрь 299 1,172 299 Итого 2292,4 9,551 2295,409
Для расчетаТrнужно месяц для которогосчитаем разделить на предыдущий. Тr февраля = февраль уi /январь уiтак для всех месяцев.
Тr=√(yn/y1)= √(299/179.6)=1.0583
yiTr= уiследующего месяца/ Тr= yiTrсентября = уiоктября/ Тr=299/1,0583= =282,529 и такдля каждого месяца.
Проверимпредпосылки осуществления прогноза:
∑yi≈∑yTr; 2295,409>2292,4; Так как предпосылка не выполняется, топрогноз методом среднего темпа построить невозможно.
3. Прогнозметодом экстраполяции трендовых моделей.
МодельпрямойМесяц
Число семей, состоявших на учете на получение
жилья, тыс. ед. yi Номер года t
t2
yixt yt
(yi-yt)2
yi2 январь 179,6 1 1 179,6 176,815 7,76 32256,16 февраль 181,2 2 4 362,4 188,465 52,78 32833,44 март 203,3 3 9 609,9 200,115 10,14 41330,89 апрель 206,1 4 16 824,4 211,765 32,09 42,477,21 май 226,9 5 25 1134,5 223,415 12,15 51483,61 июнь 248 6 36 1488 235,065 167,31 61504 июль 261,3 7 49 1829,1 246,715 212,72 68277,69 август 231,9 8 64 1855,2 258,365 700,4 53777,61 сентябрь 255,1 9 81 2295,9 270,015 222,46 65076,01 октябрь 299 10 100 2990 281,665 300,5 89401 Итого 2292,4 55 385 13569 2292,4 1718,31 538417,62
yixt= yiмесяца * t месяца.
/>na0+∑ta1=∑yt
∑ta0+∑t2a1=∑yixt
/>10a0+55a1=2292.4
55a0+385a1=13569
/>10a0=2292.4–55a1
55a0+385a1=13569
/>a0=229.24–5.5a1
55a0+385a=13569.подставим значения е а0во второе уравнение ирешим его. 55 (229,24–5,5а1)+385а1=13569
82,5а1=960,8
а1=11,65,подставим значение а1 в первое уравнение и решим его.
10а0+640,75=2292,4
а0=165,165
/>а0=165,165
а1=11,65
yt января = а0+а1;yt февраля = yt января+ а1, такдля всех месяцев.
Yt=165.165+11.65t. Построимпрогноз:номер года, t yt 11 529,915 12 604,565 13 616,215
11= yt октябрь+а1=281,665+11,65=592,915
12=11 yt+а1=592,915+11,65=604,565
13=12 yt+а1=604,565+11,65=616,215
Оценкаточности прогноза:
Среднеквадратическаяошибка: δ=√(∑(yi-yt)2/n)=13.11
Коэффициентнесоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649
МодельпараболыМесяц
Число семей, состояв-
ших на учете
на получе-ние
жилья, тыс. ед. yi
Но-мер года
t
t2
t3
t4
yixt
yixt2 yt
(yi-yt)2
yi2 январь 179,6 1 1 1 1 179,6 179,6 177,1 7,76 32256,16 февраль 181,2 2 4 8 16 362,4 724,8 188,51 52,78 32833,44 март 203,3 3 9 27 81 609,9 1829,7 200 10,14 41330,89 апрель 206,1 4 16 64 256 824,4 3297,6 211,4 32,09 42,477,21 май 226,9 5 25 125 625 1134,5 5672,5 222,8 12,15 51483,61 июнь 248 6 36 216 1296 1488 8929 234,21 167,31 61504 июль 261,3 7 49 343 2401 1829,1 12803,7 245,64 212,72 68277,69 август 231,9 8 64 512 4096 1855,2 14841,6 257,1 700,4 53777,61 сентябрь 255,1 9 81 729 6561 2295,9 20663,1 268,5 222,46 65076,01 октябрь 299 10 100 1000 10000 2990 29900 280 300,5 89401 Итого 2292,4 55 385 3025 25333 13569 98841,6 2285,3 1718,31 538417,62
/>na0+∑ta1+∑t2a2=∑yt
∑ta0+∑t2a1+∑t3a2=∑yixt
∑t2a0+∑t3a1+∑t4a2=∑yixt2
/>10a0+55a1+3025a2=2292.4
55a0+385a1+3025a2=13569
385a0+3025a1+25333a2=98841.6
/>a0=165.6578
a1=11.4036
a20.0224
Yt=165.6578+11.4036t+0.0224t2
Построимпрогноз (подставляя в найденное уравнение t)номер года, t yt 11 291,1 12 305,73 13 317,69
Оценкаточности прогноза:
Среднеквадратическаяошибка: δ=√(∑(yi-yt)2/n)=13.11
Коэффициентнесоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649
Вывод: Первые два метода: метод среднего абсолютного прироста и среднеготемпа роста неэффективны, так как построить прогноз невозможно, из-заневыполнения условий. А из метода экстраполяции трендовых моделей наиболееэффективным является модель прямой, так как у неё совпали два показателя yt и yi, асреднеквадратическая ошибка и коэффициент несоответствия одинаковые.
Списокиспользованных источников
1. Громыко Г.Л. Теориястатистики. Учебник. Москва: ИНФРА-М, 2000. – 414 с.
2. Колесникова, Н.Н. Статистика: учебное пособие./ Н.Н. Колесникова,Г.В. Круглякова. – Москва: Новое знание, 2007.-224 с.
3. Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Практикумпо статистике. Питер, 2007. – 288 с.
4. Сизова Т.М. Статистика:Учебное пособие. – СПб.: СПб ГУИТМО, 2005. – 190 с.
5. www.allstats.ru