На первой стадии в результате наблюдения накапливается масса данных об отдельных единичных фактах. Однако правильно собранные данные сами по себе еще не гарантируют автоматического получения правильных теоретических и практических выводов. Статистическое наблюдение дает массу первичного материала, который необходимо сгруппировать и определенным образом обработать, чтобы выявить путем вычисления обобщающих показателей типичные черты изучаемой совокупности.
Процесс обработки первичных материалов статистического наблюдения, процесс теоретического обобщения статистических данных получил название сводки статистических данных. Основным инструментом статистики является статистическая таблица. Такая форма представления данных наглядна, удобна и выразительна, она облегчает анализ и делает его продуктивнее. Чтобы статистические таблицы соответствовали своему назначению, необходимо обобщить первичный статистический материал. Этим целям и служит сводка.
Научной основой сводки является группировка. Группировкой в статистике называется разделение единиц изучаемого явления по существенным признакам для того, чтобы выделить конкретные типы явлений или внутри типа охарактеризовать состав совокупности или взаимосвязи в изменении варьирующих признаков. Иными словами, группировка - это сведение статистических данных в однородные группы. Из всех специфических приемов статистики группировка является главным приемом и служит важнейшим средством обобщения статистических данных.
С помощью группировок в статистике решают три основные задачи, в соответствии с чем выделяют и три вида группировок: типологические, вариационные, аналитические (факторные).
Первая задача, решаемая посредством группировок, - выделение однородных в качественном отношении типов явлений. В данном случае происходит расчленение множества разнородных явлений на однокачественные типы, классы, группы или статистические совокупности по важнейшим, существенным качественным признакам. Группировки, решающие эту задачу, называются типологическими. Например, можно произвести группировку преступлений по видам: тяжкие, особо тяжкие, насильственные преступления, корыстно-насильственные преступления, корыстные преступления, преступления экономической направленности и т.д.
Вторая задача - выявление количественных характеристик изучаемых явлений. В этом случае преследуется цель выявить внутреннее строение типически однородной группы, для чего исследуемые явления классифицируют по величине какого-либо изменяющегося (варьирующего) признака. Группировки, с помощью которых решается эта задача, называются вариационными, например, группировки данных о возрастных группах правонарушителей: преступность несовершеннолетних и т.п.
Третья задача - установление взаимосвязи между явлениями. В ходе ее решения устанавливаются и изучаются причинно-следственные связи между признаками явлений, выявляются факторы развития явления. Такие группировки называются аналитическими, или факторными, например, группировки, позволяющие установить взаимосвязь между преступностью и пьянством, преступностью и наркоманией и т.п.
По числу признаков, положенных в основу группировки, различают простые, образуемые по одному признаку, и сложные (комбинационные) - по двум и более признакам. В этом случае каждая группа, образованная по одному признаку, подразделяется на подгруппы по другому признаку. Например, распределение преступности по половому и возрастному признакам.
Главное в группировке - выбор таких признаков, которые дали бы возможность отделить одни качественные однородные группы от других. Статистика различает два рода группировочньгх признаков: количественные, т.е. такие, которые имеются во всех единицах совокупности, но в разных размерах, и качественные (атрибутивные), которые не могут быть выражены в цифровом виде. Группировка по качественному признаку показывает наличие или отсутствие этого признака в явлениях, относимых к той или иной совокупности, т.е. если явлению присуща данная разновидность качественного признака, то другая разновидность у него уже, как правило, отсутствует. Иными словами, атрибутивным, или качественным, называется такой признак, который характеризует качественную сущность явления. Например, деление преступлений по видам, деление обвиняемых по социальному положению.
Статистическая сводка - второй этап статистического исследования - представляет собой проверку, систематизацию, научную обработку материалов статистического наблюдения, подытоживание отдельных единиц и сведения их в массы или совокупности в целях получения обобщенной характеристики изучаемого явления по ряду существенных для него признаков.
Различают первичную и вторичную сводки.
Первичная сводка - обработка и подсчет первичных данных, непосредственно собранных в процессе статистического наблюдения.
Вторичная сводка - обработка и подсчет сведенных данных первичной сводки.
По форме обработки статистических данных сводка может производиться в: централизованном порядке - первичные данные сосредотачиваются в одном центральном органе; децентрализованном порядке - документы первичного учета обобщаются на местах и в вышестоящий орган направляются уже в подытоженном виде; смешанном порядке - обработка первичного материала происходит частично на местах и завершается полностью в вышестоящем государственном органе.
В основе статистической сводки лежит статистическая группировка - один из основных методов обработки информации, заключающийся в расчленении совокупностей на группы по существенным для данного исследования признакам.
Классификация группировок
Типологическая группировка - это разграничение изучаемой совокупности на однородные группы по существенному качественному признаку. Группировка по альтернативному качественному признаку называется альтернативной.
Структурная (вариационная) группировка - это распределение типически однородных групп по количественным признакам, которые могут изменяться (варьировать).
Аналитические (комбинационные) группировки - это распределение по взаимосвязи между двумя или несколькими разнородными группами явлений или их признаками.
Взаимосвязанные признаки делятся на факторные и результативные.
Факторные - независимые признаки, под воздействием которых изменяются другие, зависящие от них признаки.
Результативные - зависимые признаки, которые изменяются под воздействием факторных.
Количественные признаки могут принимать как фиксированные значения, так и изменяться в пределах какого-либо интервала.
Интервал - значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границу или хотя бы одну из них.
Нижняя граница интервала - наименьшее значение признака в интервале.
Верхняя граница интервала - наибольшее значение признака в интервале.
Величина интервала - разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные (т.е. являются не прогрессивно возрастающими, не прогрессивно убывающими) и специализированные (интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях).
Число групп зависит от задач исследования, вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака. Если группировка производится по количественному признаку, число групп можно определить по формуле Стерджесса: n = l + 3,322xlgN, где n - количество групп; N - число единиц совокупности.
Интервалы группировок могут быть закрытыми и открытыми.
Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы.
Открытые - интервалы, у которых имеется только одна граница: верхняя - у первого, нижняя - у последнего.
Основные этапы построения статистической группировки
Определение состава группировочных признаков, т.е. основание группировки.
Определение количества групп.
Определение интервалов группировки.
Отбор показателей, которые характеризуют группы.
Подсчет групповых итогов.
Теперь дадим характеристику рядов распределения. Статистический ряд распределения - упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивным называют ряд распределения, построенный по качественным признакам. В результате распределения образуется столько групп, сколько разновидностей атрибутивного признака имеет данная совокупность.
Вариационным называют ряд распределения, построенный по количественным признакам. Любой вариационный ряд состоит из двух элементов - вариантов и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака.
Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. числа, показывающие как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частоты, выраженные в долях единицы или в % к итогу, называются частностями. Соответственно сумма частностей равна 1 или 100%.
В зависимости от характера вариации ряды подразделяются на дискретные (прерывные) и интервальные (непрерывные).
В случае дискретной вариации величина количественного признака принимает только фиксированные значения. Например, сведения по результатам вступительных экзаменов абитуриентов:
Построение интервальных вариационных рядов целесообразно при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного ряда достаточно велико. Для исследования непрерывного варьирования всегда устанавливаются интервалы. Например, распределение числа осужденных по срокам лишения свободы.
Правила построения рядов распределения аналогичны правилам построения группировки.
Normal 0 false false false MicrosoftInternetExplorer4 /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Обычная таблица"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman"; mso-ansi-language:#0400; mso-fareast-language:#0400; mso-bidi-language:#0400;}